Доскоро мощните и скъпи AI модели от Силициевата долина се смятаха за задължителна инвестиция. Днес обаче технологични лидери като Сатя Надела (Microsoft), Никеш Арора (Palo Alto Networks) и Брайън Армстронг (Coinbase) са единодушни: по-малките и евтини модели вече покриват по-голямата част от корпоративните нужди и са ключът към масовото внедряване на технологията.
Тази промяна е резултат от горчив опит. Доскоро компаниите безразсъдно насърчаваха използването на AI, приемайки обема на потребление (явление, наречено „tokenmaxxing“) за признак на продуктивност. Сега обаче сметките стават солени. Въпреки че цените на самите токени падат, крайните разходи растат, тъй като AI разработчиците преминават от фиксирани абонаменти към таксуване на реално потребление. Това прави бюджетите непредвидими. Типичен пример е Uber – компанията изразходва целия си AI бюджет за 2026 г. само за четири месеца, след като служителите масово започват да пишат код с AI, което налага спешни ограничения.
Промяната изненада мнозина. Веднага отчетохме скок от 20% до 30% над планираните бюджети при нашите клиенти“, коментира Харолд Бюн, главен изпълнителен директор на BlueRock, цитиран от Reuters.
Страхът от огромните сметки
С навлизането на технологиите AI задачите стават по-комплексни – изискват повече стъпки, данни и по-дълги промптове. Gartner прогнозира, че до 2028 г. разходите за AI програмиране ще надхвърлят средната заплата на софтуерните разработчици.
За да овладеят ситуацията, компаниите се насочват към по-евтини модели и платформи като OpenRouter за интелигентно пренасочване на задачите: рутинната работа отива към бюджетни системи, а премиум моделите се пазят само за най-сложните процеси. По данни на Citi делът на моделите с отворен код в OpenRouter е скочил от 34% през януари до 65% през юни.
Тази тенденция засилва позициите на евтините алтернативи (като китайската DeepSeek), които бързо набират популярност сред стартъпите. Пазарният лидер OpenAI вече реагира на натиска и обмисля сериозни намаления, за да изпревари основния си конкурент Anthropic. Подобна ценова война обаче крие риск за приходите им точно преди планираните излизания на борсата (IPO).
Предстои сериозна ценова битка, тъй като и двете компании се състезават коя първа ще стане публична“, отбелязва Кристофър Браун от Synovus Securities.
На този фон инвеститорският оптимизъм към AI сектора се охлажда поради съмнения в реалната възвръщаемост, което доведе и до разпродажба на технологични акции миналата седмица.
Отвореният код и китайските модели на преден план
В момента четирите най-популярни модела в OpenRouter са изцяло китайски, водени от DeepSeek. Те бързо стопяват технологичната дистанция спрямо американските лидери, но на символична цена – едва 18 цента за милион токена, спрямо средно 4 долара при американските аналози. Разликата във възможностите им вече е свита от година на едва четири месеца.
Въпреки това, съображенията за киберсигурност и поверителност на данните ще останат пречка за масовото навлизане на китайски модели в големите корпорации. Анализаторите очакват бизнесът да приложи тактиката от облачните услуги – да комбинира различни доставчици според най-доброто съотношение цена-качество за конкретната задача.
Моделите с отворен код доказаха, че могат да бъдат 90% толкова добри, колкото лидерите, но на 10% от тяхната цена“, заключава Вал Берковичи, главен AI директор във WEKA. „Просто няма смисъл да хабим най-скъпия ресурс за всяка рутинна задача.“
Публикувано съгласно указанията на Economic.bg






