Апрель в AI Gateway: Anthropic 61 % spend, Google 38 % по токенам

59% всего объёма токенов в AI Gateway приходится на agentic workloads — доля удвоилась за шесть месяцев, а во врезке за семь месяцев прод-трафика и более чем 200K команд Vercel срезала апрельский расклад провайдеров: по spend лидирует Anthropic с 61 %, далее Google — 21 % и OpenAI — 12 %; по объёму токенов картина иная — Google держит 38 % трафика, Anthropic — 26 %, OpenAI — 13 %, xAI — 10 %.
Две разные гонки
Рейтинги по деньгам и по объёму расходятся, потому что закрывают разные профили задач даже у одних и тех же заказчиков: «дорого и критично» и «дешево и часто» — разные забеги.
- Требовательные reasoning-цепочки садятся на Claude Opus, массовые дешёвые потоки — на Flash-сегмент Gemini.
- После последних апдейтов моделей доля OpenAI по расходам в апреле выросла втрое относительно окна наблюдений отчёта.
- OSS-модели наращивают присутствие без долгосрочной лояльности к одному производителю.
Роутинг и агенты
- У высоконагруженных сценариев в среднем задействуется более 30 различных моделей под один лоток трафика.
- Agentic-нагрузка тянет 59 % всех токенов через gateway между реальными приложениями и агентами.
В проде уже не один «winner takes all»: multi-model роутинг в gateway становится операционным стандартом, а победителя нужно считать отдельно по строке платежей и по токенному потоку.
Источник: AI Gateway production index.