DeepSeek — 17% продовых токенов за месяц, Anthropic держит 65% трат

Доля DeepSeek в продовых токенах AI Gateway выросла с менее 1% до 17% за май 2026, а доля трат осталась около 1%. Anthropic подняла spend с 61% до 65% и держит 70–80% бюджета на high-stakes сценариях — генерации приложений, back-office агентах и coding agents.
Индекс Vercel AI Gateway за май фиксирует реальный прод, а не бенчмарки: общий объём токенов +20% month-over-month, spend +43%, средняя цена токена выросла почти на 20% относительно апреля. Запуск DeepSeek V4 резко сдвинул token share: сегмент дешёвых моделей, который в апреле почти не существовал, стал третьим по объёму на шлюзе.
Что изменилось в проде
- дешёвые модели впервые пошли в production на масштабе — не только в экспериментах;
- команды настраивают model routing между low-cost и frontier-моделями вместо одной модели на всё;
- в coding agents DeepSeek занял почти половину токенов, xAI и MiniMax отступили;
- back-office нагрузки остались Anthropic-heavy в оба месяца;
- B2C крутит объём токенов, B2B — основную долю spend.
Агенты и микс моделей
Агентный трафик с tool use в среднем в 2,5 раза плотнее по токенам на запрос, чем кажется по числу requests. У команд с 1M+ запросов в месяц в роутинге уже 11 и больше разных моделей — diversity растёт вместе со scale. На фоне новостей про сожжённые бюджеты (Uber исчерпал годовой лимит Claude Code после Q1, Amazon закрыл KiroRank) индекс показывает: траты в проде растут, но осознаннее — дешёвые модели на объём, frontier на критичные задачи.
Источник: DeepSeek enters the fight for token volume, Anthropic continues to dominate spend.