AI Vibe Craft
← Назад к AI Vibe News

Редакция 13 апреля 2026 г.

Разборы

Невидимый счёт за вызовы моделей: локальный прокси с помодельным учётом

Невидимый счёт за вызовы моделей: локальный прокси с помодельным учётом. Несколько AI coding tools в одной работе дают агрегированные счета провайдеров. Неочевидно, какая модель дернулась из какого инструмента и во что это вылилось в деньгах.

Несколько AI coding tools в одной работе дают агрегированные счета провайдеров. Неочевидно, какая модель дернулась из какого инструмента и во что это вылилось в деньгах.

Автор заметки на DEV Community описывает, как вынес учёт в локальный прокси CliGate между своими инструментами и upstream API и настроил помодельную разбивку затрат.

Публикация на Dev.to отмечена временем 2026-04-13T03:16:31Z (UTC).


Четыре входа в LLM и два счёта без детализации

По его словам, около трёх месяцев назад в стеке стояли четыре точки: Claude Code, Codex CLI, Gemini CLI и отдельный чат для быстрых вопросов. Ежемесячные счета приходили от Anthropic и OpenAI, без понятной привязки к задачам и к конкретным средствам разработки.

Итог тот же, что в заголовке исходного материала: накопительная «вкладка» за ИИ-инструменты существовала, но её состав был плохо наблюдаем извне.


CliGate между инструментами и API

Решением назван CliGate — локальный прокси между перечисленными AI coding tools и upstream API. Все четыре потока, по описанию, сходятся через него. Управление учётными данными и маршрутизацией в тексте привязано к единой точке:

localhost:8081

Что прокси фиксирует в потоке запросов

По объяснению автора, прокси видит каждый запрос и сохраняет связку фактов:

  • какой инструмент отправил обращение;
  • какая модель запрошена;
  • сколько токенов использовано (из потока ответа);
  • стоимость с учётом цены за токен для выбранной модели.

Дополнительно упоминаются лог запросов со стоимостью на запрос рядом с каждой записью, разбивка по аккаунтам Claude в пуле, переключение дневных и месячных представлений в интерфейсе, а также реестр цен (per-token), обновляемый в дашборде.


Пример вывода дашборда за неделю

В посте приводится иллюстративный фрагмент «usage dashboard» за неделю обычной работы. В показанном блоке — разбивка по провайдерам: строки вроде Anthropic API, ChatGPT Account, Free (Kilo AI), OpenAI API, с долями и суммой Total $7.09. Отдельно автор показывает разбивку по моделям (claude-sonnet-4-6, claude-haiku-4-5, gpt-4o, codex-mini) с указанными в примере суммами и процентами.

Это не независимая метрика платформы, а пример экрана из текста публикации, который иллюстрирует желаемую наблюдаемость расходов.


Бесплатная маршрутизация и Kilo AI

Описана функция free model routing: запрос, изначально адресованный claude-haiku-4-5, может уходить не в Anthropic, а на бесплатную модель (DeepSeek R1, Qwen3, MiniMax — в зависимости от того, что настроено) через Kilo AI. Для такого пути в формулировке автора указано, что API key не нужен.

Настроенная им схема, по его словам, такова: задачи claude-haiku по умолчанию идут через бесплатные модели, quick chat — по free path, а Claude Code получает полную Sonnet.


Субъективная оценка экономии

В повествовании приведена личная оценка: месячные расходы на AI-инструменты снизились примерно на 40% при том же описываемом рабочем процессе. Это утверждение автора поста, а не воспроизведённый бенчмарк или аудит третьей стороны.


Открытый код и пробелы по праву

В конце материала CliGate назван бесплатным и открытым исходным кодом; указан репозиторий на GitHub: codeking-ai/cligate.

Отдельного разбора лицензий, условий использования провайдеров или правовых рисков проксирования в тексте нет — при оценке внедрения у себя это остаётся зоной самостоятельной проверки.


Источники

  1. yiyaoai. «My AI Coding Tools Were Running Up a Tab I Couldn't See — So I Fixed That». DEV Community (dev.to). URL: Dev.to — дата обращения: 2026-04-13 (UTC), 09:03:43.
  2. Репозиторий CliGate на GitHub (как указано в публикации): https://github.com/codeking-ai/cligate — дата обращения: 2026-04-13 (UTC), 09:03:43 (вместе с чтением поста на dev.to).