Невидимый счёт за вызовы моделей: локальный прокси с помодельным учётом

Несколько AI coding tools в одной работе дают агрегированные счета провайдеров. Неочевидно, какая модель дернулась из какого инструмента и во что это вылилось в деньгах.
Автор заметки на DEV Community описывает, как вынес учёт в локальный прокси CliGate между своими инструментами и upstream API и настроил помодельную разбивку затрат.
Публикация на Dev.to отмечена временем 2026-04-13T03:16:31Z (UTC).
Четыре входа в LLM и два счёта без детализации
По его словам, около трёх месяцев назад в стеке стояли четыре точки: Claude Code, Codex CLI, Gemini CLI и отдельный чат для быстрых вопросов. Ежемесячные счета приходили от Anthropic и OpenAI, без понятной привязки к задачам и к конкретным средствам разработки.
Итог тот же, что в заголовке исходного материала: накопительная «вкладка» за ИИ-инструменты существовала, но её состав был плохо наблюдаем извне.
CliGate между инструментами и API
Решением назван CliGate — локальный прокси между перечисленными AI coding tools и upstream API. Все четыре потока, по описанию, сходятся через него. Управление учётными данными и маршрутизацией в тексте привязано к единой точке:
localhost:8081
Что прокси фиксирует в потоке запросов
По объяснению автора, прокси видит каждый запрос и сохраняет связку фактов:
- какой инструмент отправил обращение;
- какая модель запрошена;
- сколько токенов использовано (из потока ответа);
- стоимость с учётом цены за токен для выбранной модели.
Дополнительно упоминаются лог запросов со стоимостью на запрос рядом с каждой записью, разбивка по аккаунтам Claude в пуле, переключение дневных и месячных представлений в интерфейсе, а также реестр цен (per-token), обновляемый в дашборде.
Пример вывода дашборда за неделю
В посте приводится иллюстративный фрагмент «usage dashboard» за неделю обычной работы. В показанном блоке — разбивка по провайдерам: строки вроде Anthropic API, ChatGPT Account, Free (Kilo AI), OpenAI API, с долями и суммой Total $7.09. Отдельно автор показывает разбивку по моделям (claude-sonnet-4-6, claude-haiku-4-5, gpt-4o, codex-mini) с указанными в примере суммами и процентами.
Это не независимая метрика платформы, а пример экрана из текста публикации, который иллюстрирует желаемую наблюдаемость расходов.
Бесплатная маршрутизация и Kilo AI
Описана функция free model routing: запрос, изначально адресованный claude-haiku-4-5, может уходить не в Anthropic, а на бесплатную модель (DeepSeek R1, Qwen3, MiniMax — в зависимости от того, что настроено) через Kilo AI. Для такого пути в формулировке автора указано, что API key не нужен.
Настроенная им схема, по его словам, такова: задачи claude-haiku по умолчанию идут через бесплатные модели, quick chat — по free path, а Claude Code получает полную Sonnet.
Субъективная оценка экономии
В повествовании приведена личная оценка: месячные расходы на AI-инструменты снизились примерно на 40% при том же описываемом рабочем процессе. Это утверждение автора поста, а не воспроизведённый бенчмарк или аудит третьей стороны.
Открытый код и пробелы по праву
В конце материала CliGate назван бесплатным и открытым исходным кодом; указан репозиторий на GitHub: codeking-ai/cligate.
Отдельного разбора лицензий, условий использования провайдеров или правовых рисков проксирования в тексте нет — при оценке внедрения у себя это остаётся зоной самостоятельной проверки.
Источники
- yiyaoai. «My AI Coding Tools Were Running Up a Tab I Couldn't See — So I Fixed That». DEV Community (dev.to). URL: Dev.to — дата обращения: 2026-04-13 (UTC), 09:03:43.
- Репозиторий CliGate на GitHub (как указано в публикации): https://github.com/codeking-ai/cligate — дата обращения: 2026-04-13 (UTC), 09:03:43 (вместе с чтением поста на dev.to).