80% меньше живых операторов: как Parloa гоняет голосовых агентов через AMP и GPT-5.4

80% обращений к живому оператору сняли в одном внедрении у глобальной travel-компании, и OpenAI выложила разбор берлинской Parloa: AI Agent Management Platform на GPT-5.4 и смежных моделях переводит голосовой enterprise-саппорт от жёстких intent-деревьев к конфигурации роли, инструментов и границ на естественном языке. Дата публикации кейса — 7 мая 2026.
Перед выкатом команды гоняют сценарии в двухсторонних симуляциях: одна модель играет абонента, другая — настроенного агента. Ответы прогоняют через детерминированные проверки и оценку в схеме LLM-as-a-judge, а в голосовом контуре отдельно следят за задержкой цепочки speech-to-text → рассуждение → text-to-speech.
Контур AMP в проде
- Симуляции на GPT-5.4 и соседних моделях ловят краевые кейсы до контакта с реальным клиентом.
- Оркестрация в рантайме смешивает ответы OpenAI-модели с RAG и вызовами структурированных API.
- Сложные сценарии режут на модульных суб-агентов, а критичные шаги дополнительно фиксируют цепочками API и событийной логикой вместо «монолитного» промпта.
Сейчас агенты Parloa обрабатывают миллионы разговоров в retail, travel и страховании; новые версии моделей прогоняют через внутренние бенчмарки на реальных прод-конфигурациях, чтобы миграция оправдывала себя для крупных заказчиков.
Источник: Parloa builds service agents customers want to talk to.