GPT-5.5 Instant усилила health-ответы ChatGPT: −71% ошибок по фактам

Еженедельно более 230 миллионов человек обращаются к ChatGPT с вопросами о здоровье и велнесе — и OpenAI усилила health intelligence на базе GPT-5.5 Instant: на агрегате HealthBench Professional модель догнала флагманские Thinking-версии и доступна всем бесплатным пользователям в лимитах тарифа.
GPT-5.5 Instant вышла в мае 2026 года, вслед за GPT-5.3 Instant от марта. В слепом сравнении врачи разобрали 3 500 ответов на типичные health-диалоги и поставили GPT-5.5 Instant выше и прежних моделей, и текстов, которые коллеги писали вручную при неограниченном времени и доступе к интернету. Меньше промахов по локальному контексту здравоохранения, пропуску red flags и запросу недостающего контекста у пользователя.
Метрики продакшена
OpenAI сравнила health-трафик за последние два месяца — речь о миллиардах сообщений в неделю. По privacy-preserving мониторам в продакшене доля ответов с хотя бы одной зафлаженной фактической ошибкой снизилась на 71%. Отдельные бенчмарки HealthBench и HealthBench Professional используют реалистичные диалоги и рубрики, которые врачи пишут для оценки точности, безопасности, эскалации и ясности формулировок.
260 врачей и 700 000 разборов
За кадром — глобальная сеть из более чем 260 врачей в 60 странах, 49 языках и 26 специальностях. Они разобрали свыше 700 000 примеров ответов модели; новый кейс уходит на ревью каждые несколько минут, а фидбек превращается в критерии для следующих итераций. Тот же контур ложится и на продукты вроде ChatGPT for Clinicians и OpenAI for Healthcare.
Источник: Improving health intelligence in ChatGPT.