Редакция 18 июня 2026 г.

GPT-5.5 Instant усилила health-ответы ChatGPT: −71% ошибок по фактам

Экран ChatGPT с разбором симптомов на фоне схемы оценки HealthBench и отметок врачебной экспертизы OpenAI.

Еженедельно более 230 миллионов человек обращаются к ChatGPT с вопросами о здоровье и велнесе — и OpenAI усилила health intelligence на базе GPT-5.5 Instant: на агрегате HealthBench Professional модель догнала флагманские Thinking-версии и доступна всем бесплатным пользователям в лимитах тарифа.

GPT-5.5 Instant вышла в мае 2026 года, вслед за GPT-5.3 Instant от марта. В слепом сравнении врачи разобрали 3 500 ответов на типичные health-диалоги и поставили GPT-5.5 Instant выше и прежних моделей, и текстов, которые коллеги писали вручную при неограниченном времени и доступе к интернету. Меньше промахов по локальному контексту здравоохранения, пропуску red flags и запросу недостающего контекста у пользователя.

Метрики продакшена

OpenAI сравнила health-трафик за последние два месяца — речь о миллиардах сообщений в неделю. По privacy-preserving мониторам в продакшене доля ответов с хотя бы одной зафлаженной фактической ошибкой снизилась на 71%. Отдельные бенчмарки HealthBench и HealthBench Professional используют реалистичные диалоги и рубрики, которые врачи пишут для оценки точности, безопасности, эскалации и ясности формулировок.

260 врачей и 700 000 разборов

За кадром — глобальная сеть из более чем 260 врачей в 60 странах, 49 языках и 26 специальностях. Они разобрали свыше 700 000 примеров ответов модели; новый кейс уходит на ревью каждые несколько минут, а фидбек превращается в критерии для следующих итераций. Тот же контур ложится и на продукты вроде ChatGPT for Clinicians и OpenAI for Healthcare.

Источник: Improving health intelligence in ChatGPT.