Обновлено 4 июня 2026
GPT-Rosalind обновили: бенчмарки химии и геномики, плагины в Codex

3 июня 2026 серия GPT-Rosalind получила апдейт на GPT-5.5 с усиленным biological reasoning и tool-use для enterprise в life sciences — от medicinal chemistry до troubleshooting в wet lab. В MedChemBench новая версия набирает 27,5% против 25,1% у GPT-5.5 при на 7,2% меньшем расходе токенов; на GeneBench — 21,6% против 20,4% при экономии 31% токенов.
Бенчмарки под реальные задачи
OpenAI собрала LifeSciBench — экспертно оцениваемый end-to-end бенчмарк из шести зон workflow: evidence handling, analysis, design and optimization, scientific reasoning, validation and operations, translation and communication. Дополнительно замеряют узкие сценарии:
- MedChemBench — SAR, ADME, retrosynthesis и lead optimization;
- GeneBench — длинные agentic задачи по functional genomics, spatial transcriptomics, proteomics;
- LabWorkBench — связь perturbations с исходами в реальных протоколах: 63,2% против 55,8% у GPT-5.5, минус 5,3% токенов.
Плагины и viewers в Codex
Плагины Life Sciences Research и Life Sciences NGS Analysis добавляют execution layer: sourced evidence retrieval, биоинтерпретацию и bioinformatics в одном workspace с provenance. Qualified enterprise-пользователи могут питать плагины именно GPT-Rosalind; все остальные — через Codex на базовой модели. Появились interactive viewers для sequence, alignment и structure — чтобы не отрываться от доказательств при follow-up вопросах.
Доступ и партнёры
Research preview для eligible organizations globally идёт через trusted-access deployment: governance, safety oversight и enterprise-grade security. Novo Nordisk уже масштабирует медицинские исследования на GPT-Rosalind; для организаций без Enterprise — managed workspace от OpenAI.
Источник: Introducing new capabilities to GPT-Rosalind.