GPT-Rosalind обновили: бенчмарки химии и геномики, плагины в Codex

Учёный в Codex смотрит выравнивание и структуру белка, пока GPT-Rosalind ведёт workflow по liquid biopsy.

3 июня 2026 серия GPT-Rosalind получила апдейт на GPT-5.5 с усиленным biological reasoning и tool-use для enterprise в life sciences — от medicinal chemistry до troubleshooting в wet lab. В MedChemBench новая версия набирает 27,5% против 25,1% у GPT-5.5 при на 7,2% меньшем расходе токенов; на GeneBench — 21,6% против 20,4% при экономии 31% токенов.

Бенчмарки под реальные задачи

OpenAI собрала LifeSciBench — экспертно оцениваемый end-to-end бенчмарк из шести зон workflow: evidence handling, analysis, design and optimization, scientific reasoning, validation and operations, translation and communication. Дополнительно замеряют узкие сценарии:

MedChemBench — SAR, ADME, retrosynthesis и lead optimization;
GeneBench — длинные agentic задачи по functional genomics, spatial transcriptomics, proteomics;
LabWorkBench — связь perturbations с исходами в реальных протоколах: 63,2% против 55,8% у GPT-5.5, минус 5,3% токенов.

Плагины и viewers в Codex

Плагины Life Sciences Research и Life Sciences NGS Analysis добавляют execution layer: sourced evidence retrieval, биоинтерпретацию и bioinformatics в одном workspace с provenance. Qualified enterprise-пользователи могут питать плагины именно GPT-Rosalind; все остальные — через Codex на базовой модели. Появились interactive viewers для sequence, alignment и structure — чтобы не отрываться от доказательств при follow-up вопросах.

Доступ и партнёры

Research preview для eligible organizations globally идёт через trusted-access deployment: governance, safety oversight и enterprise-grade security. Novo Nordisk уже масштабирует медицинские исследования на GPT-Rosalind; для организаций без Enterprise — managed workspace от OpenAI.

Источник: Introducing new capabilities to GPT-Rosalind.