ChatGPT Images 2.0: генерация картинок с лучшим текстом и мультиязычностью

OpenAI представила ChatGPT Images 2.0 — новую итерацию модели генерации изображений внутри ChatGPT. По описанию компании, речь идёт о более современной архитектуре, ориентированной на практические сценарии, где на снимке или в макете должен читаться именно текст, а не «похожие каракули».

Среди заявленных улучшений — более аккуратный рендеринг текста прямо в кадре, расширенная поддержка нескольких языков и более продвинутое визуальное рассуждение: модель должна увереннее держать композицию, логику сцены и детали там, где прежним системам чаще приходилось «додумывать» картинку за счёт артефактов.

Для разработчиков и инди-команд это в первую очередь экономия времени на итерациях: быстрые UI-мокапы, баннеры с реальными формулировками, схемы и иллюстрации к гайдам — всё, где раньше приходилось вручную править буквы и языковые смеси в одном кадре.

Релиз выглядит как шаг к тому, чтобы генеративные картинки реже ломались на «мелочах», из-за которых макет нельзя было сразу показать заказчику или выложить в продуктовый канал.

Источник: Introducing ChatGPT Images 2.0 — официальный материал OpenAI.