LogoХолст.ИИ
Вернуться к блогу

Встречаем GPT Image 2: тестируем и сравниваем модели

Встречаем GPT Image 2: тестируем и сравниваем модели

Да, да мы снова обновились - на платформе появилась GPT Image 2. Застетируем ее вместе с вами!

Мы взяли GPT Image 2, GPT Image 1.5 и Nano Banana 2, скормили им одинаковые промпты и посмотрели, кто где справляется лучше. 

Промпт 1: Реалистичность

Проверяем, насколько модели умеют создавать фотореалистичные изображения с живыми текстурами.

Промпт:

Портрет 30-летней женщины, естественная текстура кожи, видимые поры, веснушки, мягкий утренний свет из окна, малая глубина резкости, объектив 50 мм, фотореалистичный, 8K

Что смотрим: кожа (пластик или живая?), волосы (отдельные или слипшиеся?), свет (естественный или студийный?)

GPT Image 2 - выдаёт самую живую кожу - поры, веснушки, естественные тени. Сама картинка более привлекательная.
GPT Image 1.5 - тоже хороша, но чуть «приглаживает» текстуры и веснушки делает везде.
Nano Banana 2 - самая реалистичная, но взгяд не цепляет совсем, словно есть пластик в лице и волосах.

Промпт 2: Русский текст на изображении

Самая больная тема нейросетей - текст, особенно на кириллице.

Промпт:

Предметная фотосъемка, белая кофейная чашка на мраморной поверхности, надпись на чашке «Свежий кофе» элегантными буквами, четкой кириллицей, мягкое естественное освещение, минималистичная композиция, высокая детализация.

Что смотрим: читаемость текста, правильность букв, отсутствие артефактов.

С текстом все модели справились на 5+, но возникла проблема с лишними деталями на фото.

GPT Image 2 - «Свежий кофе» читается чётко, буквы правильные, ближе к реализму и нет лишних деталей на фото, которые мы не просили.
GPT Image 1.5 - текст читаем хорошо, но модель дорисовала кофейные зерна и кофе в кружке. А мы просили?
Nano Banana 2 - текст тоже читаем, даже лучшем, чем у GPT Image 2, но опять же - кофе в кружке и лишние детали, которых нет в контексте.

Промпт 3: Понимание контекста

Проверяем, насколько модель понимает сложные запросы с несколькими объектами и их расположением.

Промпт:

Композиция в стиле flat lay: керамическая кофейная чашка слева, кожаный блокнот в центре, свежий апельсин справа, оливковая ветвь на заднем плане, теплые терракотовые тона, мягкий рассеянный свет сверху справа, минималистичный стиль.

Что смотрим: расположение объектов (слева/центр/справа), цвета, свет, композиция.


GPT Image 2 - объекты на своих местах, композиция как в промпте, цвета приятные, насыщенные. 
GPT Image 1.5 - объекты рядом, тут все отлично.
Nano Banana 2 - объекты кучей, композиция нарушена. Куча лишних деталей, типа : ручки, ложки, долек апельсина и листьев + текстура на фоне, которую мы не просили. 

Когда что выбирать

GPT Image 2 - когда нужно качество: финальные проекты, клиентские работы, публикации.

GPT Image 1.5 - золотая середина: хорошие арты, если скорость не критична, но любит пририсовывать лишнее время от времени.

Nano Banana 2 - для быстрых тестов и вдохновения. Эта модель любит рисовать и фантазировать :)

Новая модель уже доступна на платформе по ссылке...

Все изображения были сгенерированы на платформе Холст.ИИ