Veo 3.1 и Sora 2: Как промпты творят кинематографичное видео из ваших идей

В этой статье мы разберёмся, как «думают» эти модели, и предоставим схему рабочего промпта + разберем принципы для создания потрясающего видео из текста.
Прежде чем писать промпты, нужно понять «характер» каждого инструмента. Условно, они немного разные режиссёры.
Veo 3.1 — виртуозный оператор и стилист.
Его сильные стороны:
++ Невероятное кинематографичное качество: Чёткое понимание физики света, теней, атмосферы. Кадры выглядят как снятые профессиональной камерой.
++ Точное следование стилю: Отлично работает с запросами вроде «в стиле студии Ghibli», «киноплёнка 80-х», «масляная живопись».
++ Чувство кадра: Умеет красиво выстраивать композицию, работать с ракурсами.
++ Что любит: Короткие (до минуты), стилистически цельные, визуально красивые видео.
Sora 2 — безудержный фантазёр и сценарист.
Его сильные стороны:
++ Связность сцен и логика повествования: Может генерировать сложные, динамичные сцены с несколькими персонажами, которые взаимодействуют друг с другом и средой предсказуемо.
++ Понимание причинно-следственных связей: Если в промпте написано «откусить от печенья», на нём будет виден укус. Это прорыв.
++ Масштаб миров: Создаёт цельные вселенные, которые живут по своим законам.
++ Что любит: Сюжетные мини-истории, сложную динамику, мир-building.
Алхимия промпта.
Промпт — это не просто описание, это техническое задание для режиссёра-нейросети. Чем детальнее и профессиональнее ТЗ, тем ближе результат к вашей задумке.
Структура идеального промпта (сохраните на память):
1. СУБЪЕКТ / ГЕРОЙ: Кто или что в центре кадра? (Космонавт-кошка, старый деревянный корабль, светящийся кристалл).
2. ДЕЙСТВИЕ: Что происходит? (Медленно плывёт, взрывается в замедленной съёмке, трансформируется в бабочку).
3. ОБСТАНОВКА / ФОН: Где это происходит? (На фоне биолюминесцентного океана, в запылённой антикварной лавке, на марсианском каньоне).
4. СТИЛЬ И НАСТРОЙКА: Как это выглядит? (Кинематографично, макросъёмка, анимэ, воркшоп эпохи Возрождения, тёплые тона).
5. ДЕТАЛИ СЪЁМКИ: Какая оптика и движение? (Снимок с дрона, от первого лица, steadycam, широкоугольный объектив, tilt-shift).
Практика и примеры
Приведем пример двух разных подходов к генерации на модели Sora 2, учитывая ее стилистику и особенности.
**В первом варианте мы взяли обычный промпт, который написали и использовали самый бюджетный формат модели, без дополнительных настроек, первого кадра и улучшения промпта.
Основная идея: Лис открывает портал в лесу.
Prompt (Sora 2): Продолжительное следование кадра за маленьким лисом, который бежит по заросшему мхом сказочному лесу. Лис подбегает к древнему камню с рунами, встаёт на задние лапы и касается его передними лапами. Из точки касания расходится волна золотого света, и в воздухе разрывается вращающийся портал из сияющих частиц. Лис оглядывается на камеру и прыгает внутрь портала, исчезая. Стиль: реалистичное 3D-анимация, похожее на студию Pixar.
Результат при русском промпте, без улучшения, на более бюджетной версии модели:
Результат нас не впечатлил, поэтому мы:
1. Сгенерировали первый кадр в модели nano banana pro и вставили картинку, как первый кадр видео (она сейчас у нас по самой выгодной цене на рынке).
2. Улушшили промпт, сделав запрос у нейросети.
3. Самостоятельно перевели промпт на английский язык.
4. Использовали более дорогую и качественную версию модели для генерации.
Полученный в результате Prompt (для Sora 2) - на русском языке, в последствии мы его перевели + сгенерированный первый кадр для видео.
Prompt: Сцена: Сказочный лес, густо заросший мхом. Атмосфера таинственная, волшебная. Освещение мягкое, рассеянное, как в светлую облачную погоду.
Объект и действие:
Кадр: Непрерывное (одним планом), плавное слежение сзади и сбоку за маленьким лисом.
Действия лиса: Лис бежит рысцой по лесу, оглядываясь по сторонам. Он подбегает к крупному, древнему камню, покрытому резными рунами. Лис встает на задние лапы, приподнимается и аккуратно касается лапами поверхности камня на уровне глаз. В момент касания из-под его лап мгновенно расходится волна золотого сияния, подсвечивающая руны. Прямо перед камнем в воздухе с резким, но мягким звуком разрывается вращающийся портал, состоящий из мерцающих золотистых частиц.
Лис поворачивает голову назад, на мгновение смотрит прямо в камеру (во взгляде - решительность и любопытство). Он отталкивается задними лапами и совершает динамичный прыжок внутрь портала, после чего полностью исчезает. Портал начинает быстро схлопываться.
Стиль и качество визуала:
Стиль анимации: Фотореалистичное 3D, но с уклоном в стилистику студии Pixar (очаровательный, слегка утрированный дизайн персонажа, выразительная анимация, насыщенные, но естественные цвета).
Детализация: Высокая детализация меха лиса, текстур мха, коры деревьев и древнего камня.
Освещение и эффекты: Волшебное, кинематографическое освещение. Эффект золотой волны и портала — объемный, с частицами, с мягким свечением и бликами.
Ракурс: Камера движется за лисом на одном уровне, создавая эффект присутствия и вовлеченности.
1 Кадр для видео:![]()
Наш результат:
- Ну другой уровень, согласны? В этом примере понятно, насколько важен правильный подход к генерации.
Советы для более качественной генерации видео:
1. Переводить промпт на английским самостоятельно: зачастую, хорошо переведенный промпт уже на английский язык лучше дает результат.
2. Формат первого и последнего кадра видео: если нет конкретной картинки для реализации видео, лучше сгенерировать ее изначально в модели GPT Image 1.5 или Nano banana pro. Так у вас будет больше шансов в конечном итоге получить желаемое.
3. 7 раз проверь - 1 раз сгенерируй: важно подходить ответственно к написанию промпта для экономии средств и ваших нервов. Проверяйте промпт перед генерацией, чтобы избежать неудачных исходов.
4. Помощь в написании промпта: просите помощи в написании промпта у нейросетей deepseek или gemini. Если в голове нет четкого понимания исходного видео - нейросеть может помочь понять, что вы хотите. Но даже в таком случае, промпт нужно проверить самому и исправить неточности.
5. Загрузка начального кадра: модели хорошо относятся к четким задачам, поэтому рекомендуем загрузить начальный кадр видео(картинку) и конечный кадр видео(картинку). Их так же можно сгенерировать самостоятельно с помощью моделей для фото (nana banana, её версия "pro", GPT Image 1.5, Seedream 4.5 и д.р.)
6. Выбор в цене и качестве моделей: для более простых видео, базовых оживлений - выбирайте более бюджетную версию моделей, а для коммерческих целей, форматах, где важно качество - выбирайте модели более дорогого формата.
7. Видеокарточка продукта: если вы делаете видеокарточку для своего продукта, прописывайте в референсе, чтобы продукт на видео совпадал на 100% с референсом. И загружайте его фото без лишних деталей.
8. Дополнительные настройки: не пренебрегайте дополнительными настройками при генерации. Зачастую они могут сыграть важную роль при генерации.
Главный секрет — в практике. Тестируйте разные подходы, запоминайте удачные комбинации, и скоро вы сможете создавать именно то видео, что задумали, с первой же попытки.
Все видео были сгенерированы на платформе Холст.ИИ
