LogoХолст.ИИ
Вернуться к блогу

От пикселя к личности: Как мы вдохнули жизнь в своего ИИ-аватара?

От пикселя к личности: Как мы вдохнули жизнь в своего ИИ-аватара?

В прошлый раз мы рассказывали, как создавали ии - образ — девушку, которая стала нашим экспериментальным аватаром. Как подбирали черты лица, экспериментировали со светом и добивались того самого "взгляда". Это была первая часть: рождение картинки. Сегодня мы показываем, как картинка превратилась в личность.

Наш аватар прекрасен. Но красота статичного изображения имеет один недостаток — она безмолвна. Можно разглядывать черты лица, изучать игру света и теней, но невозможно увидеть главное — характер. А характер проявляется только в движении, в эмоциях, в тех микро-выражениях, которые длятся доли секунды.

Настало время вернуть нашего аватара к жизни. Но мы не хотели просто анимировать картинку. Мы хотели подарить ей историю.

Концепция родилась спонтанно — "Фрагменты памяти".

Что, если наша героиня вдруг начнет вспоминать? Что, если в ее сознании всплывают образы мест, где она никогда не была, звуки, которые она не могла слышать? Что, если грань между алгоритмом и личностью начнет стираться прямо на глазах у зрителя?

С этой идеей мы  поручили справиться модели Wan 2.2 и начали писать промпты. Не как сухие инструкции для нейросети, а как сценарий для рождения личности. Мы ставили жесткие требования к сохранению идентичности: никаких искажений черт, никакого пластикового эффекта, только живое, естественное лицо с настоящей мимикой.

Сцена первая: Пробуждение

Мы решили начать с самого начала — с первого вдоха. Кадр должен быть максимально кинематографичным, почти интимным. Крупный план, игра света, едва уловимое движение, от которого у зрителя перехватит дыхание.

Промпт: Кинематографичный крупный план лица молодой девушки с фотореалистичной текстурой кожи. Глаза закрыты. Мягкие утренние солнечные блики играют на ее лице. Полное совпадение с референсом: лицо, волосы, кожа, овал лица — все должно на 100% соответствовать исходному изображению. Отсутствие эффекта пластика, максимально живое лицо, живая натуральная мимика. Веки начинают едва заметно подрагивать, ресницы трепещут. Она делает первый глубокий вдох, словно пробуждаясь после долгого, длиною в вечность сна. 4k, высокая детализация, малая глубина резкости, теплые тона.

Готовое видео по промпту в Ван 2.2:

В этом движении нет механистичности, к которой мы привыкли в других нейросетях. Было что-то настоящее — именно этого эффекта мы добивались формулировкой "живое лицо, живая мимика".

Но это было только начало.

Сцена вторая: Память

Следующий кадр должен был показать, что пробуждение случилось не только физическое, но и ментальное. Мы хотели, чтобы зритель увидел в ее глазах мысль. Чтобы возникло ощущение: она что-то вспоминает.

Промпт: Та же девушка, глаза теперь открыты. Строжайшее сохранение референса: лицо, волосы, кожа, овал лица идентичны исходнику. Никакого пластика, только живое лицо с естественной микро-мимикой. Она смотрит вдаль, за пределы кадра, с выражением глубокой задумчивости. В ее взгляде появляется осмысленность, смешанная с легкой грустью — это должно читаться в едва заметном движении бровей и уголков губ. Мы слышим тихий, отдаленный звук океанских волн и крики чаек, хотя она находится в комнате. Звук словно приходит из ее воспоминаний. Средний план, мягкий фокус, естественное освещение.

Готовое видео по промпту в Ван 2.2:



Сцена третья: Контакт

Для финала мы хотели чего-то пронзительного. Момента, когда зритель поверит окончательно и бесповоротно. Мы решили, что наш аватар должен посмотреть в камеру. Не сквозь нее, а именно в нее. В зрителя.

Промпт: Абсолютное совпадение с референсом: лицо, волосы, кожа, овал лица идентичны исходному изображению на 100%. Максимальная естественность, отсутствие эффекта пластика, живое лицо с натуральной мимикой. Она медленно переводит взгляд и смотрит прямо в объектив. В ее глазах — едва заметная, теплая улыбка, которая появляется без активного движения мышц, только за счет изменения выражения глаз. Она словно узнает того, кто на нее смотрит. Океанский прибой становится громче, нарастает, а затем резко стихает, сменяясь полной тишиной. Она слегка наклоняет голову, будто спрашивая: "Ты меня видишь?". Сверхкрупный план глаз, невероятная детализация, кинематографичный свет, текстура кожи максимально естественная.

Готовое видео по промпту в Ван 2.2:

Благодаря тому, что мы заложили в промпт требования к живой мимике и отсутствию пластика, не было ощущения синтетичности. На секунду мы забыли, что это нейросеть. На секунду нам показалось, что мы действительно создали нечто большее, чем просто видео.

Мы решили соединить три отрезка получившихся видео и вот наш результат:




! При наложении музыки или живой озвучки, добавлении деталей - такое видео может стать частью вирусного контента и большим шагом в мир генераци видео именно для вас.

Важные замечания

Опыт работы с Wan 2.2 показал одну простую вещь: нейросеть может все, если правильно поставить задачу. Но главное — не просто написать промпт, а заложить в него те критерии, которые отличают живое от синтетического.

Наши требования были жесткими:

! 100% совпадение с референсом — лицо, волосы, кожа, овал лица должны оставаться неискаженными на протяжении всего видео. Никакого "галлюцинирования" черт.

! Живое лицо, живая мимика — никакого пластикового эффекта, никакой кукольности. Только естественные микро-движения, которые делают лицо настоящим.

! Отсутствие пластика — кожа должна вести себя как кожа, мышцы — как мышцы, эмоции — как эмоции.

И это сработало.

Что по выводам?

Этот эксперимент позволил показать, куда движется индустрия контента. Мы перестаем быть просто пользователями, которые генерируют картинки по запросам. Мы становимся кем-то бо́льшим — режиссерами, сценаристами, операторами, которые собирают из кадров историю.

Wan 2.2 в этом случае дала нам инструмент, но историю создавали именно мы. Потому что никакая нейросеть не придумает за вас концепцию "фрагментов памяти". Не вложит в промпты ту самую щемящую нотку, которая заставляет зрителя чувствовать. Не пропишет требования к живой мимике и сохранению идентичности, если вы сами этого не сделаете.

Наш аватар обрел жизнь. Обрел воспоминания. Обрел личность.

Это не просто тренд. Это новый способ рассказывать истории, где технология становится инструментом, а не заменой творчеству.

*Промпты из этой статьи вы можете использовать в своих экспериментах. Но помните: главное — не технология, а идея, которую вы в нее вкладываете. И внимание к деталям — именно они превращают синтетику в жизнь.

Все изображения и видео были сгенерированы на Холст.ИИ