В последние несколько лет мы наблюдаем стремительный рост возможностей нейросетей в области генерации изображений и видео. Одна из самых свежих разработок в этом направлении – PixVerse, нейросеть-генератор видео, способная создать 4-секундные ролики на основе текста или изображения. Мы решили протестировать ее возможности в оживлении памятников Йошкар-Олы.
Оживают знакомые образы
Стоит только правильно сформулировать запрос (промпт) в этой нейросети, как привычные памятники начинают двигаться. Любопытный факт: результаты генерации на разных языках могут отличаться: PixVerse гораздо лучше понимает запросы на английском и генерирует более точные и качественные ролики. Например, можно наблюдать, как Грейс Келли целует принца Монако Ренье III прямо перед загсом в Йошкар-Оле.

Оживает и сцена из русской классики: Онегин «помогает» Пушкину писать строки величайшего романа «Евгений Онегин».

А вот Йыван Кырля приветствует вас на железнодорожном вокзале. Смотрите, как он радостно машет вам рукой!
Внимание привлекает советский памятник «Мать и дитя», расположенный на улице Карла Маркса в Йошкар-Оле. Генерация заставляет статую «двигаться», и кажется, что красавица-мама, уже более 60 лет крепко держащая ребенка, мягко опускает его на землю. Это не монтаж, а тоже результат работы нейросети.

Композиция «Древо жизни» в Центральном парке культуры и отдыха с помощью PixVerse внезапно приходит в движение – музыкант начинает задорно играть на гуслях.

Но не только памятники оживают: неподвижный Йошкин кот теперь гладит девочку лапкой и сладко мурлычет. Эти сцены удивляют своей плавностью движений. Правда, нейросеть добавила образ настоящего «пушистика», меняя ракурс бронзового «брата».

Как происходит процесс генерации
PixVerse позволяет создавать 4-секундные видео на основе текстовых запросов и изображений. Принцип работы очень прост: пользователь загружает картинку, прописывает текстовый запрос или выбирает из предложенных вариантов, а нейросеть генерирует соответствующий ролик. Несмотря на небольшую длительность видео, результат впечатляет.

Кстати, после регистрации на платформе пользователю предоставляется начальный бонус в 90 «кредитов», по 30 из которых списываются на каждую генерацию. Далее «кредиты» обновляются ежедневно, предоставляя доступ лишь к двум бесплатным генерациям в день. Дополнительные функции и больше генераций – за деньги.
«Наш» ответ
Хотя PixVerse выглядит многообещающе, отмечу, что на отечественном рынке также есть несколько интересных проектов – FusionBrain и нейросеть от «Яндекса» – «Шедеврум». Эти нейросети работают с изображениями и видео, но пока не предлагают функции оживления уже существующих фотографий. Только сгенерированных по вашему запросу.
Для теста я попросила FusionBrain и «Шедеврум» создать памятник Александру Пушкину на монохромном зеленом фоне с высоким разрешением 8K. Для чистоты эксперимента – промпт один и тот же. Столь знаковая личность должна быть отлично известна любой нейросети, а тем более российской, подумалось мне. Однако FusionBrain за 4 минуты создал изображение мужчины... который, увы, совершенно не похож на Пушкина. Образ напомнил, скорее, немецкого композитора Людвига ван Бетховена.

Результат FusionBrain.
В свою очередь, «Шедеврум» за минуту проделал аналогичную «непохожую» работу, но с более качественной детализацией и предложил два ракурса в своей бета-версии. Есть заломы на одежде, с пропорциями тоже порядок. Но – не похож на Александра Сергеевича. Невозможно не заметить этот факт.

Результат «Шедеврум».
Тем не менее, ни одна из этих нейросетей не смогла оживить памятники так, как это сделала PixVerse.
Смотрите сами:
| FusionBrain | «Шедеврум» |
|---|---|
|
|
Что выбрать?
Каждая из нейросетей – будь то PixVerse, FusionBrain или «Шедеврум» – имеет свои сильные стороны. Первая удивляет довольно быстрым оживлением, что делает ее хорошим выбором для тех, кто хочет вдохнуть жизнь в статичные изображения.
Преимущества «Шедеврум» и FusionBrain – в их способности создавать более детализированные изображения, однако они не могут предложить анимацию и тем более создание видео из уже существующих фото. Пожалуй, пока не могут. Однако стоит отметить, что эти нейросети разработаны отечественными командами, что гарантирует стабильный доступ без блокировок и VPN. Кроме того, они дают более щедрое число бесплатных генераций изображений и видео, да еще и без водяных знаков, которые часто в зарубежных сервисах можно убрать лишь при покупке платного аккаунта.
Выбирайте сами, что вам ближе. Пробуйте!
Изображения сгенерированы на основе фотографий Ивана Речкина и Михаила Скобелева/ИА «Марий Эл», а также Петра Васильева. Все оживленные образы вымышлены и являются творческой фантазией автора.
- Недавно Всероссийский центр изучения общественного мнения (ВЦИОМ) совместно с АНО «Национальные приоритеты» представляют результаты мониторингового исследования об общественном восприятии технологий искусственного интеллекта. О технологиях искусственного интеллекта в той или иной степени знает и молодежь, и старшее поколение (91 - 96%). Вопрос лишь в качестве этого знания. Чем моложе респондент, тем лучше он разбирается в теме («слышали, смогут объяснить» - 74 % в группе 18-24-летних, 67 % среди 25-34-летних, 57 % среди 35-44-летних); россияне в возрасте 45 лет и старше, напротив, чаще декларируют поверхностное знание (51 - 59%). Где встречается ИИ – читайте в материале.






