Съёмки без камеры: риски создания видеоконтента с помощью ИИ

Автор фото: Frame stock footage/Shutterstock/FOTODOM

Нейросети генерируют видеоконтент всё лучше, позволяя бизнесу экономить на производстве рекламы. Но заменить дизайнеров всё ещё не способны.

Популярный сервис веб–дизайна Figma выпустил из бета–доступа свой ИИ, который позволяет создавать целые дизайн–концепты с нуля.
А компания OpenAI, создавшая ChatGPT, в конце сентября открыла доступ к своему сервису генерации ИИ–видео Sora 2.
Однако массовая замена художников и видеографов на ИИ пока что остаётся страшилкой, а не реальной угрозой.
Основными преимуществами ИИ–сервисов являются скорость и эффективность создания готовых видео. Даже для короткого рекламного ролика в соцсети вам нужно нанять оператора, найти или снять локацию, актёров, а после ещё и решить вопрос с монтажом. Это всё могут заменить несколько предложений промпта для нейросети. Правки вносить, кстати, можно в любую минуту, в отличие от уже отснятого материала с реальными актёрами.
Автор telegram–канала "tamers X нейрохакатон" Кирилл Песков уверен, что сгенерированные видео будут развиваться во всех направлениях: от коротких видео и рекламных роликов до трёхчасовых фильмов.
Финансовая сторона тоже выглядит привлекательно: подписка на Sora 2 или Kling (ещё один сервис для создания видео) стоит до 5 тыс. рублей в месяц, в зависимости от тарифа. Для создания ролика "руками" понадобится как минимум та же сумма, а как максимум — несколько сотен тысяч рублей.
Поэтому резонно предположить, что прямо сейчас каждый второй предприниматель вовсю генерирует свою ИИ–рекламу. Но не всё так гладко с технологической точки зрения. К примеру, для написания сценария роликов и раскадровок, по оценке Пескова, в среднем в 90% случаев создателям помогают нейросети — это эффективно и экономит время. А вот непосредственно при съёмках объём генерируемого контента редко превышает 10–15%.
Вокруг генеративного ИИ сегодня больше энтузиазма, чем зрелого промышленного применения. Развитие идёт неравномерно и спорадически: исследовательские команды пробуют разные подходы, качество скачет, заранее предсказать результат нельзя.
Даже большие инвестиции не гарантируют нужный исход. Вложив миллионы, можно получить модель, которая стабильно генерирует, скажем, только животных, а на людях даёт сбои. Поэтому компании выбирают гибридный путь — берут рабочие элементы ИИ и встраивают их в существующие процессы. А критические этапы производства по–прежнему закрывают классическими инструментами.

Проблемы с кириллицей

Сильная сторона генеративных моделей — масштаб данных, на которых они обучены, и скорость работы.
Они стабильно имитируют распространённые паттерны. Поэтому массовые сюжеты, особенно человеческие лица и фигуры, воспроизводятся убедительнее всего из–за избытка данных (кино, стоковые сервисы, соцсети). Всё, что часто встречается, воспроизводится нейросетями реалистично.
А вот с редкими объектами, фирменными стилями, нестандартными сценами или идеями ИИ справляется хуже и нестабильнее. Отсюда происходит дисбаланс: нейросети способны радикально ускорять производство контента, но они хронически слабы в специализированных или узких задачах.
В случае с Россией есть дополнительные нюансы. Например, видеогенераторы банально хуже справляются с кириллицей и русской речью. Впрочем, как и с большинством языков, за исключением английского.
По мнению Пескова, в будущем стоит ждать роста количества фирм, которые будут заниматься продажей дата–сетов — специально собранных объёмов данных для специализированных задач. К примеру, подборка вывесок на кириллице. На них и будут обучать видеосервисы.

По законам прерии

Помимо технологических затруднений сильное влияние на темпы внедрения генеративного ИИ оказывает юридическая сторона. По оценке исследователей НИУ ВШЭ, накопительный ущерб правообладателей от использования ИИ уже в этом году достигнет 1 трлн рублей.
"Основные риски создания контента с помощью ИИ связаны с нарушением интеллектуальных прав других лиц. Суд не будет волновать, что вы пользовались нейросетью. Это всего лишь инструмент, а юридическую ответственность всё равно несёте вы лично", — предупреждает основатель юридического бутика "Достигация" Артём Баранов.
Он приводит в пример случай, когда его клиент загрузил в нейросеть логотип конкурента как референс и попросил изменить его под свои нужды. Модель переставила элементы, изменила палитру и композицию, но результат остался узнаваемым. Несмотря на это, клиент решил, что формально это уже другой логотип, ввёл его в оборот и в итоге получил претензию с требованием компенсации.
Песков сравнивает нынешний рынок генеративного контента с Диким Западом: отсутствие правовой базы и абсолютное игнорирование любых авторских прав нейросетями, спокойно использующими сюжеты, стиль или персонажей известных анимационных студий.
А на Диком Западе, отмечает Песков, побеждает тот, кто достал пистолет. То есть начал создавать прямо здесь и сейчас, не дожидаясь правовой базы. Тем не менее его прогноз весьма оптимистичен.
"Я подозреваю, что в будущем в целом изменится правовая система и подход к авторскому праву. Например, будут введены какие–то автоотчисления создателю. К примеру, каждый раз, когда используется что–либо из моего произведения, я буду получать отчисления. За этим тоже смогут следить нейронки. И за каждый оммаж к произведению художник–создатель получал бы свои 10 копеек. Это действительно мог бы быть самый честный подход", — рассуждает он.
Артём Баранов напоминает, что технический прогресс всегда идёт впереди норм права.
"Так было со всеми трендами. Закон калибруют под социальный прогресс только спустя какое–то время", — подчёркивает он. Тем не менее у законодателей есть время разобраться с прецедентами и создать законодательную практику: развитие генеративного ИИ только набирает обороты.
На нашем сайте используются cookie-файлы. Продолжая пользоваться данным сайтом, вы подтверждаете свое согласие на использование файлов cookie в соответствии с настоящим уведомлением и Политикой о конфиденциальности.