1. Лидером кинематографичности считаем Veo (от Google) –
его используем
платно и в 60% случаев.
Лайфхак – есть возможность в рамках той же подписки делать 3 генерации/сутки непосредственно в панели Gemini, уже потом переходя в панель Flow, где списываются токены за каждую генерацию. Flow
сейчас представляет собой неплохой режиссёрский пульт – вы можете сперва создать персонажей, их описание, даже голос и несколько ракурсов для сюжета. Затем собрать длинный видеоролик осуществляя
последовательно (буквально доращивая) генерации с развитием сюжета и персонажей в нем.
2. Если Veo не даёт нужного результата, то в 30% случаев переходим в SeeDance (от ByteDance/TikTok). Бесплатно и результативно пользоваться возможности почти нет. Работаем в их родном мультимодельном
интерфейсе. Токены тратятся быстро, экономичнее покупать сразу большим пакетом. Озвучкой видео часто мы недовольны. Тут пригодятся неудачные генерации выполненные в Veo - там берём аудиодорожку и в
монтажной программе добавляем к удачному видео SeeDance. Приходится повозиться, чтоб совместить речь с артикуляцией персонажей, но часто это самый быстрый способ справиться с задачей. Если
необходимо больше текста в озвучке, его дополнительно генерируем в Eleven - пока равных ей нейронок нет, даже с учётом ограниченного выбора русских голосов. Отметим, что SeeDance очень круто прокачали,
чтобы делать ролики зрелищными – пролеты камер, динамическая смены ракурсов и планов – это можно сразу сделать в одной генерации набросав маркером схему движения камеры на картинке и загрузить
вместе с промтом. В условиях, когда поднять коптер для облета объекта нет возможности, мы закрываем эту задачу с помощью хороших фото с соседних зданий и обработки в SeeDance.
3. Kling AI – платно во всех прочих случаях. Генерирует менее кинематографично, чем Veo и чем SeeDance. Но есть классные встроенные опции, как, например Motion Control, с помощью можно быстро скопировать
движения одного персонажа на другого.
ВАЖНО! Сильная сторона китайских моделей, которые могут немного проигрывать Veo в кинематографичности – они значительно лучше держат образы, не ломают геометрию, сохраняют детали и
форму объекта за счёт как раз именно того, что не обладают сравнимой мощностью для построения сложных кадров и не готовы сильно фантазировать, дорисовывать картинку в динамике.
Далее вступает в работу монтаж. Сергей Эйзенштейн считал монтаж "основой киноязыка и главным инструментом создания смысла и эмоций в фильме, превращающим набор кадров в диалектический
процесс столкновения и синтеза". И проводил столько времени в монтажной, что иногда терял зрение. Хорошо подобранная музыка к ролику - это его ритм и динамика, камертон. При этом она тоже имеет свой
тайминг и структуру, что может усложнять финальный монтаж видео.
На создание итогового ролика длинной 20 секунд требуется 4-5 сцен. Или кадров, если ролик обыгрывает одну сцену, но с разных ракурсов. А это значит примерно 40-50 генераций. Случается, что достаточно
одной, а случается и 20 не реализуют задуманного в сцене. И приходится дробить на более короткие кадры, менять сценарный план. Можно в итоге вообще не получить результата и все начать заново от
идеи, например, из-за проблем с последним кадром. Порой кажется, что снять было бы быстрее. Но снять можно тоже не все, а особенно фантазийное, затратное по гриму, костюмам, декорациям.
И нейронки - это решение.

