Для генерации изображений, в том числе создание реалистичных изображений на основе рендеров, мы используем:
1. Nano Banana 2 (Google) - платно, в 50%.
2. GPT Image 2.0 (встроено в GPT Chat) - платно, в 50% решений.
2. GPT Image 2.0 (встроено в GPT Chat) - платно, в 50% решений.
Это устойчивые лидеры, позволяющие работать с исправлением деталей, ресайзить, менять формат, генерировать другие ракурсы на основе существующих, создавать изображения из схематичных эскизов, видеть и понимать пометки маркером. Общение с ними похоже на то, как если бы вы стояли за спиной дизайнера и под руку просили его сделать правки, а он смиренно слушал весь поток сознания. Конечно, нейросети иногда ловят глюк и, словно бастуя, генерируют полный бред – например, уже почти добившись финального изображения могут заменить его на рисунок, или сгенерировать что-то "левое", подтащив историю из ваших старых чатов. Словно "я устала, больше не могу". Помогает запуск новой ветки чата или отложить задачу на другой день.
На данный момент GPT Image немного лучше и с меньшим количеством шагов справляется с задачей фотореалистичности и внедрением заданного персонажа в заданный фон (когда важно сохранение определенных деталей), чем Nano Banana 2. Но потому, что обновление более свежее в сравнении с конкурентом.
Для того, чтобы написать хороший промт для генерации, мы также обращаемся к нейросетям. Которые уже буквально научились догадываться, что вы имели в виду, чтоб технически описать необходимую сцену понятным для модели языком. Если вы готовите цикл изображений или видео с одним персонажем и/или локацией, то сперва создайте "студийное" изображение с 4 сторон, один-два портретных изображения, а также описание "героя" (паспорт персонажа в формате json). Подгружая затем эти данные вместе с промтом, вы будете добиваться лучшего соответствия изображений от сцены к сцене.
Подготовка промта для создания видео (чаще всего мы все ещё просим, чтобы промт был на английском языке, когда видим много ошибок в результате):
1. ChatGPT - в 50%
2. Cloud - в 40% (начинаем с него, как кончается пакет, переходим в ChatGPT)
3. Gemini - в 10%
2. Cloud - в 40% (начинаем с него, как кончается пакет, переходим в ChatGPT)
3. Gemini - в 10%
Промптинг стал отдельным навыком, в совершенствовании которого, кажется не остановиться. Часто приходится излагать AI задачу подробно, чтоб добиться результата, и при этом не перегрузить описанием, не сболтнуть лишнего, за которое AI зацепится и станет строить сцену вокруг этой второстепенной детали.
Удачные решения (промты) лучше сохранять. Периодически добавляя к ним актуальную информацию и улучшения.
Следует помнить, что, поручая AI одну и ту же задачу несколько раз, вы можете получать каждый раз немного новый результат. Особенно если работаете в разных интерфейсах, которые позволяют делать настройки и вариативность генерации.
Поэтому не надейтесь, что благодаря AI вы будете работать меньше, скорее у вас добавятся новые навыки и станете ещё более занятыми. Но есть важное преимущество, которое мы получили вместе с AI – возможность получить новый навык и знание быстрее и буквально сразу. Без обучения. Когда вам требуется выполнить новую задачу с помощью AI, то самое полезное – спросить саму нейронку, как ее решить, какая информация нужна, сколько потребуется времени, какие инструменты понадобятся и как с ними работать.

