Первый опыт
Семь лет назад интернет взорвало приложение Prisma, позволяющее переносить стиль одного изображение на другое. Соцсети тут же заполнили портреты в стиле Ван Гога и Пикассо, которые создавали обычные пользователи. С выходом Midjourney появился простой и понятный инструмент для генерации изображений, доступный человеку без знания программирования. Было интересно, как его можно использовать в работе.
Мы решили протестировать нейросеть на SMM-контенте. Так появился эксперимент «Месяц контента, сделанного с помощью нейросетей», о котором писали здесь, и специализированное ПО Stable Diffusion на наших компьютерах. В отличие от Midjourney, у которой есть цензура и узнаваемый стиль изображений, нейросеть Stable Diffusion можно обучать на основе заданных картинок-рефов.
Первый опыт, который удивил результатом, — генерация картинки с девушкой-маскотом для поста о бразильском фестивале. Чтобы нарисовать ее костюм с перьями в 3D, пришлось бы потратить несколько часов. Не очень рациональная трата ресурсов. Решили использовать для этого нейросеть.
Нейросеть обучили на 3D-картинках с маскотом, загрузив их в качестве рефов. Так появилась первая модель стиля, дублирующая цвета, обработку, мимику персонажа во всех сгенерированных изображениях.
Следующий этап — текстовое описание или промт. Вот как промт для бразильской девушки-маскота выглядел в переводе:
«Длиннофокусное мультяшное 3D unreal engine экстерьерное фото полуголой прекрасной молодой женщины с разведенными в стороны руками с длинными волосами, одетой в цветастый бразильский карнавальный костюм с кучей перьев. Полуобнаженная грудь, карнавальное окружение на фоне, расслабляющий солнечный свет. Негативный: мужчина»
Получить желаемое изображение с первого раза не получилось. И это нормально, так как нейросеть — робот, у нее нет понятия красоты. Мы меняли промт каждый раз, пока картинка не стала удовлетворять ожиданиям. Лучшие версии сложили в фотошопе, как мозаику: из одной картинки взяли руку, из другой — глаза. Глядя на итоговое изображение, простой обыватель никогда бы не догадался, что перед ним — проект нейросети.
Меняем расу моделей
Мы поняли, что работая с моделями стилей Stable Diffusion, можно получать качественные изображения в заданной стилистике. Стали думать, как еще можно использовать новые возможности. Как раз выпустили новую линейку рекламных макетов, которую нужно было адаптировать для Кейптауна. Требовались африканские модели. Их практически нереально найти на Урале, где работают наши фотографы.
У нас был опыт работы с местными фотографами, когда требовались модели в Иране и Индонезии, который не принес желаемого результата. Был опыт командировок штатных фотографов, что было слишком затратно. А в стоковых фото мы не находили нужного ракурса и типажа. Решение было нестандартным — поменять расу европейских моделей с помощью нейросети.
В качестве рефов взяли уже отснятые для России фото. Затемнили их кожу, чтобы нейросети легче было превратить их в африканцев. После доработки результатов в фотошопе получили нужные типажи, стоящие в точно такой же позе. По такой же схеме действовали, когда нужно было адаптировать рекламную линейку для Индии.
Еще одна задача была связана с рекламой для Малайзии. Нужны были изображения пожилого мужчины за рулем в определенном ракурсе. ИИ обучили прямо на фотографиях штатного фотографа «Бункермедиа».
В очередную модель нейросети загрузили рефы с текстовым описанием, содержащим ключевые детали каждого фото. Так искусственный интеллект понимал, откуда взять нужный ракурс, резкость кадра, позу модели, части гардероба и обработку фотографии в целом. Сгенерировали изображение, которое повторяет стилистику и органично вписывается в фирменную линейку. Вот что получилось.
Получаем фуд-фото без продукта
Очередная задача, требующая нестандартного решения, появилась, когда мы искали изображения популярных местных блюд для рекламы доставки еды в Индонезии и Малайзии. На стоках подходящих вариантов не было, а сфотографировать «живое» блюдо оказалось нереально. Мало того, что некоторых ингредиентов в России просто нет, его еще нужно правильно приготовить.
Сгенерированная в Midjourney картинка была неаппетитной и в узнаваемой стилистике этого сервиса. Поэтому она стала рефом для Stable Diffusion, которая прекрасно справилась с задачей и нарисовала реалистичное, рецептурно точное изображение в большом разрешении. Например, так выглядит традиционная филиппинская лапша.
Вносим правки без иллюстратора
Помог ИИ и в замене отдельных частей изображений. Например, для рекламы в Индонезии дизайнер нарисовал иллюстрацию в стиле аниме: герои сидели на байке и держали шлемы в руках. При согласовании попросили внести изменения. Картинка не соответствовала требованиям безопасности, шлемы должны быть надеты на людей. Чтобы сэкономить время и ресурсы сотрудника, перерисовать макет попросили нейросеть. Для этого выделили нужный участок изображения и описали, что требуется сделать. Получилось отлично.
Согласитесь, отличный способ снять с сотрудника рутинные задачи, вроде внесения в макет мелких изменений, и освободить время для креатива.
Инструмент не заменит идею
Казалось бы, искусственный интеллект скоро вытеснит живых сотрудников: дизайнеров, фотографов, копирайтеров… Но на деле это не так. Нейросеть — это, в первую очередь, инструмент, который сам по себе не может ничего. Так же как фотоаппарат без фотографа или кисти без иллюстратора. ИИ не придумает сюжет или картинку, у него нет насмотренности, чувства стиля, знаний трендов и понимания потребностей аудитории. Но он может существенно облегчить исполнение рутинных задач и помочь в нестандартных ситуациях.
Вот, что думает по этому поводу Дмитрий Скоков, креативный директор коммуникационной группы.
Дизайн — это не про знание программ и умение рисовать. Это про мышление и умение видеть результат, который решит поставленную маркетинговую задачу. Это про психологию и понимание, как люди воспринимают рекламу. Можно купить инструменты плотника, но плотником ты от этого не станешь. Можно научиться генерировать картинки в простых браузерных сервисах, но это не сделает тебя дизайнером или фотографом.
Открытость инструментов ИИ располагает к экспериментам, и некоторые непрофильные сотрудники могут пытаться применить полученный сомнительный результат. Но надо понимать различия и важное условие применения ИИ в профессиональной среде: изначально рекламный макет разработан дизайнерами, он прошел тестирование на аудитории, то есть выбран из нескольких путем анализа эффективности после тестовых показов. Инструменты нейросети применяются к заведомо правильному рекламному макету и служат для упрощения его адаптации к переменным.
Мы считаем, что прямо на наших глазах формируется новая профессия в дизайне — оператор искусственного интеллекта. Это позволит перераспределить ресурсы сотрудников: переложить рутинные задачи на ИИ, освободить время для креатива и экспериментов. Фотограф будет готовить базу рефов, оператор — генерировать картинки в нужном стиле. Дизайнер будет разрабатывать макет, оператор — тиражировать его с помощью нейросети.
Как еще можно использовать нейросети в креативный сфере, покажет время. Сейчас возможность применить инструмент рассматривается, исходя из существующей задачи. Но уже понятно, что ИИ можно использовать для адаптации, макетирования, формирования технического задания, подборки речевых оборотов при написании текста.
Развиваются нейросети для создания видео, но картинка, полученная лишь по текстовому описанию, пока неприемлема по качеству. Возможно, еще лет через пять искусственный интеллект будет помогать и в создании видеоконтента с нуля. Совершенно точно ясно одно: никакой робот не сможет заменить профессионала.