Мы продолжаем делиться с вами публикациями на тему нейросетей и их возможностей. Недавно мы рассказывали о ChatGPT и о том, почему это отличный помощник для всех, кто работает с текстом (и не только). А сегодня поговорим об изображениях!
Как и прежде, мы на реальных примерах посмотрим, насколько качественными и релевантными будут полученные результаты. И, конечно же, поделимся своим алгоритмом действий. Покажем, на что способна современная нейросеть, а с чем она пока не может справиться.
Небольшое предисловие
Google любит уникальный контент — это факт. Но, когда мы говорим об уникальности, обычно речь идет именно о текстах. Изображения очень часто остаются без должного внимания. Но они тоже играют роль в ранжировании. Условно говоря, из двух идентичных сайтов выше в поисковой выдаче будет тот, который использует оригинальные изображения.
Вариантов получения таких картинок несколько: покупка на фотостоках (необязательно гарантирует уникальность, так как другие тоже могут использовать те же изображения), создание самостоятельно, найм фотографа, дизайнера или другого специалиста, который будет работать над графической составляющей вашего контента. И вот недавно стал стремительно набирать обороты еще один способ — генерация изображений при помощи нейросетей.
Список популярных нейросетей для генерации изображений
Вообще существуют десятки функциональных платформ, способных генерировать вполне удобоваримые картинки, основываясь на описаниях (промптах). Есть даже те, которые могут «перерисовать» ваш простой эскиз и создать из него настоящее произведение искусства. Мы можем назвать несколько наиболее популярных:
Многие нейросети генерируют изображения в облаке. И это для большинства приоритетный вариант, потому как работа нейросети требует больших вычислительных мощностей. Создание картинки 512×512 пикселей может оказаться крайне трудоемкой задачей даже для относительно новых и довольно мощных компьютеров. Рекомендуется использовать устройства macOS с чипами М1 или М2, которые как раз таки неплохо справляются с подобными задачами.
Отсюда следует совет: если у вас нет высокопроизводительного компьютера, используйте облачные нейросети. Иначе придется тратить по 10-20 минут на генерацию даже маленького изображения. Вряд ли этот процесс принесет вам удовольствие.
Но давайте все-таки от теории переходить к практике!
Генерируем изображения при помощи Midjourney
Мы выбрали именно эту нейросеть по трем причинам:
- Midjourney — по праву одна из передовых технологий на данный момент.
- Нейросеть действительно хорошо «понимает», что от нее хотят.
- С ней можно генерировать до 15 изображений бесплатно, а находчивые пользователи наверняка найдут способ это ограничение обойти.
Единственное, что делает использование данной нейросети несколько неудобным, — необходимость регистрироваться в Discord, чтобы взаимодействовать с ботом Midjourney и отправлять ему запросы/промпты. Это несложно, но требует от вас немного времени.
Мы не будем расписывать процесс регистрации и подключения бота нейросети, так как в интернете этой информации просто масса. Вы найдете ее без особых усилий. Перейдем сразу к делу!
Как сделать запрос в Midjourney для генерации изображений
Тут все просто. В чате Discord после подключения бота Midjourney достаточно ввести /imagine и ваш запрос — что именно должна сгенерировать нейросеть.
Промпт должен быть на английском языке!
Начнем с простого! Допустим, мы пишем текст о продвижении сайтов и нам нужно изображение мужчины в костюме, сидящего за компьютером в офисе. Собственно, такой запрос мы и вводим в текстовое поле:
Нажимаем Enter и получаем несколько вариантов:
Обратите внимание! По умолчанию Midjourney генерирует сразу четыре варианта картинки ОДНИМ изображением и с соотношением сторон 1:1. Но это можно изменить. Подробности — далее.
Согласитесь, получилось вполне неплохо. Но!
Лично у нас сразу возникают два пожелания:
- Мы хотим, чтобы изображения были более реалистичными, а не рисованными.
- Нам нужно получить картинку с соотношением сторон не 1:1, а 16:9.
- Мужчину не помешало бы омолодить.
И да, все это можно сделать!
Но нам придется несколько расширить и усложнить наш запрос:
На этом моменте рекомендуем остановиться и прочесть наш промпт внимательнее, чтобы понять, что именно мы там обозначили. Мы не просто попросили Midjourney добавить реализма, но и написали, что это должна быть имитация фото с конкретными настройками фотокамеры, с цветокоррекцией и в высоком разрешении.
Вот такой результат мы получили:
Как видите, разница по сравнению с прошлым вариантом просто колоссальная!
Вы можете использовать наш промпт, а можете изменить его по своему усмотрению. Например, превратить мужчину в женщину, состарить или омолодить персонажа, переодеть, заставить улыбаться и многое-многое другое. Тут все ограничивается лишь вашей фантазией.
Кстати, вернитесь к скриншоту нашего промпта выше и обратите внимание на короткие заметки в самом конце. 8k — это не параметр, а подсказка для нейросети, что изображение должно быть в высоком разрешении. А вот с остальными не так очевидно:
- --ar 16:9 — соотношение сторон;
- --q 2 — качество изображения (от 0,25 до 2);
- --v 4 — версия Midjourney.
Есть и другие полезные параметры:
- --hd — генерация изображения в высоком разрешении;
- --w — ширина;
- --h — высота;
- :: — приоритетность слов в промпте (например, full body::10 man::1).
Но давайте двигаться дальше!
Как мы выяснили, Midjourney генерирует сразу несколько изображений и склеивает их. Можно просто вырезать одно из них в любом графическом редакторе, но разрешение будет очень невысоким. К счастью, так делать вовсе не обязательно.
У Midjourney есть все необходимые вам функции — вы можете увеличить любой из вариантов изображения, а также попросить нейросеть сделать еще несколько вариантов выбранной картинки. Все это делается в один клик:
Если ни один из вариантов вам не нравится, нажмите круговые стрелки, и нейросеть сгенерирует изображения заново.
Допустим, нам понравился первый вариант, но хочется посмотреть несколько альтернативных картинок, похожих на него. Нажимаем V1 и ждем, пока нейросеть сгенерирует нам четыре новых изображения, отталкиваясь от первого варианта:
На первый взгляд может показаться, что картинки идентичные. Но присмотритесь — они отличаются.
Теперь нам нравится третий вариант, и мы готовы его использовать на своем сайте. Нажимаем U3 и ждем, пока нейросеть увеличит нашу картинку:
Мы получили отличное изображение с разрешением 1568 × 896 пикселей. Более чем достаточно для публикации на сайте, в блоге или в соцсетях.
Обратите внимание! После апскейла под картинкой появляются дополнительные варианты действий: Light Upscale Redo, Beta Upscale Redo и Make Variations. С ними тоже можно поэкспериментировать, но на данный момент они работают не всегда корректно и иногда откровенно портят изображение. Плюс увеличенная картинка может несколько отличаться от «оригинала», потому как нейросеть не просто делает апскейл, а перерисовывает его.
Кстати, вы обратили внимание на косяк в работе нейросети (а вместе с ней — и наш)?
Вернитесь к первым четырем «реалистичным» вариантам и присмотритесь. Только на двух изображениях перед мужчиной стоит дисплей. В том варианте, который выбрали мы, мониторы стоят за человеком. То есть нейросеть не всегда срабатывает корректно, и ее нужно контролировать, при необходимости меняя промпты, добавляя и удаляя части запросов.
Midjourney — это не только о портретах. Еще больше возможностей для креатива!
Midjourney может создавать поистине великолепные портреты. Они настолько реалистичные, что отличить их от реальных фотографий порой очень сложно.
Просто посмотрите на пару сгенерированных нами женских портретов:
Здорово, правда?
Но возможности нейросети куда обширнее!
Например, мы можем попросить ее сгенерировать изображение рабочего места, используя простой промпт: laptop, ux ui, social network, workspace, --q 5 --ar 16:9.
Можем попросить подготовить несколько иллюстраций для какого-нибудь хоррор-рассказа. Для этого используем промпт: cabin in a mysterious forest, moonlight, fog, realistic, 8k --ar 16:9.
А можем даже сгенерировать изображение для нового сериала The Last of Us от HBO. В качестве промпта используем название сериала — the last of us.
Так можно продолжать до бесконечности.
Но мы еще хотели рассказать вам о некоторых нестандартных и полезных способах применения Midjourney, а также поделиться полезными промптами. Используйте их в качестве дополнения к своим основным запросам.
Пиксель-арт
Есть несколько промптов, с помощью которых можно создавать стильные пиксельные изображения:
- 8 bit pixel art / 16 bit pixel art / 32 bit pixel art;
- game boy style / SNES style / PlayStation style;
- isometric.
Дизайн логотипов
Здесь можно экспериментировать:
- Paul Rand / Saul Bass / Massimo Vignelli — имена известных дизайнеров, чьему стилю вы хотите следовать (любые достаточно известные);
- simple / flat / vector — общие промпты для лого и векторной графики;
- kitschy / elegant / minimal — стили изображений.
Мы попросили нейросеть сгенерировать дизайн логотипа для веб-студии Elit-Web. Вероятно, у вас возникнут вопросы к результату, но к этому мы еще вернемся.
Киноплакаты
Можно использовать название фильма, чтобы сгенерировать изображение в нужной вам стилистике. Работает подчас очень даже хорошо!
Дизайн интерфейсов
Есть несколько популярных промптов, с помощью которых можно генерировать различные интерфейсы:
- vector;
- user interface;
- Adobe Illustrator / Figma;
- Dribbble / Behance.
Midjourney не всегда точно понимает, какой конкретно результат вы хотите получить. Но иногда выдает действительно симпатичные варианты.
Изометрические иллюстрации
Можно получить очень интересные изображения, используя следующие промпты:
- isometric;
- low-poly;
- box cutout;
- made in blender;
- материалы: matte clay.
Иллюстрации в стиле Paper Art
Необычайно красивые и стильные иллюстрации, которые порой кажутся абсолютно реалистичными. Можете попробовать сами, используя дополнительные промпты:
- layered paper craft;
- paper art;
- diorama.
Мы попросили сделать диораму для «Властелина колец». Не беремся утверждать, что фильм или книга угадывается, но выглядит симпатично, не правда ли?
В чем же ложка дегтя в этой бочке меда?
Midjourney, да и другие нейросети, генерирующие изображения, — это настоящая находка для креативщиков всех уровней. А ведь мы перечислили лишь малую часть их возможностей и вариантов использования. Они фактически не ограничены.
Но будем с вами честными — тот же Midjourney далеко не всегда срабатывает идеально. И в некоторых случаях выдает крайне спорные результаты. А есть сценарии, в которых нейросеть и вовсе работает откровенно плохо:
- Взаимодействие человека (и не только человека) с различными объектами.
Иногда нейросеть совершенно не понимает, как люди взаимодействуют с предметами. Например, мы попросили Midjourney изобразить девушку, которая фотографирует себя в зеркале. Получилось… местами страшно:
- Проблемные руки.
Человеческие руки и лапы животных — «больное место» нейросетей. Как раз они обычно и выдают работу того же Midjourney. Лишние пальцы, неестественное их положение, странная форма ногтей — это порой очень сильно бросается в глаза. Смотрите сами:
- Текст на изображениях.
Выше мы показывали вам пример сгенерированного логотипа для Elit-Web. Проблема в том, что вы не можете указать Midjourney, какой текст должен быть на картинке. Он в лучшем случае подберет какие-то похожие символы. А потому взять и за пару секунд сгенерировать себе готовое лого не получится. Зато можно почерпнуть несколько интересных идей и далее воплотить их в жизнь самостоятельно. Например, здесь тоже должно было читаться Elit-Web:
Вместо заключения
Подытожив все вышесказанное и глядя на результаты работы нейросетей, мы с уверенностью можем сказать, что их действительно можно использовать для создания изображений под самые разные задачи. Они открывают просто колоссальные возможности для креатива и воплощения неординарных, порой откровенно сумасшедших идей. И работают при этом необычайно быстро!
Да, глядя на некоторые результаты, можно констатировать, что алгоритмы все еще неидеальны. Но вы только взгляните, насколько стремительно обучилась нейросеть Midjourney с марта по ноябрь 2022 года. Вот вам простейший пример — кот!
А представьте, что будет еще через год? А через пять лет? Не знаем, как вы, а мы с нетерпением ждем обновлений и следим за трендами в этом направлении.
Надеемся, вам было интересно! Вероятно, мы еще вернемся к этой теме в будущем, потому как развитие нейросетей просто неудержимое. И уже через несколько месяцев нам наверняка будет что обсудить.
Оставьте ваши контактные данные.
Будем рады обсудить ваш проект!