Как использовать инструменты редактирования DALL-E 3
Вы когда-нибудь хотели мгновенно отредактировать свое творение DALL-E 3, но не знали как?
Единственная проблема в том, что они не делают то, что рекламирует OpenAI, и сложно определить, получены ли желаемые правки или нет. Тем не менее, это только начало того, что будет в монтаже DALL-E 3, и вот как это работает.
Что такое инструмент редактирования DALL-E 3?
Они существуют уже некоторое время, но OpenAI наконец-то добавила функции редактирования в DALL-E 3 в ChatGPT Plus. Перед этим вы можете попробовать отредактировать свои творения DALL-E 3, но обычно при этом всегда создается совершенно новое изображение. Даже если приглашение, использованное для создания отредактированного изображения, очень похоже на первое приглашение, из-за особенностей генерации ИИ выходные данные могут существенно отличаться.
Встроенные инструменты редактирования DALL-E 3 теперь направлены на исправление проблем в одном и том же изображении без создания новой подсказки. Вы выделяете область изображения, которую хотите настроить, предлагаете DALL-E внести конкретное изменение (например, «удалить это» или «добавить эту функцию»), и это работает.
Пример в официальном блоге OpenAI показывает, что DALL-E добавляет цветы вишни к изображению кошки в стиле укиё-э, и все работает отлично. По опыту, инструменты редактирования DALL-E испытывают трудности с добавлением таких детальных изображений к существующим изображениям и в большинстве случаев не способны обрабатывать запросы такого типа.
Это не означает, что инструменты редактирования не работают. Удалить функции и внести небольшие изменения вполне возможно, как подробно описано ниже, но все это в небольших масштабах.
Как использовать инструменты редактирования DALL-E 3
Лучший способ показать, на что способны инструменты редактирования DALL-E 3, — это привести несколько подходящих примеров.
Удалить и удалить
Инструменты редактирования DALL-E 3 позволяют удалить некоторые мелкие детали, но это, конечно, сложно. На следующем изображении автор статьи попросил DALL-E создать «Роботизированная рука держит прозрачный светящийся квадратный чип с надписью «AI Accelerated». Фон ярко-синий, что создает футуристическую и высокотехнологичную атмосферу».
Письменный текст является проблемой для Генеративного ИИ, поэтому неудивительно, что текст был неправильным — поэтому автор попросил DALL-E убрать опечатки. С первой попытки с подсказкой «пожалуйста, удалите это слово» не удалось, но со второй попытки с подсказкой «пожалуйста, удалите это слово из изображения» это удалось. Поэтому вам, возможно, придется попробовать разные подсказки, чтобы получить желаемые результаты. Затем автор приказал ему переместить буквы ИИ в середину квадрата, и это отлично сработало, хотя по какой-то причине компьютер вылетел.
Далее автор попросил DALL-E отредактировать изображение телевизора. DALL-E отлично подходит для создания уникальных изображений, но он неправильно передает некоторые детали или искажает текст. В данном случае на информационной панели на экране телевизора отображался бессмысленный текст AI, поэтому автор захотел его удалить. Первая попытка DALL-E оставила тень на информационной панели, вторая и третья попытки оказались намного чище. Не идеально, но достаточно хорошо для использования исходного изображения по назначению.
Добавить и изменить
DALL-E 3 может вносить некоторые изменения в изображения, но опять же, это зависит от масштаба требуемого контента. Могут быть незначительные дополнения и изменения, но в большинстве случаев инструменты редактирования DALL-E не могут справиться с тем, что требуется.
Автор попросил DALL-E «создать детальное изображение человеческого глаза крупным планом 4K 2:1», в результате чего получилось следующее изображение:
Довольно неплохо (кроме ресниц), но автор хотел изменить цвет радужки на синий, в результате получилось вот такое изображение:
Цвет немного тусклый, но не измененный, некоторые детали немного изогнуты.
Далее автор спросил DALL-E «создать из глины изображение человека в комбинезоне тигра, катающегося на лыжах с горы, в формате 4K 2:1, на заднем плане — снеговик» .
Еще раз: исходное изображение хорошее, четкое, цвета яркие и соответствуют заданию. Однако автор хотел превратить снеговика в другое страшное животное.
Вместо того, чтобы превратить снеговика в другое животное, он полностью исчез. Автор вернулся к исходному изображению и попросил добавить еще одного снеговика, но это не помогло. Точно так же результаты не увенчались успехом, когда автор попросил добавить к изображению больше деревьев.
Добавить текст
При этом у генеративного ИИ часто возникают трудности с текстом, а добавление текста к изображениям еще сложнее. Автор попросил DALL-E создать открытку с видом на английское побережье, и она прекрасно передала эту сцену. Затем автор хотел добавить к изображению текст «Солнечный берег», но инструмент не смог с этим справиться.
То есть до тех пор, пока после примерно 6 или 7 подсказок, напоминавших DALL-E, что ему нужно сделать, инструмент создавал совершенно новое изображение с запрошенным текстом.
Далее открытка на день рождения. На этот раз DALL-E добавил «С Днем Рождения» без подсказки. Итак, автор попросил его добавить на открытку день рождения. И снова DALL-E не удалось добавить дату на карту, но после нескольких запросов он создал новое изображение с запрошенной датой. В этом случае дату проще добавить самостоятельно, особенно если вы хотите сохранить исходное фото.
Инструменты редактирования DALL-E полезны, но требуют некоторой настойчивости.
Инструменты редактирования DALL-E полезны для определенных задач, но для правильного редактирования требуется время. Во многих случаях это не сработает, и, вероятно, лучше взять исходную подсказку и настроить ее для создания нового изображения.
Инструменты редактирования DALL-E, вероятно, со временем улучшатся, но до тех пор лучше редактировать изображения с помощью инструмента редактирования изображений, а не проходить несколько раундов дорогостоящих чатов. время с DALL-E.
Сэмюэл Дэниел
Обновление от 22 июня 2024 г.