Синтез визуального контента, отвечающего потребностям пользователей, часто требует гибкого и точного управления позой, формой, выражением и композицией созданных объектов. Существующие подходы к управлению генеративными противоборствующими сетями (GAN) достигают управляемости путем ручной аннотации обучающих данных или использования предварительной 3D-модели, что часто не обладает гибкостью, точностью и обобщаемостью. В данной работе мы изучаем мощный, но гораздо менее изученный способ управления GAN, а именно,

Перейти на сайт
Перетащите свой GAN: интерактивное точечное воздействие на генеративное изображение манифольда

Введение

Что такое DragGAN?

DragGAN - это мощный инструмент для интерактивной точечной манипуляции на генеративном изображении. Он позволяет пользователям "тянуть" любые точки изображения, чтобы точно достичь целевых точек в интерактивном режиме.

Как работает DragGAN?

DragGAN состоит из двух основных компонентов: 1) надзор за движением на основе признаков, который заставляет точку рукоятки двигаться к целевой позиции, и 2) новый подход к отслеживанию точек, который использует дискриминативные признаки GAN для постоянного определения позиции точек рукоятки.

Особенности DragGAN

  • Точный контроль над тем, куда идут пиксели, позволяющий манипулировать позой, формой, выражением и композицией различных категорий, таких как животные, автомобили, люди, пейзажи и т. д.
  • Возможность деформировать изображение с реалистичными результатами даже для сложных сценариев, таких как генерация скрытого контента и деформация форм, которые последовательно следуют за жесткостью объекта.
  • Может использоваться для задач манипуляции изображениями и отслеживания точек.

Цена

Статья и код доступны бесплатно, а изображения, текст и видеофайлы на сайте предоставляются бесплатно для некоммерческого использования в соответствии с лицензией Creative Commons CC BY-NC 4.0.

Перетащите - Альтернатива

Фото в мультфильм – превратите себя в мультяшного персонажа и создайте аватар бесплатно

Превратите ваши фотографии в произведения искусства, эскизы и мультфильмы одним нажатием – самый простой, красивый и понятный редактор фотографий и мультфильмов для всех.

--
Разработка чатботов на основе искусственного интеллекта и решения в области разговорного искусственного интеллекта

Chaibar.ai: Революционизируйте свой опыт работы на Mac с помощью Chaibar, передового искусственного интеллекта, который безупречно интегрирует мощь ChatGPT и Dall-E, давая вам возможность разблокировать невиданное творчество и продуктивность.

--
Change Clothes AI

Смена одежды с искусственным интеллектом - Измените свой стиль с помощью онлайн-сервиса смены одежды и бесплатного пробного периода.

--
Больше тегов о: Перетащите свой GAN: интерактивное точечное воздействие на генеративное изображение манифольда