Синтез визуального контента, отвечающего потребностям пользователей, часто требует гибкого и точного управления позой, формой, выражением и композицией созданных объектов. Существующие подходы к управлению генеративными противоборствующими сетями (GAN) достигают управляемости путем ручной аннотации обучающих данных или использования предварительной 3D-модели, что часто не обладает гибкостью, точностью и обобщаемостью. В данной работе мы изучаем мощный, но гораздо менее изученный способ управления GAN, а именно,

Перейти на сайт
Перетащите свой GAN: интерактивное точечное воздействие на генеративное изображение манифольда

Введение

Что такое DragGAN?

DragGAN - это мощный инструмент для интерактивной точечной манипуляции на генеративном изображении. Он позволяет пользователям "тянуть" любые точки изображения, чтобы точно достичь целевых точек в интерактивном режиме.

Как работает DragGAN?

DragGAN состоит из двух основных компонентов: 1) надзор за движением на основе признаков, который заставляет точку рукоятки двигаться к целевой позиции, и 2) новый подход к отслеживанию точек, который использует дискриминативные признаки GAN для постоянного определения позиции точек рукоятки.

Особенности DragGAN

  • Точный контроль над тем, куда идут пиксели, позволяющий манипулировать позой, формой, выражением и композицией различных категорий, таких как животные, автомобили, люди, пейзажи и т. д.
  • Возможность деформировать изображение с реалистичными результатами даже для сложных сценариев, таких как генерация скрытого контента и деформация форм, которые последовательно следуют за жесткостью объекта.
  • Может использоваться для задач манипуляции изображениями и отслеживания точек.

Цена

Статья и код доступны бесплатно, а изображения, текст и видеофайлы на сайте предоставляются бесплатно для некоммерческого использования в соответствии с лицензией Creative Commons CC BY-NC 4.0.

Перетащите - Альтернатива

Glossi

Glossi - Легко создавайте визуализации продукта студийного качества для электронной коммерции с помощью создания контента в реальном времени.

--
Godinabox.co:GPT-3.5 AI Chatbot на Whatsapp | Бог в коробке

Godinabox.co: Ощутите мощь ChatGPT/GPT-3 на Whatsapp с нашим инновационным и удобным в использовании ботом, всегда обновляемым до последней модели, предлагающим непревзойденные возможности разговорного искусственного интеллекта по доступной цене, как первооткрывающий платный сервис ChatGPT на Whatsapp.

--
GoEnhance AI - улучшение видео, увеличение изображений и увеличение разрешения

Платформа для преобразования видео в анимацию, превращает ваши видеоролики в различные анимационные стили, включая пиксельную и плоскую анимацию. Улучшайте и увеличивайте изображения с помощью искусственного интеллекта до крайних деталей.

--
Gooey.AI - Лучшее из частного и открытого искусственного интеллекта

Gooey.AI демонстрирует лучшее из частного и открытого искусственного интеллекта с одним биллинговым аккаунтом и обнаруживаемыми рабочими процессами.

--
Больше тегов о: Перетащите свой GAN: интерактивное точечное воздействие на генеративное изображение манифольда