Синтез визуального контента, отвечающего потребностям пользователей, часто требует гибкого и точного управления позой, формой, выражением и композицией созданных объектов. Существующие подходы к управлению генеративными противоборствующими сетями (GAN) достигают управляемости путем ручной аннотации обучающих данных или использования предварительной 3D-модели, что часто не обладает гибкостью, точностью и обобщаемостью. В данной работе мы изучаем мощный, но гораздо менее изученный способ управления GAN, а именно,

Посетить сайт
Перетащите свой GAN: интерактивное точечное воздействие на генеративное изображение манифольда

Введение

Что такое DragGAN?

DragGAN - это мощный инструмент для интерактивной точечной манипуляции на генеративном изображении. Он позволяет пользователям "тянуть" любые точки изображения, чтобы точно достичь целевых точек в интерактивном режиме.

Как работает DragGAN?

DragGAN состоит из двух основных компонентов: 1) надзор за движением на основе признаков, который заставляет точку рукоятки двигаться к целевой позиции, и 2) новый подход к отслеживанию точек, который использует дискриминативные признаки GAN для постоянного определения позиции точек рукоятки.

Особенности DragGAN

  • Точный контроль над тем, куда идут пиксели, позволяющий манипулировать позой, формой, выражением и композицией различных категорий, таких как животные, автомобили, люди, пейзажи и т. д.
  • Возможность деформировать изображение с реалистичными результатами даже для сложных сценариев, таких как генерация скрытого контента и деформация форм, которые последовательно следуют за жесткостью объекта.
  • Может использоваться для задач манипуляции изображениями и отслеживания точек.

Цена

Статья и код доступны бесплатно, а изображения, текст и видеофайлы на сайте предоставляются бесплатно для некоммерческого использования в соответствии с лицензией Creative Commons CC BY-NC 4.0.

Перетащите - Альтернатива

AI Stage

Aistage.net: Исследуйте лучшие инструменты искусственного интеллекта, веб-сайты и проекты с открытым исходным кодом на платформе AIStage, ведущей платформе по агрегации искусственного интеллекта. Будьте в курсе последних новостей по искусственному интеллекту.

4.9 K
AI Wedding Photo Studio

Искусственный интеллект свадебная фотография - Система редактирования и генерации фотографий на свадьбу на основе искусственного интеллекта.

--
Премиумное видео-приложение AI для бизнеса | AKOOL

AKOOL - это прорывная платформа Generative AI для персонализированного визуального маркетинга и рекламы. С помощью AKOOL маркетологи и инноваторы могут создавать индивидуальные, привлекательные впечатления, которые притягивают людей внутрь бренда таким образом, что они становятся лояльными клиентами.

1.1 M
Альбус - исследуйте, учитесь, создавайте с помощью искусственного интеллекта

Альбус отлично подходит для повышения вашего самообучения, исследований и креативных сессий с использованием искусственного интеллекта. Генерируйте изображения и аудио с помощью ИИ. Получите доступ ко всем моделям SDXL, GPT-4o, Vision, DALL-E 3, ElevenLabs Audio, Gemini Flash от Google, Gemini Pro & Vision, Claude 3 и другим.

60.2 K
Больше тегов о: Перетащите свой GAN: интерактивное точечное воздействие на генеративное изображение манифольда