La synthèse de contenu visuel qui répond aux besoins des utilisateurs nécessite souvent une contrôlabilité flexible et précise de la pose, de la forme, de l'expression et de la disposition des objets générés. Les approches existantes acquièrent la contrôlabilité des réseaux antagonistes génératifs (GAN) via des données d'entraînement annotées manuellement ou un modèle 3D préalable, qui manquent souvent de flexibilité, de précision et de généralité. Dans ce travail, nous étudions une manière puissante mais beaucoup moins explorée de contrôler les GAN, à savoir

Faites glisser votre GAN : Manipulation interactive basée sur des points sur le maniement d'images génératives

Introduction

Qu'est-ce que DragGAN?

DragGAN est un outil puissant pour la manipulation interactive basée sur les points sur le manège d'images génératives. Il permet aux utilisateurs de "tirer" n'importe quel point de l'image pour atteindre précisément des points cibles de manière interactive.

Comment fonctionne DragGAN?

DragGAN se compose de deux composants principaux : 1) une supervision du mouvement basée sur les caractéristiques qui guide le point de manipulation vers la position cible, et 2) une nouvelle approche de suivi des points qui exploite les caractéristiques du GAN discriminatif pour localiser en continu la position des points de manipulation.

Caractéristiques de DragGAN

  • Contrôle précis sur la destination des pixels, permettant de manipuler la pose, la forme, l'expression et la disposition de diverses catégories telles que les animaux, les voitures, les humains, les paysages, etc.
  • Capacité à déformer une image avec des sorties réalistes même pour des scénarios difficiles tels que la création de contenu occulté et la déformation de formes suivant de manière cohérente la rigidité de l'objet.
  • Peut être utilisé pour la manipulation d'images et le suivi de points.

Prix

L'article et le code sont disponibles gratuitement, et les images, textes et fichiers vidéo sur le site sont mis à disposition gratuitement pour une utilisation non commerciale sous la licence Creative Commons CC BY-NC 4.0.

Faites - Alternative

Logiciel d'édition vidéo AI pour YouTube - Gling

Gling.ai : Le logiciel d'édition vidéo AI de Gling est conçu pour les créateurs YouTube, simplifiant le processus d'édition en éliminant les éléments indésirables tels que les prises ratées, les moments de silence, les mots de remplissage et le bruit de fond. Améliorez votre contenu facilement pour un résultat plus professionnel et captivant.

236.3 K
Glossi

Glossi - Créez facilement des visuels de produits de qualité studio pour le commerce électronique grâce à la création de contenu en temps réel.

1.6 K
Godinabox.co: GPT-3.5 AI Chatbot sur Whatsapp | Dieu dans une boîte

Godinabox.co : Découvrez la puissance de ChatGPT/GPT-3 sur Whatsapp avec notre bot innovant et convivial, toujours mis à jour avec le dernier modèle, offrant des capacités d'IA conversationnelle inégalées à un prix abordable, en tant que service pionnier payant de ChatGPT sur Whatsapp.

4.3 K
Plus de tags sur: Faites glisser votre GAN : Manipulation interactive basée sur des points sur le maniement d'images génératives