La synthèse de contenu visuel qui répond aux besoins des utilisateurs nécessite souvent une contrôlabilité flexible et précise de la pose, de la forme, de l'expression et de la disposition des objets générés. Les approches existantes acquièrent la contrôlabilité des réseaux antagonistes génératifs (GAN) via des données d'entraînement annotées manuellement ou un modèle 3D préalable, qui manquent souvent de flexibilité, de précision et de généralité. Dans ce travail, nous étudions une manière puissante mais beaucoup moins explorée de contrôler les GAN, à savoir

Faites glisser votre GAN : Manipulation interactive basée sur des points sur le maniement d'images génératives

Introduction

Qu'est-ce que DragGAN?

DragGAN est un outil puissant pour la manipulation interactive basée sur les points sur le manège d'images génératives. Il permet aux utilisateurs de "tirer" n'importe quel point de l'image pour atteindre précisément des points cibles de manière interactive.

Comment fonctionne DragGAN?

DragGAN se compose de deux composants principaux : 1) une supervision du mouvement basée sur les caractéristiques qui guide le point de manipulation vers la position cible, et 2) une nouvelle approche de suivi des points qui exploite les caractéristiques du GAN discriminatif pour localiser en continu la position des points de manipulation.

Caractéristiques de DragGAN

  • Contrôle précis sur la destination des pixels, permettant de manipuler la pose, la forme, l'expression et la disposition de diverses catégories telles que les animaux, les voitures, les humains, les paysages, etc.
  • Capacité à déformer une image avec des sorties réalistes même pour des scénarios difficiles tels que la création de contenu occulté et la déformation de formes suivant de manière cohérente la rigidité de l'objet.
  • Peut être utilisé pour la manipulation d'images et le suivi de points.

Prix

L'article et le code sont disponibles gratuitement, et les images, textes et fichiers vidéo sur le site sont mis à disposition gratuitement pour une utilisation non commerciale sous la licence Creative Commons CC BY-NC 4.0.

Faites - Alternative

Galileo AI

Galileo AI est une plateforme de génération d'interface utilisateur pour une idéation de design facile et rapide

336.4 K
Générateur de texte et d'images AI n°1 en Europe | neuroflash

Utilisez notre générateur de texte et d'images IA pour produire la meilleure qualité de contenu dans 7 langues différentes. La création de contenu n'a jamais été aussi facile !

378
Déterminez votre symétrie faciale avec l'IA

Découvrez votre symétrie faciale avec l'IA ! Téléchargez une photo et laissez l'IA analyser votre symétrie faciale.

238.4 K
Plus de tags sur: Faites glisser votre GAN : Manipulation interactive basée sur des points sur le maniement d'images génératives