La synthèse de contenu visuel qui répond aux besoins des utilisateurs nécessite souvent une contrôlabilité flexible et précise de la pose, de la forme, de l'expression et de la disposition des objets générés. Les approches existantes acquièrent la contrôlabilité des réseaux antagonistes génératifs (GAN) via des données d'entraînement annotées manuellement ou un modèle 3D préalable, qui manquent souvent de flexibilité, de précision et de généralité. Dans ce travail, nous étudions une manière puissante mais beaucoup moins explorée de contrôler les GAN, à savoir

Faites glisser votre GAN : Manipulation interactive basée sur des points sur le maniement d'images génératives

Introduction

Qu'est-ce que DragGAN?

DragGAN est un outil puissant pour la manipulation interactive basée sur les points sur le manège d'images génératives. Il permet aux utilisateurs de "tirer" n'importe quel point de l'image pour atteindre précisément des points cibles de manière interactive.

Comment fonctionne DragGAN?

DragGAN se compose de deux composants principaux : 1) une supervision du mouvement basée sur les caractéristiques qui guide le point de manipulation vers la position cible, et 2) une nouvelle approche de suivi des points qui exploite les caractéristiques du GAN discriminatif pour localiser en continu la position des points de manipulation.

Caractéristiques de DragGAN

  • Contrôle précis sur la destination des pixels, permettant de manipuler la pose, la forme, l'expression et la disposition de diverses catégories telles que les animaux, les voitures, les humains, les paysages, etc.
  • Capacité à déformer une image avec des sorties réalistes même pour des scénarios difficiles tels que la création de contenu occulté et la déformation de formes suivant de manière cohérente la rigidité de l'objet.
  • Peut être utilisé pour la manipulation d'images et le suivi de points.

Prix

L'article et le code sont disponibles gratuitement, et les images, textes et fichiers vidéo sur le site sont mis à disposition gratuitement pour une utilisation non commerciale sous la licence Creative Commons CC BY-NC 4.0.

Faites - Alternative

Service de rédaction de dissertations personnalisées | Écrivez mon essai pour moi

Obtenez des essais et des travaux académiques 100% originaux des meilleurs rédacteurs de MyPerfectWords.com. Profitez d'un support 24/7, d'une livraison rapide et d'une confidentialité totale pour seulement 11 $ la page.

89.2 K
API de Diffusion Stable et Dreambooth - Générez et peaufinez la Diffusion Stable de Dreambooth en utilisant l'API

Pas besoin de GPU à 2000 $, de 40 Go de RAM pour exécuter une diffusion stable. Utilisez l'API de diffusion stable pour économiser des coûts, du temps, de l'argent et obtenir des générations d'images 50 fois plus rapides.

92.5 K
Commencez avec les outils AI et la plateforme créative de Soona

Débloquez l'ultime boîte à outils pour le contenu professionnel et généré par les utilisateurs, la gestion de la créativité des produits et la mesure des performances. Rehaussez votre marque avec notre suite complète pour la création de contenu, la gestion et les analyses.

87.7 K
PikPoet | Comble l'écart entre vos photos et les légendes parfaites.

Explorez le monde des expressions créatives et faites parler vos photos avec de belles et évocatrices expressions textuelles

--
Plus de tags sur: Faites glisser votre GAN : Manipulation interactive basée sur des points sur le maniement d'images génératives