La synthèse de contenu visuel qui répond aux besoins des utilisateurs nécessite souvent une contrôlabilité flexible et précise de la pose, de la forme, de l'expression et de la disposition des objets générés. Les approches existantes acquièrent la contrôlabilité des réseaux antagonistes génératifs (GAN) via des données d'entraînement annotées manuellement ou un modèle 3D préalable, qui manquent souvent de flexibilité, de précision et de généralité. Dans ce travail, nous étudions une manière puissante mais beaucoup moins explorée de contrôler les GAN, à savoir

Faites glisser votre GAN : Manipulation interactive basée sur des points sur le maniement d'images génératives

Introduction

Qu'est-ce que DragGAN?

DragGAN est un outil puissant pour la manipulation interactive basée sur les points sur le manège d'images génératives. Il permet aux utilisateurs de "tirer" n'importe quel point de l'image pour atteindre précisément des points cibles de manière interactive.

Comment fonctionne DragGAN?

DragGAN se compose de deux composants principaux : 1) une supervision du mouvement basée sur les caractéristiques qui guide le point de manipulation vers la position cible, et 2) une nouvelle approche de suivi des points qui exploite les caractéristiques du GAN discriminatif pour localiser en continu la position des points de manipulation.

Caractéristiques de DragGAN

  • Contrôle précis sur la destination des pixels, permettant de manipuler la pose, la forme, l'expression et la disposition de diverses catégories telles que les animaux, les voitures, les humains, les paysages, etc.
  • Capacité à déformer une image avec des sorties réalistes même pour des scénarios difficiles tels que la création de contenu occulté et la déformation de formes suivant de manière cohérente la rigidité de l'objet.
  • Peut être utilisé pour la manipulation d'images et le suivi de points.

Prix

L'article et le code sont disponibles gratuitement, et les images, textes et fichiers vidéo sur le site sont mis à disposition gratuitement pour une utilisation non commerciale sous la licence Creative Commons CC BY-NC 4.0.

Faites - Alternative

Methexis-Inc Img2prompt API sur Replicate

Replicate.com : Générez des prompts textuels qui correspondent étroitement à une image avec style en utilisant l'outil Img2Prompt de Methexis Inc. Optimisé pour la diffusion stable (clip ViT-L/14).

1.5 M
Restaurateur de photos de visage

Restaurez vos anciennes photos de visage et gardez les souvenirs vivants.

82.3 K
Restauration de photos | Technologie IA pour la restauration de vieilles photos et la retouche de visage

Restorephotos.one : Revitalisez vos souvenirs chéris avec notre technologie d'IA. Spécialisé dans la restauration de vieilles photos, la retouche haute définition des visages et la colorisation des photos en noir et blanc à l'aide d'algorithmes d'IA avancés. Inscrivez-vous pour un compte gratuit afin de préserver et améliorer facilement vos photos originales en ligne.

1.5 K
Retouch4me — Avantages de l'intelligence artificielle (IA) dans la retouche

Nos plugins sont conçus pour fonctionner de la même manière qu'un retoucheur professionnel le ferait. Retouch4me préserve la texture de la peau d'origine et les photos ont un aspect naturel. Il vous suffit de télécharger vos photos dans le plug-in, de cliquer sur un bouton et d'attendre que l'IA fasse le travail.

235.4 K
Plus de tags sur: Faites glisser votre GAN : Manipulation interactive basée sur des points sur le maniement d'images génératives