Die Synthese visueller Inhalte, die den Bedürfnissen der Benutzer gerecht werden, erfordert oft eine flexible und präzise Steuerbarkeit der Pose, Form, Ausdruck und Anordnung der generierten Objekte. Bestehende Ansätze erlangen die Steuerbarkeit von generativen adversarialen Netzwerken (GANs) über manuell annotierte Trainingsdaten oder ein zuvor erstelltes 3D-Modell, die oft an Flexibilität, Präzision und Allgemeingültigkeit mangeln. In dieser Arbeit untersuchen wir einen leistungsstarken, aber viel weniger erforschten Weg zur Steuerung von GANs, nämlich zu

Ziehen Sie Ihren GAN: Interaktive punktbasierte Manipulation auf dem generativen Bildmanifold

Einführung

Was ist DragGAN?

DragGAN ist ein leistungsstolles Werkzeug für die interaktive punktbasierte Manipulation auf dem generativen Bildmanifold. Es ermöglicht Benutzern, beliebige Punkte des Bildes "zu ziehen", um auf präzise Weise Zielpositionen auf benutzerinteraktive Weise zu erreichen.

Wie funktioniert DragGAN?

DragGAN besteht aus zwei Hauptkomponenten: 1) einer auf Merkmalen basierenden Bewegungsüberwachung, die den Handpunkt dazu bringt, sich in Richtung der Zielposition zu bewegen, und 2) einem neuen Ansatz zum Punkt-Tracking, der die diskriminativen GAN-Merkmale nutzt, um die Position der Handpunkte weiter zu lokalisieren.

Eigenschaften von DragGAN

  • Präzise Kontrolle darüber, wohin Pixel gehen, um die Pose, Form, Ausdruck und Anordnung verschiedener Kategorien wie Tiere, Autos, Menschen, Landschaften usw. zu manipulieren.
  • Fähigkeit, ein Bild mit realistischen Ausgaben zu verformen, auch für anspruchsvolle Szenarien wie das Halluzinieren verdeckter Inhalte und das Verformen von Formen, die konsistent der Steifigkeit des Objekts folgen.
  • Kann für Bildmanipulation und Punkt-Tracking-Aufgaben verwendet werden.

Preis

Das Paper und der Code sind kostenlos verfügbar, und die Bilder, Texte und Videodateien auf der Website sind zur nicht-kommerziellen Nutzung unter der Creative Commons CC BY-NC 4.0 Lizenz frei verfügbar.

Ziehen - Alternative

Godinabox.co:GPT-3.5 KI-Chatbot auf Whatsapp | Gott In Einer Box

Godinabox.co: Erleben Sie die Kraft von ChatGPT/GPT-3 auf Whatsapp mit unserem innovativen und benutzerfreundlichen Bot, immer auf dem neuesten Stand des Modells, der unübertroffene Gesprächsfähigkeiten der KI zu einem erschwinglichen Preis bietet, als der führende kostenpflichtige ChatGPT-Dienst auf Whatsapp.

1.4 K
Korewa.ai: KI-gestützte Conversational Design Plattform für Unternehmen

Korewa AI ist eine revolutionäre Chat-Plattform, die künstliche Intelligenz nutzt, um Anime-Charaktere zum Leben zu erwecken. Benutzer können damit erschreckend realistische Persönlichkeiten erstellen, veröffentlichen und interagieren, die mit Erinnerungen und Emotionen ausgestattet sind, für ein wirklich immersives Erlebnis.

15.7 K
Getfloorplan.com: Generieren Sie 2D- und 3D-Grundrisse mit KI-Technologie

GetFloorPlan bietet 2D-Grundriss-Downloads an, die es Benutzern ermöglichen, atemberaubende 3D-Renderings mit Möbeln und immersiven virtuellen Touren zu erstellen und somit die Art und Weise zu revolutionieren, wie Sie Ihren Raum visualisieren und interagieren.

43.3 K
T.me: Stabiler Diffusionsbot auf Telegramm - KI-Kunstgenerierungsassistent

T.me: Stabile Diffusionsenthusiasten, erkunden Sie den inoffiziellen Bot für reibungslose Interaktionen, betrieben von @neuralpony, und erhalten Sie sofortige Unterstützung über @neuralforum für ein problemloses Erlebnis.

806.4 M
Weitere Tags über: Ziehen Sie Ihren GAN: Interaktive punktbasierte Manipulation auf dem generativen Bildmanifold