La síntesis de contenido visual que satisface las necesidades de los usuarios a menudo requiere una controlabilidad flexible y precisa de la pose, forma, expresión y diseño de los objetos generados. Los enfoques existentes obtienen controlabilidad de las redes generativas adversarias (GAN) a través de datos de entrenamiento anotados manualmente o un modelo 3D previo, que a menudo carecen de flexibilidad, precisión y generalidad. En este trabajo, estudiamos una forma poderosa pero mucho menos explorada de controlar GANs, es decir,

Arrastra tu GAN: Manipulación interactiva basada en puntos en el espacio de imágenes generativas

Introducción

¿Qué es DragGAN?

DragGAN es una herramienta poderosa para la manipulación interactiva basada en puntos en el espacio de imagen generativo. Permite a los usuarios "arrastrar" cualquier punto de la imagen para alcanzar de manera precisa puntos objetivo de forma interactiva.

¿Cómo funciona DragGAN?

DragGAN consta de dos componentes principales: 1) una supervisión de movimiento basada en características que guía al punto de control a moverse hacia la posición objetivo, y 2) un nuevo enfoque de seguimiento de puntos que aprovecha las características discriminativas de GAN para seguir localizando la posición de los puntos de control.

Características de DragGAN

  • Control preciso sobre hacia dónde van los píxeles, manipulando así la pose, forma, expresión y disposición de diversas categorías como animales, coches, humanos, paisajes, etc.
  • Capacidad para deformar una imagen con salidas realistas incluso en escenarios desafiantes como la alucinación de contenido oculto y la deformación de formas que siguen consistentemente la rigidez del objeto.
  • Puede utilizarse para tareas de manipulación de imágenes y seguimiento de puntos.

Precio

El artículo y el código están disponibles de forma gratuita, y las imágenes, texto y archivos de video en el sitio se ponen a disposición de forma gratuita para uso no comercial bajo la licencia Creative Commons CC BY-NC 4.0.

Arrastra - Alternativa

Swapr LOL | Intercambio de caras de IA, Emoji de IA, muñecas LOL Surprise

Swapr.lol: Swapr LOL es la mejor aplicación de intercambio de caras y emojis con inteligencia artificial. Intercambia caras fácilmente y crea emojis divertidos con Swapr LOL. Disfruta intercambiando caras con muñecas LOL Surprise y tots de intercambio sorpresa. ¡Únete a la diversión con Swapr LOL!

95
AI Studio | Música libre de regalías, licencias, blog, música de fondo

Hooksounds.com: Genera pistas de música personalizadas para tus videos en segundos con Hooksounds AI Studio. Simplifica tu proceso creativo y encuentra el ajuste perfecto con solo unos clics. Suscríbete hoy y experimenta la revolución musical impulsada por la tecnología de inteligencia artificial.

153.3 K
Mejor Escritor de IA y Chatbot - Koala.sh

Koala.sh: Koala.sh ofrece servicios de redacción y chatbot de inteligencia artificial de primera calidad a través de KoalaWriter y KoalaChat. Explore la tecnología GPT-4o, generación de párrafos, precios, imágenes, opciones de contacto y reseñas en Koala.sh.

114.1 K
Más etiquetas sobre: Arrastra tu GAN: Manipulación interactiva basada en puntos en el espacio de imágenes generativas