Sintetizar conteúdo visual que atenda às necessidades dos usuários frequentemente requer controle flexível e preciso da pose, forma, expressão e layout dos objetos gerados. Abordagens existentes ganham controle das redes adversariais generativas (GANs) por meio de dados de treinamento manualmente anotados ou de um modelo 3D prévio, que frequentemente carecem de flexibilidade, precisão e generalidade. Neste trabalho, estudamos uma maneira poderosa, porém muito menos explorada, de controlar GANs, ou seja,

Arraste o seu GAN: Manipulação interativa baseada em pontos na manobra de imagens generativas

Introdução

O que é DragGAN?

DragGAN é uma ferramenta poderosa para manipulação interativa baseada em pontos na manopla de imagem generativa. Permite aos usuários "arrastar" quaisquer pontos da imagem para alcançar precisamente os pontos-alvo de maneira interativa.

Como o DragGAN funciona?

DragGAN consiste em dois componentes principais: 1) uma supervisão de movimento baseada em características que faz com que o ponto de controle se mova em direção à posição-alvo, e 2) uma nova abordagem de rastreamento de pontos que aproveita as características discriminativas do GAN para continuar localizando a posição dos pontos de controle.

Recursos do DragGAN

  • Controle preciso sobre para onde os pixels vão, manipulando assim a pose, forma, expressão e layout de diversas categorias, como animais, carros, humanos, paisagens, etc.
  • Capacidade de deformar uma imagem com saídas realistas mesmo em cenários desafiadores, como alucinar conteúdo oculto e deformar formas que seguem consistentemente a rigidez do objeto.
  • Pode ser usado para tarefas de manipulação de imagem e rastreamento de pontos.

Preço

O artigo e o código estão disponíveis gratuitamente, e as imagens, textos e arquivos de vídeo no site são disponibilizados gratuitamente para uso não comercial sob a licença Creative Commons CC BY-NC 4.0.

Arraste - Alternativa

GoEnhance AI - Aumentador e melhorador de vídeos para vídeos, imagens e ampliador

Plataforma de vídeo para animação, transforme seus vídeos em uma variedade de estilos animados, incluindo anime em pixel e flat. Aprimore e amplie imagens com extrema precisão por meio de IA.

--
Gooey.AI - O melhor da inteligência artificial privada e de código aberto

Gooey.AI destaca o melhor da IA privada e de código aberto com uma conta de faturamento e fluxos de trabalho descobríveis.

--
GPT4o.so

GPT4o.so - Explore o Acesso Online Gratuito à Plataforma Avançada de IA Multimodal da OpenAI

--
Gptforslides.app: Criador de Apresentações com Inteligência Artificial: Crie Slides com GPT em Segundos

GPT for Slides é um inovador complemento do Google Slides que utiliza tecnologia de IA para converter qualquer texto em slides de apresentação envolventes, proporcionando uma experiência perfeita de texto para apresentação.

--
Mais Tags sobre: Arraste o seu GAN: Manipulação interativa baseada em pontos na manobra de imagens generativas