合成滿足用戶需求的視覺內容通常需要對生成的物件的姿勢、形狀、表情和佈局進行靈活和精確的控制。現有方法通常通過手動標註的訓練數據或先前的3D模型來實現生成對抗網絡(GANs)的可控性,但這些方法往往缺乏靈活性、精確性和通用性。在這項工作中,我們研究了一種強大但較少探索的控制GANs的方法,即

在生成圖像流形上進行交互式基於點的操作:拖動您的GAN

介紹

什麼是 DragGAN?

DragGAN 是一個強大的工具,用於對生成圖像流形上的基於點的互動操作。它允許用戶以用戶互動的方式“拖動”圖像的任何點,以精確地達到目標點。

DragGAN 如何工作?

DragGAN 由兩個主要組件組成:1)基於特徵的運動監督,推動手柄點向目標位置移動,2)一種新的點跟踪方法,利用區分性 GAN 特徵來持續定位手柄點的位置。

DragGAN 的特點

  • 可精確控制像素的移動位置,從而操縱各種類別的姿勢、形狀、表情和佈局,如動物、汽車、人類、風景等。
  • 具有變形圖像的能力,產生逼真的輸出,即使在具有挑戰性的情況下,例如幻覺遮蔽內容和變形形狀,仍能始終遵循對象的剛性。
  • 可用於圖像操作和點跟踪任務。

價格

論文和代碼可免費獲得,網站上的圖像、文本和視頻文件可根據創用 CC BY-NC 4.0 許可證免費供非商業用途使用。

在生成圖像流形上進行交互式基於點的操作:拖動您的GAN - 替代

為創作者量身打造的最終肖像編輯器,讓您可以照片上的AirBrush

使用AirBrush照片編輯,您可以通過使用各種修飾工具輕鬆增強照片,將您的視覺呈現出來。

2.1 M
AI Stage

Aistage.net:在 AIStage 這個頂尖的 AI 聚合平台上探索頂尖的 AI 工具、網站和開源項目。隨時掌握最新的人工智能新聞。

6.7 K
AI Wedding Photo Studio

AI婚禮攝影工作室 - 人工智慧婚禮照片編輯與生成器

--
商業專用高級人工智慧視頻套件 | AKOOL

AKOOL是一個突破性的生成式人工智慧平台,專門用於個性化的視覺行銷和廣告。有了AKOOL,行銷創作者和創新者可以打造定制的、引人入勝的體驗,讓人們深入品牌,並以一種轉化為忠實客戶的方式參與其中。

1.1 M
更多標籤關於: 在生成圖像流形上進行交互式基於點的操作:拖動您的GAN