合成滿足用戶需求的視覺內容通常需要對生成的物件的姿勢、形狀、表情和佈局進行靈活和精確的控制。現有方法通常通過手動標註的訓練數據或先前的3D模型來實現生成對抗網絡(GANs)的可控性,但這些方法往往缺乏靈活性、精確性和通用性。在這項工作中,我們研究了一種強大但較少探索的控制GANs的方法,即

在生成圖像流形上進行交互式基於點的操作:拖動您的GAN

介紹

什麼是 DragGAN?

DragGAN 是一個強大的工具,用於對生成圖像流形上的基於點的互動操作。它允許用戶以用戶互動的方式“拖動”圖像的任何點,以精確地達到目標點。

DragGAN 如何工作?

DragGAN 由兩個主要組件組成:1)基於特徵的運動監督,推動手柄點向目標位置移動,2)一種新的點跟踪方法,利用區分性 GAN 特徵來持續定位手柄點的位置。

DragGAN 的特點

  • 可精確控制像素的移動位置,從而操縱各種類別的姿勢、形狀、表情和佈局,如動物、汽車、人類、風景等。
  • 具有變形圖像的能力,產生逼真的輸出,即使在具有挑戰性的情況下,例如幻覺遮蔽內容和變形形狀,仍能始終遵循對象的剛性。
  • 可用於圖像操作和點跟踪任務。

價格

論文和代碼可免費獲得,網站上的圖像、文本和視頻文件可根據創用 CC BY-NC 4.0 許可證免費供非商業用途使用。

在生成圖像流形上進行交互式基於點的操作:拖動您的GAN - 替代

在Telegram上的T.me:Stable Diffusion Bot - AI藝術生成助手

T.me:穩定擴散愛好者,探索非官方機器人,實現無縫互動,由@neuralpony提供支持,並通過@neuralforum獲得即時支持,讓您輕鬆體驗。

806.4 M
Tangia - 互動串流

通過 Tangia 在您的直播中提高聊天互動

139.4 K
適用於2至20,000人團隊的企業人工智慧軟體 | Team-GPT

Team-GPT 幫助公司採用 ChatGPT 進行工作。在共享工作空間中組織知識、協作並精通人工智慧。100% 私密和安全。

281.8 K
Tensor.Art | 免費的線上圖像生成器和模型託管網站!

AI 模型共享平台,線上運行模型以免費生成圖像。您可以上傳或下載模型,包括檢查點、嵌入、控制網、LoRA 等。同時我們還提供一些基礎模型,如穩定擴散 1.5 和 XL 進行生成。

5.2 M
更多標籤關於: 在生成圖像流形上進行交互式基於點的操作:拖動您的GAN