合成符合用户需求的视觉内容通常需要对生成对象的姿势、形状、表情和布局具有灵活和精确的可控性。现有方法通过手动注释的训练数据或先前的3D模型来获得生成对抗网络(GANs)的可控性,但往往缺乏灵活性、精确性和普适性。在这项工作中,我们研究了一种强大但鲜为人知的控制GANs的方式,即

拖动您的GAN:在生成图像流形上进行交互式基于点的操作

简介

什么是 DragGAN?

DragGAN 是一个强大的工具,用于在生成图像流形上进行基于点的交互式操作。它允许用户以用户交互的方式“拖动”图像的任何点,精确地达到目标点。

DragGAN 如何工作?

DragGAN 由两个主要组成部分组成:1)基于特征的运动监督,驱动手柄点向目标位置移动,2)利用辨别性 GAN 特征的新点跟踪方法,持续定位手柄点的位置。

DragGAN 的特点

  • 对像素去向有精确控制,从而操纵动物、汽车、人类、风景等各种类别的姿势、形状、表情和布局。
  • 能够以逼真的输出对图像进行变形,即使在挑战性场景下,如幻觉遮挡内容和变形形状,仍能保持对象的刚性。
  • 可用于图像操作和点跟踪任务。

价格

论文和代码可免费获取,网站上的图像、文本和视频文件可根据创意共享署名-非商业性使用 4.0 许可证免费使用。

拖动您的GAN:在生成图像流形上进行交互式基于点的操作 - 可选替代

使用AI图像编辑创作令人惊叹的艺术 - 文字绘画

Paintbytext.chat: 使用AI技术在Paint by Text上编辑您的照片,通过书面指导。通过生成式AI模型生成独特的抽象图像和3D渲染,尝试。使用这款创新的AI工具,通过基于文本的指导复制和修改图像。

--
在线为照片上色 | 免费试用 | 逼真色彩

Palette.fm:使用Palette.fm的AI在线编辑器,即刻为您的黑白图像上色。探索订阅计划和关键功能,实现高效的照片上色。立即阅读一篇全面的Palette FM评论。

--
PDF2Anki | 每天手动制作单词卡,节省几个小时

在几秒钟内将讲座幻灯片、笔记和PowerPoints转换成闪卡,并与它们交谈。

--
Phot AI

Phot.ai:发现 Phot AI,您终极的高级 AI 照片编辑目的地。我们创新的视觉设计平台提供强大的图像处理工具、无缝的照片编辑功能和动态背景更换器,让您轻松转换图像。释放您的创造力,使用用户友好的在线工具,提升您的摄影体验。

--
更多相关标签: 拖动您的GAN:在生成图像流形上进行交互式基于点的操作