ユーザーのニーズに応じたビジュアルコンテンツを合成することは、生成されたオブジェクトのポーズ、形状、表情、およびレイアウトの柔軟かつ正確な制御を必要とすることがよくあります。既存のアプローチでは、生成的対抗ネットワーク(GAN)の制御可能性を、手動で注釈付けされたトレーニングデータや事前の3Dモデルを介して獲得していますが、これらはしばしば柔軟性、精度、一般性に欠けています。この研究では、GANを制御するための強力かつあまり探求されていない方法を検討しています。

あなたのGANを引っ張る:生成画像多様体上のインタラクティブなポイントベースの操作

紹介

DragGANとは何ですか?

DragGANは生成画像多様体上での対話型ポイントベースの操作において強力なツールです。これにより、ユーザーは画像の任意のポイントを「ドラッグ」して、ユーザーインタラクティブな方法で目標ポイントに正確に到達することができます。

DragGANはどのように機能しますか?

DragGANには2つの主要なコンポーネントがあります。1) ハンドルポイントを目標位置に移動させる特徴ベースのモーション監督、および2) ハンドルポイントの位置を継続的に特定するために識別的GAN特徴を活用する新しいポイントトラッキングアプローチが含まれています。

DragGANの特徴

  • ピクセルの移動先を正確に制御できるため、動物、車両、人物、風景などの様々なカテゴリのポーズ、形状、表情、レイアウトを操作できます。
  • オクルージョンされたコンテンツの幻想化や、オブジェクトの剛性に一貫して従う形状の変形など、難しいシナリオでもリアルな出力で画像を変形できます。
  • 画像操作やポイントトラッキングのタスクに使用できます。

価格

論文とコードは無料で提供されており、サイト上の画像、テキスト、ビデオファイルは、クリエイティブ・コモンズCC BY-NC 4.0ライセンスのもとで非営利目的で自由に利用できます。

あなたのGANを引っ張る:生成画像多様体上のインタラクティブなポイントベースの操作 - 代替案

オンラインで3Dイメージを作成する

Make3d.app: Make3Dを使用して画像を3Dに変換しましょう。この強力なオンラインツールは、写真を見事な3次元作品に変換します。

2.3 K
Stability.ai:Stable Animation SDK: Text-to-Animation Tool for Developers by Stability AI

Stability AIのStable Animation SDKは、芸術家や開発者が、高度なStable Diffusionモデル(Stable Diffusion 2.0やStable Diffusion XLを含む)を活用して息をのむようなアニメーションを生成することを可能にし、プロンプト、ソース画像、またはソースビデオから、前例のない創造的な可能性を開放します。

1.1 M
AI Powered Chatbot Development and Conversational AI Solutions

Chaibar.ai: Chaibarを使用してMacの体験を革新しましょう。この先端のAIアシスタントは、ChatGPTとDall-Eのパワーをシームレスに統合し、前例のない創造性と生産性を引き出すことができます。

--
創造的なアイデアの生成のためのAIパワード画像プロンプターツール

Sites.google.com: Image Prompterを使用してデザインワークフローを強化し、視覚コンテンツを作成および磨き上げる方法を革新しましょう。

216.8 M
に関するその他のタグ: あなたのGANを引っ張る:生成画像多様体上のインタラクティブなポイントベースの操作