ユーザーのニーズに応じたビジュアルコンテンツを合成することは、生成されたオブジェ...

ユーザーのニーズに応じたビジュアルコンテンツを合成することは、生成されたオブジェクトのポーズ、形状、表情、およびレイアウトの柔軟かつ正確な制御を必要とすることがよくあります。既存のアプローチでは、生成的対抗ネットワーク（GAN）の制御可能性を、手動で注釈付けされたトレーニングデータや事前の3Dモデルを介して獲得していますが、これらはしばしば柔軟性、精度、一般性に欠けています。この研究では、GANを制御するための強力かつあまり探求されていない方法を検討しています。

ウェブサイトへ

あなたのGANを引っ張る：生成画像多様体上のインタラクティブなポイントベースの操作

紹介

DragGANとは何ですか？

DragGANは生成画像多様体上での対話型ポイントベースの操作において強力なツールです。これにより、ユーザーは画像の任意のポイントを「ドラッグ」して、ユーザーインタラクティブな方法で目標ポイントに正確に到達することができます。

DragGANはどのように機能しますか？

DragGANには2つの主要なコンポーネントがあります。1) ハンドルポイントを目標位置に移動させる特徴ベースのモーション監督、および2) ハンドルポイントの位置を継続的に特定するために識別的GAN特徴を活用する新しいポイントトラッキングアプローチが含まれています。

DragGANの特徴

ピクセルの移動先を正確に制御できるため、動物、車両、人物、風景などの様々なカテゴリのポーズ、形状、表情、レイアウトを操作できます。
オクルージョンされたコンテンツの幻想化や、オブジェクトの剛性に一貫して従う形状の変形など、難しいシナリオでもリアルな出力で画像を変形できます。
画像操作やポイントトラッキングのタスクに使用できます。

価格

論文とコードは無料で提供されており、サイト上の画像、テキスト、ビデオファイルは、クリエイティブ・コモンズCC BY-NC 4.0ライセンスのもとで非営利目的で自由に利用できます。

あなたのGANを引っ張る：生成画像多様体上のインタラクティブなポイントベースの操作 - 代替

FeedHive - 大規模なコンテンツを作成する ⚡

FeedHive - 大規模なコンテンツを作成する ⚡

FeedHiveのAIパワードプラットフォームを使用して、規模の大きなソーシャルメディアコンテンツを簡単に作成、公開、管理できます

--

ぼやけた写真を修正するためのAIパワードツール - 復元、ぼかしを解除、シャープ化

ぼやけた写真を修正するためのAIパワードツール - 復元、ぼかしを解除、シャープ化

Fixblurry.photos: 当社のAIパワード写真修復サービスで古い思い出をよみがえらせましょう。Face Photo Restorerを使用して無料でぼやけた写真や損傷した写真を修復します。オンラインツールを使用して画像を向上させましょう。

--

Flim | クリエイティブな人々のための検索エンジン

Flim | クリエイティブな人々のための検索エンジン

Flimは、あなたのアイデアを表現するための完璧な画像を見つけるのに役立ちます

--

ChatGPT用のビジュアルインターフェース、FlowGPT

ChatGPT用のビジュアルインターフェース、FlowGPT

FlowGPTは、マルチスレッドのビジュアル会話フローを持つChatGPTのためのビジュアルインターフェースです

--

関連タグ: あなたのGANを引っ張る：生成画像多様体上のインタラクティブなポイントベースの操作