methexis-inc/img2promptとは何ですか?
methexis-inc/img2promptは、画像に一致するスタイルを持つおおよそのテキストプロンプトを生成するモデルです。このモデルは、安定した拡散(clip ViT-L/14)に最適化されています。
methexis-inc/img2promptの使用方法
methexis-inc/img2promptは、Node.js、Python、Elixir、HTTP、Cog、Dockerなどさまざまな方法で使用できます。以下は、モデルの使用方法の例です:
Node.js
const replicate = new Replicate({
auth: process.env.REPLICATE_API_TOKEN,
});
const output = await replicate.run(
"methexis-inc/img2prompt:50adaf2d3ad20a6f911a8a9e3ccf777b263b8596fbd2c8fc26e8888f8a0edbb5",
{
input: {
image: "https://replicate.delivery/mgxm/8b4d747d-feca-477d-8069-ee4d5f89ad8e/a_high_detail_shot_of_a_cat_wearing_a_suit_realism_8k_-n_9_.png"
}
}
);
console.log(output);
Python
import replicate
output = replicate.run(
"methexis-inc/img2prompt:50adaf2d3ad20a6f911a8a9e3ccf777b263b8596fbd2c8fc26e8888f8a0edbb5",
input={
"image": "https://replicate.delivery/mgxm/8b4d747d-feca-477d-8069-ee4d5f89ad8e/a_high_detail_shot_of_a_cat_wearing_a_suit_realism_8k_-n_9_.png"
}
)
print(output)
Elixir
output = Replicate.run(
"methexis-inc/img2prompt:50adaf2d3ad20a6f911a8a9e3ccf777b263b8596fbd2c8fc26e8888f8a0edbb5",
%{
image: "https://replicate.delivery/mgxm/8b4d747d-feca-477d-8069-ee4d5f89ad8e/a_high_detail_shot_of_a_cat_wearing_a_suit_realism_8k_-n_9_.png"
}
)
IO.inspect(output)
HTTP
curl -s -X POST \
-H "Authorization: Bearer $REPLICATE_API_TOKEN" \
-H "Content-Type: application/json" \
-d $'{
"version": "50adaf2d3ad20a6f911a8a9e3ccf777b263b8596fbd2c8fc26e8888f8a0edbb5",
"input": {
"image": "https://replicate.delivery/mgxm/8b4d747d-feca-477d-8069-ee4d5f89ad8e/a_high_detail_shot_of_a_cat_wearing_a_suit_realism_8k_-n_9_.png"
}
}' \
https://api.replicate.com/v1/predictions
Cog
cog predict r8.im/methexis-inc/img2prompt@sha256:50adaf2d3ad20a6f911a8a9e3ccf777b263b8596fbd2c8fc26e8888f8a0edbb5 \
-i 'image="https://replicate.delivery/mgxm/8b4d747d-feca-477d-8069-ee4d5f89ad8e/a_high_detail_shot_of_a_cat_wearing_a_suit_realism_8k_-n_9_.png"'
Docker
docker run -d -p 5000:5000 --gpus=all r8.im/methexis-inc/img2prompt@sha256:50adaf2d3ad20a6f911a8a9e3ccf777b263b8596fbd2c8fc26e8888f8a0edbb5
curl -s -X POST \
-H "Content-Type: application/json" \
-d $'{
"input": {
"image": "https://replicate.delivery/mgxm/8b4d747d-feca-477d-8069-ee4d5f89ad8e/a_high_detail_shot_of_a_cat_wearing_a_suit_realism_8k_-n_9_.png"
}
}' \
http://localhost:5000/predictions
methexis-inc/img2promptの機能
このモデルは、画像/絵画の類似した外観のバージョンを再現するために安定した拡散で使用できるおおよそのテキストプロンプトを提供します。これは、@pharmapsychoticによるCLIPインターロゲーターノートブックのわずかに適応されたバージョンです。
methexis-inc/img2promptの価格設定
methexis-inc/img2promptの価格設定は明記されていません。ただし、このモデルはNvidia T4 GPUハードウェア上で実行され、通常51秒以内に予測が完了します。このモデルの予測時間は、入力に基づいて大幅に異なります。