Was ist methexis-inc/img2prompt?
methexis-inc/img2prompt ist ein Modell, das einen ungefähren Text-Prompt mit Stil generiert, der zu einem Bild passt. Es ist optimiert für stable-diffusion (clip ViT-L/14).
Wie man methexis-inc/img2prompt verwendet
Sie können methexis-inc/img2prompt über verschiedene Methoden verwenden, einschließlich Node.js, Python, Elixir, HTTP, Cog und Docker. Hier sind einige Beispiele, wie man das Modell verwendet:
Node.js
const replicate = new Replicate({
auth: process.env.REPLICATE_API_TOKEN,
});
const output = await replicate.run(
"methexis-inc/img2prompt:50adaf2d3ad20a6f911a8a9e3ccf777b263b8596fbd2c8fc26e8888f8a0edbb5",
{
input: {
image: "https://replicate.delivery/mgxm/8b4d747d-feca-477d-8069-ee4d5f89ad8e/a_high_detail_shot_of_a_cat_wearing_a_suit_realism_8k_-n_9_.png"
}
}
);
console.log(output);
Python
import replicate
output = replicate.run(
"methexis-inc/img2prompt:50adaf2d3ad20a6f911a8a9e3ccf777b263b8596fbd2c8fc26e8888f8a0edbb5",
input={
"image": "https://replicate.delivery/mgxm/8b4d747d-feca-477d-8069-ee4d5f89ad8e/a_high_detail_shot_of_a_cat_wearing_a_suit_realism_8k_-n_9_.png"
}
)
print(output)
Elixir
output = Replicate.run(
"methexis-inc/img2prompt:50adaf2d3ad20a6f911a8a9e3ccf777b263b8596fbd2c8fc26e8888f8a0edbb5",
%{
image: "https://replicate.delivery/mgxm/8b4d747d-feca-477d-8069-ee4d5f89ad8e/a_high_detail_shot_of_a_cat_wearing_a_suit_realism_8k_-n_9_.png"
}
)
IO.inspect(output)
HTTP
curl -s -X POST \
-H "Authorization: Bearer $REPLICATE_API_TOKEN" \
-H "Content-Type: application/json" \
-d $'{
"version": "50adaf2d3ad20a6f911a8a9e3ccf777b263b8596fbd2c8fc26e8888f8a0edbb5",
"input": {
"image": "https://replicate.delivery/mgxm/8b4d747d-feca-477d-8069-ee4d5f89ad8e/a_high_detail_shot_of_a_cat_wearing_a_suit_realism_8k_-n_9_.png"
}
}' \
https://api.replicate.com/v1/predictions
Cog
cog predict r8.im/methexis-inc/img2prompt@sha256:50adaf2d3ad20a6f911a8a9e3ccf777b263b8596fbd2c8fc26e8888f8a0edbb5 \
-i 'image="https://replicate.delivery/mgxm/8b4d747d-feca-477d-8069-ee4d5f89ad8e/a_high_detail_shot_of_a_cat_wearing_a_suit_realism_8k_-n_9_.png"'
Docker
docker run -d -p 5000:5000 --gpus=all r8.im/methexis-inc/img2prompt@sha256:50adaf2d3ad20a6f911a8a9e3ccf777b263b8596fbd2c8fc26e8888f8a0edbb5
curl -s -X POST \
-H "Content-Type: application/json" \
-d $'{
"input": {
"image": "https://replicate.delivery/mgxm/8b4d747d-feca-477d-8069-ee4d5f89ad8e/a_high_detail_shot_of_a_cat_wearing_a_suit_realism_8k_-n_9_.png"
}
}' \
http://localhost:5000/predictions
Funktionen von methexis-inc/img2prompt
Das Modell bietet ungefähre Text-Prompts, die mit stable diffusion verwendet werden können, um ähnlich aussehende Versionen des Bildes/Gemäldes zu reproduzieren. Es handelt sich um eine leicht angepasste Version des CLIP Interrogator-Notebooks von @pharmapsychotic.
Preisgestaltung von methexis-inc/img2prompt
Die Preisgestaltung von methexis-inc/img2prompt ist nicht spezifiziert. Das Modell läuft jedoch auf Nvidia T4 GPU-Hardware, und Vorhersagen werden in der Regel innerhalb von 51 Sekunden abgeschlossen. Die Vorhersagezeit für dieses Modell variiert erheblich je nach den Eingaben.