¿Qué es methexis-inc/img2prompt?
methexis-inc/img2prompt es un modelo que genera una aproximación de un texto de estilo que coincide con una imagen. Está optimizado para la difusión estable (clip ViT-L/14).
Cómo usar methexis-inc/img2prompt
Puedes usar methexis-inc/img2prompt a través de varios métodos, incluyendo Node.js, Python, Elixir, HTTP, Cog y Docker. Aquí tienes algunos ejemplos de cómo usar el modelo:
Node.js
const replicate = new Replicate({
auth: process.env.REPLICATE_API_TOKEN,
});
const output = await replicate.run(
"methexis-inc/img2prompt:50adaf2d3ad20a6f911a8a9e3ccf777b263b8596fbd2c8fc26e8888f8a0edbb5",
{
input: {
image: "https://replicate.delivery/mgxm/8b4d747d-feca-477d-8069-ee4d5f89ad8e/a_high_detail_shot_of_a_cat_wearing_a_suit_realism_8k_-n_9_.png"
}
}
);
console.log(output);
Python
import replicate
output = replicate.run(
"methexis-inc/img2prompt:50adaf2d3ad20a6f911a8a9e3ccf777b263b8596fbd2c8fc26e8888f8a0edbb5",
input={
"image": "https://replicate.delivery/mgxm/8b4d747d-feca-477d-8069-ee4d5f89ad8e/a_high_detail_shot_of_a_cat_wearing_a_suit_realism_8k_-n_9_.png"
}
)
print(output)
Elixir
output = Replicate.run(
"methexis-inc/img2prompt:50adaf2d3ad20a6f911a8a9e3ccf777b263b8596fbd2c8fc26e8888f8a0edbb5",
%{
image: "https://replicate.delivery/mgxm/8b4d747d-feca-477d-8069-ee4d5f89ad8e/a_high_detail_shot_of_a_cat_wearing_a_suit_realism_8k_-n_9_.png"
}
)
IO.inspect(output)
HTTP
curl -s -X POST \
-H "Authorization: Bearer $REPLICATE_API_TOKEN" \
-H "Content-Type: application/json" \
-d $'{
"version": "50adaf2d3ad20a6f911a8a9e3ccf777b263b8596fbd2c8fc26e8888f8a0edbb5",
"input": {
"image": "https://replicate.delivery/mgxm/8b4d747d-feca-477d-8069-ee4d5f89ad8e/a_high_detail_shot_of_a_cat_wearing_a_suit_realism_8k_-n_9_.png"
}
}' \
https://api.replicate.com/v1/predictions
Cog
cog predict r8.im/methexis-inc/img2prompt@sha256:50adaf2d3ad20a6f911a8a9e3ccf777b263b8596fbd2c8fc26e8888f8a0edbb5 \
-i 'image="https://replicate.delivery/mgxm/8b4d747d-feca-477d-8069-ee4d5f89ad8e/a_high_detail_shot_of_a_cat_wearing_a_suit_realism_8k_-n_9_.png"'
Docker
docker run -d -p 5000:5000 --gpus=all r8.im/methexis-inc/img2prompt@sha256:50adaf2d3ad20a6f911a8a9e3ccf777b263b8596fbd2c8fc26e8888f8a0edbb5
curl -s -X POST \
-H "Content-Type: application/json" \
-d $'{
"input": {
"image": "https://replicate.delivery/mgxm/8b4d747d-feca-477d-8069-ee4d5f89ad8e/a_high_detail_shot_of_a_cat_wearing_a_suit_realism_8k_-n_9_.png"
}
}' \
http://localhost:5000/predictions
Características de methexis-inc/img2prompt
El modelo proporciona aproximaciones de texto que pueden ser usadas con difusión estable para recrear versiones similares de la imagen/pintura. Es una versión ligeramente adaptada del cuaderno CLIP Interrogator por @pharmapsychotic.
Precios de methexis-inc/img2prompt
No se especifica el precio de methexis-inc/img2prompt. Sin embargo, el modelo se ejecuta en hardware Nvidia T4 GPU, y las predicciones suelen completarse en aproximadamente 51 segundos. El tiempo de predicción para este modelo varía significativamente según las entradas.