Что такое methexis-inc/img2prompt?
methexis-inc/img2prompt - это модель, которая генерирует приблизительный текстовый запрос с учетом стиля, соответствующий изображению. Она оптимизирована для stable-diffusion (clip ViT-L/14).
Как использовать methexis-inc/img2prompt
Вы можете использовать methexis-inc/img2prompt различными способами, включая Node.js, Python, Elixir, HTTP, Cog и Docker. Вот некоторые примеры использования модели:
Node.js
const replicate = new Replicate({
auth: process.env.REPLICATE_API_TOKEN,
});
const output = await replicate.run(
"methexis-inc/img2prompt:50adaf2d3ad20a6f911a8a9e3ccf777b263b8596fbd2c8fc26e8888f8a0edbb5",
{
input: {
image: "https://replicate.delivery/mgxm/8b4d747d-feca-477d-8069-ee4d5f89ad8e/a_high_detail_shot_of_a_cat_wearing_a_suit_realism_8k_-n_9_.png"
}
}
);
console.log(output);
Python
import replicate
output = replicate.run(
"methexis-inc/img2prompt:50adaf2d3ad20a6f911a8a9e3ccf777b263b8596fbd2c8fc26e8888f8a0edbb5",
input={
"image": "https://replicate.delivery/mgxm/8b4d747d-feca-477d-8069-ee4d5f89ad8e/a_high_detail_shot_of_a_cat_wearing_a_suit_realism_8k_-n_9_.png"
}
)
print(output)
Elixir
output = Replicate.run(
"methexis-inc/img2prompt:50adaf2d3ad20a6f911a8a9e3ccf777b263b8596fbd2c8fc26e8888f8a0edbb5",
%{
image: "https://replicate.delivery/mgxm/8b4d747d-feca-477d-8069-ee4d5f89ad8e/a_high_detail_shot_of_a_cat_wearing_a_suit_realism_8k_-n_9_.png"
}
)
IO.inspect(output)
HTTP
curl -s -X POST \
-H "Authorization: Bearer $REPLICATE_API_TOKEN" \
-H "Content-Type: application/json" \
-d $'{
"version": "50adaf2d3ad20a6f911a8a9e3ccf777b263b8596fbd2c8fc26e8888f8a0edbb5",
"input": {
"image": "https://replicate.delivery/mgxm/8b4d747d-feca-477d-8069-ee4d5f89ad8e/a_high_detail_shot_of_a_cat_wearing_a_suit_realism_8k_-n_9_.png"
}
}' \
https://api.replicate.com/v1/predictions
Cog
cog predict r8.im/methexis-inc/img2prompt@sha256:50adaf2d3ad20a6f911a8a9e3ccf777b263b8596fbd2c8fc26e8888f8a0edbb5 \
-i 'image="https://replicate.delivery/mgxm/8b4d747d-feca-477d-8069-ee4d5f89ad8e/a_high_detail_shot_of_a_cat_wearing_a_suit_realism_8k_-n_9_.png"'
Docker
docker run -d -p 5000:5000 --gpus=all r8.im/methexis-inc/img2prompt@sha256:50adaf2d3ad20a6f911a8a9e3ccf777b263b8596fbd2c8fc26e8888f8a0edbb5
curl -s -X POST \
-H "Content-Type: application/json" \
-d $'{
"input": {
"image": "https://replicate.delivery/mgxm/8b4d747d-feca-477d-8069-ee4d5f89ad8e/a_high_detail_shot_of_a_cat_wearing_a_suit_realism_8k_-n_9_.png"
}
}' \
http://localhost:5000/predictions
Особенности methexis-inc/img2prompt
Модель предоставляет приблизительные текстовые подсказки, которые можно использовать с помощью stable diffusion для создания похожих изображений/картинок. Это немного адаптированная версия блокнота CLIP Interrogator от @pharmapsychotic.
Ценообразование для methexis-inc/img2prompt
Ценообразование для methexis-inc/img2prompt не указано. Однако модель работает на оборудовании Nvidia T4 GPU, и прогнозы обычно завершаются в течение 51 секунд. Время предсказания для этой модели значительно варьируется в зависимости от входных данных.