Replicate.com : Générez des prompts textuels qui correspondent étroitement à une image avec style en utilisant l'outil Img2Prompt de Methexis Inc. Optimisé pour la diffusion stable (clip ViT-L/14).

Methexis-Inc Img2prompt API sur Replicate

Introduction

Qu'est-ce que methexis-inc/img2prompt?

methexis-inc/img2prompt est un modèle qui génère une approximation de texte prompt, avec style, correspondant à une image. Il est optimisé pour la diffusion stable (clip ViT-L/14).

Comment utiliser methexis-inc/img2prompt

Vous pouvez utiliser methexis-inc/img2prompt à travers diverses méthodes, y compris Node.js, Python, Elixir, HTTP, Cog et Docker. Voici quelques exemples d'utilisation du modèle :

Node.js

const replicate = new Replicate({
  auth: process.env.REPLICATE_API_TOKEN,
});

const output = await replicate.run(
  "methexis-inc/img2prompt:50adaf2d3ad20a6f911a8a9e3ccf777b263b8596fbd2c8fc26e8888f8a0edbb5",
  {
    input: {
      image: "https://replicate.delivery/mgxm/8b4d747d-feca-477d-8069-ee4d5f89ad8e/a_high_detail_shot_of_a_cat_wearing_a_suit_realism_8k_-n_9_.png"
    }
  }
);
console.log(output);

Python

import replicate

output = replicate.run(
    "methexis-inc/img2prompt:50adaf2d3ad20a6f911a8a9e3ccf777b263b8596fbd2c8fc26e8888f8a0edbb5",
    input={
        "image": "https://replicate.delivery/mgxm/8b4d747d-feca-477d-8069-ee4d5f89ad8e/a_high_detail_shot_of_a_cat_wearing_a_suit_realism_8k_-n_9_.png"
    }
)
print(output)

Elixir

output = Replicate.run(
  "methexis-inc/img2prompt:50adaf2d3ad20a6f911a8a9e3ccf777b263b8596fbd2c8fc26e8888f8a0edbb5",
  %{
    image: "https://replicate.delivery/mgxm/8b4d747d-feca-477d-8069-ee4d5f89ad8e/a_high_detail_shot_of_a_cat_wearing_a_suit_realism_8k_-n_9_.png"
  }
)
IO.inspect(output)

HTTP

curl -s -X POST \
  -H "Authorization: Bearer $REPLICATE_API_TOKEN" \
  -H "Content-Type: application/json" \
  -d $'{
    "version": "50adaf2d3ad20a6f911a8a9e3ccf777b263b8596fbd2c8fc26e8888f8a0edbb5",
    "input": {
      "image": "https://replicate.delivery/mgxm/8b4d747d-feca-477d-8069-ee4d5f89ad8e/a_high_detail_shot_of_a_cat_wearing_a_suit_realism_8k_-n_9_.png"
    }
  }' \
  https://api.replicate.com/v1/predictions

Cog

cog predict r8.im/methexis-inc/img2prompt@sha256:50adaf2d3ad20a6f911a8a9e3ccf777b263b8596fbd2c8fc26e8888f8a0edbb5 \
  -i 'image="https://replicate.delivery/mgxm/8b4d747d-feca-477d-8069-ee4d5f89ad8e/a_high_detail_shot_of_a_cat_wearing_a_suit_realism_8k_-n_9_.png"'

Docker

docker run -d -p 5000:5000 --gpus=all r8.im/methexis-inc/img2prompt@sha256:50adaf2d3ad20a6f911a8a9e3ccf777b263b8596fbd2c8fc26e8888f8a0edbb5
curl -s -X POST \
  -H "Content-Type: application/json" \
  -d $'{
    "input": {
      "image": "https://replicate.delivery/mgxm/8b4d747d-feca-477d-8069-ee4d5f89ad8e/a_high_detail_shot_of_a_cat_wearing_a_suit_realism_8k_-n_9_.png"
    }
  }' \
  http://localhost:5000/predictions

Caractéristiques de methexis-inc/img2prompt

Le modèle fournit des approximations de texte prompt qui peuvent être utilisées avec la diffusion stable pour recréer des versions similaires de l'image/peinture. Il s'agit d'une version légèrement adaptée du notebook CLIP Interrogator par @pharmapsychotic.

Tarification de methexis-inc/img2prompt

La tarification de methexis-inc/img2prompt n'est pas spécifiée. Cependant, le modèle fonctionne sur du matériel GPU Nvidia T4, et les prédictions se terminent généralement en 51 secondes. Le temps de prédiction pour ce modèle varie considérablement en fonction des entrées.

Methexis-Inc - Alternative

Molmo

Molmo - Modèle multimodal d'IA open-source pour la compréhension visuelle et les applications robotiques

1.7 K
PixelDance 8Pixlabs

PixelDance 8Pixlabs - Démo Gratuite de Molmo IA en Ligne

8.7 K
PicPicAI

PicPicAI - Outils d'Édition Photo AI & Améliorateur | Supprimeur de Fond AI & Générateur d'Images

21.7 K
Spotify Bedroom

Spotify Bedroom - Transformez votre espace avec une décoration inspirée par la musique et des playlists en ligne

1.2 K
Plus de tags sur: Methexis-Inc Img2prompt API sur Replicate