Replicate.com : Générez des prompts textuels qui correspondent étroitement à une image avec style en utilisant l'outil Img2Prompt de Methexis Inc. Optimisé pour la diffusion stable (clip ViT-L/14).

Methexis-Inc Img2prompt API sur Replicate

Présentation

Qu'est-ce que methexis-inc/img2prompt?

methexis-inc/img2prompt est un modèle qui génère une approximation de texte prompt, avec style, correspondant à une image. Il est optimisé pour la diffusion stable (clip ViT-L/14).

Comment utiliser methexis-inc/img2prompt

Vous pouvez utiliser methexis-inc/img2prompt à travers diverses méthodes, y compris Node.js, Python, Elixir, HTTP, Cog et Docker. Voici quelques exemples d'utilisation du modèle :

Node.js

const replicate = new Replicate({
  auth: process.env.REPLICATE_API_TOKEN,
});

const output = await replicate.run(
  "methexis-inc/img2prompt:50adaf2d3ad20a6f911a8a9e3ccf777b263b8596fbd2c8fc26e8888f8a0edbb5",
  {
    input: {
      image: "https://replicate.delivery/mgxm/8b4d747d-feca-477d-8069-ee4d5f89ad8e/a_high_detail_shot_of_a_cat_wearing_a_suit_realism_8k_-n_9_.png"
    }
  }
);
console.log(output);

Python

import replicate

output = replicate.run(
    "methexis-inc/img2prompt:50adaf2d3ad20a6f911a8a9e3ccf777b263b8596fbd2c8fc26e8888f8a0edbb5",
    input={
        "image": "https://replicate.delivery/mgxm/8b4d747d-feca-477d-8069-ee4d5f89ad8e/a_high_detail_shot_of_a_cat_wearing_a_suit_realism_8k_-n_9_.png"
    }
)
print(output)

Elixir

output = Replicate.run(
  "methexis-inc/img2prompt:50adaf2d3ad20a6f911a8a9e3ccf777b263b8596fbd2c8fc26e8888f8a0edbb5",
  %{
    image: "https://replicate.delivery/mgxm/8b4d747d-feca-477d-8069-ee4d5f89ad8e/a_high_detail_shot_of_a_cat_wearing_a_suit_realism_8k_-n_9_.png"
  }
)
IO.inspect(output)

HTTP

curl -s -X POST \
  -H "Authorization: Bearer $REPLICATE_API_TOKEN" \
  -H "Content-Type: application/json" \
  -d $'{
    "version": "50adaf2d3ad20a6f911a8a9e3ccf777b263b8596fbd2c8fc26e8888f8a0edbb5",
    "input": {
      "image": "https://replicate.delivery/mgxm/8b4d747d-feca-477d-8069-ee4d5f89ad8e/a_high_detail_shot_of_a_cat_wearing_a_suit_realism_8k_-n_9_.png"
    }
  }' \
  https://api.replicate.com/v1/predictions

Cog

cog predict r8.im/methexis-inc/img2prompt@sha256:50adaf2d3ad20a6f911a8a9e3ccf777b263b8596fbd2c8fc26e8888f8a0edbb5 \
  -i 'image="https://replicate.delivery/mgxm/8b4d747d-feca-477d-8069-ee4d5f89ad8e/a_high_detail_shot_of_a_cat_wearing_a_suit_realism_8k_-n_9_.png"'

Docker

docker run -d -p 5000:5000 --gpus=all r8.im/methexis-inc/img2prompt@sha256:50adaf2d3ad20a6f911a8a9e3ccf777b263b8596fbd2c8fc26e8888f8a0edbb5
curl -s -X POST \
  -H "Content-Type: application/json" \
  -d $'{
    "input": {
      "image": "https://replicate.delivery/mgxm/8b4d747d-feca-477d-8069-ee4d5f89ad8e/a_high_detail_shot_of_a_cat_wearing_a_suit_realism_8k_-n_9_.png"
    }
  }' \
  http://localhost:5000/predictions

Caractéristiques de methexis-inc/img2prompt

Le modèle fournit des approximations de texte prompt qui peuvent être utilisées avec la diffusion stable pour recréer des versions similaires de l'image/peinture. Il s'agit d'une version légèrement adaptée du notebook CLIP Interrogator par @pharmapsychotic.

Tarification de methexis-inc/img2prompt

La tarification de methexis-inc/img2prompt n'est pas spécifiée. Cependant, le modèle fonctionne sur du matériel GPU Nvidia T4, et les prédictions se terminent généralement en 51 secondes. Le temps de prédiction pour ce modèle varie considérablement en fonction des entrées.

Methexis-Inc - Alternative

Améliorez l'image pour des visuels époustouflants avec l'IA | Améliorez les photos jusqu'à une résolution de 4K

Améliorez la résolution de vos images avec notre logiciel de mise à l'échelle alimenté par l'IA. Augmentez la résolution, améliorez la qualité et restaurez d'anciennes photos en ligne !

--
Faites glisser votre GAN : Manipulation interactive basée sur des points sur le maniement d'images génératives

La synthèse de contenu visuel qui répond aux besoins des utilisateurs nécessite souvent une contrôlabilité flexible et précise de la pose, de la forme, de l'expression et de la disposition des objets générés. Les approches existantes acquièrent la contrôlabilité des réseaux antagonistes génératifs (GAN) via des données d'entraînement annotées manuellement ou un modèle 3D préalable, qui manquent souvent de flexibilité, de précision et de généralité. Dans ce travail, nous étudions une manière puissante mais beaucoup moins explorée de contrôler les GAN, à savoir

--
Free Face Rating

Free Face Rating - Analyse Faciale par AI pour Déterminer Votre Beauté en Ligne (Évaluation Faciale Gratuite, Videoweb, AI, Analyse Faciale)

--
Logiciel de montage vidéo IA | Outils de montage vidéo en ligne simples

Wearenova.ai : Créez des vidéos époustouflantes avec notre plateforme de montage vidéo en ligne alimentée par l'IA. Rognez, coupez et fusionnez vos clips facilement. Ajoutez des sous-titres, des traductions et plus encore avec nos outils de montage vidéo conviviaux. Aucune installation requise - tout est fait en ligne pour votre confort.

--
Plus de tags sur: Methexis-Inc Img2prompt API sur Replicate