Replicate.com: Generieren Sie Textvorgaben, die einem Bild mit Stil mit Methexis Inc's Img2Prompt-Tool nahe kommen. Optimiert für stabile Diffusion (Clip ViT-L/14).

Methexis-Inc Img2prompt API auf Replicate

Einführung

Was ist methexis-inc/img2prompt?

methexis-inc/img2prompt ist ein Modell, das einen ungefähren Text-Prompt mit Stil generiert, der zu einem Bild passt. Es ist optimiert für stable-diffusion (clip ViT-L/14).

Wie man methexis-inc/img2prompt verwendet

Sie können methexis-inc/img2prompt über verschiedene Methoden verwenden, einschließlich Node.js, Python, Elixir, HTTP, Cog und Docker. Hier sind einige Beispiele, wie man das Modell verwendet:

Node.js

const replicate = new Replicate({
  auth: process.env.REPLICATE_API_TOKEN,
});

const output = await replicate.run(
  "methexis-inc/img2prompt:50adaf2d3ad20a6f911a8a9e3ccf777b263b8596fbd2c8fc26e8888f8a0edbb5",
  {
    input: {
      image: "https://replicate.delivery/mgxm/8b4d747d-feca-477d-8069-ee4d5f89ad8e/a_high_detail_shot_of_a_cat_wearing_a_suit_realism_8k_-n_9_.png"
    }
  }
);
console.log(output);

Python

import replicate

output = replicate.run(
    "methexis-inc/img2prompt:50adaf2d3ad20a6f911a8a9e3ccf777b263b8596fbd2c8fc26e8888f8a0edbb5",
    input={
        "image": "https://replicate.delivery/mgxm/8b4d747d-feca-477d-8069-ee4d5f89ad8e/a_high_detail_shot_of_a_cat_wearing_a_suit_realism_8k_-n_9_.png"
    }
)
print(output)

Elixir

output = Replicate.run(
  "methexis-inc/img2prompt:50adaf2d3ad20a6f911a8a9e3ccf777b263b8596fbd2c8fc26e8888f8a0edbb5",
  %{
    image: "https://replicate.delivery/mgxm/8b4d747d-feca-477d-8069-ee4d5f89ad8e/a_high_detail_shot_of_a_cat_wearing_a_suit_realism_8k_-n_9_.png"
  }
)
IO.inspect(output)

HTTP

curl -s -X POST \
  -H "Authorization: Bearer $REPLICATE_API_TOKEN" \
  -H "Content-Type: application/json" \
  -d $'{
    "version": "50adaf2d3ad20a6f911a8a9e3ccf777b263b8596fbd2c8fc26e8888f8a0edbb5",
    "input": {
      "image": "https://replicate.delivery/mgxm/8b4d747d-feca-477d-8069-ee4d5f89ad8e/a_high_detail_shot_of_a_cat_wearing_a_suit_realism_8k_-n_9_.png"
    }
  }' \
  https://api.replicate.com/v1/predictions

Cog

cog predict r8.im/methexis-inc/img2prompt@sha256:50adaf2d3ad20a6f911a8a9e3ccf777b263b8596fbd2c8fc26e8888f8a0edbb5 \
  -i 'image="https://replicate.delivery/mgxm/8b4d747d-feca-477d-8069-ee4d5f89ad8e/a_high_detail_shot_of_a_cat_wearing_a_suit_realism_8k_-n_9_.png"'

Docker

docker run -d -p 5000:5000 --gpus=all r8.im/methexis-inc/img2prompt@sha256:50adaf2d3ad20a6f911a8a9e3ccf777b263b8596fbd2c8fc26e8888f8a0edbb5
curl -s -X POST \
  -H "Content-Type: application/json" \
  -d $'{
    "input": {
      "image": "https://replicate.delivery/mgxm/8b4d747d-feca-477d-8069-ee4d5f89ad8e/a_high_detail_shot_of_a_cat_wearing_a_suit_realism_8k_-n_9_.png"
    }
  }' \
  http://localhost:5000/predictions

Funktionen von methexis-inc/img2prompt

Das Modell bietet ungefähre Text-Prompts, die mit stable diffusion verwendet werden können, um ähnlich aussehende Versionen des Bildes/Gemäldes zu reproduzieren. Es handelt sich um eine leicht angepasste Version des CLIP Interrogator-Notebooks von @pharmapsychotic.

Preisgestaltung von methexis-inc/img2prompt

Die Preisgestaltung von methexis-inc/img2prompt ist nicht spezifiziert. Das Modell läuft jedoch auf Nvidia T4 GPU-Hardware, und Vorhersagen werden in der Regel innerhalb von 51 Sekunden abgeschlossen. Die Vorhersagezeit für dieses Modell variiert erheblich je nach den Eingaben.

Methexis-Inc - Alternative

Midjourney SREF Codes Bibliothek - Entdecken Sie einzigartige Stile

Entdecken Sie über 100 einzigartige MidJourney sref-Code-Stile und sehen Sie die beliebtesten Empfehlungen, um Ihren perfekten MidJourney sref-Code-Effekt einfach zu finden.

99.5 K
AiHub

Öffnen Sie sich kostenlos den Zugang zu neuronalen Netzen!

--
AI-Fotogenerator | Foto-KI™

Erzeugen Sie fotorealistische Bilder von Menschen mit KI. Nehmen Sie atemberaubende Fotos von Menschen mit dem ersten KI-Fotografen auf! Generieren Sie Foto- und Videomaterial für Ihre...

251.6 K
Ziehen Sie Ihren GAN: Interaktive punktbasierte Manipulation auf dem generativen Bildmanifold

Die Synthese visueller Inhalte, die den Bedürfnissen der Benutzer gerecht werden, erfordert oft eine flexible und präzise Steuerbarkeit der Pose, Form, Ausdruck und Anordnung der generierten Objekte. Bestehende Ansätze erlangen die Steuerbarkeit von generativen adversarialen Netzwerken (GANs) über manuell annotierte Trainingsdaten oder ein zuvor erstelltes 3D-Modell, die oft an Flexibilität, Präzision und Allgemeingültigkeit mangeln. In dieser Arbeit untersuchen wir einen leistungsstarken, aber viel weniger erforschten Weg zur Steuerung von GANs, nämlich zu

--
Weitere Tags über: Methexis-Inc Img2prompt API auf Replicate