Einführung

Was ist Segment Anything?

Segment Anything ist ein neues KI-Modell von Meta AI, das mit einem einzigen Klick jedes Objekt in einem Bild "ausschneiden" kann. Es handelt sich um ein anweisbares Segmentierungssystem mit Null-Schuss-Verallgemeinerung auf unbekannte Objekte und Bilder, ohne zusätzliches Training.

Wie funktioniert Segment Anything?

Segment Anything verwendet verschiedene Eingabeaufforderungen, einschließlich der Spezifizierung dessen, was in einem Bild segmentiert werden soll, und ermöglicht so eine Vielzahl von Segmentierungsaufgaben ohne zusätzliches Training. Es kann auch Eingabeaufforderungen von anderen Systemen wie einem Objektdetektor entgegennehmen und mehrere gültige Masken für mehrdeutige Aufforderungen generieren.

Merkmale von Segment Anything

Anweisbares Design ermöglicht flexible Integration mit anderen Systemen
Erweiterbare Ausgaben können als Eingaben für andere KI-Systeme verwendet werden
Null-Schuss-Verallgemeinerung auf unbekannte Objekte und Bilder ohne zusätzliches Training
Kann Eingabeaufforderungen von anderen Systemen wie einem Objektdetektor entgegennehmen
Kann mehrere gültige Masken für mehrdeutige Aufforderungen generieren

Preis

Das Modell ist Open Source und auf GitHub verfügbar, und der Datensatz kann heruntergeladen werden.

Training des Modells

Das Modell wurde auf einem Datensatz von 11 Millionen Bildern und 1,1 Milliarden Segmentierungsmasken trainiert, unter Verwendung eines Modells-im-Schleifen-"Datenmotors", der Bilder interaktiv annotierte und das Modell aktualisierte.

Meta KI Computer Vision Forschung