Pesquisa de Visão Computacional da Meta AI

Segmentar qualquer coisa | Meta AI

Introdução

O que é o Segment Anything?

Segment Anything é um novo modelo de IA da Meta AI que pode "recortar" qualquer objeto, em qualquer imagem, com um único clique. É um sistema de segmentação promptable com generalização de zero-shot para objetos e imagens desconhecidos, sem a necessidade de treinamento adicional.

Como o Segment Anything funciona?

O Segment Anything utiliza uma variedade de prompts de entrada, incluindo a especificação do que segmentar em uma imagem, permitindo uma ampla gama de tarefas de segmentação sem a necessidade de treinamento adicional. Ele também pode receber prompts de entrada de outros sistemas, como um detector de objetos, e pode gerar múltiplas máscaras válidas para prompts ambíguos.

Recursos do Segment Anything

  • Design promptable permite integração flexível com outros sistemas
  • Saídas extensíveis podem ser usadas como entradas para outros sistemas de IA
  • Generalização de zero-shot para objetos e imagens desconhecidos sem a necessidade de treinamento adicional
  • Pode receber prompts de entrada de outros sistemas, como um detector de objetos
  • Pode gerar múltiplas máscaras válidas para prompts ambíguos

Preço

O modelo é de código aberto e está disponível no GitHub, e o conjunto de dados está disponível para download.

Treinamento do modelo

O modelo foi treinado em um conjunto de dados de 11 milhões de imagens e 1,1 bilhão de máscaras de segmentação, usando um "motor de dados" interativo no loop do modelo que anotava imagens e atualizava o modelo.

Segmentar - Alternativa

Brilliant Labs

AR de bolso para hackers imaginativos. Na Brilliant Labs, estamos construindo um ecossistema de código aberto para apoiar desenvolvedores e criativos que reimaginam o futuro.

35.5 K
API para Geração Automatizada de Imagens e Vídeos - Bannerbear

A API do Bannerbear ajuda você e sua equipe a gerar automaticamente visuais para redes sociais, banners de comércio eletrônico, vídeos de podcast e muito mais

156.8 K
Experimente Dalle 3 Grátis Online - Dall-E 3 IA de Imagem

Anunciado pela OpenAI, o DALL-E 3 representa a última iteração de seu revolucionário gerador de imagens de IA, demonstrando melhorias notáveis na tradução precisa de textos em visuais altamente realistas e detalhados. Lançado primeiro para usuários ChatGPT Plus e Enterprise em outubro de 2023, a integração estreita do DALL-E 3 com o ChatGPT simplifica a criação de prompts e a manutenção do contexto da imagem. Incorporando medidas de segurança contra conteúdo prejudicial e dando aos artistas controle sobre o uso da arte, o DALL-E 3 promete revolucionar a transformação de ideias em imagens precisas.

23.5 K
Desbloqueie conteúdo de IA generativa em escala | Synthesys.io

Descubra o poder da IA com os geradores de voz, vídeo e imagem da Synthesys.io. Eleve a criação do seu conteúdo e experimente nossas ferramentas gratuitamente hoje!

217.7 K
Mais tags sobre: Segmentar qualquer coisa | Meta AI