Pesquisa de Visão Computacional da Meta AI

Segmentar qualquer coisa | Meta AI

Introdução

O que é o Segment Anything?

Segment Anything é um novo modelo de IA da Meta AI que pode "recortar" qualquer objeto, em qualquer imagem, com um único clique. É um sistema de segmentação promptable com generalização de zero-shot para objetos e imagens desconhecidos, sem a necessidade de treinamento adicional.

Como o Segment Anything funciona?

O Segment Anything utiliza uma variedade de prompts de entrada, incluindo a especificação do que segmentar em uma imagem, permitindo uma ampla gama de tarefas de segmentação sem a necessidade de treinamento adicional. Ele também pode receber prompts de entrada de outros sistemas, como um detector de objetos, e pode gerar múltiplas máscaras válidas para prompts ambíguos.

Recursos do Segment Anything

  • Design promptable permite integração flexível com outros sistemas
  • Saídas extensíveis podem ser usadas como entradas para outros sistemas de IA
  • Generalização de zero-shot para objetos e imagens desconhecidos sem a necessidade de treinamento adicional
  • Pode receber prompts de entrada de outros sistemas, como um detector de objetos
  • Pode gerar múltiplas máscaras válidas para prompts ambíguos

Preço

O modelo é de código aberto e está disponível no GitHub, e o conjunto de dados está disponível para download.

Treinamento do modelo

O modelo foi treinado em um conjunto de dados de 11 milhões de imagens e 1,1 bilhão de máscaras de segmentação, usando um "motor de dados" interativo no loop do modelo que anotava imagens e atualizava o modelo.

Segmentar - Alternativa

Biblioteca de Códigos SREF da Midjourney - Explore Estilos Únicos

Descubra mais de 100 estilos de código sref únicos e veja as recomendações mais populares para encontrar facilmente o efeito de código sref perfeito para você.

--
AiHub

Abra acesso gratuito às redes neurais!

--
Gerador de Fotos de IA | Foto AI™

Gere imagens fotorrealistas de pessoas com IA. Tire fotos impressionantes de pessoas com o primeiro Fotógrafo de IA! Gere conteúdo de foto e vídeo para o seu...

--
Arraste o seu GAN: Manipulação interativa baseada em pontos na manobra de imagens generativas

Sintetizar conteúdo visual que atenda às necessidades dos usuários frequentemente requer controle flexível e preciso da pose, forma, expressão e layout dos objetos gerados. Abordagens existentes ganham controle das redes adversariais generativas (GANs) por meio de dados de treinamento manualmente anotados ou de um modelo 3D prévio, que frequentemente carecem de flexibilidade, precisão e generalidade. Neste trabalho, estudamos uma maneira poderosa, porém muito menos explorada, de controlar GANs, ou seja,

--
Mais tags sobre: Segmentar qualquer coisa | Meta AI