Meta AI计算机视觉研究

分词任何东西 | 元 AI

介绍

什么是Segment Anything?

Segment Anything是Meta AI推出的一款新的人工智能模型,可以通过单击“剪切”任何图像中的任何对象。它是一个可提示的分割系统,对陌生对象和图像具有零样本泛化能力,无需额外的训练。

Segment Anything如何工作?

Segment Anything使用各种输入提示,包括指定图像中要分割的内容,可以进行各种分割任务,而无需额外的训练。它还可以接受来自其他系统的输入提示,例如对象检测器,并为模棱两可的提示生成多个有效的蒙版。

Segment Anything的特点

  • 可提示的设计使其能够灵活集成到其他系统中
  • 可扩展的输出可以作为其他人工智能系统的输入
  • 对陌生对象和图像具有零样本泛化能力,无需额外训练
  • 可以接受来自其他系统的输入提示,例如对象检测器
  • 可为模棱两可的提示生成多个有效的蒙版

价格

该模型是开源的,可在GitHub上获得,数据集也可以下载。

训练模型

该模型在一个包含1100万图像和11亿分割蒙版的数据集上进行了训练,使用了一个“数据引擎”中的模型来交互式地注释图像并更新模型。

分词任何东西 - 替代

RunDiffusion - 在云端自动化1111

在云上使用全托管的Automatic1111、Fooocus和ComfyUI,配备高速GPU。无需编码。在90秒内获得私人工作空间。立即开始创作AI生成艺术!

273.7 K
卓越实验室

口袋大小的增强现实技术,为富有想象力的黑客提供支持。在Brilliant Labs,我们正在构建一个开源生态系统,支持开发者和创意人士重新构想未来。

215.5 K
用于自动生成图像和视频的API - Bannerbear

Bannerbear API 可以帮助您和您的团队自动生成社交媒体视觉、电子商务横幅、播客视频等

196.0 K
尝试Dalle 3免费在线-Dall-E 3人工智能图像

根据OpenAI宣布,DALL-E 3代表了其开创性的AI图像生成器的最新迭代,展示了在准确将文本提示转化为高度逼真和详细的视觉方面取得的显著改进。DALL-E 3将于2023年10月首次发布给ChatGPT Plus和企业用户,其与ChatGPT的紧密集成简化了创建提示和保持图像上下文。DALL-E 3整合了针对有害内容的安全措施,并赋予艺术家对艺术使用的控制权,承诺彻底改变将想法转化为精确图像的方式。

95.9 K
更多标签关于: 分词任何东西 | 元 AI