北京智源推出通用视觉 AI 模型 SegGPT:可自动追踪并分割影音中的物体

北京智源推出通用视觉 AI 模型 SegGPT:可自动追踪并分割影音中的物体

人工智能 2023-06-03 08:00:02 1年以前

IT酷哥 5 月 31 日消息,在2023年中关村论坛人工智能大模型发展论坛中,北京智源人工智能研究院推出了旗下通用分割模型 SegGPT(SegmentEverythingInContex)。

▲图源 Arxiv

据称,SegGPT模型是智源通用视觉模型Painter的衍生模型,具备上下文推理能力,在训练完成后只需要提供示例即可推理并完成对应分割任务,包括图像和视频中的实例、类别、零部件、轮廓、文本、人脸、医学图像等,都可以利用视觉提示词(Prompt)完成分割任务。

▲图源 Arxiv

SegGPT也拥有支持任意数量视觉提示的推理能力。能够以第一帧图像和对应的物体掩码作为上下文示例进行自动视频分割,并且可以用掩码的颜色作为物体的 ID,进行自动追踪。

IT酷哥经过查询知悉,此前 Meta 也发布了其基于AI的SegmentAnythingModel(SAM)模型,具有识别和分离图像和视频中特定对象的能力。而威斯康辛麦迪逊、微软、港科大等机构的研究人员也推出SEEM 模型,通过不同的视觉提示和语言提示,一键分割图像、视频。IT酷哥的小伙伴们可以从这里访问模型的论文链接。

文章版权声明:除非注明,否则均为网络转载文章,转载或复制请以超链接形式并注明出处。

相关阅读

  • 网易云音乐和小冰联合推出 AI 歌手音乐创作软件,首发内置 12 名 AI 歌手
  • 必应聊天周报:iOS 端引入小组件、为语音聊天扩展语言支持
  • 捷豹路虎宣布采用 AI 管控供应链,最大程度降低生产中断风险
  • 软银 CEO 孙正义称每天都会使用 ChatGPT,是生成式 AI 服务的“忠实用户”
  • 软银 CEO 孙正义宣布策略调整:AI 革命正在爆发,公司将“转守为攻”
  • 京东 AI 大模型官宣 7 月 13 日发布:新上任 CEO 许冉演讲,还有重磅合作
  • 谷歌 DeepMind 自曝正开发新型 AI 模型 Gemini,号称“比 GPT-4 强”
  • iOS 版 ChatGPT 集成必应搜索功能,仅限付费订阅者使用
  • 金融巨头瑞穗银行押注生成式 AI,开放 Azure OpenAI 给 4.5 万名员工使用
  • 版权问题难解,OpenAI 被控非法使用图书数据训练 AI 系统
  • 微软英伟达参投,OpenAI 竞争对手 Inflection AI 获 13 亿美元融资
  • Meta 将提高 AI 算法应用透明度,向用户提供详细说明和更多选择
  • 英国初创公司用 AI 提升垃圾回收效率,每年追踪量达 320 亿件
  • 李开复创业大模型公司“零一万物”官网上线:致力于打造全新的 AI 2.0 平台
  • MetaGPT AI 模型开源:可模拟软件公司开发过程,生成高质量代码
  • 配 2.2 万片英伟达 H100 GPU,Inflection AI 正开发超级计算机
  • ChatGPT 技术被滥用,绍兴警方侦破团伙制作虚假视频案
  • MDN Web 文档项目引入生成式 AI 后遭到开发者广泛差评
  • 华为宣布联合 26 家企业启动昇腾 AI 大模型联合创新,已建成业界首个万卡 AI 集群
  • 奔驰正在车辆生产中测试 ChatGPT,进行质量管理和流程优化等活动
  • 最新资讯

    热门资讯