阿里达摩院首次开源具身智能“三大件”机器人上下文协议

阿里达摩院首次开源具身智能“三大件”机器人上下文协议

人工智能 2025-08-12 13:03:08 1天前

IT酷哥 8 月 11 日消息,在上周开幕的 2025 世界机器人大会上,阿里达摩院宣布开源自研的 VLA 模型 RynnVLA-001-7B、世界理解模型 RynnEC、以及机器人上下文协议 RynnRCP,推动数据、模型和机器人的兼容适配,打通具身智能开发全流程。

具身智能领域飞速发展,但仍面临开发流程碎片化,数据、模型与机器人本体适配难等重大挑战。达摩院将 MCP(Model Context Protocol)理念引入具身智能,首次提出并开源了 RCP(Robotics Context Protocol)协议以推动不同的数据、模型与本体之间的对接适配。

达摩院打造了名为 RynnRCP 的一套完整的机器人服务协议和框架,能够打通从传感器数据采集、模型推理到机器人动作执行的完整工作流,帮助用户根据自身场景进行适配。RynnRCP 现已经支持 Pi0、GR00T N1.5 等多款热门模型以及 SO-100、SO-101 等多种机械臂,正持续拓展。

具体而言,RynnRCP 包括 RCP 框架和 RobotMotion 两个主要模块。

RCP 框架旨在建立机器人本体与传感器的连接,提供标准化能力接口,并实现不同的传输层和模型服务之间的兼容。

RobotMotion 则是具身大模型与机器人本体控制之间的桥梁,能将离散的低频推理命令实时转换为高频的连续控制信号,实现平滑、符合物理约束的机器人运动。

同时,RobotMotion 还提供了一体化仿真-真机控制工具,帮助开发者快速上手,支持任务规控、仿真同步、数据采集与回放、轨迹可视化等功能,降低策略迁移难度。

大会上,达摩院还宣布开源两款具身智能大模型:

RynnVLA-001 是达摩院自主研发的基于视频生成和人体轨迹预训练的视觉-语言-动作模型,其特点是能够从第一人称视角的视频中学习人类的操作技能,隐式迁移到机器人手臂的操控上,从而让机械臂操控更加连贯、平滑,更接近于人类动作。

世界理解模型 RynnEC 将多模态大语言模型引入具身世界,赋予了大模型理解物理世界的能力。该模型能够从位置、功能、数量等 11 个维度全面解析场景中的物体,并在复杂的室内环境中精准定位和分割目标物体。无需 3D 模型,该模型仅靠视频序列就能建立连续的空间感知,还支持灵活交互。

此外,达摩院还在上月开源了 WorldVLA 模型, 首次将世界模型与动作模型融合,提升了图像与动作的理解与生成能力。相比传统模型,该模型抓取成功率提高 4%,视频生成质量改善,展现了较好的协同性和准确性。

IT酷哥附开源地址:

机器人上下文协议 RynnRCP:https://github.com/alibaba-damo-academy/RynnRCP

视觉-语言-动作模型 RynnVLA-001:https://github.com/alibaba-damo-academy/RynnVLA-001

世界理解模型 RynnEC:https://github.com/alibaba-damo-academy/RynnEC

WorldVLA 模型:https://github.com/alibaba-damo-academy/WorldVLA

文章版权声明:除非注明,否则均为网络转载文章,转载或复制请以超链接形式并注明出处。

相关阅读

  • WordPress 引入 AI 助手,可撰写博文、纠正语法、翻译内容
  • 北京智源发布悟道 3.0 大模型系列
  • 微软推出 LLaVA-Med AI 模型,可对医学病理案例进行分析
  • 当一个网站的内容被 AI 完全接管
  • 使用自然语言,纽约大学团队利用聊天机器人 ChatGPT 从零设计出微处理器
  • 谷歌警告员工使用聊天机器人时要小心,包括自家的 Bard
  • Snap 研发出新技术 SnapFusion,未来智能手机秒出 AI 生成图像
  • 宏碁、惠普、华硕等品牌发力 AI 笔记本市场,明年将带动新一波换机潮
  • 开源模型 PrivateGPT 上线,可本地搭建、避免信息外泄
  • 微软用 AI 缩短癌症放疗时间:扫描速度提高 2.5 倍,准确率达 90%
  • iOS 版 ChatGPT 集成必应搜索功能,仅限付费订阅者使用
  • 微软推出 ZeRO++ 技术,可显著减少 AI 大模型训练时间和成本
  • 中国团队推出脑电图图像生成模型 DreamDiffusion,清华、腾讯参与研究
  • 《自然》杂志正刊发表华为云旗下盘古气象大模型研究成果,天气预报更精准
  • 华为宣布联合 26 家企业启动昇腾 AI 大模型联合创新,已建成业界首个万卡 AI 集群
  • OpenAI 组建新团队,以解决控制超智能 AI 的核心技术挑战
  • 下一代“世界最快”超级计算机 El Capitan 开始安装 AMD Instinct MI300 人工智能 GPU
  • 图表显示必应聊天今年 3 月月活用户数量逼近 15 亿
  • OpenAI 已全面开放 GPT-3.5 Turbo、DALL-E 及 Whisper API
  • 美国著名喜剧演员起诉 OpenAI,称 ChatGPT 侵犯其书籍版权
  • 最新资讯

    热门资讯