智元推出行业首个机器人世界模型开源平台 Genie Envisioner

智元推出行业首个机器人世界模型开源平台 Genie Envisioner

人工智能 2025-08-16 18:10:08 8小时前

IT酷哥 8 月 15 日消息,智元机器人昨天通过公众号宣布,推出行业首个面向真实世界机器人操控的统一世界模型平台 --- Genie Envisioner(GE)。

根据官方介绍,不同于传统“数据 — 训练 — 评估”割裂的流水线模式,GE 将未来帧预测、策略学习与仿真评估首次整合进以视频生成为核心的闭环架构,使机器人在同一世界模型中完成从“看”到“想”再到“动”的端到端推理与执行。基于 3000 小时真机数据,GE-Act 不仅在跨平台泛化和长时序任务执行上显著超越现有 SOTA,更为具身智能打开了从视觉理解到动作执行的全新技术路径。

IT酷哥附开源有关链接:

Project page:https://genie-envisioner.github.io/

Arxiv:https://arxiv.org/abs/2508.05635

Github:https://github.com/AgibotTech/Genie-Envisioner

GE 平台通过构建统一的视频生成世界模型,将这些分散的环节集成到一个闭环系统中。基于约 3000 小时的真实机器人操控视频数据,GE 建立了从语言指令到视觉空间的直接映射,保留了机器人与环境交互的完整时空信息。

基于强大的视觉空间预训练,GE-Act 仅需极少量数据即可实现跨平台迁移。在 Agilex Cobot Magic 和 Dual Franka 等全新机器人平台上,GE-Act 仅使用 1 小时(约 250 个演示)的遥操作数据就实现了高质量的任务执行。

智元方面表示,团队将开源全部代码、预训练模型和评测工具。GE 通过视觉中心的世界建模,为机器人学习开辟了新的技术路径。GE 的发布,标志着机器人从被动执行向主动‘想象 — 验证 — 行动’的转变。未来,将扩展更多传感器模态,支持全身移动与人机协作,持续推动智能制造与服务机器人的落地应用。

相关阅读:

《智元发布首个世界模型开源平台“Genie Envisioner”,让机器人先彩排再上岗》

文章版权声明:除非注明,否则均为网络转载文章,转载或复制请以超链接形式并注明出处。

相关阅读

  • 日本发布 2023 年知识产权推进计划,将重点讨论生成式 AI 侵权界定
  • Meta 开源 AI 语言模型 MusicGen,可将文本和旋律转化为完整乐曲
  • 麦肯锡:到 2045 年左右,将有 50% 工作被 AI 接管
  • 微软为 AI 初学者推出免费网课:为期 12 周,共 24 节课
  • 捷豹路虎宣布采用 AI 管控供应链,最大程度降低生产中断风险
  • Opera 向桌面和安卓用户开放浏览器 AI“Aria”
  • 日本起草针对学校的生成式 AI 使用指南,禁止学生用 ChatGPT 写作文
  • 科大讯飞星火 AI 大模型出海东南亚,将在新加坡实施“1+4”战略
  • 成功率 99%,科学家研发语音 deepfake 软件:只需 5 分钟录音即可欺骗语音认证系统
  • 版权问题难解,OpenAI 被控非法使用图书数据训练 AI 系统
  • 微软英伟达参投,OpenAI 竞争对手 Inflection AI 获 13 亿美元融资
  • 中国电信公布 TeleChat 大模型,宣称将建立“百亿级 AI 服务商”
  • 首款搭载 ChatGPT 的自行车问世,让你骑行不再孤单
  • 方舟启航,火山引擎这波在“大气层”
  • 丁磊:当前网易的首要任务是用最快的速度探索 AI 大模型的创新应用
  • ChatGPT 又陷版权风波:两位恐怖小说作家起诉 OpenAI 盗用自己作品用于训练
  • WPS AI 官网上线:可申请体验官资格,支持 Windows、安卓端下载
  • OpenAI 组建新团队,以解决控制超智能 AI 的核心技术挑战
  • 中国工程院院士高文:没有大算力做大模型就是天方夜谭
  • 牛津剑桥解除 ChatGPT 禁令,英国 24 所顶尖高校发布详细使用原则
  • 最新资讯

    热门资讯