蔚来:世界模型 NWM 在小路、窄路、人车混行道路上的表现格外出色

蔚来:世界模型 NWM 在小路、窄路、人车混行道路上的表现格外出色

人工智能 2025-07-18 17:04:03 2天前

IT酷哥 7 月 16 日消息,蔚来世界模型全量推送至「Banyan 榕」、「Cedar 雪松」、「Cedar S 雪松」车型,官方称智能辅助驾驶的使用率翻了好几倍。蔚来官方今日发布“蔚来世界模型 NWM 有问必答第 1 期”,就用户对蔚来世界模型关心的问题进行解答,包括世界模型和常规端到端的区别、世界模型上来后群体智能是否还需要、世界模型为什么会被称为“小路之王”等。

IT酷哥附蔚来此次世界模型 NWM 有问必答详情如下:

蔚来世界模型和常规的端到端架构有什么区别?

端到端架构让智能辅助驾驶从人工手写规则变成了靠数据驱动迭代的模型,并且基于模型能自动抽取信息,减少了信息损失,数据利用更加充分。比如在下雨天,明明前方看不太清,但在人工手写规则下,感知模型依然必须要输出具体的距离。而端到端架构可以由模型直接输出执行结果,场景覆盖与性能上都有很大的提升。

不过,如果想要真正实现智能辅助驾驶像人一样开车,仅靠端到端架构是不够的。人类大脑有两个非常核心的能力:一个是空间认知能力,也叫想象重建能力;另一个是时间认知能力,也叫想象推演能力。这两个能力合起来,就构成了人类的时空认知能力,也就是对我们生活的三维空间和一维时间所发生的所有变化和可能性的认知能力。

所以,智能辅助驾驶进化的下一步,就是要具备和人一样的时空认知能力。但端到端架构,并不必然具备这样的能力。而蔚来世界模型,既要去建立时空认知能力,而且还具备在想象的平行世界里规划轨迹的能力。

相比常规的端到端架构,蔚来世界模型有三个主要优势:

在空间理解上,通过生成式模型重构传感器输入,更加泛化地抽取信息;

在时间理解上,通过自回归模型,自动建模长时序环境;

在海量数据使用上,通过自监督学习的方式,无需人工标注。

这样的模型对于算力的要求也会更高。蔚来在「Banyan 榕」系统搭载的 4×Orin-X 芯片,提供了充足的算力储备为用户提供长期的领先体验。而在「Cedar 雪松」系统上搭载的「神玑 NX9031」芯片,更是今天全球智能辅助驾驶芯片的算力天花板,为蔚来世界模型原生设计,将来会有更高的上限。

蔚来世界模型还需要群体智能吗?

在大规模的人工智能应用中,真实的数据并不容易获取,而智能辅助驾驶是这些应用中数据闭环最为成熟的,也是最有可能率先形成大规模安全性应用落地的。在蔚来「Banyan 榕」系统的 4×Orin-X 芯片中,有一颗是群体智能专用芯片,可以将智能辅助驾驶待验证的新版本分发到数十万量级的量产车上,去对比人类驾驶的状态,或是对比之前稳定版本的状态,从而针对性提升新算法的适用性,大大加快智能辅助驾驶的总体进化速度,确保用户的智能辅助驾驶体验更好。

而在更新蔚来世界模型架构后,对数据的需求量变得更大,群体智能依然具备不可或缺的重要性,在「神玑 NX9031」芯片中也设计了专门用于群体智能的模块。除了群体智能,蔚来世界模型在数据层面的另一个杀手锏是生成式仿真,基于真实世界的视频去重建一个虚拟的、可以任意编辑的世界,从而将真实世界的结果和想象出的结果做验证、对比和学习,在千万个变化的世界里去共同训练模型,让蔚来世界模型想象的结果更真、驾驶输出更好。

群体智能和生成式仿真,共同满足蔚来世界模型庞大的数据需求。

为什么蔚来世界模型在小路、人车混行等复杂场景中的表现格外出色?

蔚来世界模型具备很强的认知、理解、推理能力,尤其是空间理解能力和长时序的建模能力突出。而小路通行空间狭窄,行人、二轮车、三轮车运动相对无序,各类障碍物摆放无规则,特别考验智能辅助驾驶系统的动态博弈能力和预测能力,而这些恰恰是蔚来世界模型基础能力的体现。因此,蔚来世界模型在小路、窄路、人车混行道路上的表现格外出色。

文章版权声明:除非注明,否则均为网络转载文章,转载或复制请以超链接形式并注明出处。

相关阅读

  • OpenAI CEO 阿尔特曼到访日本,对全球 AI 协调合作表示“非常乐观”
  • 格莱美修订规则:只有“人类创作者”才有资格获奖
  • Snap 研发出新技术 SnapFusion,未来智能手机秒出 AI 生成图像
  • 你的工作未来由人工智能决定,报告称明年 43% 的企业部署 AI 面试
  • AI 作画工具 Midjourney 迎来 5.2 版本更新,可生成相机“变焦效果”
  • 微软推出生成式 AI 培训项目,免费提供在线课程和证书
  • 微软在 Bing 和 Edge 浏览器中拓展网购服务,帮用户选购心仪产品
  • 微软必应聊天周报:改善体育相关话题、向 Skype 开放图片生成工具
  • “世界上最像人的机器人”Ameca 接入 Stable Diffusion 和 GPT-3,现场完成作画
  • 研究发现 AI 筛选的私募基金回报率高于大部分机构投资者
  • 联合国将招募数十个机器人,协助完成 2030 可持续发展目标
  • 丁磊:当前网易的首要任务是用最快的速度探索 AI 大模型的创新应用
  • 精准度可提高 20%:英国九家银行签约使用基于 AI 的“消费者欺诈风险系统”应对诈骗
  • Mozilla 的 AI Help 工具终遭官方停用:生成的技术信息真假参半
  • 下一代“世界最快”超级计算机 El Capitan 开始安装 AMD Instinct MI300 人工智能 GPU
  • 科大讯飞:讯飞医疗基于星火大模型升级医疗诊后康复管理平台,出院患者满意度 98% 以上
  • 华为云“盘古大模型 3.0”正式发布:为企业定制 AI 助手,最高可选 1000 亿参数
  • 调查:过半数艺术家认为 AI 作图无法帮助他们的工作
  • 牛津剑桥解除 ChatGPT 禁令,英国 24 所顶尖高校发布详细使用原则
  • 日本警察将使用 AI 分析可疑人员动作、表情,应对“独狼”式犯罪
  • 最新资讯

    热门资讯