AI 生成游戏,昆仑万维发布并开源 Matrix-Game 2.0、Matrix-3D 模型

AI 生成游戏,昆仑万维发布并开源 Matrix-Game 2.0、Matrix-3D 模型

人工智能 2025-08-13 17:11:07 11小时前

IT酷哥 8 月 12 日消息,昆仑万维 SkyWork AI 技术发布周于 8 月 11 日启动,连续五天每天发布一款模型,覆盖多模态 AI 核心场景。

今日,昆仑万维带来了自研世界模型 Matrix 系列中 Matrix-Game 交互世界模型的升级版本 ——「Matrix-Game 2.0」,号称是实现了通用场景下的交互式实时长序列生成的世界模型。

并且为促进交互式世界模型领域的发展,「Matrix-Game 2.0」全面开源,号称是业内首个在通用场景上实现实时长序列交互式生成的世界模型开源方案。

「Matrix-Game 2.0」号称在实时生成和长序列能力上实现了“质的飞跃”。相较于上一版本,2.0 版本更加侧重低延迟、高帧率的长序列交互性能,能够以 25 FPS 的速度,在多种复杂场景中稳定生成连续视频内容,且生成时长可扩展至分钟级,大幅提升了连贯性与实用性。

在推理速度显著提升的同时,模型依然保持了对物理规律与场景语义的“精准理解”,支持用户通过简单指令,自由探索、操控并实时构建结构清晰、细节丰富、规则合理的虚拟环境。

昆仑万维还开源了 Matrix-3D 大模型,从单图像出发,生成高质量、轨迹一致的全景视频,并直接还原可漫游的三维空间,对标李飞飞 WorldLabs 的生成效果,可实现更大范围的探索空间。

Matrix-3D 由以下核心部分组成:

轨迹引导的全景视频生成模块:利用场景 Mesh 渲染图作为条件输入,训练视频扩散模型生成符合给定相机轨迹的全景视频。提升生成视频在空间结构上的一致性,缓解遮挡错误与图像伪影问题。

双路径可选择的全景 3D 重建模块:优化路径,对生成的视频进行超分与 3DGS 优化,获取高质量 3D 结构。前馈网络路径:基于 Transformer 直接回归,从生成视频 Latent 特征快速预测 3D 几何属性,实现高效重建。

Matrix-Pano 数据集:大规模高质量合成数据集,包含 116K 条带有相机轨迹、深度图和文本注释的静态全景视频序列。

IT酷哥附两个模型的开源地址如下:

https://github.com/SkyworkAI/Matrix-Game

https://github.com/SkyworkAI/Matrix-3D

文章版权声明:除非注明,否则均为网络转载文章,转载或复制请以超链接形式并注明出处。

相关阅读

  • 消息称 AI 服务器需求强劲,鸿海旗下鸿佰科技计划新增五到六条产线
  • 韩国宣布 2025 年起将 AI 引入中小学课程,三年内实现全覆盖
  • 可按用户语气自动回复消息,在线会议软件 Zoom 推出基于生成式 AI 的新功能
  • 套娃不可取:研究人员证实用 AI 生成的结果训练 AI 将导致模型退化乃至崩溃
  • 马斯克称没人会真暂停开发 AI ,呼吁只是为提醒大家注意
  • 日本神户开始验证市政 AI 化效果:自动规划巡逻路线,减少犯罪发生
  • 印象笔记开放旗下“印象 AI”,可一键生成思维导图、写文章等
  • 你的工作未来由人工智能决定,报告称明年 43% 的企业部署 AI 面试
  • 快手旗下视频剪辑类产品“快影”内测多款 AIGC 创作功能,可一键生成文案等
  • 长虹电视 AI 大模型“长虹超脑”发布:三大核心能力,可连续自然对话
  • AI 图像编辑技术 DragGAN 开源,拖动鼠标即可将狮子 P 转头
  • 金融巨头瑞穗银行押注生成式 AI,开放 Azure OpenAI 给 4.5 万名员工使用
  • 英伟达联手 Snowflake:卖出更多芯片,帮助企业客户建立自己的 AI 模型
  • 正版文心一言上架 App Store,百度此前起诉苹果“盗版 App 泛滥”
  • 方舟启航,火山引擎这波在“大气层”
  • ChatGPT 的 Bing 浏览功能让用户免费阅读付费内容,OpenAI 暂停测试
  • AI 作画工具 Midjourney 推出“pan”功能,可上下左右平移扩展图片外场景
  • 配 2.2 万片英伟达 H100 GPU,Inflection AI 正开发超级计算机
  • 联合国安理会将首次召开 AI 监管会议,讨论 AI 对全球和平与安全的潜在威胁
  • 亚马逊 Kindle 自助出版功能被滥用,AI 生成的书籍泛滥
  • 最新资讯

    热门资讯