智源研究院发布“悟界”系列大模型,含全球首个原生多模态世界模型 Emu3

智源研究院发布“悟界”系列大模型,含全球首个原生多模态世界模型 Emu3

人工智能 2025-06-09 09:03:03 9小时前

IT酷哥 6 月 6 日消息,北京智源人工智能研究院今日发布“悟界”系列大模型,包括全球首个原生多模态世界模型“悟界・Emu3”、全球首个脑科学多模态通用基础模型“悟界・见微 Brainμ”。

智源研究院还发布了悟界・具身智能大模型,包括全球首个支持 MCP 的跨本体大小脑协作框架悟界・RoboOS 2.0、具身大脑大模型悟界・RoboBrain 2.0 和全原子微观生命模型悟界・OpenComplex2也一并发布。

去年 10 月,智源研究院发布了原生多模态世界模型 Emu3。据IT酷哥此前报道,该模型只基于下一个 token 预测,无需扩散模型或组合方法,即可完成文本、图像、视频三种模态数据的理解和生成。官方宣称实现图像、文本、视频大一统。Emu3 支持多模态输入、多模态输出的端到端映射,验证了自回归框架在多模态领域的普适性与先进性,为跨模态交互提供了强大的技术基座。

见微 Brainμ 基于 Emu3 底层架构,将 fMRI、EEG、双光子等神经科学与脑医学相关的脑信号统一 token 化,利用预训练模型多模态对齐的优势,可以实现多模态脑信号与文本、图像等模态的多向映射,并实现跨任务、跨模态、跨个体的统一通用建模,以单一模型完成多种神经科学的下游任务。

▲Emu3 生成的图像

相关阅读:

《智源发布原生多模态世界模型 Emu3,宣称实现图像、文本、视频大一统》

文章版权声明:除非注明,否则均为网络转载文章,转载或复制请以超链接形式并注明出处。

相关阅读

  • AI 钞能力:阿联酋打造的 Falcon-40B 语言模型 OpenLLM 排名第一、持续霸榜
  • 视觉中国推出 AI 灵感绘图功能,付费后可在“合法合规前提下使用”
  • 消息称微软曾不听 OpenAI 警告,上线不成熟的必应聊天服务
  • 美国心理学会:经常接触 AI 的员工更容易孤独,增加疾病风险
  • GitHub 报告称 92% 的美国程序员正在使用 AI 工具
  • 赛博手冢治虫:GPT-4 将参与漫画《怪医黑杰克》续作创作过程
  • 中科院自研新一代 AI 大模型“紫东太初 2.0”问世,支持视频、3D 等模态数据
  • 折腾十年,扎克伯格痛失 AI 好局
  • OpenAI CTO 揭晓 ChatGPT 内幕,原本只是一个研究示范项目
  • 全球 AI 人才需求激增,部分岗位年薪逼近 40 万美元
  • AI 朗读冲击有声读物市场,配音演员工作面临威胁
  • 日本神户开始验证市政 AI 化效果:自动规划巡逻路线,减少犯罪发生
  • 网友“欺骗”ChatGPT 生成 Win10、Win11 密钥,马斯克调侃:真适合做睡前读物
  • 京东 AI 大模型官宣 7 月 13 日发布:新上任 CEO 许冉演讲,还有重磅合作
  • 特斯拉创建 Tesla AI 推特账户,称下月开始生产 Dojo 超级计算机
  • 美国商务部宣布成立 AI 公共工作组,应对生成式人工智能潜在风险
  • 英伟达赚翻了,甲骨文今年将斥资数十亿美元买 GPU 发力 AI 云服务
  • Unity 推出面向开发者的 AI 软件市场 AI Hub,股价飙涨 15%
  • iOS 版 ChatGPT 集成必应搜索功能,仅限付费订阅者使用
  • 微软推出 ZeRO++ 技术,可显著减少 AI 大模型训练时间和成本
  • 最新资讯

    热门资讯