华为云发布盘古大模型 5.5:自然语言处理等五大基础模型全面升级

华为云发布盘古大模型 5.5:自然语言处理等五大基础模型全面升级

人工智能 2025-06-23 15:04:05 2天前

IT酷哥 6 月 20 日消息,在今日下午的华为开发者大会 HDC 2025 主题演讲中,华为常务董事、华为云计算 CEO 张平安正式发布盘古大模型 5.5,自然语言处理(NLP)、计算机视觉(CV)、多模态、预测、科学计算五大基础模型全面升级。

IT酷哥整理主要内容如下:

盘古自然语言处理 NLP 大模型:

全新的 718B 深度思考模型是一个由 256 个专家组成的 MoE 大模型,在知识推理、工具调用、数学等领域大幅增强,实现能力领先。盘古大模型是基于昇腾云的全栈软硬件训练而成的,这标志着基于昇腾架构可以打造出世界一流大模型。

盘古大模型 5.5 在高效长序列、低幻觉、快慢思考融合、Agent 等特性上进行升级,提升用户体验。例如,盘古提出了自适应快慢思考合一的技术,通过构建难度感知的快慢思考数据和两阶段渐进训练,实现模型根据问题难易程度自适应地切换快慢思考,简单问题敏捷回复,复杂问题深度思考,整体模型推理效率提升 8 倍。盘古深度研究 DeepDiver 通过长链难题合成、渐进式奖励等关键技术,可以在网页搜索、常识性问答等应用上获得很高的执行效率,如可以在 5 分钟内完成超过 10 跳的复杂问答、生成万字以上的专业调研报告等,大幅提升工作效率。

盘古预测大模型:

采用业界首创的 triplet transformer 统一预训练架构,将不同行业的数据,包括工艺参数的表格数据,设备运行日志的时间序列数据,产品检测的图片数据进行统一的三元组编码,并在同一框架内高效处理和预训练,极大地提升预测大模型的精度,并大幅提升跨行业、跨场景的泛化性。

盘古科学计算大模型:

华为云持续拓展盘古科学计算大模型与更多科学应用领域的结合。深圳气象局基于盘古,进一步升级了“智霁”大模型,首次实现 AI 集合预报,能更直观地反映天气系统的演变可能性,减少单一预报模型的误差。重庆市气象局针对成渝地区降水局地性强,且降水强度大的特点,基于盘古打造了“天资・12h”气象大模型,提升灾害天气的日内预报预警能力。深圳能源采用盘古进行中短期风光水发电量预测,减少发电侧弃电,提升能源开发效率。

盘古计算机视觉 CV 大模型:

华为云发布全新 MoE 架构的 300 亿参数视觉大模型,这是目前业界最大的视觉模型,并全面支持图像、红外、激光点云、光谱、雷达等多维度、泛视觉的感知、分析与决策。另外,盘古 CV 大模型通过跨维度生成模型,构建油气、交通、煤矿等工业场景稀缺的泛视觉故障样本库,极大地提升了业务场景的可识别种类与精度。

盘古多模态大模型:

全新发布基于盘古多模态大模型的世界模型,可以为智能驾驶、具身智能机器人的训练,构建所需要的数字物理空间,实现持续优化迭代。例如,在智能驾驶领域,输入首帧的行车场景、行车控制信息和路网数据,盘古世界模型就可以生成每路摄像头的行车视频和激光雷达的点云,能够为智能驾驶生成大量的训练数据,而无需依赖高成本的路采。

华为开发者大会 HDC 2025 专题

文章版权声明:除非注明,否则均为网络转载文章,转载或复制请以超链接形式并注明出处。

相关阅读

  • 消息称 ChatGPT 本可更强,GPU 短缺成最大阻碍
  • 消息称 AI 服务器需求强劲,鸿海旗下鸿佰科技计划新增五到六条产线
  • OpenAI 为开发者推出 GPT 聊天机器人 API 大更新,同时降低价格
  • 美国最大报业集团 Gannett 引入生成式人工智能,保留人类编辑的最终决定权
  • 你的工作未来由人工智能决定,报告称明年 43% 的企业部署 AI 面试
  • 报告称 5 月美国生成式 AI 岗位激增 20%
  • AI 公司 MosaicML 推出 300 亿参数模型 MPT-30B,号称训练成本仅为竞品零头
  • AI 图像编辑技术 DragGAN 开源,拖动鼠标即可将狮子 P 转头
  • 微软用 AI 缩短癌症放疗时间:扫描速度提高 2.5 倍,准确率达 90%
  • iOS 版 ChatGPT 集成必应搜索功能,仅限付费订阅者使用
  • 调查发现 20% 的男性使用 ChatGPT 等 AI 工具“美化”约会资料,提高交流技巧
  • 16 名匿名人士起诉 ChatGPT 侵犯隐私,向微软和 OpenAI 索赔 30 亿美元
  • 版权问题难解,OpenAI 被控非法使用图书数据训练 AI 系统
  • Meta 将提高 AI 算法应用透明度,向用户提供详细说明和更多选择
  • 微软必应聊天周报:改善体育相关话题、向 Skype 开放图片生成工具
  • 学而思网校推出《人工智能第一课》,号称首个基于自研大模型的 AIGC 课程
  • 谷歌更新隐私政策规定,可使用互联网上的公开信息训练 AI 模型
  • 研究表明 GPT-4 模型具备自我纠错能力,有望推动 AI 代码进一步商业化
  • 必应聊天将推出“#nosearch”功能:禁用网络搜索,直达精准答案
  • 格莱美 CEO 解释 AI 新规:愿意接纳新技术,包含 AI 要素作品也可获提名
  • 最新资讯

    热门资讯