华为发布 AI 推理创新技术 UCM:可实现高吞吐、低时延推理体验,计划 9 月开源

华为发布 AI 推理创新技术 UCM:可实现高吞吐、低时延推理体验,计划 9 月开源

人工智能 2025-08-14 08:12:06 2天前

IT酷哥 8 月 12 日消息,今日,华为正式发布 AI 推理创新技术 UCM(推理记忆数据管理器)。

据IT酷哥了解,作为一款以 KV Cache 为中心的推理加速套件,UCM 融合了多类型缓存加速算法工具,分级管理推理过程中产生的 KV Cache 记忆数据,可扩大推理上下文窗口,实现高吞吐、低时延的推理体验,降低每 Token 推理成本。该技术已率先在中国银联“客户之声”“营销策划”“办公助手”三大业务场景中,开展智慧金融 AI 推理加速应用试点,并已取得成果。

华为计划于 2025 年 9 月正式开源 UCM,届时将在魔擎社区首发,后续逐步贡献给业界主流推理引擎社区,并共享给业内所有 Share Everything (共享架构) 存储厂商和生态伙伴。

文章版权声明:除非注明,否则均为网络转载文章,转载或复制请以超链接形式并注明出处。

相关阅读

  • 李开复:AI 2.0 制造虚假信息的缺陷不能完全被杜绝
  • AI 钞能力:阿联酋打造的 Falcon-40B 语言模型 OpenLLM 排名第一、持续霸榜
  • 用 AI 补完遗憾,披头士乐队成员确认今年将发布最后一首“新曲”
  • 一个月来至少三起,台积电频频投资硅谷 AI 芯片创企
  • 报告称 70% 程序员已使用各种 AI 工具编程
  • 普林斯顿大学推出 Infinigen AI 模型,可生成真实自然环境 3D 场景
  • LG 发布首个生成式 AI 商业化服务 Captioning AI:10 秒内为图片提供 5 句描述和 10 个关键词
  • 语音生成 AI 初创公司 ElevenLabs 发布合成语音检测工具,号称准确率超过 99%
  • 京东 AI 大模型官宣 7 月 13 日发布:新上任 CEO 许冉演讲,还有重磅合作
  • 英特尔研究院发布全新 AI 扩散模型,可根据文本提示生成 360 度全景图
  • 日本起草针对学校的生成式 AI 使用指南,禁止学生用 ChatGPT 写作文
  • Unity 推出面向开发者的 AI 软件市场 AI Hub,股价飙涨 15%
  • 近 12 年由 AI 造成的事故暴涨 15 倍,Facebook、特斯拉、OpenAI 位居总量前三
  • 16 名匿名人士起诉 ChatGPT 侵犯隐私,向微软和 OpenAI 索赔 30 亿美元
  • 微软在 Bing 和 Edge 浏览器中拓展网购服务,帮用户选购心仪产品
  • 英国初创公司用 AI 提升垃圾回收效率,每年追踪量达 320 亿件
  • 金山办公宣布与英伟达团队合作,加速 WPS AI 服务
  • Pixela 推出 ChatGPT 翻译 App:支持中日英韩互译,限时免费上架 Google Play
  • MetaGPT AI 模型开源:可模拟软件公司开发过程,生成高质量代码
  • 谷歌更新隐私政策规定,可使用互联网上的公开信息训练 AI 模型
  • 最新资讯

    热门资讯