面壁智能发布端侧大模型“前进四”MiniCPM 4.0,号称性能大小王

面壁智能发布端侧大模型“前进四”MiniCPM 4.0,号称性能大小王

人工智能 2025-06-09 18:07:08 5小时前

IT酷哥 6 月 7 日消息,面壁智能 6 日晚发布端侧大模型 MiniCPM 4.0。该公司称新模型通过自研 CPM.cu 推理框架,在极限场景下实现最高 220 倍提速,常规 5 倍提速,支持在 vLLM、SGLang、LlamaFactory 等框架部署。

此次发布的一款 8B 闪电稀疏版,采用创新稀疏架构掀起高效风暴;另一款 0.5B 则被称作“轻巧灵动的最强小小钢炮”。

据官方介绍,此次面壁推出的 MiniCPM 4.0 系列 LLM 模型拥有 8B、0.5B 两种参数规模,针对单一架构难以兼顾长、短文本不同场景的技术难题,MiniCPM 4.0-8B 采用「高效双频换挡」机制,能够根据任务特征自动切换注意力模式:在处理高难度的长文本、深度思考任务时,启用稀疏注意力以降低计算复杂度,在短文本场景下切换至稠密注意力以确保精度,实现了长、短文本切换的高效响应。

据IT酷哥了解,MiniCPM 4.0 可在 vLLM、SGLang、LlamaFactory、XTuner 等开源框架部署。其内置自研 CPM.cu 极速端侧推理框架,从投机采样创新、模型压缩量化创新、端侧部署框架创新几方面,带来 90% 的模型瘦身和速度提升,官方宣称将实现端侧推理“从天生到终生”的丝滑。

文章版权声明:除非注明,否则均为网络转载文章,转载或复制请以超链接形式并注明出处。

相关阅读

  • 上架 6 天,iOS 端 ChatGPT 累计下载量突破 50 万次
  • 美国心理学会:经常接触 AI 的员工更容易孤独,增加疾病风险
  • 【IT之家评测室】讯飞星火认知大模型 V1.5 体验:真变成随身智能助理了
  • 软银 CEO 孙正义宣布策略调整:AI 革命正在爆发,公司将“转守为攻”
  • 丰田推出生成式 AI 工具:输入文字指令可自动设计汽车外形,并符合工程学需求
  • 美国商务部宣布成立 AI 公共工作组,应对生成式人工智能潜在风险
  • 日媒关注中国推进鸟类识别 AI 普及,除监测保护外还可预防传染性疾病
  • 中国团队推出世界首颗 AI 全自动设计 CPU“启蒙 1 号”:无人工干预,性能堪比 486
  • 中国电信公布 TeleChat 大模型,宣称将建立“百亿级 AI 服务商”
  • 正版文心一言上架 App Store,百度此前起诉苹果“盗版 App 泛滥”
  • 腾讯与西湖大学共同申请 AI 聊天机器人专利,可使问答语句更准确连贯
  • 方舟启航,火山引擎这波在“大气层”
  • ChatGPT 的 Bing 浏览功能让用户免费阅读付费内容,OpenAI 暂停测试
  • 亚马逊 Kindle 自助出版功能被滥用,AI 生成的书籍泛滥
  • 中国工程院院士高文:将打造 2000 亿参数自然语言大模型底座,性能对标 ChatGPT
  • 奔驰正在车辆生产中测试 ChatGPT,进行质量管理和流程优化等活动
  • OpenAI 组建新团队,以解决控制超智能 AI 的核心技术挑战
  • 精准度可提高 20%:英国九家银行签约使用基于 AI 的“消费者欺诈风险系统”应对诈骗
  • 遇版权纠纷可获全额补偿:Adobe 及 Shutterstock 宣布将为平台 AI 图片负责
  • 小冰 CEO 李笛:马斯克呼吁停止研发 AI 大模型,可能是想给自己争取更多时间
  • 最新资讯

    热门资讯