腾讯混元 0.5B、1.8B、4B、7B 模型开源发布,消费级显卡即可运行

腾讯混元 0.5B、1.8B、4B、7B 模型开源发布,消费级显卡即可运行

人工智能 2025-08-06 09:04:04 2小时前

IT酷哥 8 月 4 日消息,腾讯混元今日发布了四款开源的小尺寸模型,参数分别为 0.5B、1.8B、4B、7B,消费级显卡即可运行,适用于笔记本电脑、手机、智能座舱、智能家居等低功耗场景,且支持垂直领域低成本微调。

目前,四个模型均在 Github 和 Huggingface 等开源社区上线,Arm、高通、英特尔、联发科技等多个消费级终端芯片平台也都宣布支持部署。

新开源的 4 个模型属于融合推理模型,具备推理速度快、性价比高的特点,用户可根据使用场景灵活选择模型思考模式 —— 快思考模式提供简洁、高效的输出;而慢思考涉及解决复杂问题,具备更全面的推理步骤。

效果上,四个模型均实现了跟业界同尺寸模型的对标,特别是在语言理解、数学、推理等领域有出色表现,在多个公开测试集上得分达到了领先水平。

这四个模型的亮点在于 agent 和长文能力,跟此前开源的 Hunyuan-A13B 模型一样,技术上通过精心的数据构建和强化学习奖励信号设计,提升了模型在任务规划、工具调用和复杂决策以及反思等 agent 能力上的表现,让模型实际应用中可以胜任深度搜索、excel 操作、旅行攻略规划等任务。

此外,模型原生长上下文窗口达到了 256k,意味着模型可以一次性记住并处理相当于 40 万中文汉字或 50 万英文单词的超长内容,相当于一口气读完 3 本《哈利波特》小说,并且能记住所有人物关系、剧情细节,还能根据这些内容讨论后续故事发展。

部署上,四个模型均只需单卡即可部署,部分 PC、手机、平板等设备可直接接入。并且,模型具有较强的开放性,主流推理框架(例如,SGLang,vLLM and TensorRT-LLM)和多种量化格式均能够支持。

应用层面,四款小尺寸模型都能够满足从端侧到云端、从通用到专业的多样化需求,并且已经在腾讯多个业务中应用:

依托模型原生的超长上下文能力,腾讯会议 AI 小助手、微信读书 AI 问书 AI 助手均实现对完整会议内容、整本书籍的一次性理解和处理。

在端侧应用上,腾讯智能座舱助手通过双模型协作架构解决车载环境痛点,充分发挥模型低功耗、高效推理的特性。

在高并发场景中,搜狗输入法基于模型的多模态联合训练机制使嘈杂环境下提升识别准确率;腾讯地图采用多模型架构,利用意图分类和推理能力提升了用户交互体验;微信输入法「问 AI」基于模型实现输入框与 AI 即问即答的无缝衔接。

在需求各异、约束严苛的垂直行业应用中,金融 AI 助手通过 Prompt 优化和少量数据微调实现 95%+ 意图识别准确率,展现出金融级的高可靠性;游戏翻译和 QQ 飞车手游 NPC 充分利用模型的理解能力在多语言理解能力、方言翻译和智能对话方面有突出表现。

在大语言模型领域,腾讯混元此前陆续开源了激活参数量达 52B 的 hunyuan large 和首个混合推理 MoE 模型 Hunyuan-A13B。

多模态方面,混元还开放了完整多模态生成能力及工具集插件,陆续开源了文生图、视频生成和 3D 生成能力,提供接近商业模型性能的开源基座,方便社区基于业务和使用场景定制,图像、视频衍生模型数量达到 3000 个。上周,腾讯发布并开源了混元 3D 世界模型 1.0。

IT酷哥附开源地址:

【Github】

Hunyuan-0.5B:https://github.com/Tencent-Hunyuan/Hunyuan-0.5B

Hunyuan-1.8B:https://github.com/Tencent-Hunyuan/Hunyuan-1.8B

Hunyuan-4B:https://github.com/Tencent-Hunyuan/Hunyuan-4B

Hunyuan-7B:https://github.com/Tencent-Hunyuan/Hunyuan-7B

【HuggingFace】

Hunyuan-0.5B:https://huggingface.co/tencent/Hunyuan-0.5B-Instruct

Hunyuan-1.8B:https://huggingface.co/tencent/Hunyuan-1.8B-Instruct

Hunyuan-4B:https://huggingface.co/tencent/Hunyuan-4B-Instruct

Hunyuan-7B:https://huggingface.co/tencent/Hunyuan-7B-Instruct

文章版权声明:除非注明,否则均为网络转载文章,转载或复制请以超链接形式并注明出处。

相关阅读

  • 香港科技大学(广州)校内上线 GPT 服务,包括 GPT-4、ChatGPT
  • Meta 展示自研生成式 AI 工具,一句话搞定修图、聊天表情
  • 格莱美修订规则:只有“人类创作者”才有资格获奖
  • Snap 研发出新技术 SnapFusion,未来智能手机秒出 AI 生成图像
  • 网友“欺骗”ChatGPT 生成 Win10、Win11 密钥,马斯克调侃:真适合做睡前读物
  • 语音生成 AI 初创公司 ElevenLabs 发布合成语音检测工具,号称准确率超过 99%
  • 京东 AI 大模型官宣 7 月 13 日发布:新上任 CEO 许冉演讲,还有重磅合作
  • 美国商务部宣布成立 AI 公共工作组,应对生成式人工智能潜在风险
  • 科大讯飞星火 AI 大模型出海东南亚,将在新加坡实施“1+4”战略
  • Unity 推出面向开发者的 AI 软件市场 AI Hub,股价飙涨 15%
  • 谷歌 DeepMind 自曝正开发新型 AI 模型 Gemini,号称“比 GPT-4 强”
  • 美国银行分析师:聊天机器人中 ChatGPT 占据最大优势,过半用户会为其付费服务买单
  • 微软推出 ZeRO++ 技术,可显著减少 AI 大模型训练时间和成本
  • 2023 全球 AI 指数排名公布:美中稳居前二,亚洲国家表现亮眼
  • 调查发现 20% 的男性使用 ChatGPT 等 AI 工具“美化”约会资料,提高交流技巧
  • 内置 AI 助手 Copilot 上线:微软 Win11 Dev 预览版 Build 23493 发布,设置、音量大改
  • 微软在 Bing 和 Edge 浏览器中拓展网购服务,帮用户选购心仪产品
  • 刚合作就解约,Unity 剔除一家销售盗用资源的 AI 合作伙伴
  • 韩媒称三星先进封装技术落后于台积电,导致难以取得 AI 芯片订单
  • 国内 AI 初创公司第四范式获得证监会赴港 IPO 批准,有望近期进行上市聆讯
  • 最新资讯

    热门资讯