高通:OpenAI 最小开源模型 gpt-oss-20b 可在骁龙终端运行

高通:OpenAI 最小开源模型 gpt-oss-20b 可在骁龙终端运行

人工智能 2025-08-13 10:11:05 3小时前

IT酷哥 8 月 11 日消息,OpenAI 于 8 月 6 日推出了其最小开源模型 gpt-oss-20b,在常见基准测试中与 OpenAI o3‑mini 模型取得类似结果。高通今日宣布,这是 OpenAI 首个可在搭载骁龙平台的终端侧运行的开源推理模型。

IT酷哥从官方新闻稿获悉,高通称 gpt-oss-20b 思维链推理模型可直接在搭载骁龙旗舰处理器的终端上运行。此前 OpenAI 的复杂模型仅限云端部署,这是 OpenAI 首次实现模型支持终端侧推理。通过提前获取模型,并结合高通 ® AI 引擎和 Qualcomm® AI Stack 进行集成测试,我们发现这款 200 亿参数的模型表现极为出色,能够完全在终端侧进行思维链推理。

高通认为这是一个关键转折点:预示着 AI 的未来方向,即丰富复杂的助手式推理也将在本地实现。这也展现了 AI 生态系统的成熟性,合作伙伴和开发者可以利用骁龙处理器,实时采用 OpenAI 等领军企业的开源创新成果。OpenAI 的 gpt-oss-20b 将助力终端设备利用终端侧推理,带来隐私保护和时延方面的优势,同时通过 AI 智能体为云端解决方案提供支持。

高通称,通过提前获取 gpt-oss-20b 模型,并结合 Qualcomm AI Stack 进行集成测试,见证了该模型的卓越能力,它能完全在终端侧进行复杂推理。开发者将可通过 Hugging Face 和 Ollama 等主流平台获取该模型,并在搭载骁龙平台的终端上发挥其性能。更多部署详情即将在 Qualcomm AI Hub 上公布。

将 Ollama 的轻量级的开源 LLM 服务框架和强大的骁龙平台集成,开发者和企业不仅可以直接在搭载骁龙计算平台的终端上运行 gpt-oss-20b 模型,还能够进行网页搜索等多个默认特性,无需额外配置。用户也可以在 Ollama 上尝试 Turbo 模式,以探索该模型的更多功能。

文章版权声明:除非注明,否则均为网络转载文章,转载或复制请以超链接形式并注明出处。

相关阅读

  • 英伟达公布 Neuralangelo AI 模型,可将视频内容转换为高精 3D 模型
  • OpenAI CEO 阿尔特曼:应当有一个类似联合国核监督的机构来管控 AI
  • 韩国宣布 2025 年起将 AI 引入中小学课程,三年内实现全覆盖
  • OpenAI 为开发者推出 GPT 聊天机器人 API 大更新,同时降低价格
  • 全球最大资产管理公司 CEO:人工智能可能是一种抑制通货膨胀的技术
  • 消息称谷歌警告员工不要向生成式 AI“泄密”,也不要直接用其写代码
  • (更新)消息称谷歌将与联发科合作打造 AI 服务器芯片,后者回应“错误报道”
  • 谷歌警告员工使用聊天机器人时要小心,包括自家的 Bard
  • 宏碁、惠普、华硕等品牌发力 AI 笔记本市场,明年将带动新一波换机潮
  • 人工智能深度调查:用过 AI 工具的人并没想象的那么多
  • 警用 AI 助手到来,美亚柏科发布国内首个公共安全大模型“天擎”
  • 近 12 年由 AI 造成的事故暴涨 15 倍,Facebook、特斯拉、OpenAI 位居总量前三
  • 内置 AI 助手 Copilot 上线:微软 Win11 Dev 预览版 Build 23493 发布,设置、音量大改
  • 微软在 Bing 和 Edge 浏览器中拓展网购服务,帮用户选购心仪产品
  • 英国初创公司用 AI 提升垃圾回收效率,每年追踪量达 320 亿件
  • 中国电信公布 TeleChat 大模型,宣称将建立“百亿级 AI 服务商”
  • 腾讯与西湖大学共同申请 AI 聊天机器人专利,可使问答语句更准确连贯
  • 金山办公宣布与英伟达团队合作,加速 WPS AI 服务
  • “世界上最像人的机器人”Ameca 接入 Stable Diffusion 和 GPT-3,现场完成作画
  • 配 2.2 万片英伟达 H100 GPU,Inflection AI 正开发超级计算机
  • 最新资讯

    热门资讯