Mistral 推出 Voxtral 系列语音理解模型：以开源形式提供一流正确率表现

Mistral 推出 Voxtral 系列语音理解模型：以开源形式提供一流正确率表现

人工智能 2025-07-18 18:06:06 2天前

IT酷哥 7 月 16 日消息，Mistral AI 当地时间昨日公布了其 Voxtral 语音理解模型。该系列模型以开源形式推出，可以更低价格提供一流的低错误率表现，支持真实世界的语音智能生产应用。

Voxtral 系列模型由 Mistral Small 3.1 派生而来，包括面向生产应用的 24B 版本 Voxtral Small 和适用于本地 / 边缘部署的 3B 版本 Voxtral Mini，此外还有仅具备语音转文字功能的 Voxtral Mini Transcribe。

该模型支持 32K Token 的上下文长度，可处理 30 分钟音频转录或 40 分钟音频理解，内置生成相关问题、结构化摘要的能力，支持英语、西班牙语、法语、葡萄牙语、印地语、德语、荷兰语、意大利语等印欧诸语言。

Mistral AI 宣称 Voxtral Mini Transcribe 在成本敏感用例中性能优于 OpenAI Whisper，而价格不到后者的一半；而在高级用例方面，Voxtral Small 的性能与本领域顶尖模型 ElevenLabs Scribe 接近，价格也不到一半。

模型语音荷兰语葡萄牙语价格

相关阅读

上海 AI 实验室发布“书生・浦语”大模型：中文考试超越 ChatGPT

中国电科发布生成式人工智能大模型“小可”，为党政企行业用户打造

亚马逊云服务部门高管称正考虑使用 AMD 的新款 AI 芯片，还未最终决定

麦肯锡：到 2045 年左右，将有 50% 工作被 AI 接管

行业首家，长虹电视 AI 大模型“长虹超脑”开启公测

Snap 研发出新技术 SnapFusion，未来智能手机秒出 AI 生成图像

腾讯首次披露行业大模型进展：不追求参数高，希望成本预算可控

语音生成 AI 初创公司 ElevenLabs 发布合成语音检测工具，号称准确率超过 99%

DeepMind 联合创始人提出新的图灵测试：让 AI 将 10 万美元变成 100 万美元

亚马逊投入 1 亿美元成立 AI 创新中心，助力 AWS 业务发展

Meta 和 OpenAI 公司 CEO 公开支持欧盟推行 AI 监管方案

警用 AI 助手到来，美亚柏科发布国内首个公共安全大模型“天擎”

内置 AI 助手 Copilot 上线：微软 Win11 Dev 预览版 Build 23493 发布，设置、音量大改

微软必应聊天周报：改善体育相关话题、向 Skype 开放图片生成工具

首款搭载 ChatGPT 的自行车问世，让你骑行不再孤单

研究发现 AI 筛选的私募基金回报率高于大部分机构投资者

日本计划在学校内限度使用 ChatGPT 等生成式 AI

中国团队推出脑电图图像生成模型 DreamDiffusion，清华、腾讯参与研究

国内 AI 初创公司第四范式获得证监会赴港 IPO 批准，有望近期进行上市聆讯

丁磊：当前网易的首要任务是用最快的速度探索 AI 大模型的创新应用