Mistral 推出 Voxtral 系列语音理解模型:以开源形式提供一流正确率表现

Mistral 推出 Voxtral 系列语音理解模型:以开源形式提供一流正确率表现

人工智能 2025-07-18 18:06:06 2天前

IT酷哥 7 月 16 日消息,Mistral AI 当地时间昨日公布了其 Voxtral 语音理解模型。该系列模型以开源形式推出,可以更低价格提供一流的低错误率表现,支持真实世界的语音智能生产应用。

Voxtral 系列模型由 Mistral Small 3.1 派生而来,包括面向生产应用的 24B 版本 Voxtral Small 和适用于本地 / 边缘部署的 3B 版本 Voxtral Mini,此外还有仅具备语音转文字功能的 Voxtral Mini Transcribe。

该模型支持 32K Token 的上下文长度,可处理 30 分钟音频转录或 40 分钟音频理解,内置生成相关问题、结构化摘要的能力,支持英语、西班牙语、法语、葡萄牙语、印地语、德语、荷兰语、意大利语等印欧诸语言。

Mistral AI 宣称 Voxtral Mini Transcribe 在成本敏感用例中性能优于 OpenAI Whisper,而价格不到后者的一半;而在高级用例方面,Voxtral Small 的性能与本领域顶尖模型 ElevenLabs Scribe 接近,价格也不到一半。

文章版权声明:除非注明,否则均为网络转载文章,转载或复制请以超链接形式并注明出处。

相关阅读

  • 上海 AI 实验室发布“书生・浦语”大模型:中文考试超越 ChatGPT
  • 中国电科发布生成式人工智能大模型“小可”,为党政企行业用户打造
  • 亚马逊云服务部门高管称正考虑使用 AMD 的新款 AI 芯片,还未最终决定
  • 麦肯锡:到 2045 年左右,将有 50% 工作被 AI 接管
  • 行业首家,长虹电视 AI 大模型“长虹超脑”开启公测
  • Snap 研发出新技术 SnapFusion,未来智能手机秒出 AI 生成图像
  • 腾讯首次披露行业大模型进展:不追求参数高,希望成本预算可控
  • 语音生成 AI 初创公司 ElevenLabs 发布合成语音检测工具,号称准确率超过 99%
  • DeepMind 联合创始人提出新的图灵测试:让 AI 将 10 万美元变成 100 万美元
  • 亚马逊投入 1 亿美元成立 AI 创新中心,助力 AWS 业务发展
  • Meta 和 OpenAI 公司 CEO 公开支持欧盟推行 AI 监管方案
  • 警用 AI 助手到来,美亚柏科发布国内首个公共安全大模型“天擎”
  • 内置 AI 助手 Copilot 上线:微软 Win11 Dev 预览版 Build 23493 发布,设置、音量大改
  • 微软必应聊天周报:改善体育相关话题、向 Skype 开放图片生成工具
  • 首款搭载 ChatGPT 的自行车问世,让你骑行不再孤单
  • 研究发现 AI 筛选的私募基金回报率高于大部分机构投资者
  • 日本计划在学校内限度使用 ChatGPT 等生成式 AI
  • 中国团队推出脑电图图像生成模型 DreamDiffusion,清华、腾讯参与研究
  • 国内 AI 初创公司第四范式获得证监会赴港 IPO 批准,有望近期进行上市聆讯
  • 丁磊:当前网易的首要任务是用最快的速度探索 AI 大模型的创新应用
  • 最新资讯

    热门资讯