香港特区立法会投用科大讯飞“智识听”系统:实时准确率 96%,特殊口音也能应对

香港特区立法会投用科大讯飞“智识听”系统:实时准确率 96%,特殊口音也能应对

人工智能 2025-08-06 08:12:05 3小时前

IT酷哥 8 月 4 日消息,据科大讯飞官方公众号,香港特区立法会与科大讯飞联合打造了智慧誊录系统“智识听”,可深度识别立法会场景的实时字幕功能,运用科大讯飞中英粤混读引擎,结合声纹识别和字幕与帧画面对齐压制技术,实现会议直播中文字和视频画面的同轨显示,公众可通过实时字幕无障碍获取政策资讯。

“智识听”深度学习 2.5 亿字语料、400 小时音频、20 万条香港特色关键词,口音、新地名、混语发言实时适配,即使面对议员特殊口音或复杂地名也能高效处理。目前,实时字幕的准确率达 96%,通过幕后同事的即时修正,准确率通过人机结合可达 99%。

IT酷哥从官方获悉,“智识听”正式调研、研发、上线历时近 3 年,1.0 版具备录音转文字功能,2.0 引入对实时转文字的支持,3.0 版则开始支持实时字幕。为解决粤语俚语及法律专业术语较多、部分议员存在口音、中英粤混杂等问题,立法会秘书处整理了 2.5 亿汉字的中英文对照和 20 万个高频粤语词汇,将其作为语料库提供给机器学习。经过数据和算法的优化和不断地训练,立法会会议实时字幕的准确率达 96%。

原先,需要 7 个工作日才能发布的议事录,会议召开后第二天即可发布。目前智识听四期正在准备中,该期将建设英语字幕和多语种字幕系统。同时,基于星火大模型的进步,香港立法会的智慧办公系统也提上日程。

文章版权声明:除非注明,否则均为网络转载文章,转载或复制请以超链接形式并注明出处。

相关阅读

  • 北京智源发布悟道 3.0 大模型系列
  • 消息称 AI 服务器需求强劲,鸿海旗下鸿佰科技计划新增五到六条产线
  • 普通人也能成为音频剪辑师,Meta 推出 AI 模型 Voicebox
  • 长城汽车申请 SPACEGPT 等商标,有望成为首批在车机终端引入 AI 智能助理的吃螃蟹者
  • 使用自然语言,纽约大学团队利用聊天机器人 ChatGPT 从零设计出微处理器
  • LG 发布首个生成式 AI 商业化服务 Captioning AI:10 秒内为图片提供 5 句描述和 10 个关键词
  • 美国安全公司发现两款仿冒 ChatGPT 恶意应用,提醒用户暂无官方安卓客户端
  • 腾讯首次披露行业大模型进展:不追求参数高,希望成本预算可控
  • 香港电台推出 AI 天气主播 Aida,表情、动作均由电脑合成
  • 调查发现 20% 的男性使用 ChatGPT 等 AI 工具“美化”约会资料,提高交流技巧
  • 微软在 Bing 和 Edge 浏览器中拓展网购服务,帮用户选购心仪产品
  • 英国初创公司用 AI 提升垃圾回收效率,每年追踪量达 320 亿件
  • 研究表明 GPT-4 模型具备自我纠错能力,有望推动 AI 代码进一步商业化
  • 亚马逊 Kindle 自助出版功能被滥用,AI 生成的书籍泛滥
  • 丁磊:当前网易的首要任务是用最快的速度探索 AI 大模型的创新应用
  • 中国工程院院士高文:将打造 2000 亿参数自然语言大模型底座,性能对标 ChatGPT
  • 陈天桥再投 10 亿元支持 AI 脑科学,筹建睡眠梦境、抗衰老等前沿实验室
  • OpenAI 组建新团队,以解决控制超智能 AI 的核心技术挑战
  • Mozilla 的 AI Help 工具终遭官方停用:生成的技术信息真假参半
  • 魅族申请“魅 GPT”“FlymeGPT” 商标,有望布局手机 / 车机 AI 大模型
  • 最新资讯

    热门资讯