研究人员推手语转文字 AI 翻译器,帮助听障人士正常交流

研究人员推手语转文字 AI 翻译器,帮助听障人士正常交流

人工智能 2023-05-27 21:01:02 1年以前

IT酷哥 5 月 25 日消息,巴塞罗那超级计算中心(BSC)和加泰罗尼亚理工大学(UPC)的研究人员开发了一种将手语翻译成文本的新工具,以给予听觉障碍者更多包容性和可及性。该工具利用人工智能技术,包括自我注意机制和更快的吞吐量,以更准确地理解手语者的姿势并产生准确的文字转写。

▲图源 Arxiv

该工具基于 How2Sign 数据集,这是一个公开可用的大规模、多模态和多视图数据集,包括 80 小时的美国手语教学视频和相应的英语文字记录。该数据集由 BSC 和 UPC 发布,用于训练模型,以便将手语转换为文本。研究人员使用膨胀式三维网络(I3D)对数据进行预处理,这是一种视频提取方法,可以对视频进行三维过滤,直接从视频中获取时空信息。并使用了一个转化器式的机器学习模型,与 ChatGPT 等其他人工智能工具背后的模型类似。

▲ 图源论文《Sign Language Translation from Instructional Videos》

该研究的主要作者 Laia Tarrés 表示:“我们开发的新工具是以前发布的名为 How2Sign 的出版物的延伸,在那里,训练模型所需的数据被公布。利用这些已经可用的数据,我们开发了一个新的开源软件,能够学习视频和文本之间的映射。”

▲图源 Pexels

研究人员发现,他们的模型能够产生有意义的翻译,但仍存在改进的空间。该工具尚处于实验阶段,研究人员将继续努力,以创建一个能够与无听力损失者使用的技术相媲美的工具。

Laia Tarrés 同时表示:“这个自动手语翻译的开放工具是对关注无障碍环境的科学界的宝贵贡献,它的发表代表了向为所有人创造更具包容性和无障碍的技术迈出的重要一步。”

文章版权声明:除非注明,否则均为网络转载文章,转载或复制请以超链接形式并注明出处。

相关阅读

  • OpenAI 捐款 10 万美元,推动治理人工智能、引导其健康发展
  • 欲挑战微软 OpenAI 组合,甲骨文寻求和加拿大 AI 创企 Cohere 结盟
  • 网易云音乐和小冰联合推出 AI 歌手音乐创作软件,首发内置 12 名 AI 歌手
  • 当一个网站的内容被 AI 完全接管
  • AI 朗读冲击有声读物市场,配音演员工作面临威胁
  • Meta 发布 Voicebox AI 模型:可生成音频回复信息,用于 NPC 对话等
  • Snap 研发出新技术 SnapFusion,未来智能手机秒出 AI 生成图像
  • 网友“欺骗”ChatGPT 生成 Win10、Win11 密钥,马斯克调侃:真适合做睡前读物
  • 软银 CEO 孙正义称每天都会使用 ChatGPT,是生成式 AI 服务的“忠实用户”
  • 京东 AI 大模型官宣 7 月 13 日发布:新上任 CEO 许冉演讲,还有重磅合作
  • YouTube 测试 Aloud 人工智能配音功能,可将视频转述为不同语言
  • AI 作画工具 Midjourney 迎来 5.2 版本更新,可生成相机“变焦效果”
  • 中国联通发布鸿湖图文 AI 大模型 1.0,可实现以文生图、视频剪辑
  • iOS 版 ChatGPT 集成必应搜索功能,仅限付费订阅者使用
  • 微软推出 ZeRO++ 技术,可显著减少 AI 大模型训练时间和成本
  • 腾讯与西湖大学共同申请 AI 聊天机器人专利,可使问答语句更准确连贯
  • 金山办公宣布与英伟达团队合作,加速 WPS AI 服务
  • 李开复创业大模型公司“零一万物”官网上线:致力于打造全新的 AI 2.0 平台
  • 方舟启航,火山引擎这波在“大气层”
  • “世界上最像人的机器人”Ameca 接入 Stable Diffusion 和 GPT-3,现场完成作画
  • 最新资讯

    热门资讯