研究人员推手语转文字 AI 翻译器,帮助听障人士正常交流

研究人员推手语转文字 AI 翻译器,帮助听障人士正常交流

人工智能 2023-05-27 21:01:02 1年以前

IT酷哥 5 月 25 日消息,巴塞罗那超级计算中心(BSC)和加泰罗尼亚理工大学(UPC)的研究人员开发了一种将手语翻译成文本的新工具,以给予听觉障碍者更多包容性和可及性。该工具利用人工智能技术,包括自我注意机制和更快的吞吐量,以更准确地理解手语者的姿势并产生准确的文字转写。

▲图源 Arxiv

该工具基于 How2Sign 数据集,这是一个公开可用的大规模、多模态和多视图数据集,包括 80 小时的美国手语教学视频和相应的英语文字记录。该数据集由 BSC 和 UPC 发布,用于训练模型,以便将手语转换为文本。研究人员使用膨胀式三维网络(I3D)对数据进行预处理,这是一种视频提取方法,可以对视频进行三维过滤,直接从视频中获取时空信息。并使用了一个转化器式的机器学习模型,与 ChatGPT 等其他人工智能工具背后的模型类似。

▲ 图源论文《Sign Language Translation from Instructional Videos》

该研究的主要作者 Laia Tarrés 表示:“我们开发的新工具是以前发布的名为 How2Sign 的出版物的延伸,在那里,训练模型所需的数据被公布。利用这些已经可用的数据,我们开发了一个新的开源软件,能够学习视频和文本之间的映射。”

▲图源 Pexels

研究人员发现,他们的模型能够产生有意义的翻译,但仍存在改进的空间。该工具尚处于实验阶段,研究人员将继续努力,以创建一个能够与无听力损失者使用的技术相媲美的工具。

Laia Tarrés 同时表示:“这个自动手语翻译的开放工具是对关注无障碍环境的科学界的宝贵贡献,它的发表代表了向为所有人创造更具包容性和无障碍的技术迈出的重要一步。”

文章版权声明:除非注明,否则均为网络转载文章,转载或复制请以超链接形式并注明出处。

相关阅读

  • 《Generated Adventure》游戏推出:风格、剧情、角色、场景和音乐等均由 AI 生成
  • 中央气象台:基于 AI 的台风监测和预报系统初步建成
  • Meta 发布 Voicebox AI 模型:可生成音频回复信息,用于 NPC 对话等
  • 丰田推出生成式 AI 工具:输入文字指令可自动设计汽车外形,并符合工程学需求
  • 亚马逊投入 1 亿美元成立 AI 创新中心,助力 AWS 业务发展
  • 科大讯飞星火 AI 大模型出海东南亚,将在新加坡实施“1+4”战略
  • 外媒提议更新开源许可证:摆脱 80 年代束缚,应对当下人工智能时代
  • 英科智能推出 AI 设计的罕见病特效药,已在中美同时启动人体临床试验
  • 英伟达联手 Snowflake:卖出更多芯片,帮助企业客户建立自己的 AI 模型
  • 成功率 99%,科学家研发语音 deepfake 软件:只需 5 分钟录音即可欺骗语音认证系统
  • 微软必应聊天周报:改善体育相关话题、向 Skype 开放图片生成工具
  • 中国电信公布 TeleChat 大模型,宣称将建立“百亿级 AI 服务商”
  • 正版文心一言上架 App Store,百度此前起诉苹果“盗版 App 泛滥”
  • 研究表明 GPT-4 模型具备自我纠错能力,有望推动 AI 代码进一步商业化
  • 联合国将招募数十个机器人,协助完成 2030 可持续发展目标
  • ChatGPT 又陷版权风波:两位恐怖小说作家起诉 OpenAI 盗用自己作品用于训练
  • 微软大中华区董事长侯阳:今后每一家公司的每一个应用程序都将由 AI 来驱动
  • 华为:盘古大模型不会开源,和 ChatGPT 不在一个轨道
  • 机器人首次在联合国答记者问:我们不会抢走工作、反抗人类
  • 全国首个 AI 射击射箭辅助训练系统发布,支持云端存储、实时查询
  • 最新资讯

    热门资讯