苹果引领 AR 革命?Unity 技术开放日 x Rokid,畅谈下一代人机交互新路线

苹果引领 AR 革命?Unity 技术开放日 x Rokid,畅谈下一代人机交互新路线

IT资讯 2023-06-11 21:06:03 1年以前

一场由苹果引发的空间计算时代革命,镌刻在 AR(增强现实)发展的里程碑上。由 Vision Pro 打造的沉浸式空间,正在为用户带来全新的人机交互体验,比如:突破传统显示屏的限制,用户浏览 App 时,只要轻松地看着它们、捏合手指来选择,即可在空中任意拖拉点击。

事实上,这也是 Rokid 一直探索的方向 —— 将人、现实世界与虚拟世界的融合,更自然真实地结合在一起。

在今年 3 月的 Rokid Open Day 上,Rokid 发布了全新一代自研 AR 空间操作系统 ——YodaOS-Master:基于 Rokid Max Pro 眼镜,张开手掌,菜单立马浮现在眼前。点击图标,便可进入应用,享受灵动随心的空间多屏互动体验。其中,业内首创基于单摄像头即可实现 SLAM 及 3D 裸手交互等能力,这一全新的技术路线,发布即引发行业的关注与热议。

今天,中国开发者最重要的年度盛典之一“2023 年 Unity 技术开放日”首站在北京隆重举行,Rokid 出席本次活动。会上 Rokid 系统研发总工程师石文峰带来了主题为《Rokid YodaOS-Master 系统介绍及应用开发与落地》的演讲,分享了这一备受关注的技术路线,以及 Rokid 最新的技术发展,与现场开发者们进行了深入的交流与探讨。

Rokid 全新一代自研空间 AR 系统

业内首创单摄 SLAM 技术

在今天的游戏论坛上,Rokid 系统研发总工程师石文峰,结合多年丰富的 AR 行业技术研发经验,向现场开发者们介绍了备受关注的 YodaOS-Master 系统,以及 Rokid 背后的技术思考。

围绕感知、理解、交互、展现、协同和数字创作五个方面,YodaOS-Master 从芯片优化、硬件设计、软件架构、AR 算法还有创作工具等诸多方面都做了巨大升级,或是目前最为完整的一套面向 AR 时代的空间操作系统。

基于 Rokid Max Pro 眼镜,首创基于单摄像头即可实现 SLAM、3D 裸手交互、第一视角分享、视觉定位 VPS 等能力,可以支持多任务运行、空间创作等 AR 体验,给更轻量化、普惠的 AR 眼镜带来无限可能。

在 YodaOS 操作系统诞生之初,Rokid 就秉持着一个观点,通过 YodaOS 操作系统赋能开发者,释放想像力,创造价值。

石文峰表示,“YodaOS-Master 操作系统通过模块化的方式,将 Rokid 语音识别、手势识别、SLAM 等在内的多项核心技术进行‘打包’处理,形成 SDK 供开发者高效开发,比如 SDK for Unity,可以让 Unity 开发者能够快速使用 Rokid 核心技术进行开发。”

Rokid 一直致力于更自然的 AR 交互体验。相比于传统的 2D 手势识别,3D 手势识别更具有挑战性。基于 YodaOS-Master 的底层系统能力,文峰老师重点谈到了 Rokid 目前的单目 3D 手势识别技术。

基于深度学习算法和大量实验数据,Rokid 自研的单目 3D 手势算法能在移动端实时重建手部姿态参数,包括手部 6DoF、手部关节点 26DoF,以及 Hand Mesh 信息,为 AR 的手势交互提供良好的算法基础。

目前,Rokid 的手势识别在 3D 空间中可实现多种操作,包括点、捏、抓、握、拖、拉等等,完全可以满足 AR 交互应用需求。例如,戴上 Rokid Max Pro,伸出手,在眼前张开手掌即可呼出菜单。

值得一提的是,Rokid 软硬件于一体的 AR 空间体验已在全国多个场景落地,包括全国首个基于 AR 眼镜的元宇宙街区项目 —— 杭州文三元宇宙 AR 数字生活街区、全国文旅行业内首个基于单目视觉 SLAM 的 AR 眼镜导览方案 —— 敦煌 AR 智能导,以及钉钉携手 Rokid 所打造的全国首个企业 AR 数字展厅等等。

若琪数字人 + AIGC

多模态交互体验全新升级

随着 AI 时代的加速发展,人机交互方式的发展趋势为多模态交互。单一的键盘交互、触摸交互、语音交互等方式,已经不能满足未来人们更深层次的需求。

试想,如果你想要边听音乐边办公的话,需要先通过语音或触摸交互的方式唤醒音响,再通过键盘交互的方式打开办公软件。但如果你拥有一个“数字人”助手,一切变得简单起来,只需一个指令,就可以同时完成这两件事。

这也是 Rokid 做 AI 数字人的原因之一。石文峰表示,AI 数字人技术可以串连系统所有的能力,包括语音助手 AI 数字人、SLAM、3D 手势、6DOF 空间音频等 Rokid 核心技术,从而为用户带来更丰富的人机交互体验。

目前,Rokid 所打造的“若琪”数字人已经全面接入 AIGC,用户可以随时唤起“若琪”,和这位虚拟助手探讨任何有趣的话题。

石文峰介绍,这背后采用的是 AIGC 多模态数字智能驱动的模式,通过 ASR、NLP、TTS 等自研算法技术,驱动“若琪”产生准确的面部表情、语音表达、肢体动作,并且表现得更真实、自然、流畅。

Rokid 全方位赋能开发者

共同迎接下一个人机互交时代

观影、游戏、办公、教育等多种场景,随着 AR、MR 等技术的趋向成熟,未来将有着无限的想像空间。多重生态内容的重新构建,亟待开发者们带来更多突破与创新。

Unity 技术开放日是中国开发者最重要的年度互动盛典之一,通过每年的若干场线下巡回活动,为创作者群体搭建技术交流平台,传达技术演进路径,营建多元活跃的开发者社区氛围,同时聆听来自开发者的声音,赋能实时 3D 技术的内容创新与应用延展。

Rokid 作为 AR 行业领军企业,参与共促行业繁荣。当天的活动中,Rokid 除了带去最新的技术分享演讲,还在现场设置展台区,带来了包括 Rokid 最新 AR 产品与生态建设场景,供现场开发者们体验,帮助他们更直观地了解 Rokid 的最新技术与生态。

近年来,Rokid 始终致力于赋能更多的开发者,打造了专门的 AR 开放平台(ar.rokid.com),推出了“若琪空间站”开发者助力计划,举办全球范围的 AR 应用开发大赛等,激励开发者共同参与生态共建,促进 AR 生态繁荣。

文峰介绍,Rokid 为开发者们量身打造的“若琪空间站”开发者助力计划,在硬件设备、算法能力、开发支持、市场推广等方面全方位支持开发者。同时,Rokid 联合多个行业头部企业与 VC 成立 10 亿人民币规模的生态智投联盟,对优秀的开发者直接进行投资。

在大力扶持开发者的同时,Rokid 成功举办了首届全球 AR 应用开发大赛,为全球开发者颁出 11 项重磅大奖。今年 5 月,Rokid 首届高校 XR 内容创作大赛面向全国高校正式启动,激发高校创新力量。

未来,Rokid 愿携手更多合作伙伴,一起加入 AR 生态构建中,打造开放共赢的生态体系,持续为行业赋能,推动 AR 行业加快发展,共同迎接下一个人机交互时代。

文章版权声明:除非注明,否则均为网络转载文章,转载或复制请以超链接形式并注明出处。

相关阅读

  • 辛巴辛有志打通农产品产销通道,推动农村经济发展
  • 百度:已有 15 万企业申请“文心一言”AI 大模型内测
  • 华为举办 2023 创新数据基础设施论坛,加速全球数据生产力跃升
  • 邀请 VR 领域记者和创作者参加 WWDC,侧面表明苹果会推首款头显
  • 专为 GeForce RTX 4060 Ti 和《魔戒:咕噜》GeForce 玩家打造的全新 Game Ready 驱动发布
  • 下好科技创新“先手棋”:汉王科技三十年的数字时代之变
  • 古尔曼称苹果推出首款头显利好 Meta,助其提高市场份额
  • 英特尔黑科技加持,腾讯应用宝登陆电脑:安卓应用完美移植 PC 更有神器辅助
  • 携手女足队员赵丽娜,OPPO Reno10 系列「暮光紫」为你乘风破浪
  • Synido 森林岛亮相广州国际专业灯光音响展,现场人气爆棚!
  • Meta 发布 Megabyte AI 模型抗衡 Transformer:解决后者已知问题、速度提升 4 成
  • 《动物派对》全新宣传视频放出,支持英伟达 DLSS 2 和 Reflex 技术
  • NVIDIA RTX 带来革命性的 14 英寸笔记本电脑, 并行场景编码等
  • 小米 / Redmi 旗下多款手机参与 618 大促:到手价 1699-3999 元
  • 英伟达股价飙升:机构投资者大力支持,散户持币观望
  • 首战告捷!魅族 618 开门红在多平台斩获优异战绩,魅族手机销售额增速实现第一!
  • 瑞士政府要求互联网巨头向当地媒体支付“新闻引用费”
  • 网易严选 618 开门红战报:首日 28 小时全渠道销售同比增长超预期
  • 2023 中国科幻大会未来智慧城市畅想论坛在首钢园成功举办
  • 中国移动、华为等申请的 5G 信息安全鉴权方法及系统专利公布
  • 最新资讯

    热门资讯