百度“根据场景生成数字人”专利获授权,可应用于元宇宙

百度“根据场景生成数字人”专利获授权,可应用于元宇宙

人工智能 2023-06-12 15:53:02 1年以前

IT酷哥 6 月 9 日消息,北京百度网讯科技有限公司申请的“生成数字人的方法、模型的训练方法、装置、设备和介质”专利获授权。

IT酷哥从专利摘要获取到,该专利提供了一种生成数字人的方法、模型的训练方法、装置、设备和介质,涉及人工智能领域,具体涉及自然语言处理、深度学习、计算机视觉、图像处理、增强现实和虚拟现实等技术领域,可应用于元宇宙等场景。实现方案为:获取素材内容;基于预训练的场景划分模型,从素材内容中确定多个场景。

其中,多个场景中的每个场景分别对应于素材内容中的一个具有完整语义信息的内容片段;以及对于多个场景中的每个场景,基于对应的内容片段,确定该场景对应的目标内容;基于对应的目标内容,确定该场景的场景标签信息;以及基于场景标签信息,配置特定于该场景的数字人。

专利称,数字人在视频中的运用主要基于模板进行,比如固定数字人进行播报,数字人播报时可能会出现数字人与内容割裂,播报内容与数字人形象不匹配,用户体验差。

该专利通过对素材内容进行场景切分,并以场景为粒度进行数字人的配置,从而确保了数字人与场景和目标内容的一致性,改善了素材内容和数字人之间的融合,提升了用户观看数字人的体验。

文章版权声明:除非注明,否则均为网络转载文章,转载或复制请以超链接形式并注明出处。

相关阅读

  • 谷歌演示文稿应用 Slides 引入 AI 生成图像功能
  • OpenAI CEO 阿尔特曼到访日本,对全球 AI 协调合作表示“非常乐观”
  • OpenAI 为开发者推出 GPT 聊天机器人 API 大更新,同时降低价格
  • 讯飞星火 App 上线苹果 iOS 平台:搭载 V1.5 认知大模型,须获取内测资格后使用
  • 全球最大资产管理公司 CEO:人工智能可能是一种抑制通货膨胀的技术
  • 全球 AI 人才需求激增,部分岗位年薪逼近 40 万美元
  • 语音生成 AI 初创公司 ElevenLabs 发布合成语音检测工具,号称准确率超过 99%
  • 软银 CEO 孙正义宣布策略调整:AI 革命正在爆发,公司将“转守为攻”
  • YouTube 测试 Aloud 人工智能配音功能,可将视频转述为不同语言
  • 宏碁、惠普、华硕等品牌发力 AI 笔记本市场,明年将带动新一波换机潮
  • Unity 推出面向开发者的 AI 软件市场 AI Hub,股价飙涨 15%
  • 英伟达联手 Snowflake:卖出更多芯片,帮助企业客户建立自己的 AI 模型
  • 16 名匿名人士起诉 ChatGPT 侵犯隐私,向微软和 OpenAI 索赔 30 亿美元
  • “商汤如影 SenseAvatar” 数字人视频生成平台上线,支持定制形象、声音克隆、创作视频等功能
  • 韩媒称三星先进封装技术落后于台积电,导致难以取得 AI 芯片订单
  • 国内 AI 初创公司第四范式获得证监会赴港 IPO 批准,有望近期进行上市聆讯
  • 亚马逊 Kindle 自助出版功能被滥用,AI 生成的书籍泛滥
  • 陈天桥再投 10 亿元支持 AI 脑科学,筹建睡眠梦境、抗衰老等前沿实验室
  • 精准度可提高 20%:英国九家银行签约使用基于 AI 的“消费者欺诈风险系统”应对诈骗
  • 下一代“世界最快”超级计算机 El Capitan 开始安装 AMD Instinct MI300 人工智能 GPU
  • 最新资讯

    热门资讯