百度“根据场景生成数字人”专利获授权，可应用于元宇宙

百度“根据场景生成数字人”专利获授权，可应用于元宇宙

人工智能 2023-06-12 15:53:02 1年以前

IT酷哥 6 月 9 日消息，北京百度网讯科技有限公司申请的“生成数字人的方法、模型的训练方法、装置、设备和介质”专利获授权。

IT酷哥从专利摘要获取到，该专利提供了一种生成数字人的方法、模型的训练方法、装置、设备和介质，涉及人工智能领域，具体涉及自然语言处理、深度学习、计算机视觉、图像处理、增强现实和虚拟现实等技术领域，可应用于元宇宙等场景。实现方案为：获取素材内容；基于预训练的场景划分模型，从素材内容中确定多个场景。

其中，多个场景中的每个场景分别对应于素材内容中的一个具有完整语义信息的内容片段；以及对于多个场景中的每个场景，基于对应的内容片段，确定该场景对应的目标内容；基于对应的目标内容，确定该场景的场景标签信息；以及基于场景标签信息，配置特定于该场景的数字人。

专利称，数字人在视频中的运用主要基于模板进行，比如固定数字人进行播报，数字人播报时可能会出现数字人与内容割裂，播报内容与数字人形象不匹配，用户体验差。

该专利通过对素材内容进行场景切分，并以场景为粒度进行数字人的配置，从而确保了数字人与场景和目标内容的一致性，改善了素材内容和数字人之间的融合，提升了用户观看数字人的体验。

场景数字内容素材多个专利

相关阅读

消息称微软曾不听 OpenAI 警告，上线不成熟的必应聊天服务

百度与中国石化签署战略合作框架协议，将在 AI 等领域深化合作

对公司缺乏信心，Meta 去年流失三分之一 AI 研究人员

Meta 发布 Voicebox AI 模型：可生成音频回复信息，用于 NPC 对话等

腾讯宣布打造行业大模型精选商店，提供一站式服务

Snap 研发出新技术 SnapFusion，未来智能手机秒出 AI 生成图像

长虹电视 AI 大模型“长虹超脑”发布：三大核心能力，可连续自然对话

科学家利用 AI 识别热门歌曲，准确率高达 97%

英特尔研究院发布全新 AI 扩散模型，可根据文本提示生成 360 度全景图

Dropbox 网盘推出 AI 搜索工具 Dropbox Dash：聚合多办公平台，可视化管理工作任务

AI 公司 MosaicML 推出 300 亿参数模型 MPT-30B，号称训练成本仅为竞品零头

香港电台推出 AI 天气主播 Aida，表情、动作均由电脑合成

人工智能深度调查：用过 AI 工具的人并没想象的那么多

美国银行分析师：聊天机器人中 ChatGPT 占据最大优势，过半用户会为其付费服务买单

成功率 99%，科学家研发语音 deepfake 软件：只需 5 分钟录音即可欺骗语音认证系统

近 12 年由 AI 造成的事故暴涨 15 倍，Facebook、特斯拉、OpenAI 位居总量前三

日媒关注中国推进鸟类识别 AI 普及，除监测保护外还可预防传染性疾病

英国初创公司用 AI 提升垃圾回收效率，每年追踪量达 320 亿件

Pixela 推出 ChatGPT 翻译 App：支持中日英韩互译，限时免费上架 Google Play

百度华为阿里入局 AI 大模型“国家队”，联合担任首个标准化专题组组长