英特尔研究院发布全新 AI 扩散模型,可根据文本提示生成 360 度全景图

英特尔研究院发布全新 AI 扩散模型,可根据文本提示生成 360 度全景图

人工智能 2023-06-25 15:02:02 1年以前

IT酷哥 6 月 21 日消息,英特尔研究院今日宣布与 Blockade Labs 合作发布 LDM3D(Latent Diffusion Model for 3D)模型,这一全新的扩散模型使用生成式 AI 创建 3D 视觉内容。

据介绍,LDM3D 是业界领先的利用扩散过程(diffusion process)生成深度图(depth map)的模型,进而生成逼真的、沉浸式的 360 度全景图。LDM3D 有望革新内容创作、元宇宙应用和数字体验,改变包括娱乐、游戏、建筑和设计在内的许多行业。

英特尔表示,LDM3D 是在 LAION-400M 数据集包含一万个样本的子集上训练而成的。LAION-400M 是一个大型图文数据集,包含超过 4 亿个图文对。对训练语料库进行标注时,研究团队使用了之前由英特尔研究院开发的稠密深度估计模型 DPT-Large,为图像中的每个像素提供了高度准确的相对深度。LAION-400M 数据集是基于研究用途创建而成的,以便广大研究人员和其它兴趣社群能在更大规模上测试模型训练。

LDM3D 模型在一台英特尔 AI 超级计算机上完成了训练,该超级计算机由英特尔至强处理器和英特尔Habana Gaudi AI 加速器驱动。最终的模型和流程整合了 RGB 图像和深度图,生成 360 度全景图,实现了沉浸式体验。

文章版权声明:除非注明,否则均为网络转载文章,转载或复制请以超链接形式并注明出处。

相关阅读

  • 英国首相称必须尽快行动保持科技中心地位,要抓住人工智能机遇
  • 360 发布 AI 数字人广场,可同孙悟空、爱因斯坦等古今中外人物角色对话
  • 必应聊天周报:iOS 端引入小组件、为语音聊天扩展语言支持
  • 使用自然语言,纽约大学团队利用聊天机器人 ChatGPT 从零设计出微处理器
  • (更新)消息称谷歌将与联发科合作打造 AI 服务器芯片,后者回应“错误报道”
  • 软银 CEO 孙正义称每天都会使用 ChatGPT,是生成式 AI 服务的“忠实用户”
  • 腾讯首次披露行业大模型进展:不追求参数高,希望成本预算可控
  • AI 图像编辑技术 DragGAN 开源,拖动鼠标即可将狮子 P 转头
  • 微软用 AI 缩短癌症放疗时间:扫描速度提高 2.5 倍,准确率达 90%
  • 混合 AI 时代将至,这是你从未有过的全新体验
  • 内置 AI 助手 Copilot 上线:微软 Win11 Dev 预览版 Build 23493 发布,设置、音量大改
  • 微软必应聊天周报:改善体育相关话题、向 Skype 开放图片生成工具
  • 中国电信公布 TeleChat 大模型,宣称将建立“百亿级 AI 服务商”
  • 正版文心一言上架 App Store,百度此前起诉苹果“盗版 App 泛滥”
  • 李开复创业大模型公司“零一万物”官网上线:致力于打造全新的 AI 2.0 平台
  • Pixela 推出 ChatGPT 翻译 App:支持中日英韩互译,限时免费上架 Google Play
  • 联合国安理会将首次召开 AI 监管会议,讨论 AI 对全球和平与安全的潜在威胁
  • ChatGPT 技术被滥用,绍兴警方侦破团伙制作虚假视频案
  • 匈牙利公司推出世界首款 AI 研发饮料,口味、包装均由 AI 完成
  • 丁磊:当前网易的首要任务是用最快的速度探索 AI 大模型的创新应用
  • 最新资讯

    热门资讯