AI 图像编辑技术 DragGAN 开源,拖动鼠标即可将狮子 P 转头

AI 图像编辑技术 DragGAN 开源,拖动鼠标即可将狮子 P 转头

人工智能 2023-06-30 21:24:02 1年以前

IT酷哥6 月 28 日消息,近日来自马克斯・普朗克计算机科学研究所、MIT CSAIL 和谷歌的研究者们研究了一种控制 GAN 的新方法 DragGAN,只要点击拖拽,用户就可以“改变汽车的尺寸或者将人物的笑容变成皱眉”。目前该项目已经在 GitHub 中开源,有兴趣的IT酷哥小伙伴们可以前往了解。

▲ 视频源 DragDAN,微博视频转录由 科普君 XueShu

DragGAN 是一个直观的图像编辑工具,用户只需要控制图像中的像素点和方向,就可以快速调整照片主体的位置、姿态、表情、大小和角度等。这种工具的潜力主要表现在,从文本生成图像的人工智能并不总是能输出你想要的结果,所以用户可以在生成图像之后再进行重新编辑,而不必重新生成一个新的图像。

▲ 图源DragGAN

▲ 图源DragGAN

研究论文中展示了一些演示案例,包括增加山峰的高度,改变模特的姿势和衣服的长度和形状,张开或闭合狮子的嘴巴,以及将一个人的表情从平淡变成微笑。

研究人员表示,他们的方法在基于 GAN 的操作中优于 SOTA,并为图像编辑开辟了新方向。在接下来的几个月里,他们希望将基于点的编辑扩展到 3D 生成模型。

虽然公布了源代码,但源代码有严格的限制:

本作品及其任何衍生作品只能用于或打算用于非商业用途。尽管有上述规定,英伟达公司及其附属机构可以在商业上使用该作品和任何衍生作品。在此,"非商业" 是指仅用于研究或评估目的。

文章版权声明:除非注明,否则均为网络转载文章,转载或复制请以超链接形式并注明出处。

相关阅读

  • 韩国创作者发起大规模抵制 AI 漫画运动,反对侵权盗用与非法商业化
  • 中国电科发布生成式人工智能大模型“小可”,为党政企行业用户打造
  • AI 朗读冲击有声读物市场,配音演员工作面临威胁
  • 理想汽车负责人:我们在 ChatGPT 问世之前就已启动 AI 大语言模型训练
  • 宜家发布由 AI 设计的下一代沙发:轻便、扁平、模块化,采用 100% 可回收材料
  • 软银 CEO 孙正义宣布策略调整:AI 革命正在爆发,公司将“转守为攻”
  • 全球首个 AI 广播频道公司完成 1900 万美元融资,开发无障碍及游戏 NPC 技术
  • AI 入局世界网球温布顿锦标赛,可分析赢球概率及生成球评
  • AI 模型 Stable Diffusion 升级:正常生成五指、图像更逼真
  • 开源模型 PrivateGPT 上线,可本地搭建、避免信息外泄
  • 美国商务部宣布成立 AI 公共工作组,应对生成式人工智能潜在风险
  • 中国联通发布鸿湖图文 AI 大模型 1.0,可实现以文生图、视频剪辑
  • 谷歌 DeepMind 自曝正开发新型 AI 模型 Gemini,号称“比 GPT-4 强”
  • 英科智能推出 AI 设计的罕见病特效药,已在中美同时启动人体临床试验
  • 为防止泄密,美国国会明确要求职员仅可使用付费版 ChatGPT
  • 英伟达联手 Snowflake:卖出更多芯片,帮助企业客户建立自己的 AI 模型
  • 近 12 年由 AI 造成的事故暴涨 15 倍,Facebook、特斯拉、OpenAI 位居总量前三
  • 调查发现 20% 的男性使用 ChatGPT 等 AI 工具“美化”约会资料,提高交流技巧
  • 微软必应聊天周报:改善体育相关话题、向 Skype 开放图片生成工具
  • 首款搭载 ChatGPT 的自行车问世,让你骑行不再孤单
  • 最新资讯

    热门资讯