AI 图像编辑技术 DragGAN 开源,拖动鼠标即可将狮子 P 转头

AI 图像编辑技术 DragGAN 开源,拖动鼠标即可将狮子 P 转头

人工智能 2023-06-30 21:24:02 1年以前

IT酷哥6 月 28 日消息,近日来自马克斯・普朗克计算机科学研究所、MIT CSAIL 和谷歌的研究者们研究了一种控制 GAN 的新方法 DragGAN,只要点击拖拽,用户就可以“改变汽车的尺寸或者将人物的笑容变成皱眉”。目前该项目已经在 GitHub 中开源,有兴趣的IT酷哥小伙伴们可以前往了解。

▲ 视频源 DragDAN,微博视频转录由 科普君 XueShu

DragGAN 是一个直观的图像编辑工具,用户只需要控制图像中的像素点和方向,就可以快速调整照片主体的位置、姿态、表情、大小和角度等。这种工具的潜力主要表现在,从文本生成图像的人工智能并不总是能输出你想要的结果,所以用户可以在生成图像之后再进行重新编辑,而不必重新生成一个新的图像。

▲ 图源DragGAN

▲ 图源DragGAN

研究论文中展示了一些演示案例,包括增加山峰的高度,改变模特的姿势和衣服的长度和形状,张开或闭合狮子的嘴巴,以及将一个人的表情从平淡变成微笑。

研究人员表示,他们的方法在基于 GAN 的操作中优于 SOTA,并为图像编辑开辟了新方向。在接下来的几个月里,他们希望将基于点的编辑扩展到 3D 生成模型。

虽然公布了源代码,但源代码有严格的限制:

本作品及其任何衍生作品只能用于或打算用于非商业用途。尽管有上述规定,英伟达公司及其附属机构可以在商业上使用该作品和任何衍生作品。在此,"非商业" 是指仅用于研究或评估目的。

文章版权声明:除非注明,否则均为网络转载文章,转载或复制请以超链接形式并注明出处。

相关阅读

  • 日本横须贺市宣布“第一个吃螃蟹”,开始在日常行政中使用 ChatGPT
  • 报告称英伟达人工智能软件可被轻易破解,存在泄露用户隐私的风险
  • 支持普通话,桌面端 Bing Chat 新增语音聊天方式
  • 微软推出 LLaVA-Med AI 模型,可对医学病理案例进行分析
  • 百度与中国石化签署战略合作框架协议,将在 AI 等领域深化合作
  • 科学家利用 AI 识别热门歌曲,准确率高达 97%
  • 英特尔研究院发布全新 AI 扩散模型,可根据文本提示生成 360 度全景图
  • Unity 推出面向开发者的 AI 软件市场 AI Hub,股价飙涨 15%
  • iOS 版 ChatGPT 集成必应搜索功能,仅限付费订阅者使用
  • 英伟达联手 Snowflake:卖出更多芯片,帮助企业客户建立自己的 AI 模型
  • 近 12 年由 AI 造成的事故暴涨 15 倍,Facebook、特斯拉、OpenAI 位居总量前三
  • 内置 AI 助手 Copilot 上线:微软 Win11 Dev 预览版 Build 23493 发布,设置、音量大改
  • 北京出台机器人产业新政,支持 AI 大模型与机器人融合发展
  • 金山办公宣布与英伟达团队合作,加速 WPS AI 服务
  • MetaGPT AI 模型开源:可模拟软件公司开发过程,生成高质量代码
  • 谷歌更新隐私政策规定,可使用互联网上的公开信息训练 AI 模型
  • ChatGPT 技术被滥用,绍兴警方侦破团伙制作虚假视频案
  • 联合国将招募数十个机器人,协助完成 2030 可持续发展目标
  • ChatGPT 又陷版权风波:两位恐怖小说作家起诉 OpenAI 盗用自己作品用于训练
  • 中国工程院院士高文:将打造 2000 亿参数自然语言大模型底座,性能对标 ChatGPT
  • 最新资讯

    热门资讯