1.7 秒实现高清大片快速复原,我国团队发布 HYPIR 图像复原大模型

1.7 秒实现高清大片快速复原,我国团队发布 HYPIR 图像复原大模型

人工智能 2025-07-29 22:11:05 18小时前

IT酷哥 7 月 28 日消息,中国科学院深圳先进技术研究院数字所董超研究员团队今日发布了一项名为 HYPIR 的图像复原大模型,不仅比现有的图像复原技术快数十倍,更在高清分辨率、文字保真、理解能力、用户控制灵活性等方面展现出了优异性能。

传统方法中,基于预训练扩散模型的复原技术显著提升了图像复原效果,但存在计算复杂度高、推理速度慢、训练资源消耗大以及生成结果可控性不足等问题,成为了限制图像复原技术发展的瓶颈问题。

▲ 1927 年第五届索尔维会议合影修复

去年,董超团队提出了智能画质增强大模型 SUPIR,将低质量的图像恢复到接近原始状态的高清图像,修复多种退化类型的图像。而此次图像大模型 HYPIR 作为升级版,舍弃了迭代式的扩散模型训练,改用单步的对抗生成模型训练方式,将原有的算法速度提升了数倍,同时采用更新的文生图基模型进一步提升算法效果,实现了 8K 级别的细节生成,在生成图像的稳定性和可控性方面远超 SUPIR 大模型。

▲ HYPIR 大模型修复图像效果展示

“以往图像复原方法中往往包括扩散模型蒸馏、ControlNet 适配器或者多步推理过程。而 HYPIR 则不需要依赖这些步骤,使用方法更加简单。在训练和推理速度上较传统方法提升了一个数量级以上,且性能更优。”董超介绍,HYPIR 主要有两个创新点,一是使用预训练扩散模型初始化复原网络;二是从理论角度出发解释这一简单方法背后蕴含的深刻原理。

实验数据显示,在单张显卡(图像处理器)上,HYPIR 仅需 1.7 秒即可完成一张 1024x1024 分辨率图像的复原。相比现有的图像复原方法,研究人员提出的 HYPIR 在复原图像的质量上性能更优,且能够适用于各种尺寸的预训练扩散模型,为不同应用场景提供了灵活性。

▲ HYPIR 大模型处理图片纹理细节的效果展示

在应用层面,研究人员介绍,HYPIR 在图像高清分辨率、文字保真、理解能力、用户控制灵活性等方面均展现出了优异的性能。

例如,在老照片修复方面,研究人员运用 HYPIR 修复了国内外经典电影、电视剧老照片,让模糊的影像重现清晰的细节,为文化记忆传承提供了技术支持。在高分辨率图像修复领域,HYPIR 同样表现出色,因其兼具速度与效果,HYPIR 成功攻克了传统方法在生成 8K 分辨率图像时往往面临速度慢或效果不佳的难题。

▲ HYPIR 大模型在高分辨率图像超分复原方面的效果展示

在文字保真方面,传统基于扩散模型的方法常导致复原出的文字模糊或扭曲,缺乏精确性,而 HYPIR 则能够使复原出的文字保持高保真度和清晰度,无论是简单的标识还是复杂的文档,HYPIR 都能精准地还原其原始形态,使图像中的文字清晰可读。

值得一提的是,HYPIR 还具备了突出的自然语言理解能力,能够精准捕捉和理解用户的输入指令,在图像复原过程中准确地反映用户的意图。此外,用户可以根据需求灵活调节生成与复原的平衡,或精细控制图像细节程度,从而获得符合自身偏好的结果。

HYPIR 不仅展示了图像修复技术上的创新性,也体现了对实际应用需求的理解。通过打破传统思维定式,该技术在文化传承与保护、影视修复、高分辨率图像生成等领域提供了解决方案。

IT酷哥附 HYPIR 项目官网链接:

https://hypir.xpixel.group/

文章版权声明:除非注明,否则均为网络转载文章,转载或复制请以超链接形式并注明出处。

相关阅读

  • Take-Two CEO:人工智能只是工具,游戏天才不可取代
  • 家乐福推出采用 GPT-4 模型的 Hopla 购物资讯机器人 ,可一键规划预算、设计食谱
  • 腾讯自主研发机器狗 Max 升级,可模仿真狗“奔跑跳跃”完成避障动作
  • 赛博手冢治虫:GPT-4 将参与漫画《怪医黑杰克》续作创作过程
  • 日本音乐作家团体联合会发表声明,要求政府立即组织 AI 监管讨论并邀请创作者参与
  • 百度与中国石化签署战略合作框架协议,将在 AI 等领域深化合作
  • 特斯拉创建 Tesla AI 推特账户,称下月开始生产 Dojo 超级计算机
  • 中国联通发布鸿湖图文 AI 大模型 1.0,可实现以文生图、视频剪辑
  • 复旦大学与阿里巴巴达成全面战略合作,共享 AI 大模型底层能力
  • 微软推出 ZeRO++ 技术,可显著减少 AI 大模型训练时间和成本
  • 成功率 99%,科学家研发语音 deepfake 软件:只需 5 分钟录音即可欺骗语音认证系统
  • 腾讯与西湖大学共同申请 AI 聊天机器人专利,可使问答语句更准确连贯
  • 方舟启航,火山引擎这波在“大气层”
  • “世界上最像人的机器人”Ameca 接入 Stable Diffusion 和 GPT-3,现场完成作画
  • 研究表明 GPT-4 模型具备自我纠错能力,有望推动 AI 代码进一步商业化
  • 联合国将招募数十个机器人,协助完成 2030 可持续发展目标
  • 热度过去用户兴趣降低:数据显示 ChatGPT 流量在 6 月首次出现下降
  • OpenAI 组建新团队,以解决控制超智能 AI 的核心技术挑战
  • 小冰 CEO 李笛:马斯克呼吁停止研发 AI 大模型,可能是想给自己争取更多时间
  • 腾讯多媒体实验室发布自研 AI 作曲框架 XMusic,不通音律也能帮你“自动作曲”
  • 最新资讯

    热门资讯