智象未来团队研发成果获 ICML 2025 收录!图像生成更有“全局视野”

智象未来团队研发成果获 ICML 2025 收录!图像生成更有“全局视野”

IT资讯 2025-05-23 16:05:09 6小时前

智象未来团队提出全新层级自回归生成范式Hierarchical Masked Autoregressive models (Hi-MAR),有效解决自回归图像生成中结构失真问题。该研究已被 ICML 2025 收录,并在多个图像生成任务中取得领先性能。

现有自回归图像生成模型存在缺乏全局结构建模能力、训练-推理分布不一致、尺度引导缺失等问题。Hi - MAR 借鉴人类绘画过程,采用自顶向下层次化生成范式,还引入多尺度联合训练策略等。实验显示,其在图像质量和语义一致性上优于主流方法,可以显著提升模型的全局感知能力与生成质量。

本次发表的论文《Hierarchical Masked Autoregressive Models with Low-Resolution Token Pivots》,展示了团队在多模态生成式基础架构设计领域的前沿探索。这一全新的层级自回归生成架构 Hi-MAR,为构建具备“全局感知 + 局部细化”能力的生成基础架构提供了新的范式,同时它也是 HiDream 系列开源模型家族重要的一员,为下一代多模态生成式基础架构的技术演进带来更多的可能性!

文章版权声明:除非注明,否则均为网络转载文章,转载或复制请以超链接形式并注明出处。

相关阅读

  • 立讯精密不断挖掘价值深度,在消费电子领域布局各类产品线
  • 谷歌开源 Rust Crate 审查结果:便于 Rust 开发者验证源码安全
  • 美股周三:三大股指集体收跌,热门中概股多数下跌,蔚来跌超 9%
  • 【IT之家评测室】科大讯飞 iFLYBUDS Nano + 录音降噪会议耳机体验:耳朵上的办公助手
  • 一价全包家电、家居、家装产品就选京东 自营装修每户直补 2 万元
  • 索尼 PS Plus 六月会免游戏公布,《NBA 2K23》等三款
  • 不在同一局域网也想轻松使用 RDP?向日葵远程控制帮你实现
  • 守护孩子成长瞬间 三星 BESPOKE 缤色铂格系列产品全力护航健康生活
  • 提现需数周,苹果版“余额宝”业务遭用户吐槽
  • 2023 中国科幻大会未来智慧城市畅想论坛在首钢园成功举办
  • 《变形金刚:超能勇士崛起》最新预告发布:现已预售,6 月 9 日上映
  • 狂霸 14 个榜单,联想 618 赢麻了?
  • 中国联通:云南联通收回云南全省委托承包运营权
  • 顶象发布《车企 App 安全研究白皮书》,剖析车企 App 两大风险
  • 苹果 iOS 17 可自动屏蔽不请自来的裸照,并发出“敏感内容警告”
  • 《闪光的她》第二季全新升级,快手磁力引擎、伊利牧场再次携手诠释女性力量
  • 业内首推“找供应商”能力,爱企查助力企业高效寻源、一站式采购
  • 联发科天玑开发者中心上线,提供 AI 和移动游戏开发一站式解决方案
  • 台积电在美“水土不服”:员工吐槽加班严重,公司支持率未达及格线
  • 网易味央养猪业务遇困境,相关公司被冻结 1.2 亿元股权
  • 最新资讯

    热门资讯