字节跳动发布图像编辑模型 SeedEdit 3.0,处理更加丝滑高效

字节跳动发布图像编辑模型 SeedEdit 3.0,处理更加丝滑高效

人工智能 2025-06-09 15:08:05 6小时前

IT酷哥 6 月 6 日消息,字节跳动 Seed 团队今日宣布发布图像编辑模型 SeedEdit 3.0,目前已经在即梦网页端开启测试,豆包 App 也即将上线。

依靠 AI 完成指令式图像编辑的需求,广泛存在于视觉内容创意工作中。但此前,图像编辑模型在主体 & 背景保持、指令遵循等方面能力相对有限,导致编辑图像可用率不高。

据字节跳动官方介绍,SeedEdit 3.0 基于文生图模型 Seedream 3.0,叠加多样化的数据融合方法与特定奖励模型,较好地解决了上述难题。其图像主体、背景和细节保持能力进一步提升,尤其在人像编辑、背景更改、视角与光线转换等场景表现较为突出。

该模型可处理并生成 4K 图像,在精细且自然地处理编辑区域的同时,还能高保真地维持其他信息。尤其针对图像编辑“哪里改与哪里不改”的取舍,该模型表现出更佳的理解力和权衡力,可用率相应提高。当用户需要去掉图片内一众行人,模型不仅可以准确识别并移除场景内的无关人物,连影子也能一并去掉。

▲Prompt:移除中间人物以外的所有行人

在 2D 绘画转为真实模特的任务中,SeedEdit 3.0 较好地保持了人物的衣帽穿搭与手提包等细节,生成图片兼具时尚街拍感。

Prompt:使女孩看起来逼真

整个场景的光影变换,模型也可以处理得丝滑、自然。从近处房屋,到远处海水波纹,细节均能合理保留下来,并跟随光线变化,进行“像素级”的渲染调整。

Prompt:把场景变为白天

为了实现上述能力,团队在 SeedEdit 3.0 的研发工作中提出了一种高效的数据融合策略,并构建了多种专用奖励模型。

通过将这些奖励模型与扩散模型联合训练,团队针对性地改善了关键任务的编辑质量(如人脸对齐、文本渲染等)。实际落地中,我们也对推理加速进行了同步优化。

Prompt:将“STOP”更改为“WARM”

字节跳动表示,除进一步优化编辑性能外,未来团队还将探索更丰富的编辑操作,让模型拥有连续多图生成、多张图像合成、故事性内容生成等能力。

IT酷哥附链接如下:

项目主页:https://seed.bytedance.com/seededit

技术报告:https://arxiv.org/ pdf/2506.05083

文章版权声明:除非注明,否则均为网络转载文章,转载或复制请以超链接形式并注明出处。

相关阅读

  • 达人打造外形像喇叭的奇特相机:通过听声音构建周围环境图像
  • 商汤科技:元萝卜 AI 下棋机器人新品发布会 6 月 14 日举行
  • 360 智脑大模型应用发布会直播(视频)
  • 可按用户语气自动回复消息,在线会议软件 Zoom 推出基于生成式 AI 的新功能
  • 网易云音乐和小冰联合推出 AI 歌手音乐创作软件,首发内置 12 名 AI 歌手
  • 中科院自研新一代 AI 大模型“紫东太初 2.0”问世,支持视频、3D 等模态数据
  • 微软用 AI 缩短癌症放疗时间:扫描速度提高 2.5 倍,准确率达 90%
  • 金融巨头瑞穗银行押注生成式 AI,开放 Azure OpenAI 给 4.5 万名员工使用
  • 成功率 99%,科学家研发语音 deepfake 软件:只需 5 分钟录音即可欺骗语音认证系统
  • 混合 AI 时代将至,这是你从未有过的全新体验
  • 调查发现 20% 的男性使用 ChatGPT 等 AI 工具“美化”约会资料,提高交流技巧
  • 中国团队推出世界首颗 AI 全自动设计 CPU“启蒙 1 号”:无人工干预,性能堪比 486
  • 英国初创公司用 AI 提升垃圾回收效率,每年追踪量达 320 亿件
  • 腾讯与西湖大学共同申请 AI 聊天机器人专利,可使问答语句更准确连贯
  • 金山办公宣布与英伟达团队合作,加速 WPS AI 服务
  • 首款搭载 ChatGPT 的自行车问世,让你骑行不再孤单
  • 学而思网校推出《人工智能第一课》,号称首个基于自研大模型的 AIGC 课程
  • 亚马逊 Kindle 自助出版功能被滥用,AI 生成的书籍泛滥
  • 联合国将招募数十个机器人,协助完成 2030 可持续发展目标
  • 必应聊天将推出“#nosearch”功能:禁用网络搜索,直达精准答案
  • 最新资讯

    热门资讯