(终于这是最后一个模型了…..)
本次 Qwen-Image-Edit-2509 最大的三个亮点:
多图像联合编辑 – 支持1-3张图像同时处理,可以玩”人+人”、”人+物”、”人+场景”的各种组合
一致性大幅提升 – 这个是真正的提升,人脸保持、产品特征、文本渲染的一致性都有显著改善
原生 ControlNet 集成 – 不用再单独加载 ControlNet 插件了,深度图、边缘图、关键点控制直接内置。这对工程化部署来说省了不少事
(简单来讲:nano-banana 有的我全都要)
技术猜测:
从推荐参数 true_cfg_scale: 4.0, guidance_scale: 1.0 来看,这次应该是采用了新的引导策略,可能是为了平衡生成质量和编辑一致性
40步推理虽然不算快,但考虑到多图像编辑的复杂度,这个步数还算合理。支持 bfloat16。
对比之前版本,这次更新最实用的我觉得是多图像编辑功能(参考我做的那个 nano-banana 把新海诚电影中13个元素合成一张图的教程)
特别是电商场景,产品+模特+场景的组合编辑,这个需求量还是很大的
模型地址:http://huggingface.co/Qwen/Qwen-Image-Edit-2509