千问又震撼开源！AI 绘画告别“一整张图”，进入原生图层时代

最新推荐文章于 2026-06-30 10:04:46 发布

原创最新推荐文章于 2026-06-30 10:04:46 发布 · 352 阅读

·

6

·

本内容遵循CC 4.0 BY-SA版权协议

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

收录于

开源AI模型

开源项目

Qwen-Image 定制镜像 | RTX4090D CUDA12.4 大模型推理专用

基于官方 Qwen-Image 基础镜像定制优化，适配 RTX 4090D 24GB 显存环境，预装 CUDA 12.4、对应驱动 550.90.07，配置 10 核 CPU / 120GB 内存运行环境，内置通义千问视觉语言模型依赖库、推理脚本与常用工具，开箱即用，支持大模型快速加载、图像理解、多模态推理等任务，无需重复配置环境。

如果说 Stable Diffusion 的出现是让 AI 学会了“临摹”，那么阿里 Qwen 团队刚刚发布的这个开源项目，则是真正教会了 AI “做设计”。

Qwen-Image-Layered，这是一款能够将图像分解为多个 RGBA 图层的模型。这种分层表示赋予了图像内在的可编辑性：每个图层都可以独立操作，而不会影响其他内容。同时，这种分层结构天然支持高保真的基本编辑操作，例如缩放、移动和重新着色。通过将不同元素物理地隔离到不同的图层中，我们的方法实现了高保真的编辑效果。

wxv_4305592260034658312

01.

分层分解的应用

给定一张图像，Qwen-Image-Layered 可将其分解为若干个 RGBA 图层：

分解完成后，编辑操作仅作用于目标图层，将其与其他内容物理隔离，从根本上确保了编辑的一致性。

例如，我们可以对第一个图层重新着色，而保持其余内容不变：

我们也可以将第二个图层中的女孩替换为男孩：

在下面的例子中，我们将文字内容修改为 “Qwen-Image”：

此外，分层结构天然支持各种基本操作。例如，我们可以干净地删除不需要的物体：

我们也可以轻松的对物体进行缩放而不引入形变和失真：

在完成图层分解后，我们还能在画布内自由移动物体：

02.

灵活且可迭代的分解

Qwen-Image-Layered 并不限于固定的图层数量，模型支持可变数量的图层分解。例如，我们可以根据需要将同一张图像分解为 3 层或 8 层：

此外，分解过程还可以递归进行：任意一个图层本身都可以被进一步分解，从而实现无限层级的细化分解。

03.

开源网站技术报告

https://arxiv.org/abs/2512.15603

Github: https://github.com/QwenLM/Qwen-Image-Layered

您可能感兴趣的与本文相关的镜像

Qwen-Image 定制镜像 | RTX4090D CUDA12.4 大模型推理专用

Qwen-Image 定制镜像 | RTX4090D CUDA12.4 大模型推理专用

Qwen

图片生成

ComfyUI

基于官方 Qwen-Image 基础镜像定制优化，适配 RTX 4090D 24GB 显存环境，预装 CUDA 12.4、对应驱动 550.90.07，配置 10 核 CPU / 120GB 内存运行环境，内置通义千问视觉语言模型依赖库、推理脚本与常用工具，开箱即用，支持大模型快速加载、图像理解、多模态推理等任务，无需重复配置环境。

标签

#经验分享

官方同款运行环境

Qwen-Image 定制镜像 | RTX4090D CUDA12.4 大模型推理专用

基于官方 Qwen-Image 基础镜像定制优化，适配 RTX 4090D 24GB 显存环境，预装 CUDA 12.4、对应驱动 550.90.07，配置 10 核 CPU / 120GB 内存运行环境，内置通义千问视觉语言模型依赖库、推理脚本与常用工具，开箱即用，支持大模型快速加载、图像理解、多模态推理等任务，无需重复配置环境。

Qwen

图片生成

ComfyUI

Qwen-Image

显存大小

24GB

CPU

10核心

内存

120GB

系统盘/数据盘

40GB

无需本地环境部署，可直接运行

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。