千问又震撼开源!AI 绘画告别“一整张图”,进入原生图层时代

Qwen-Image 定制镜像 | RTX4090D CUDA12.4 大模型推理专用

基于官方 Qwen-Image 基础镜像定制优化,适配 RTX 4090D 24GB 显存 环境,预装 CUDA 12.4、对应驱动 550.90.07,配置 10 核 CPU / 120GB 内存运行环境,内置通义千问视觉语言模型依赖库、推理脚本与常用工具,开箱即用,支持大模型快速加载、图像理解、多模态推理等任务,无需重复配置环境。

图片

如果说 Stable Diffusion 的出现是让 AI 学会了“临摹”,那么阿里 Qwen 团队刚刚发布的这个开源项目,则是真正教会了 AI “做设计”。

Qwen-Image-Layered,这是一款能够将图像分解为多个 RGBA 图层的模型。这种分层表示赋予了图像内在的可编辑性:每个图层都可以独立操作,而不会影响其他内容。同时,这种分层结构天然支持高保真的基本编辑操作,例如缩放、移动和重新着色。通过将不同元素物理地隔离到不同的图层中,我们的方法实现了高保真的编辑效果。

wxv_4305592260034658312

01.

分层分解的应用

给定一张图像,Qwen-Image-Layered 可将其分解为若干个 RGBA 图层:

图片

分解完成后,编辑操作仅作用于目标图层,将其与其他内容物理隔离,从根本上确保了编辑的一致性。

例如,我们可以对第一个图层重新着色,而保持其余内容不变:

图片

我们也可以将第二个图层中的女孩替换为男孩:

图片

在下面的例子中,我们将文字内容修改为 “Qwen-Image”:

图片

此外,分层结构天然支持各种基本操作。例如,我们可以干净地删除不需要的物体:

图片

我们也可以轻松的对物体进行缩放而不引入形变和失真:

图片

在完成图层分解后,我们还能在画布内自由移动物体:

图片

02.

灵活且可迭代的分解

Qwen-Image-Layered 并不限于固定的图层数量,模型支持可变数量的图层分解。例如,我们可以根据需要将同一张图像分解为 3 层或 8 层:

图片

此外,分解过程还可以递归进行:任意一个图层本身都可以被进一步分解,从而实现无限层级的细化分解。

图片

03. 

开源网站技术报告

https://arxiv.org/abs/2512.15603

Github: https://github.com/QwenLM/Qwen-Image-Layered 

您可能感兴趣的与本文相关的镜像

Qwen-Image 定制镜像 | RTX4090D CUDA12.4 大模型推理专用

Qwen-Image 定制镜像 | RTX4090D CUDA12.4 大模型推理专用

Qwen
图片生成
ComfyUI

基于官方 Qwen-Image 基础镜像定制优化,适配 RTX 4090D 24GB 显存 环境,预装 CUDA 12.4、对应驱动 550.90.07,配置 10 核 CPU / 120GB 内存运行环境,内置通义千问视觉语言模型依赖库、推理脚本与常用工具,开箱即用,支持大模型快速加载、图像理解、多模态推理等任务,无需重复配置环境。

内容概要:本文系统介绍了物理信息神经网络(PINNs)在求解布洛赫-托雷(Bloch-Torrey)方程中的应用,结合PyTorch框架提供了完整的Python代码实现案例。文章深入阐述了如何将物理先验知识嵌入神经网络训练过程,通过构建复合损失函数,强制网络输出满足控制方程、初始条件与边界条件,从而实现对布洛赫-托雷方程的无网格化、高精度求解。该方法突破了传统数值方法在高维、多尺度及复杂几何场景下的计算瓶颈,展现出优异的泛化能力与计算效率,特别适用于医学成像、扩散磁共振等领域中复杂的物理场建模与仿真任务。; 适合人群:具备深度学习与偏微分方程理论基础,从事科学计算、生物医学工程、材料科学或相关交叉学科研究的研究生、科研人员及算法工程师。; 使用场景及目标:①应用于扩散磁共振成像(dMRI)等医学影像技术中的复杂扩散过程建模与反演;②为高维偏微分方程的高效求解提供数据驱动的新范式,提升仿真精度与计算速度;③作为PINNs在AI for Science领域中的典型实践案例,推动物理引导的深度学习方法在实际科研项目中的落地与拓展。; 阅读建议:建议读者结合提供的完整代码资源(可通过公众号“荔枝科研社”或百度网盘获取),动手复现并调试模型,深入理解PINNs的架构设计、损失函数构建与物理约束嵌入机制,同时可尝试将该方法迁移至其他类似物理系统的建模与求解任务中进行创新性研究。
内容概要:本文围绕“基于多VSG独立微网的多目标二次控制MATLAB模型研究”展开,详细阐述了利用Simulink对多虚拟同步发电机(VSG)构成的独立微网系统进行建模与仿真,实现频率调节、电压支撑与有功无功功率均分等多目标协同优化的二次控制策略。研究引入先进的最优控制算法,解决微网在孤岛运行模式下的功率动态分配、频率电压恢复及系统稳定性题,并通过MATLAB/Simulink平台构建完整仿真模型,验证所提控制策略在不同负载扰动下的有效性、鲁棒性与动态响应性能。; 适合人群:具备电力系统分析、现代控制理论基础以及MATLAB/Simulink仿真能力的电气工程、自动化等相关专业的硕士研究生、科研人员及从事微网控制系统开发的工程技术人才。; 使用场景及目标:① 深入理解多VSG在独立微网中的并联运行机理与协同控制架构;② 掌握基于Simulink的微网二次控制系统的建模方法与仿真流程;③ 实现频率、电压与功率分配的多目标优化控制仿真验证;④ 为微网控制系统的设计、算法优化及科研课题提供可靠的仿真依据和技术参考。; 阅读建议:建议读者结合文中控制策略,动手搭建Simulink模型,重点关注控制器参数整定对系统动态性能的影响,可通过对比不同工况下的仿真结果,进一步优化控制算法以提升系统鲁棒性与响应精度。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值