ComfyUI局部重绘:精准修改图像的神器

Qwen-Image 定制镜像 | RTX4090D CUDA12.4 大模型推理专用

Qwen-Image 定制镜像 | RTX4090D CUDA12.4 大模型推理专用

Qwen
图片生成
ComfyUI

基于官方 Qwen-Image 基础镜像定制优化,适配 RTX 4090D 24GB 显存 环境,预装 CUDA 12.4、对应驱动 550.90.07,配置 10 核 CPU / 120GB 内存运行环境,内置通义千问视觉语言模型依赖库、推理脚本与常用工具,开箱即用,支持大模型快速加载、图像理解、多模态推理等任务,无需重复配置环境。

1、功能介绍

ComfyUI的局部重绘功能允许用户对图像的特定区域(遮罩)进行修改以及修改成什么(提示词),然后通过特定的“编码器”或控制工具来实现精准修改。

2、基础组件

  • 加载图像:加载图片后,右键点击打开 遮罩编辑器 ,用画笔画出需要重绘的区域。

  • 模型加载器:加载大模型(Checkpoint)。可以使用普通的文生图模型,但使用专门针对修复优化的 “Inpainting 模型”,效果通常会更好。

  • CLIP文本编码器:需要两个。一个输入正向提示词(描述你想要重绘成什么),一个输入负向提示词(描述你不想要什么,可直接使用embedding:EasyNegative, NSFW)。

  • K采样器:这是生成图像的核心。其中的降噪值是关键参数,它控制着重绘幅度。

降噪值设置推荐
参数效果
降噪值越小(如0.2-0.4)结果越接近原图,适合微调。
降噪值越大(如0.7-1.0)AI的创作自由度越高,可能生成与原图差异很大的内容
  • VAE解码器:将处理后的潜空间数据解码,转换回我们能看到的像素图片。

  • 保存/预览图像:输出并查看最终的重绘结果。

3、核心组件

3.1、遮罩高斯模糊:对蒙版进行羽化处理,使修改区域和原始背景能够自然过渡。

遮罩高斯模糊核心参数

序号

核心参数

作用

效果

1

kernel_size

决定模糊的作用范围,也就是过渡带的宽度

值越小,过渡带越窄,边缘越“硬”,适合只想轻微软化边界时使用;值越大,过渡带越宽,融合效果越“朦胧”,适合大面积背景替换或创意合成。

2

sigma

决定模糊的强度羽化程度,即过渡的柔和度。

sigma值越大,过渡的灰色层次就越丰富,看起来越柔和;sigma值越小,过渡就越生硬。通常建议将 sigma 设置为 kernel_size / 3 左右,可以获得比较自然的效果。

核心参数设置建议

场景

kernel_size

sigma

效果

人脸细节微调

小 (3-7)

1.0 - 2.3

轻微羽化,仅模糊最边缘的像素,让修改融入周围皮肤

物体边缘融合

中 (9-15)

3.0 - 5.0

让新衣服的轮廓与背景或身体其他部分自然衔接

创意合成/背景替换

大 (15以上)

5.0以上

制造非常柔和、梦幻的边缘效果,让主体完全融入新背景

3.2、差异扩散:逐步改善图像质量,并生成细节丰富的功能。让AI从“机械地替换”进化为“智能地融合”的技术。它通过像素级的精细控制,实现了真正以假乱真的局部修改,尤其适合对人像、复杂背景等高要求场景进行精细化处理。

3.3、内补模型条件:专门给蒙版区域做细化处理。

4、工作流截图

您可能感兴趣的与本文相关的镜像

Qwen-Image 定制镜像 | RTX4090D CUDA12.4 大模型推理专用

Qwen-Image 定制镜像 | RTX4090D CUDA12.4 大模型推理专用

Qwen
图片生成
ComfyUI

基于官方 Qwen-Image 基础镜像定制优化,适配 RTX 4090D 24GB 显存 环境,预装 CUDA 12.4、对应驱动 550.90.07,配置 10 核 CPU / 120GB 内存运行环境,内置通义千问视觉语言模型依赖库、推理脚本与常用工具,开箱即用,支持大模型快速加载、图像理解、多模态推理等任务,无需重复配置环境。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值