【SD教程】图片也能开口说话？别惊讶！用SadTalker插件，一键生成自己的数字人，本地部署，免费使用！（附资料）

原创已于 2024-12-30 18:57:06 修改 · 1.2k 阅读

·

5

·

本内容遵循CC 4.0 BY-SA版权协议

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

标签

#人工智能 #AI作画 #stable diffusion #AIGC #AI

于 2024-09-24 15:08:33 首次发布

最近数字人越来越火，连互联网大佬都纷纷下场，比如360的周鸿祎，京东的刘强东等等。小伙伴可能也想拥有自己的数字人如果想用最简单的方式，那么可以用第三方的网站，例如 HeyGen平台、腾讯的智影等等。可这些网站都是收费的，而且价格也不便宜。如果我们只是想尝尝鲜，又想白嫖，那么有什么方法呢？

今天，我给大家安利一个SD插件，叫做SadTalker，这个插件可以实现让图片开口说话。操作简单之余，关键还是免费的。

使用

所需插件和模型

一、SadTalker插件

打开Stable Diffusion后，我们选择扩展选项。然后切换到可下载标签，点击加载扩展列表后，输入SadTalker ，就能看到插件，此时我们点击安装即可。

这份完整版的AI绘画（SD、comfyui、AI视频）整合包已经上传CSDN，朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费】

在这里插入图片描述

二、所需模型

插件安装后，暂时还不能正常使用，还需手动下载几个模型，存放在指定的位置后才能使用，贴心的我早已为大家准备好了，文末会有说明，现在先接着往下看：

上述两个步骤完成后，需要重启SD，确保模型生效。

步骤说明

首先，我们打开SadTalker标签页，然后上传一张图片和一段音频：

接着来到参数部分，脸部模型分辨率选择 256 （显卡内存大的可以选择512），预处理选择完整，勾选 使用GFPGAN 增强面部。最后点击生成即可。

以下是SadTalker中提到的几种预处理选项的区别：

1. 裁剪（Crop）：

裁剪预处理选项通常用于对输入图像进行调整，以确保面部区域是图像的主要焦点。这可能涉及到去除图像的多余部分，或者调整面部的位置和大小，使其符合模型的输入要求。

2. 缩放（Resize）：

缩放是指改变图像的尺寸大小。这可以是将图像放大或缩小到特定的分辨率，以便与模型的输入尺寸相匹配。缩放可能会影响图像的细节和质量，因此需要谨慎处理以避免过度失真。

3. 完整（Full）：

完整预处理选项可能意味着使用整个输入图像作为模型的输入，不做任何裁剪或缩放。这适用于模型能够处理原始图像尺寸的情况，或者当用户希望保留图像的所有内容时。

4. 裁剪后扩展（Crop and Expand）：

这个选项可能包含两个步骤：首先裁剪图像以聚焦于面部区域，然后将裁剪后的图像扩展到所需的尺寸。这种预处理方式旨在保留面部的细节，同时确保图像符合模型的输入要求。

5. 填充至完整（Pad to Full）：

填充至完整选项通常用于在保持图像原始尺寸的同时，通过添加背景或其他内容来填充图像的空白区域。这可以用于确保图像的尺寸符合模型的要求，同时避免图像内容的失真。

生成效果如下：

（视频由AI生成，请谨慎甄别）

总结

总体来说，有了这款sadTalker插件，只需通过一张图片，一段音频，就能轻松生成一个会说话的视频。
这份完整版的AI绘画（SD、comfyui、AI视频）整合包已经上传CSDN，朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费】

在这里插入图片描述

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。