41

Stable Diffusion+Wav2lip克隆数字人

预先安装FFmpeg 、TorchAudio 版本与 PyTorch 兼容

Planetfall Logo

Stable Diffusion+Wav2lip克隆数字人视频(预先安装FFmpeg 、TorchAudio 版本与 PyTorch 兼容)

FFmpeg : 预先安装好FFmpeg 下载地址:FFmpeg官网。根据你的操作系统,按照官网说明安装好,注意,FFmpeg要加入环境变量设置,便于在任意目录调用。 查找 FFmpeg 可执行文件的路径: 如果默认安装,可以使用以下命令找到

which ffmpeg
/usr/bin/ffmpeg

编辑 .bashrc 文件: 打开你的用户主目录下的 .bashrc 文件。你可以使用任何文本编辑器,比如 nano: 在文件末尾添加路径: 在 .bashrc 文件的末尾,添加以下行,将其中的 /path/to/ffmpeg 替换为你找到的 FFmpeg 可执行文件的实际路径:

export PATH=$PATH:/usr/bin/ffmpeg

保存并关闭文件。 使更改生效: 在终端中运行以下命令,使更改立即生效:

source ~/.bashrc

或者可以重新启动终端窗口。 现在,你应该能够在任何目录中通过简单地运行 ffmpeg 命令来调用 FFmpeg。

参考安装教程官方:

https://github.com/numz/sd-wav2lip-uhq/blob/main/README_CN.md#-%E5%AE%89%E8%A3%85%E8%AF%B4%E6%98%8E

报错信息处理

来到“已安装”标签,点击“应用并重启用户界面”出现报错信息。 Planetfall Logo 看起来你遇到了一个关于 PyTorch 和 TorchAudio CUDA 版本不匹配的问题。错误信息显示 PyTorch 使用 CUDA 版本 11.8,而 TorchAudio 使用 CUDA 版本 11.7。为了解决这个问题,你可以尝试以下几个步骤: 更新 TorchAudio: 确保你的 TorchAudio 版本与你的 PyTorch 版本兼容。在你的 diffuenv 虚拟环境中运行以下命令:

这里经过验证使用最新版本

CUDA 11.8版本下安装信息
pip install torch==2.1.0 torchvision==0.16.0 torchaudio==2.1.0 --index-url https://download.pytorch.org/whl/cu118