1. 环境搭建前的准备工作:知己知彼,百战不殆
每次看到有朋友在群里问“为什么我的PyTorch用不了GPU?”,或者“CUDA安装报错怎么办?”,我都能回想起自己刚入门时踩过的那些坑。说实话,在Windows10上配置CUDA和PyTorch,就像搭积木,顺序和型号选对了,一气呵成;选错了,那就是各种“大厦将倾”。今天,我就把自己这些年折腾了无数台电脑(从笔记本到台式工作站)的经验,掰开揉碎了分享给你。我们的目标很简单:让你从零开始,一次成功地把PyTorch全家桶(torch, torchvision, torchaudio)配上GPU加速给跑起来。
首先,你得明白我们到底在配置什么。你可以把整个环境想象成一个三层蛋糕。最底层是你的NVIDIA显卡,它是干活的“肌肉”;中间层是CUDA,这是NVIDIA官方提供的“工具箱”和“操作手册”,告诉显卡的肌肉(计算核心)如何去进行复杂的数学运算;最上层才是PyTorch这个深度学习框架,它调用CUDA工具箱里的工具,来指挥显卡干活。而cuDNN呢,可以理解为CUDA工具箱里一套专门为深度学习优化过的“特种工具”,能让计算效率大幅提升。所以,正确的安装顺序必须是:先确保显卡支持,再装对应版本的CUDA,接着配置cuDNN,最后安装匹配的PyTorch。顺序乱了,或者版本对不上,蛋糕就塌了。
在动手之前,我强烈建议你先花5分钟,搞清楚自己电脑的“家底”。这能帮你避开至少80%的坑。你需要确认三件事:你的Windows10系统版本、你的NVIDIA显卡具体型号、以及你已有的Python环境。系统版本太老(比如早期的1909)可能会遇到一些奇怪的兼容性问题,建议更新到较新的版本(如21H2或22H2)。Python环境,我默认你用的是Anaconda,因为它能很好地管理不同项目的依赖,避免环境冲突。如果你还没装,去Anaconda官网下载安装,这个过程比较常规,这里就不赘述了。
2. 显卡适配与CUDA版本选择:找到你的“灵魂伴侣”
这是整个流程中最关键、也最容易出错的一步。很多新手一上来就直奔官网下载最新的CUDA,结果发现和PyTorch不兼容,或者自己的显卡根本带不动。所以,请务必耐心完成这一步。
2.1 查询显卡算力与驱动版本
首先,我们得知道自己的显卡“能力”如何。按下 Win + R,输入 cmd 打开命令提示符,然后输入一个神奇的指令:
nvidia-smi
回车后,你会看到一个表格。这里信息量很大,重点关注两行:
- Driver Version:这是你的NVIDIA显卡驱动版本。CUDA版本对驱动有最低要求,驱动太旧是装不上新CUDA的。
- CUDA Version:注意! 这里显示的不是你已安装的CUDA,而是此驱动版本最高能支持的CUDA版本。比如,它显示“12.4”,意味着你的驱动支持到CUDA 12.4,你可以安装≤12.4的版本,但不能装12.5。
接下来,你需要知道显卡的具体型号,比如RTX 3060、RTX 4070 Ti、或者笔记本上的RTX 4060 Laptop GPU。知道型号后,可以去NVIDIA官网的CUDA GPU支持列表页面查询它的计算能力。计算能力是一个数字,比如8.6、8.9,它代表了显卡硬件的代际和功能级别。不过对于选择CUDA版本来说,更直接的方法是参考PyTorch官方的兼容性。
2.2 确定“黄金组合”:CUDA、PyTorch与显卡的三角关系
我个人的经验是,不要盲目追求最新版。稳定性是第一位的。目前(以我写这篇文章的时间点),一个经过无数项目验证的、非常稳定的组合是:CUDA 11.8



被折叠的 条评论
为什么被折叠?



