颇走了些弯路哦。
主要是安装显卡坑太多
第一个大坑就是不建议用ubuntu16,因为几台电脑都没安装成功,也许可以靠升级内核来搞定,可是路径太长了。
然后, 有几个节点要注意
1 查看已安装的驱动,如果无法判断结果,就没办法找问题和改善了
hy@hy-Mi-Gaming-Laptop-15-6:~/kxwell$ ls /usr/src | grep nvidia
nvidia-455.38
回显的就是已安装版本
没安装过就没有显示,如果版本太老,建议先卸载
sudo apt-get remove --purge nvidia*
查看显卡信息
lspci |grep VGA能查看设备信息
lspci -vnn | grep VGA -A 12 能查看驱动使用的情况
(base) hy@hy-Default-string:~$ lspci -vnn | grep VGA -A 12
01:00.0 VGA compatible controller [0300]: NVIDIA Corporation Device [10de:2184] (rev a1) (prog-if 00 [VGA controller])
Subsystem: Device [1b4c:1366]
Flags: bus master, fast devsel, latency 0, IRQ 134
Memory at de000000 (32-bit, non-prefetchable) [size=16M]
Memory at c0000000 (64-bit, prefetchable) [size=256M]
Memory at d0000000 (64-bit, prefetchable) [size=32M]
I/O ports at e000 [size=128]
Expansion ROM at 000c0000 [disabled] [size=128K]
Capabilities: <access denied>
Kernel driver in use: nouveau
Kernel modules: nvidiafb, nouveau, nvidia_drm, nvidia
01:00.1 Audio device [0403]: NVIDIA Corporation Device [10de:1aeb] (rev a1)
这个上面的信息能看出来使用的还是nouveau驱动,而不是nvidia的驱动,所以nvidia-smi没有信息,说明显卡还未正确安装。
更新系统设置
sudo update-initramfs -u
2. UBUNTU18.04 自动安装显卡驱动
查看设备
ubuntu-drivers devices
如果安装推荐版本,只需要终端输入:
sudo ubuntu-drivers autoinstall
完成自动安装,然后重启。
实测1050安装没问题,但实测RTX3060只能安装460版本的,开机黑屏,卸载后重装465,成功。
sudo apt-get install nvidia-driver-465
验证手段: nvidia-smi能够显示显卡信息,以及支持的cuda最高版本
3. 安装cuda库
nvidia-smi可以看到显卡信息,以及支持的cuda版本。
(base) hy@hy-Default-string:~$ nvidia-smi
Mon Jul 12 10:27:19 2021
+-----------------------------------------------------------------------------+
| NVIDIA-SMI 465.27 Driver Version: 465.27 CUDA Version: 11.3 |
|-------------------------------+----------------------+----------------------+
| GPU Name Persistence-M| Bus-Id Disp.A | Volatile Uncorr. ECC |
| Fan Temp Perf Pwr:Usage/Cap| Memory-Usage | GPU-Util Compute M. |
| | |

本文详细记录了在Ubuntu18.04系统中安装RTX3060显卡驱动及CUDA的过程,包括解决安装过程中遇到的问题如黑屏等,并指导如何安装cuDNN及验证GPU在PyTorch和TensorFlow中的可用性。

1万+

被折叠的 条评论
为什么被折叠?



