从零到一:在Ubuntu 22.04上构建高效、可复现的深度学习工作站
最近几年,深度学习的门槛看似在降低,各种云端服务和一键脚本层出不穷。但真正想在一个稳定、可控、能长期迭代项目的本地环境里工作,自己动手搭建一套开发环境依然是绕不开的必修课。尤其是当你需要调试底层代码、处理特定版本的依赖,或者单纯想拥有一个不受网络和算力租赁费用困扰的“大本营”时,一个配置得当的本地工作站价值巨大。
这篇文章,就是为你准备的实战手册。我们不谈空洞的理论,也不做简单的命令罗列,而是聚焦于在Ubuntu 22.04 LTS这个长期支持版上,构建一个以Anaconda为核心环境管理器、CUDA为计算加速基石、PyCharm为高效开发利器的深度学习工作站。整个过程我会融入大量实际配置中的“坑点”和优化技巧,目标是让你搭建的环境不仅是“能用”,更是“好用”、“耐用”和“易于迁移”的。无论你是刚接触Linux的研究生,还是需要为新项目快速部署环境的工程师,相信都能从中找到清晰的路径。
1. 系统准备与驱动安装:打好地基
在开始安装任何深度学习框架之前,一个干净、稳定的系统基础是成功的一半。Ubuntu 22.04 LTS本身已经提供了优秀的开箱即用体验,但我们仍需进行一些针对性优化。
1.1 系统更新与基础工具链
安装完系统后,第一件事永远是更新软件包列表并升级现有软件。这能确保你从最新的软件源获取组件,减少潜在的依赖冲突。
sudo apt update && sudo apt upgrade -y
接下来,安装一些后续步骤中不可或缺的开发工具和库。build-essential 包含了GCC编译器、make等核心编译工具;software-properties-common 便于添加PPA软件源;而curl、wget、git、vim则是日常开发的瑞士军刀。
sudo apt install -y build-essential software-properties-common curl wget git vim
提示:如果你在虚拟机或某些云服务器上操作,可能需要先安装
open-vm-tools或相应的虚拟化增强工具,以确保剪贴板共享、文件拖放等功能正常。
1.2 NVIDIA显卡驱动的“无痛”安装
对于深度学习而言,NVIDIA显卡及其驱动是性能的灵魂。Ubuntu 22.04自带的“附加驱动”工具已经非常成熟,它能够自动检测硬件并推荐最合适的专有驱动,这通常比手动从NVIDIA官网下载.run文件安装要稳定和方便得多。
- 打开“软件和更新”应用。
- 切换到“附加驱动”标签页。
- 系统会自动扫描并列出可用的NVIDIA驱动版本。通常会提供一个标记为“专有、已测试”的推荐版本(例如
nvidia-driver-535)。 - 选择这个推荐版本,点击“应用更改”。系统会自动下载并安装驱动,期间可能需要重启。
安装完成后,打开终端,通过以下命令验证驱动是否安装成功:
nvidia-smi
你应该能看到一个类似下表的输出,其中包含了显卡型号、驱动版本、CUDA版本(这里是驱动内建的最高支持CUDA版本,并非已安装的CUDA工具包)以及GPU的实时状态。
+-----------------------------------------------------------------------------+
| NVIDIA-SMI 535.161.07 Driver Version: 535.161.07 CUDA Version: 12.2 |
|-------------------------------+----------------------+----------------------+
| GPU Name Persistence-M| Bus-Id Disp.A | Volatile Uncorr. ECC |
| Fan Temp Perf Pwr:Usage/Cap| Memory-Usage | GPU-Util Compute M. |
| | | MIG M. |
|===============================+======================+======================|
| 0 NVIDIA GeForce ... Off | 00000000:01:00.0 On | N/A |
| 0% 45C P8 10W / 250W | 512MiB / 12288MiB | 0% Default |
| | |


379

被折叠的 条评论
为什么被折叠?



