如何租用AutoDL显卡跑项目
文章目录
使用步骤
-
1、租用新实例 参考AutoDL-GPU租用平台使用教程,AutoDL快速开始
-
2、安装个人版XShell 7 + xftp7,注意要先下XShell,再下载xftp,否则xftp下载时会报-1603致命错误。参考XShell安装
-
3、使用XShell连接服务器,使用xftp上传代码到
/root/auto-tmp下,因为根目录是系统盘(20G),auto-tmp为挂载盘(100G) -
4、创建并激活虚拟环境:(不建议直接在root下装环境)
conda create -n fire_environment python=3.7 # 构建一个虚拟环境,名为:fire_environment conda init bash && source /root/.bashrc # 更新bashrc中的环境变量 conda activate fire_environment # 切换到创建的虚拟环境:fire_environment conda info -e #查看已有的环境 -
5、在JupyterLab的notebook中使用Conda虚拟环境
# 将新的Conda虚拟环境加入jupyterlab中 conda activate fire_environment # 切换到创建的虚拟环境:fire_environment conda install ipykernel ipython kernel install --user --name=fire_environment # 设置kernel,--user表示当前用户,fire_environment为虚拟环境名称 -
6、省钱小秘招
-
在配置项目环境时(带宽不够,下载很耗时),可以用无卡模式开机,费用为0.1元/小时(还好一开始有代金券,否则懊悔死了)
-
不用跑项目的时候记得关机,不然会按时计费。

-
睡觉之前最好不要拿来跑小项目,有卡模式下的开机会正常扣费,建议不要一次性充太多钱(就好比水卡忘记拔了,不停地扣费)。
-
-
7、TensorBoard使用:将项目中log文件夹下的event文件保存到/root/tf-logs
或者切换默认log文件路径,参考AutoDL使用Tensorboard
踩坑
1、GPU 3090不适配cu101版本的torch
-
注意GPU 3090并不适配cu101版本的torch,会报错:
/root/miniconda3/envs/fire_environment/lib/python3.7/site-packages/torch/cuda/__init__.py:143: UserWarning: NVIDIA GeForce RTX 3090 with CUDA capability sm_86 is not compatible with the current PyTorch installation. The current PyTorch install supports CUDA capabilities sm_37 sm_50 sm_60 sm_61 sm_70 sm_75 compute_37. If you want to use the NVIDIA GeForce RTX 3090 GPU with PyTorch, please check the instructions at https://pytorch.org/get-started/locally/ warnings.warn(incompatible_device_warn.format(device_name, capability, " ".join(arch_list), device_name)) -
解决方法:安装cuda11.0版本的pytorch:
#卸载cuda(我之前用conda安装的pytorch) conda uninstall pytorch conda uninstall libtorch pip install torch==1.7.0+cu110 torchvision==0.8.1+cu110 torchaudio===0.7.0 -f https://download.pytorch.org/whl/torch_stable.html参考pytorch与gpu版本的适配问题,cuda ubuntu安装_3090显卡 + pytorch1.7 +cuda11.0+anconda安装
2、opencv-python安装低版本才可以支持blend_truth_mosaic函数
1、无论是在GPU 3090的虚拟机上,还是在GPU 2080TI的虚拟机上,使用CPU运行yolov4项目都会报错;但是在Colab的虚拟环境上,使用CPU就没问题。

----------------------------------------------------------

本文详细介绍了如何在AutoDL平台上租用GPU进行项目开发,包括租用流程、环境配置、踩过的坑,如GPU型号与库版本匹配、opencv-python版本选择、权重文件保存问题及k8s部署限制。
&spm=1001.2101.3001.5002&articleId=123308865&d=1&t=3&u=1bccb34c2df44c0b9bbc58f21509aaf0)
4143

被折叠的 条评论
为什么被折叠?



