如何租用AutoDL显卡进行模型训练(不支持K8s部署)

本文详细介绍了如何在AutoDL平台上租用GPU进行项目开发,包括租用流程、环境配置、踩过的坑,如GPU型号与库版本匹配、opencv-python版本选择、权重文件保存问题及k8s部署限制。

如何租用AutoDL显卡跑项目

使用步骤

  • 1、租用新实例 参考AutoDL-GPU租用平台使用教程AutoDL快速开始

  • 2、安装个人版XShell 7 + xftp7,注意要先下XShell,再下载xftp,否则xftp下载时会报-1603致命错误。参考XShell安装

  • 3、使用XShell连接服务器,使用xftp上传代码/root/auto-tmp下,因为根目录是系统盘(20G),auto-tmp为挂载盘(100G)

  • 4、创建并激活虚拟环境:(不建议直接在root下装环境

    conda create -n fire_environment python=3.7  # 构建一个虚拟环境,名为:fire_environment
    conda init bash && source /root/.bashrc  # 更新bashrc中的环境变量
    conda activate fire_environment   # 切换到创建的虚拟环境:fire_environment
    conda info -e   #查看已有的环境
    

    参考 anaconda中创建虚拟环境Notebook环境切换

  • 5、在JupyterLab的notebook中使用Conda虚拟环境

    # 将新的Conda虚拟环境加入jupyterlab中
    conda activate fire_environment                         # 切换到创建的虚拟环境:fire_environment
    conda install ipykernel
    ipython kernel install --user --name=fire_environment   # 设置kernel,--user表示当前用户,fire_environment为虚拟环境名称
    

    参考Notebook环境切换

  • 6、省钱小秘招

    • 配置项目环境时(带宽不够,下载很耗时),可以用无卡模式开机,费用为0.1元/小时(还好一开始有代金券,否则懊悔死了)

    • 不用跑项目的时候记得关机,不然会按时计费。

      在这里插入图片描述

    • 睡觉之前最好不要拿来跑小项目,有卡模式下的开机会正常扣费,建议不要一次性充太多钱(就好比水卡忘记拔了,不停地扣费)。

  • 7、TensorBoard使用:将项目中log文件夹下的event文件保存到/root/tf-logs

    或者切换默认log文件路径,参考AutoDL使用Tensorboard

踩坑

1、GPU 3090不适配cu101版本的torch
  • 注意GPU 3090并不适配cu101版本的torch,会报错:

    /root/miniconda3/envs/fire_environment/lib/python3.7/site-packages/torch/cuda/__init__.py:143: UserWarning: 
    NVIDIA GeForce RTX 3090 with CUDA capability sm_86 is not compatible with the current PyTorch installation.
    The current PyTorch install supports CUDA capabilities sm_37 sm_50 sm_60 sm_61 sm_70 sm_75 compute_37.
    If you want to use the NVIDIA GeForce RTX 3090 GPU with PyTorch, please check the instructions at https://pytorch.org/get-started/locally/
    
      warnings.warn(incompatible_device_warn.format(device_name, capability, " ".join(arch_list), device_name))
    
  • 解决方法:安装cuda11.0版本的pytorch:

    #卸载cuda(我之前用conda安装的pytorch)
    conda uninstall pytorch
    conda uninstall libtorch
    
    
    pip install torch==1.7.0+cu110 torchvision==0.8.1+cu110 torchaudio===0.7.0 -f https://download.pytorch.org/whl/torch_stable.html
    

    参考pytorch与gpu版本的适配问题cuda ubuntu安装_3090显卡 + pytorch1.7 +cuda11.0+anconda安装

2、opencv-python安装低版本才可以支持blend_truth_mosaic函数

1、无论是在GPU 3090的虚拟机上,还是在GPU 2080TI的虚拟机上,使用CPU运行yolov4项目都会报错;但是在Colab的虚拟环境上,使用CPU就没问题

在这里插入图片描述


----------------------------------------------------------
评论 8
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值