今天是大年初一的美好日子,我没有松懈,而是继续在奋斗着1
解决了在多卡训练的时候,不能自己选择卡的序号的问题,"export CUDA_VISIBLE_DEVICES=1" 使用这个命令,我一直解决不了,还是默认的是第一个卡,于是我上网搜索一下,还是没有解决我的问题,困扰了好几天,于是,我还在不停的探索,终于攻负有心人,我终于解决了这个问题!
os.environ['CUDA_VISIBLE_DEVICES']='1' 我是用的是这句话进行解决的,我觉得很棒,瞬间程序就跑起来了,但是我刚刚看了一下,两个卡所占用的显存还不一样,存在很大的差异,这个问题我在我实验室的服务器上也发现了,我不知道到底是咋回事!
作者在春节期间持续解决了一个关于在多GPU训练时无法指定卡号的问题。通过设置环境变量`os.environ[CUDA_VISIBLE_DEVICES]=1`成功让程序运行,但发现不同卡的显存占用差异大,此问题也在实验室服务器上出现,作者对此感到困惑。

1855

被折叠的 条评论
为什么被折叠?



