资讯

展开

配置实验室服务器环境(记录一些坑)

作者:快盘下载 人气:

今天找导师要了实验室的服务器;然后就配了半天环境…遇到了一些问题记录一下

conda的常用命令

# 创建环境
conda create -n 名字 python=3.8
# 查看环境
conda env list
# 进入环境;在服务器上 conda activate 名字 使用不成功;
source activate 名字
# 退出环境
source deactivate
# 删除某个环境
conda remove -n 名字 --all
# 查看换的源
conda config --show-sources

问题1——不能使用conda create创建环境

首先;进入服务器使用

conda create -n Xie python=3.8

失败;显示path not writeable
NotWritableError: The current user does not have write permissions
配置实验室服务器环境(记录一些坑)
参考下面这个链接解决此问题;
http://www.kaotop.com/it/344577.html

改变conda相关文件夹的权限;-r递归应用于子文件夹
sudo chmod 777 -R ~/anaconda3/
sudo chmod 777 -R ~/.conda/

问题2——发现服务器cuda版本为11.2

因为师兄一直在跑代码;不敢升级。但是torch官网上的说明

均是使用cuda11.3;没有使用11.2的
当时使用命令

conda install pytorch torchVision torchaudio cudatoolkit=10.2 -c pytorch

后作torch检查

import torch
 
torch.cuda.is_available()       # cuda是否可用
 
torch.cuda.current_device()     # 返回当前设备索引
 
torch.cuda.device_count()       # 返回GPU的数量
 
torch.cuda.get_device_name(0)   # 返回gpu名字;设备索引默认从0开始

发现在输入torch.cuda.is_available()后显示False
报的错误是;
说pytorch 太老;新显卡不匹配
pytorch capability sm_86 is not compatible with the current PyTorch installation
类似的错误链接如下;
https://blog.csdn.net/a563562675/article/details/121656894

在国内搜索引擎上搜不到结果后;去Google搜索结果
解决措施如下文链接
https://github.com/pytorch/pytorch/issues/50032

在下面代码的基础上

conda install pytorch torchvision torchaudio cudatoolkit=10.2 -c pytorch

运行

pip3 install torch==1.8.1;cu111 -f https://download.pytorch.org/whl/torch_stable.html

然后输入torch.cuda.is_available()后显示True

最后也是配成功了

配置实验室服务器环境(记录一些坑)
4张3080ti 用的师兄也不多 满足了

学习链接;
深度学习服务器RTX3080TI配置记录
https://zhuanlan.zhihu.com/p/447026052

加载全部内容

相关教程
猜你喜欢
用户评论
快盘暂不提供评论功能!