【Linux】深度学习环境配置

步骤总结:

  1. 安装显卡驱动
  2. 安装CUDA Toolkit
  3. 安装 miniconda
  4. 安装pytorch

安装显卡驱动

Linux上快速查询所需的驱动型号:

sudo apt update
sudo apt install ubuntu-drivers-common
ubuntu-drivers devices

安装后重启系统

使用:nvidia-smi
查看驱动是否安装成功

注意:此处的 CUDA Version 是 GPU 驱动程序支持的最高CUDA版本,而不是当前使用的CUDA Toolkit版本。
nvcc -V 用于查看当前激活的系统中的 cudatoolkit 版本(非虚拟环境中的 cudatoolkit 版本)

安装CUDA Toolkit

注意:这一步安装的是系统级别的 CUDA Toolkit,不是虚拟环境中的
和pytorch版本匹配的是虚拟环境中的

根据 nvidia-smi 显示的 CUDA Version 选择 CUDA Toolkit 的版本
CUDA Toolkit 版本小于等于 CUDA Version 的
例如
如果 nvidia-smi 显示CUDA Version是11.0,则可以安装CUDA Toolkit 11.0及之前的版本(例如,10.2、10.1等)
在官网寻找对应版本:https://developer.nvidia.com/cuda-toolkit-archive
点进去按提示安装

设置环境变量
在.bashrc文件中添加以下内容以设置环境变量:

export PATH=/usr/local/cuda-11.0/bin${PATH:+:${PATH}}
export LD_LIBRARY_PATH=/usr/local/cuda-11.0/lib64${LD_LIBRARY_PATH:+:${LD_LIBRARY_PATH}}

然后执行以下命令使更改生效:

source ~/.bashrc

验证安装:nvcc -V

安装conda

推荐使用miniconda:
Miniconda软件安装教程(Linux)
tip:阅读协议的时候按空格按页阅读

安装pytorch

官网查找对应版本的pytorch安装即可,命令中会自带 cudatoolkit 的版本

conda list cudatoolkit:显示虚拟环境中的 cudatoolkit 版本

参考

实现Linux服务器配置深度学习环境并跑代码完整步骤

使用nvidia-smi完全查看显卡型号
nvidia-smi --format=csv --query-gpu=index,name,driver_version,memory.total,memory.used,memory.free
或使用
pip install gpustat
gpustat
来查看

Ubuntu系统查看显卡型号NVIDIA Corporation -display UNCLAIMED
Linux下Anaconda环境安装/创建/激活/退出/删除/管理
conda环境下安装nvcc -V

【详细】Ubuntu18.04安装更新显卡驱动、安装CUDA及cuDNN、CUDA版本切换

退出 python:>>> quit()

pyCharm专业版破解激活(超详细)

一文读懂 PyTorch 显存管理机制

windows下使用pip时,如果挂了代理,比如clash等,可能会安装失败,需关掉代理再安装

赞赏