查看CUDA版本
nvidia-smi

一、卸载显卡驱动
sh cuda_11.3.1_465.19.01_linux.run --uninstall
二、下载显卡驱动
首先确定GPU服务器类型,驱动下载地址

三、下载CUDA
1、选择正确的CUDA版本
下载地址
这里我选择11.3版本,下载地址为:CUDA Toolkit 11.3 Downloads
查看Linux服务的Architecture,选择正确的版本下载
# 查看linux服务器架构
uname -m
# x86_64
# 查看版本信息
lsb_release -a

运行下方的shell命令
wget https://developer.download.nvidia.com/compute/cuda/11.3.1/local_installers/cuda_11.3.1_465.19.01_linux.run
# 下载缓慢,使用英伟达中国区官网,服务器在北京(.cn)
curl -O https://developer.download.nvidia.cn/compute/cuda/11.3.1/local_installers/cuda_11.3.1_465.19.01_linux.run
sudo sh cuda_11.3.1_465.19.01_linux.run
⚠️注意:
如果当前环境有显卡驱动,在安装时需要注释掉driver安装,否则会报错。
建议不提前安装显卡驱动,通过cuda统一进行安装,以防版本问题。
2、下载安装cudnn
cudnn下载地址
我们这里选择11.x

安装cudnn
tar -xvf cudnn-linux-x86_64-8.9.6.50_cuda11-archive.tar
sudo cp cudnn-linux-x86_64-8.9.6.50_cuda11-archive/include/cudnn.h /usr/local/cuda-11.3/include
sudo cp cudnn-linux-x86_64-8.9.6.50_cuda11-archive/lib/libcudnn* /usr/local/cuda-11.3/lib64
sudo chmod a+r /usr/local/cuda-11.3/include/cudnn.h /usr/local/cuda-11.3/lib64/libcudnn*
四、设置环境变量
vim ~/.bashrz
export CUDA_HOME=/usr/local/cuda-11.3
export PATH=/usr/local/cuda-11.3/bin:$PATH
export LD_LIBRARY_PATH=/usr/local/cuda-11.3/lib64:$LD_LIBRARY_PATH
export CUDA_ROOT=/usr/local/cuda-11.3
# source生效
source ~/.bashrz
五、查看nvcc版本
输入:nvcc -V

六、python校验cuda是否生效
# 进入python程序
python
>>>import torch
>>>torch.__version__
>>>torch.cuda.is_available()

参考: