首先检查CUDA和cuDNN的版本是否匹配。可以通过以下命令检查CUDA版本:
nvcc --version
查看cuDNN版本:
cat /usr/local/cuda/include/cudnn.h | grep CUDNN_MAJOR -A 2
如果版本匹配,可以尝试重新安装cuDNN和CUDA。这里以cuDNN 7.6.5和CUDA 10.1为例:
下载并解压cuDNN:
wget https://developer.download.nvidia.com/compute/machine-learning/repos/ubuntu1804/x86_64/libcudnn7_7.6.5.32-1+cuda10.1_amd64.deb
sudo dpkg -i libcudnn7_7.6.5.32-1+cuda10.1_amd64.deb
sudo apt-get update
sudo apt-get install libcudnn7-dev
下载并安装CUDA:
cd ~/Downloads
wget https://developer.download.nvidia.com/compute/cuda/repos/ubuntu1804/x86_64/cuda-repo-ubuntu1804_10.1.243-1_amd64.deb
sudo dpkg -i cuda-repo-ubuntu1804_10.1.243-1_amd64.deb
sudo apt-key adv --fetch-keys http://developer.download.nvidia.com/compute/cuda/repos/ubuntu1804/x86_64/7fa2af80.pub
sudo apt-get update
sudo apt-get install cuda
如果重新安装仍然无法解决问题,可以尝试更新GPU驱动程序。查看当前安装的驱动程序:
nvidia-smi
如果驱动程序版本较旧,可以更新驱动程序以解决问题。可以参考官方文档:https://docs.nvidia.com/cuda/cuda-installation-guide-linux/index.html