首先确保正确安装了NVIDIA显卡驱动程序和CUDA。可以在NVIDIA官网上下载对应版本的驱动和CUDA。
在Anaconda中创建虚拟环境并安装Tensorflow-gpu。
conda create --name tf_gpu
conda activate tf_gpu
conda install tensorflow-gpu
如果在执行Tensorflow-gpu相关程序时遇到CUDA错误,可以检查CUDA库的路径是否正确。可以通过以下方法来检查:
import tensorflow as tf
tf.config.list_physical_devices('GPU')
如果输出为空,则说明CUDA库的路径不正确。可以通过以下方法来设置路径:
import os
os.environ["CUDA_VISIBLE_DEVICES"]="0" # 设定第一个GPU为可见设备
os.environ['PATH'] = '/usr/local/cuda-10.0/bin:'+os.environ['PATH'] # 设定CUDA路径
os.environ['LD_LIBRARY_PATH'] = '/usr/local/cuda-10.0/lib64:'+os.environ['LD_LIBRARY_PATH']
这里以CUDA 10.0为例,可以将路径改为自己安装的版本。
如果还是无法解决问题,可以尝试更换Tensorflow和CUDA的版本,或者关闭Tensorflow的Eager Execution模式。可以通过以下方法关闭:
import tensorflow as tf
tf.compat.v1.disable_eager_execution()
如果在使用Tensorflow 2.x时,可以使用以下方式关闭:
import tensorflow.compat.v1 as tf
tf.disable_eager_execution()
关闭Eager Execution模式之后,可以再次尝试执行Tensorflow-gpu的相关程序。