问题描述
运行nvidia-smi
报错:
Failed to initialize NVML: Driver/library version mismatch
解决方法
只需一步:下载一个安装包,运行一个命令来重新安装cuda driver
和cuda toolkit
(在一个包里)。
-
到这里:https://developer.nvidia.com/cuda-toolkit-archive 选择要下载的安装包。
-
点击要下载的版本后,下载对应的安装包,这个安装包包括
- Driver(驱动)
- Cuda toolkit (工具包)
还有一些其他的像Sample或者Document之类的可以选择不安装。主要就是上面这两个,报错也是这两个东西版本不对应。
注意这里要确定自己的系统版本Distribution可以通过:
lsb_release -a
来查看。
处理器架构:x86_64 是 Intel 和 AMD x86 架构的 64 位版本,ppc64le 是 IBM Power 架构的 64 位版本,而 arm64-sbsa 是 ARM 架构的 64 位版本
3. 运行上图中给定的这两个命令执行安装。
wget https://developer.download.nvidia.com/compute/cuda/11.4.2/local_installers/cuda_11.4.2_470.57.02_linux.run
sudo sh cuda_11.4.2_470.57.02_linux.run
这里会出现两次交互界面:
-
第一次是问是否接受EULA协议,输入
accept
- -
第二次是让你选择要安装的选项,上下键切换,回车键勾选,仅仅勾选前两个就可以([X]表示已经勾选)。
安装完就解决了。