lspci | grep -i vga
输出:
2d:00.0 VGA compatible controller: NVIDIA Corporation Device 2204 (rev a1)
99:00.0 VGA compatible controller: NVIDIA Corporation Device 2230 (rev a1)
import torch
print(torch.version.cuda) # 应该显示 CUDA 版本
print(torch.cuda.device_count()) # 应该大于 0
print(torch.cuda.get_device_name(0)) # 显示第一个 CUDA 设备的名字 11.1
0
Traceback (most recent call last):
File "/home/ubuntu/workspace/python/gpb_dl/tabddpm/look_gpu.py", line 4, in <module>
print(torch.cuda.get_device_name(0)) # 显示第一个 CUDA 设备的名字
File "/home/ubuntu/anaconda3/envs/tddpm/lib/python3.9/site-packages/torch/cuda/__init__.py", line 326, in get_device_name
return get_device_properties(device).name
File "/home/ubuntu/anaconda3/envs/tddpm/lib/python3.9/site-packages/torch/cuda/__init__.py", line 356, in get_device_properties
_lazy_init() # will define _get_device_properties
File "/home/ubuntu/anaconda3/envs/tddpm/lib/python3.9/site-packages/torch/cuda/__init__.py", line 214, in _lazy_init
torch._C._cuda_init()
RuntimeError: No CUDA GPUs are available
inxi -G
Graphics: Card-1: NVIDIA Device 2204
Card-2: NVIDIA Device 2230
Display Server: N/A drivers: fbdev,nouveau (unloaded: vesa) FAILED: modesetting tty size: 187x44
OpenGL: renderer: N/A version: N/A
根据你提供的 inxi -G 命令输出,你的系统中装有两块 NVIDIA 显卡,设备 ID 分别为 2204 和 2230。然而,输出中显示“Display Server: N/A drivers: fbdev,nouveau (unloaded: vesa) FAILED: modesetting”,这表明系统没有正确加载 NVIDIA 的专有驱动程序,而是使用了开源的 Nouveau 驱动或者 fbdev 基础驱动。
Nouveau 驱动
只返回了16进制码,查询网址
https://admin.pci-ids.ucw.cz/mods/PC/10de/2204
寻找对应的手动下载Driver型号
https://www.nvidia.com/en-us/drivers/
没有530,只有535版,只能用535了(有没有其他的镜像源文件)
接下来是安装:
禁用nouveau:
sudo vim /etc/modprobe.d/blacklist-nouveau.conf
1
添加如下内容:
blacklist nouveau
blacklist lbm-nouveau
options nouveau modeset=0
alias nouveau off
alias lbm-nouveau off
- 给予 .run 文件执行权限
1.确保 .run 文件在你的当前工作目录中,或者知道它的完整路径。
2.给予执行权限:
(zxc_pytorch) ubuntu@master:~$ chmod +x NVIDIA-Linux-x86_64-535.161.07.run
3.运行驱动安装脚本
执行 .run 文件:
sudo ./NVIDIA-Linux-x86_64-535.161.07.run