如果是动用了子线程创建进程,比如利用accelerate训练脚本,那么大概率可以通过这种方式解决:nvidia-smi没有进程,但是显存占用_nvidia-smi有的卡是0%-CSDN博客
如果这种方法不可用,请尝试直接查询所有python进程,找到最可能的运行脚本,grep过滤删除:
首先:
ps aux | grep python
这会显示所有python进程号,likethis
/home/gpu15/projx/sd-scripts/notebook/kohya-trainer/sdxl_train.py是我在运行的脚本,那么
ps aux | grep /home/gpu15/projx/sd-scripts/notebook/kohya-trainer/sdxl_train.py | grep -v grep | awk '{print $2}' | xargs sudo kill
传递所有以此脚本运行的进程,接着kill