Faiss assertion ‘err == cudaSuccess’ failed in void faiss::gpu:runL2Norm(). details:CUA error 209 no kernel image is available for execution on the device
本人使用的ubuntu 22.04系统,conda的环境。使用pip安装faiss-gpu出现的问题。
pip install faiss-gpu==1.80
错误原因:依然怀疑是conda安装的cuda版本和本机器安装的cuda版本不一致,在github上也查看到了解决类似的issue方法,调至版本一致。
但是没有成功。
后面仔细查看了错误原因有:details:CUA error 209 no kernel image is available for execution on the device。仔细查看了一下愿意是显卡过于落后计算能力不行,显卡是1080。在Nvidia官网中查到:
因此使用的pip 安装的可能compute capability过于高。因此需要按照源码重新编译一下库faiss。参考:
https://github.com/facebookresearch/faiss/blob/main/INSTALL.md
对于其中的编译,如果你用的是conda 可以使用下面方式编译,因为我的是1080,参考
cmake -B build . -DCUDAToolkit_ROOT=/usr/local/cuda/ -DFAISS_ENABLE_GPU=ON -DPython_EXECUTABLE=/home/xxx/anaconda3/envs/xxx/python -DCMAKE_CUDA_FLAGS="-gencode arch=compute_61,code=sm_61"
make -C build -j16
cd build/faiss/python/
python setup.py install
#注意修改成 自己的 cuda 和 python解释器,arch=compute_61,code=sm_61,如果你的是其它显卡版本,可以换成你的显卡版本,(我的是61)。
编译如果遇到问题:undifined SWIGTYPE_p_unsigned_long_long问题。那需要找到文件:swigfaiss.swig。改变一下:
将原来的64改成32,这样你使用SWIGWORDSIZE64会返回:SWIGTYPE_p_unsigned_long_long
这样编译成功。解决上述问题。