我安装apex0.1的环境是:torch(gpu)1.8.0,cuda10.2,cuda7.6.5。
第一步:下载对应的pytorch、cuda、cudnn版本
这里就不详细介绍了,具体可以参考我的这篇博文win10中anaconda创建虚拟环境配置pytorch1.8.0 gpu版 cunda9.0 cudnn7.3 并配置到pycharm上_pycharm jmv1.8.0-CSDN博客
当然,网上也有很多pytorch、cuda、cudnn的安装教程,都可以,只要安装成功即可。
第二步:下载apex0.1
网址:GitHub - NVIDIA/apex: A PyTorch Extension: Tools for easy mixed precision and distributed training in Pytorch
打开github链接之后,直接下载zip版本或者用git clone都行,
下载下来之后,解压缩,
然后打开anaconda prompt,进入你的虚拟环境,进入到解压后的apex目录下,
接下来根据解压缩文件(我这里是上图中的apex-master文件夹下)的requirements.txt,在你的虚拟环境中pip install 所需的包,
然后在prompt中输入
python setup.py install
然后它就会自动去安装了,最后成功的结果如下图所示,
当然你也可以conda list查看一下是否安装成功了apex0.1
这样,就成功在anaconda虚拟环境中安装了apex0.1。
注意事项
不过,在安装的过程中还是有一些需要注意的地方(好吧,其实是我遇到的报错问题):
(1)报错:[WinError]系统找不到文件
(我一开始安装的cuda版本是9.2)
发现这个报错之后,我上网去查,但没有一个是写遇到我这个问题的,都是pytorch版本不对应什么的,我想我也没有安装错pytorch版本呀,所以我只好去看了对应的 setup.py的源码,还一行行debug了一下,但还是没有找到问题。
后来,我在虚拟环境的命令行输出了一下torch.version.cuda,
>>>import torch
>>>torch.version.cuda
>>>10.2
结果返回结果是10.2,我一想这不是我安装的cuda版本呀,我的是9.2啊,所以这是不是我cuda版本没安装对,然后系统找不到需要的cuda path文件才报错的,
接下来我就去安装了cuda10.2,然后运行,就安装成功了。
希望大家不要犯和我一样的错呀~:)