技术背景
昇思MindSpore是由华为主导的一个,面向全场景构建最佳昇腾匹配、支持多处理器架构的开放AI框架。MindSpore不仅仅是软件层面的工具,更重要的是可以协同华为自研的昇腾Ascend平台,做到软硬件一体的行业解决方案。基于MindSpore的高通量、自动微分和自动并行等高级特性,以及对于python第三方库numpy的友好支持,我们开发了一款可以在MindSpore上进行分子动力学模拟的,模块化、高通量、端到端可微的下一代智能分子模拟程序库——MindSponge
。
本文我们的重点,是介绍如何安装与使用python语言和mindsponge分子动力学模拟框架。
免安装MindSponge
MindSponge是基于python和MindSpore框架来做的,因此更新迭代的频率会比较高。如果在本地工作空间用MindSponge源代码来构建一个项目,这样项目内的开发会相对更加的稳定,这是第一种建议的开发模式。首先,如果我们的项目只涉及到MindSponge的使用。然后clone到自己本地的一个工作空间:
$ git clone https://gitee.com/helloyesterday/mindsponge.git -b develop
正克隆到 'mindsponge'...
remote: Enumerating objects: 8691, done.
remote: Counting objects: 100% (5565/5565), done.
remote: Compressing objects: 100% (3164/3164), done.
remote: Total 8691 (delta 4144), reused 3107 (delta 2390), pack-reused 3126
接收对象中: 100% (8691/8691), 18.14 MiB | 1007.00 KiB/s, 完成.
处理 delta 中: 100% (6197/6197), 完成.
clone结束之后,会在workspace这个目录下生成一个mindsponge目录:
$ cd mindsponge/
$ ll
总用量 76
drwxrwxr-x 8 dechin dechin 4096 8月 16 10:20 ./
drwxrwxr-x 3 dechin dechin 4096 8月 16 10:20 ../
-rwxrwxr-x 1 dechin dechin 3644 8月 16 10:20 build.sh*
drwxrwxr-x 2 dechin dechin 4096 8月 16 10:20 docs/
drwxrwxr-x 8 dechin dechin 4096 8月 16 10:20 .git/
drwxrwxr-x 2 dechin dechin 4096 8月 16 10:20 .gitee/
-rw-rw-r-- 1 dechin dechin 2208 8月 16 10:20 .gitignore
-rw-rw-r-- 1 dechin dechin 11357 8月 16 10:20 LICENSE
drwxrwxr-x 14 dechin dechin 4096 8月 16 10:20 mindsponge/
-rw-rw-r-- 1 dechin dechin 79 8月 16 10:20 pytest.ini
-rw-rw-r-- 1 dechin dechin 2043 8月 16 10:20 README.en.md
-rw-rw-r-- 1 dechin dechin 2486 8月 16 10:20 README.md
-rw-rw-r-- 1 dechin dechin 128 8月 16 10:20 requirements.txt
-rw-rw-r-- 1 dechin dechin 3323 8月 16 10:20 setup.py
drwxrwxr-x 3 dechin dechin 4096 8月 16 10:20 tests/
drwxrwxr-x 5 dechin dechin 4096 8月 16 10:20 tutorials/
-rw-rw-r-- 1 dechin dechin 5 8月 16 10:20 version.txt
这样一来,我们就可以在这个路径下进行一些比较灵活的开发,比如新建一个workspace目录,然后在这个路径下开发:
$ mkdir workspace
$ touch water.py
例如,我们可以写一个这样的案例(因为是本地免安装的开发,因此需要用sys.path的方法,把mindsponge目录添加到系统路径中):
from mindspore import context
from mindspore.nn import Adam
import sys
sys.path.insert(0, '..')
from sponge import Sponge, Molecule, ForceField, set_global_units
from sponge.callback import WriteH5MD, RunInfo
if __name__ == "__main__":
set_global_units('nm', 'kj/mol')
context.set_context(mode=context.GRAPH_MODE, device_target='GPU')
system = Molecule(template='water.spce.yaml')
system.reduplicate([0.3, 0, 0])
new_sys = system.copy([0, 0, -0.3])
system.append(new_sys)
potential = ForceField(system, parameters='SPCE')
opt = Adam(system.trainable_params(), 1e-3)
mini = Sponge(system, potential, opt)
run_info = RunInfo(50)
cb_h5md = WriteH5MD(system, 'tutorial_c01.h5md', save_freq=50, write_velocity=True, write_force=True)
mini.run(500, callbacks=[run_info, cb_h5md])
这些代码的具体内容,我们都会在后面的文章中逐一讲解。这个案例运行的结果如下所示:
$ python3 water.py
[MindSPONGE] Started simulation at 2023-08-16 10:35:59
Warning! The optimizer "Adam<>" does not has the attribute "velocity".
[MindSPONGE] Step: 0, E_pot: 110.0423
[MindSPONGE] Step: 50, E_pot: 46.740437
[MindSPONGE] Step: 100, E_pot: -31.139118
[MindSPONGE] Step: 150, E_pot: -61.45553
[MindSPONGE] Step: 200, E_pot: -138.1261
[MindSPONGE] Step: 250, E_pot: -148.34193
[MindSPONGE] Step: 300, E_pot: -148.40369
[MindSPONGE] Step: 350, E_pot: -148.40425
[MindSPONGE] Step: 400, E_pot: -148.40425
[MindSPONGE] Step: 450, E_pot: -148.40456
[MindSPONGE] Finished simulation at 2023-08-16 10:36:05
[MindSPONGE] Simulation time: 5.86 seconds.
--------------------------------------------------------------------------------
简单来说,这个案例就是通过MindSponge构建了4个水分子这样的一个体系,然后用MindSpore内置的Adam优化器,做了一个能量极小化的操作。
编译安装MindSponge
编译构建版本的MindSponge,这里建议使用mindscience库上的内容:
$ git clone https://gitee.com/mindspore/mindscience.git -b dev-md
正克隆到 'mindscience'...
remote: Enumerating objects: 17524, done.
remote: Counting objects: 100% (1093/1093), done.
remote: Compressing objects: 100% (767/767), done.
remote: Total 17524 (delta 506), reused 645 (delta 316), pack-reused 16431
接收对象中: 100% (17524/17524), 322.82 MiB | 2.59 MiB/s, 完成.
处理 delta 中: 100% (10766/10766), 完成.
正在更新文件: 100% (2121/2121), 完成.
$ cd mindscience/MindSPONGE/
$ ll
总用量 100
drwxrwxr-x 6 dechin dechin 4096 8月 16 16:24 ./
drwxrwxr-x 9 dechin dechin 4096 8月 16 16:24 ../
drwxrwxr-x 5 dechin dechin 4096 8月 16 16:24 applications/
-rw-rw-r-- 1 dechin dechin 4949 8月 16 16:24 build.sh
-rw-rw-r-- 1 dechin dechin 793 8月 16 16:24 CMakeLists.txt
drwxrwxr-x 6 dechin dechin 4096 8月 16 16:24 docs/
-rw-rw-r-- 1 dechin dechin 11357 8月 16 16:24 LICENSE
-rw-rw-r-- 1 dechin dechin 69 8月 16 16:24 NOTICE
-rw-rw-r-- 1 dechin dechin 110 8月 16 16:24 OWNERS
-rw-rw-r-- 1 dechin dechin 10972 8月 16 16:24 README_CN.md
-rw-rw-r-- 1 dechin dechin 12128 8月 16 16:24 README.md
-rw-rw-r-- 1 dechin dechin 2384 8月 16 16:24 RELEASE_CN.md
-rw-rw-r-- 1 dechin dechin 2555 8月 16 16:24 RELEASE.md
-rw-rw-r-- 1 dechin dechin 171 8月 16 16:24 requirements.txt
-rw-rw-r-- 1 dechin dechin 3323 8月 16 16:24 setup.py
drwxrwxr-x 5 dechin dechin 4096 8月 16 16:24 src/
drwxrwxr-x 8 dechin dechin 4096 8月 16 16:24 tutorials/
-rw-rw-r-- 1 dechin dechin 6 8月 16 16:24 version.txt
关于具体的编译构建流程,都已经打包成了一个bash脚本,我们直接运行这个bash脚本即可完成编译:
$ bash build.sh -e gpu
构建完成后,会生成一个output目录,其中就有编译好的whl文件:
$ ll output/
总用量 1252
drwxrwxr-x 2 dechin dechin 4096 8月 17 09:10 ./
drwxrwxr-x 8 dechin dechin 4096 8月 17 09:10 ../
-rw-rw-r-- 1 dechin dechin 1267915 8月 17 09:10 mindsponge-1.0.0-py3-none-any.whl
-rw-rw-r-- 1 dechin dechin 100 8月 17 09:10 mindsponge-1.0.0-py3-none-any.whl.sha256
然后就可以进到目录,用pip进行安装:
$ cd output/
$ python3 -m pip install mindsponge-1.0.0-py3-none-any.whl
这里需要对应的调整版本号。安装完成后,可以查看到相应的软件版本信息:
$ python3 -m pip show mindsponge
Name: mindsponge
Version: 1.0.0
Summary: simulation package of next generation molecular modeling in mindspore
Home-page: https://www.mindspore.cn/
Author: The MindSpore Authors
Author-email: contact@mindspore.cn
License: Apache 2.0
Location: /home/dechin/anaconda3/envs/mindspore-latest/lib/python3.7/site-packages
Requires: descriptastorus, scipy, absl-py, pyyaml, dataclasses, biotite, h5py, biopython, numpy, glob2
Required-by:
这样就基本完成安装了,我们就可以在同一个环境下的任何位置直接调用到mindsponge的包。不过需要注意的是,mindscience仓库和MindSponge仓库这两者的调用方式略有区别,在代码中只是需要调整引用的方式。其实使用编译安装的方法,引用也会更加快捷,不需要使用sys.path来添加路径,具体调整如下所示:
- 免安装方法
import sys
sys.path.insert(0, 'your/mindsponge/path')
from sponge import Sponge
- 编译构建方法
from sponge import Sponge
如下所示是一个使用MindSponge模拟一段时间的水溶液中的多肽:
总结概要
本文主要介绍MindSponge框架的免安装使用和编译构建使用这两种使用方法,MindSponge是一款可以在MindSpore上进行分子动力学模拟的,模块化、高通量、端到端可微的下一代智能分子模拟程序库。通过MindSponge,我们可以在GPU上更加便捷的开发分子动力学模拟算法和应用,并且原生的支持神经网络力场和增强采样,使得我们可以用一个框架就完成绝大部分的分子模拟工作。