华中科技大学李松课题组,利用机器学习预测多孔材料水吸附等温线

多孔材料的水吸附等温线是一个非常重要的参数,但这一参数的获得并不容易。这是因为多孔材料种类过多、结构多元,通过实验和计算的方式获得水吸附等温线数据成本过高,耗时过长。

华中科技大学的李松课题组,建立了一个两步机器学习模型,训练 AI 通过材料的结构参数预测水吸附等温线参数和后续应用性能。

作者|加零

编辑|雪菜、李慧、三羊

在水净化、水脱盐、水收集和吸附热转换等过程中,多孔材料有着巨大的应用。这些吸附驱动应用中,诸如表面亲水性、解吸滞后性和吸水性等结构特性,都可能影响多孔材料的性能。这些结构特性都可以从水吸附等温线 (water adsorption isotherms) 中获得。

那么,如何获得材料的水吸附等温线呢?

如果以实验的方式,获得几种吸附剂的水吸附等温线并不困难,但多孔材料种类众多,如剑桥结构数据库中已录入 10 万余种多孔材料数据,对它们一一合成和测试显然是不合理的。

如果以计算的方式,通过吸附剂晶体结构分子模拟可以得到水吸附等温线,但计算成本极高,难以大规模预测。

而机器学习能够归纳处理大批量的数据,并从中提取规律,且在材料性质预测中有一定的应用案例。基于此,来自华中科技大学的李松课题组建立机器学习模型,训练 AI 提取多孔材料结构参数以预测水吸附等温线,并在此基础上进一步估算各种吸附剂的冷却性能和后续应用。

成果已发表在「Journal of Materials Chemistry A」期刊上

论文链接:

Machine learning-assisted prediction of water adsorption isotherms and cooling performance - Journal of Materials Chemistry A (RSC Publishing)

01 实验过程

数据集EWAID 数据库

研究者从 3.0 版的水吸附等温线数据库 EWAID 中选择了 460 种纳米多孔吸附剂,包括金属-有机骨架 (MOFs)、共价有机骨架 (COFs) 和具有确定晶体结构的沸石 (zeolites) ,通过文献调研获取其水吸附等温线数据。

EWAID:experimental water adsorption isotherm database

在选取的 460 种吸附剂中有 148 种具有所有的结构特征,相关结构参数为可达表面积 (Sa) 、有效孔容 (Va) 和孔径 (Dp) 。

采用通用吸附等温线模型 (UAIM, universal adsorption isotherm model) 拟合 148 种吸附剂的水吸附等温线,得到材料在不同压力 (P) 下 298K 的吸水量 (W)。

将吸附剂的结构特征和吸附性能数据 (Sa、Va、Dp、 P 和 W) 输入机器学习模型进行训练。

从 EWAID 中选择的吸附剂

模型架构两步 ML 策略

研究者们开发了两步 ML 策略:

从数据库中提取多孔材料的结构参数 (Sa、Va、 Dp) 和吸附压力 P 作为参数,输入 ML: S-I 模型,利用机器学习对水吸附等温线进行预测。

估计出水吸附等温线后,提取 3 个参数:饱和吸附容量 (Wsat),等温线的阶跃位置 (α) 和亨利常数 (KH) ,输入 ML: I-P 模型。计算吸附式制冷系统的性能系数 (COPC, the coefficient of performance for cooling) 和吸附剂/水工质对的比制冷效果 (SCE, specific cooling effects),评价其吸附冷却性能。

两步机器学习策略示意图

算法训练RF 和 ANN 综合应用

采用 Scikit-learn 模块开发机器学习模型,采用 RF(随机森林) 和 ANN 两种算法进行两步机器学习训练。

数据集 80% 的样本被随机选取作为训练集,其余 20% 作为测试集。

训练过程中,为了确定算法的最优超参数 (hyper-parameters) ,采用五重交叉验证的方法测试不同超参数组建立的模型,根据测定系数 R2 确定最优超参数。

02 从结构到等温线:S-I 流程

性能验证数据库内等温线预测

RF 准确性优于 ANN

根据 148 种训练吸附剂的结构特征和吸附性能数据  (Sa、 Va、 Dp、 P 和 W),采用 ML 模型对水吸附等温线进行预测。由下表可知, RF 模型在预测水吸附等温线方面具有较高的准确性。

RF 和 ANN 预测精度

由下图 a 可见,这些吸附剂的吸水量分布在 0 ~ 2.0 g/g 之间,大部分在 0 ~ 0.8 g/g 之间。

由下图 b 的相对重要性分析可见,吸附压力 (P) 对吸水量影响最大,二者成正相关。在固定压力下,吸附剂的结构特征,特别是表面积和孔隙体积决定吸水量多少。

RF 模型对吸水性的相关预测

RF 模型预测的精度更高

将数据库中具有不同结构特性的几种典型吸附剂作为实验对象,对比 EWAID 实验数据和 RF 模型预测的水吸附等温线。

数据库中主要有 4 种水吸附等温线类型,I 型(图 a、c 所示的倒 L 形),V 型(图 d、f 所示的典型 S 形),IV 型和 VI 型(图 g、i 所示的两个或多个吸附步骤的形状)。

由下图可见,无论等温线的类型和吸附材料的结构性质如何,吸附等温线预测值与实验值均具有较高的一致性,这验证了 RF 模型的高精度。

水吸附等温线预测结果:灰色表示 EWAID 实验数据,蓝色表示 RF 模型预测数据

RF 可识别微小结构差异,灵敏度更高

改变 MOF 族吸附剂的金属 (MOF-74-M 和 CUK-1-M,M = Co,Mg,Ni) 和功能基 (MIL-101-Cr + X,X = NH2,SO3H,NO2) 研究结构差异导致的水吸附等温线变化。

改性后结构参数见下表:

吸附剂的结构特征

对应的水等温线预测结果见下图:

水等温线预测结果 菱形表示 EWAID 实验数据,圆点表示 RF 预测结果

针对结构差异微小的吸附剂,RF 模型准确地预测了水吸附等温线的差异,展现了高精度和高灵敏度。

性能拓展数据库外等温线预测

为了进一步验证 RF 模型的适应性,研究者们选择 EWAID 数据库中不包含的吸附剂 (ZJU-210-Al,NU-405-Zr和 iso-NU-1000-Zr ) 进行测试,结果如下图。

水等温线预测结果 灰色表示实验数据,蓝色表示 RF 模型预测数据

由图 a、b 可见,RF 模型对 ZJU-210-Al 和 NU-405-Zr 的水吸附等温线有较好的预测。在图 c 中,RF 模型对 ISO-NU-1000-Zr 的高压吸水量预测值低于实验值。

这一预测偏差的产生,可能是因为 EWAID 数据库中没有足够数量的高吸附量样本(吸水量 > 0.8 g/g),也可能是对 ISO-NU-1000-Zr 的结构描述不充分。

对具有微小结构差异的吸附剂开展研究,结果如下图:

水等温线预测结果 菱形表示 EWAID 实验数据,圆点表示 RF 预测结果

UiO-67-Zr 与 UiO-66-Zr 相比,配体的附加苯环有疏水性,在图 d 中,UiO-67-Zr 的水吸附等温线向高压方向移动。

MOF-303-Al 与 CAU-23-Al 相比有更高的亲水性,在图 e 中,MOF-303-Al 表现了更小的阶跃位置,水吸附等温线向低压方向移动。

按表面亲水性 UiO-66-Zr + (OH)2 > UiO-66-Zr + NH2 > UiO-66-Zr + CH3 的顺序进行 RF 模型预测。在图 f 中,UiO-66-Zr + NH2 和 UiO-66-Zr + CH3 等温线阶跃位置的预测值大于实验值,向高压方向移动,说明 RF 模型高估了它们的疏水性。

这一偏差的产生,可能是因为在 RF 模型中对吸附剂表面特性的描述符不够丰富,不能有效区分同族但具有不同表面亲水性的吸附剂。

综上,RF 模型对数据库外的多孔材料水吸附等温线预测精度较高,且一定程度上可以分辨材料的结构差异。但相比数据库内的材料预测,会产生一些偏差。可通过补充训练数据,丰富结构特性描述符等方式修正这些偏差。

03 从等温线到性能:I-P 流程

参数提取COPC 和 SCE

以 ML 模型预测的水吸附等温线为基础,提取三个描述符:饱和吸附容量 (Wsat) ,等温线的阶跃位置 (α) 和亨利常数 (KH),对吸附式制冷 (ACs, adsorption chillers) 的性能进行分析。

吸附等温线特征示意图

吸附式制冷性能可根据性能系数 (COPC,the coefficient of performance for cooling) 和吸附剂/水工质对 (adsorbent/water working pairs) 的比制冷效果 (SCE,specific cooling effects) 这两个参数进行评估。

使用描述符 (Wsat,α,KH) ,ML 模型可以快速获得  COPC 和 SCE,而不需要复杂的计算过程。

性能预测等温线参数与性能的关系

根据 460 个吸附剂/水工质对的吸附等温线特征 (Wsat,α,KH),采用 ML 模型对 SCE 和 COPC 进行预测。由下表可知,RF 模型在预测 SCE 和 COPC 方面均具有较高的精度。

RF 和 ANN 预测精度

由下图 a 和 b 可见,绝大多数工质对的 SCE 和 COPC 分别位于 0.400 kJ/kg 和 0.4-0.8 的范围内。

由下图 c 和 d 的相对重要性分析可见,Wsat 在确定 SCE 中占 46% 的重要性,KH 在确定 COPC 中占 58% 的重要性,这意味着 Wsat 和 SCE、KH 和 COPC 之间存在很强的相关性

RF 对 SCE 和  的预测值及相关性分析

从下图可以得知,当三个参数的范围为:Wsat = 0.2-0.8 g/g,α = 0.1-0.3,KH = 10-4 - 10-1 (mol/kg·Pa) 时,冷却性能可维持在 (SCE > 200kJ kg-1,COPC  > 0.7) 这一范围内,此时水吸附等温线为 V 型。

148种吸附剂的 Wsat、α、KH 和冷却性能之间的关系

04 材料科研新范式离不开机器学习

材料科学的指导思想可以总结为四种范式:

  • 经验的试错方法;
  • 物理和化学规律;
  • 计算机模拟;
  • 大数据驱动的科学。

20 世纪 90 年代,Rao 等人在研究陶瓷基复合材料 (CMC) 时,运用 ANN 进行模拟,这是机器学习在材料科学中的开创性应用。

随着科技的发展,第四种范式融合了其他三种范式的优势,近年来,机器学习在材料科学领域可谓是火热,材料的发现、制备和性能分析验证等方向都有它的身影。

机器学习在材料科学中的应用

但是,想让机器学习直接赋能于材料实际应用,研究者们仍然任重道远。

机器学习为我们提供了「结构—性能」的视角,期待研究者们与 AI 协作,真正实现识结构、知性能、促创新,共同探索材料科学新的未来。

参考文献:

[1]https://pubs.rsc.org/en/content/articlelanding/2023/TA/D3TA03586G

[2]https://www.sciencedirect.com/science/article/abs/pii/S235249282201741X

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/181036.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

深度学习模型训练计算量的估算

深度学习模型训练计算量的估算 方法1:基于网络架构和批处理数量计算算术运算次数前向传递计算和常见层的参数数量全连接层(Fully connected layer)参数浮点数计算量 CNN参数浮点数计算量 转置CNN参数浮点数计算量 RNN参数浮点数计算量 GRU参数…

java--static修饰成员方法

1.成员方法的分类 ①类方法:有static修饰的成员方法,属于类 ②实例方法:无static修饰的成员方法,属于对象。 2.成员方法的执行原理 解析: 第一行代码:扫描class包名,在方法区生成一个Test.cl…

如何用Python爬取全国高校数据?

前言 Python是一门强大的编程语言,它可以用于爬取互联网上的各种数据。在这篇文章中,我们将学习如何使用Python爬取全国高校数据,并使用代理IP进行爬取。 本文主要分为以下几个部分: 数据来源及需求安装依赖包及导入模块爬取全…

G320E是一种低荣声、固定频率的电荷泵型DC/DC转换器

G320E 低噪声电荷泵DC/DC转换器 产品概述: G320E是一种低荣声、固定频率的电荷泵型DC/DC转换器,在输入电压范围在2.7V到5.0V的情况下,该器件可以产生5V的输出电压,最大输出电流达到300mA.G320E外部元件少,非常适合于…

MySQL-01-MySQL基础架构

1-MySQL逻辑结构 如果能在头脑中构建一幅MySQL各组件之间如何协同工作的架构图,有助于深入理解MySQL服务器。下图展示了MySQL的逻辑架构图。 MySQL逻辑架构整体分为三层,最上层为客户端层,并非MySQL所独有,诸如:连接处…

掌握视频色彩变幻特效,让你的影片更具魅力!

如果你是一名视频制作爱好者或专业人士,那么一定会知道在视频中添加特效的重要性。今天,我们将向你介绍一种令人惊叹的特效技巧——色彩变幻。通过掌握这个技巧,你将能够为你的影片增添独特的视觉效果,吸引观众的注意力。 首先第一…

亚信安慧AntDB MTK数据同步工具之数据稽核

数据稽核是一种用于确保表数据准确性和一致性的重要方法,它涉及到检查数据的完整性、一致性、有效性和合法性,以及与预期规范的匹配程度等多个方面。随着大数据时代的到来,通过有效的数据稽核,组织可以提高决策的准确性和效率&…

cefsharp119.4.30(cef119.4.3,Chromium119.0.6045.159)版本升级体验支持H264及其他多个H264版本

Cefsharp119.4.30,cef119.4.3,Chromium119.0.6045.159 此更新包括一个高优先级安全更新 This update includes a high priority security update. 说明:此版本119.4.3支持H264视频播放(需要联系我),其他版本。.NETFramework 4.6.2 NuGet Gallery | CefSharp.WinForms 119.…

IT支持团队的绩效指标和最佳实践

一名员工在远程时因笔记本问题寻求IT支持,尽管他们多次尝试排除故障,但由于缺乏专业知识,最终还是无法访问工作所需的应用程序。这时,他们需要一名专业的 IT 技术人员来指导他们,但他们只能等待有人注意到并回应他们的…

Adobe 家族系列download

adobe 前言 Adobe公司的产品线中拥有多个家族桶,下面是Adobe全家桶产品的功能介绍: Creative Cloud(创意云):包含Photoshop、Illustrator、InDesign、Premiere Pro、After Effects、Lightroom等创意设计、视频制作和…

Java的Service Provider Interface (SPI)机制动态地加载和发现服务

基本说明 “src\main\resources\META-INF\services” 是Java项目中常见的一个路径,这个路径通常被用来放置服务提供者的配置文件。在Java的Service Provider Interface (SPI)机制中,这个目录下的文件被用来注册和发现服务。 具体来说,如果你…

编写自己的CA和TA与逆向

参考内容《手机安全和可信应用开发》 https://note.youdao.com/s/MTlG4c1w 介绍 TA的全称是Trust Application, 即可信任应用程序。 CA的全称是Client Applicant, 即客户端应用程序。 TA运行在OP-TEE的用户空间, CA运行在REE侧。 CA执行时代…

NB水表能承受最大的水压是多少?

NB水表,作为新一代智能水表,以小巧的体积、稳定的性能和强大的功能赢得了市场的认可。那么,它究竟能承受多大的水压呢?接下来,小编来为大家揭秘下,一起来看下吧! 一、NB水表概述 NB水表&#xf…

森利威尔SL4010 升压恒压 12V升压24V 12V升压36V 12V升压48V

在当今的电子设备中,电源管理系统的设计是非常重要的。为了保证设备的稳定运行,升压和恒压电源的应用已经成为不可或缺的一部分。在这篇文章中,我们将介绍森利威尔SL4010升压恒压电源,它可以实现12V升压24V、12V升压36V、12V升压4…

2023亚太杯数学建模竞赛C题新能源电动汽车数据分析与代码讲解

C题论文包括摘要、问题重述、问题分析、模型假设、符号说明、模型的建立和求解(问题1模型的建立和求解、问题2模型的建立和求解、问题3模型的建立和求解、问题4模型的建立和求解、问题5模型的建立和求解)、模型的评价等等, 视频讲解如下&…

C++算法入门练习——相同的二叉查找树

将第一组n​个互不相同的正整数先后插入到一棵空的二叉查找树中,得到二叉查找树T1​;再将第二组n个互不相同的正整数先后插入到一棵空的二叉查找树中,得到二叉查找树T2​。判断T1​和T2​​是否是同一棵二叉查找树。 二叉查找(搜索)树定义&am…

基于springboot实现校园在线拍卖系统项目【项目源码】

基于springboot实现校园在线拍卖系统演示 Javar技术 JavaScript是一种网络脚本语言,广泛运用于web应用开发,可以用来添加网页的格式动态效果,该语言不用进行预编译就直接运行,可以直接嵌入HTML语言中,写成js语言&…

Jmeter 分布式压测

为什么要分布式 jmeter是100%纯java开发的程序,虚拟用户是以线程实现的,在大量并发情况下,很容易出现CPU、内存消耗过大的问题,甚至会出现java内存溢出。一般一台电脑设置500-600线程数即可,如果超过1000线程&#xf…

【UE5】组成部分

了解UE游戏的基本构成 资源(Asset): 在UE中,资源(Asset)是指游戏中使用到的各种素材,例如模型、纹理、材质、声音、动画、蓝图、数据表格、关卡等(通常以uasset结尾),他…