【论文笔记】| 微调LLM晶体生成

【论文笔记】| 微调LLM晶体生成

Fine-Tuned Language Models Generate Stable Inorganic Materials as Text
NYU, ICLR 2024
Theme:Material Generation

Main work:

微调大型语言模型以生成稳定的材料

  • 可靠性:在样本结构中,90% 遵循原子位置和电荷的物理约束条件。
  • 亚稳性:可以以大约两倍的速率(49% 对 28%)生成预测为亚稳态的材料,优于 CDVAE。
  • 灵活性:可以同时用于无条件生成稳定材料、填充部分结构以及条件生成文本。
  • 适用性:捕捉晶体结构的关键对称性,在模型规模扩大时性能提升。

Method:

将晶体结构【crystal lattice,原子类型及坐标(Fractional coordinates / 3D coordinates)】编码为换行字符串并与文本指令相结合,然后在基础LLM (LLaMA-2)上执行参数高效微调(PEFT)
[图片]

Dataset and Training details:

  • 将原始的 CDVAE 训练数据集与截至 2023 年 4 月的 Materials Project 中的材料进行扩展,过滤掉晶格中原子数超过 30 个的晶体
  • 4-bit quantization and Low-Rank Adapters (LoRA)
    [图片]

Experiment:

评估指标:

  • 有效性与多样性:结构有效性由非重叠原子半径计算;成分有效性由计算电荷为中性计算;多样性使用Matminer对结构和组成进行特征化后的样本间距离来计算;
  • 预测稳定性:利用来自 Materials Project 的已知材料和能量计算,根据元素组成配比构建了真实能量凸包。使用M3GNET和DFT方法VASP计算生成材料相对凸包的近似能量,即 E ^ h u l l \hat{E}_{hull} E^hull,预测其稳定性
    [图片]
    在这里插入图片描述

实验结果:

  • 无条件生成:我们从每个微调 LLAMA 模型中抽取 10,000 个结构,从生成的字符串解析 CIF。随机抽样、拒绝提取不出来的样本并重新抽取另一个样本
  • 条件生成:加入条件【空间群编号、成分和 E h u l l {E}_{hull} Ehull】进行生成
  • 对称性学习:通过变换下的困惑度的增加(IPT)作为评估语言模型
    IPT ( s ) = E g ∈ G [ PPL ( t g ( s ) ) − PPL ( t g ∗ ( s ) ) ] , g ∗ = arg ⁡ min ⁡ P P L ( t g ∗ ( s ) ) \text{IPT}(s)=\mathbb{E}_{g\in G}[\text{PPL}(t_g(s))-\text{PPL}(t_{g^*}(s))],g^*=\arg\min\mathrm{PPL}(t_{g^*}(s)) IPT(s)=EgG[PPL(tg(s))PPL(tg(s))]g=argminPPL(tg(s))
  • 填充部分结构:mutation-relaxation step
    • mutation:构建一个查找表,将每个元素映射到在相同氧化态时具有相似原子半径的元素。
      • 均匀选择: 从元素的查找表中均匀地选择一个元素进行替换。
      • 语言模型引导的选择: 使用Fine-tuned LLM(温度参数 t 调节)生成的元素分布中进行抽样。
    • relaxation:生成的新结构需要通过 M3GNET 评估结构的能量是否稳定。

参考文献

Gruver N, Sriram A, Madotto A, et al. Fine-Tuned Language Models Generate Stable Inorganic Materials as Text[J]. arXiv preprint arXiv:2402.04379, 2024.

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/638860.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

【因果推断从入门到精通二】随机实验3

目录 检验无因果效应假说 硬币投掷的特殊性何在? 检验无因果效应假说 无因果效应假说认为,有些人存活,有些人死亡,但接受mAb114治疗而不是ZMapp与此无关。在174例接受mAb14治疗的患者中,113/17464.9%存活了28天&…

7、按钮无法点击

不能点击,打开f12,删除disabled

基于python向量机算法的数据分析与预测

3.1 数据来源信息 该数据集来源于Kaggle网站,数据集中包含了罗平菜籽油的销售数据,每行数据对应一条记录,记录了罗平菜籽油销售数据。其中,菜籽产量、菜籽价格和菜籽油价格是数值型数据,共2486条数据。 通过读取Exce…

基于transformers框架实践Bert系列2--命名实体识别

本系列用于Bert模型实践实际场景,分别包括分类器、命名实体识别、选择题、文本摘要等等。(关于Bert的结构和详细这里就不做讲解,但了解Bert的基本结构是做实践的基础,因此看本系列之前,最好了解一下transformers和Bert…

webSocket+Node+Js实现在线聊天(包含所有代码)

这篇文章主要介绍了如何使用 webSocket、Node 和 Js 实现在线聊天功能。 重要亮点 💻 技术选型:使用 Node.js 搭建服务器,利用 Express 框架和 Socket.io 库实现 WebSocket 通信。 📄 实现思路:通过建立数组存储聊天…

中国上市公司融资约束指数数据上市公司SA指数与WW指数(2000-2023年)

上市公司融资约束指数,是用来评估公司面临的融资限制程度的工具。SA指数由Hadlock和Pierce开发,基于公司规模和年龄计算,其中较小且较年轻的公司通常会有更高的指数值,表明其融资约束较大。另一方面,WW指数由Whited和W…

Linux .eh_frame section以及libunwind

文章目录 前言一、LSB二、The .eh_frame section2.1 简介2.2 The Common Information Entry Format2.1.1 Augmentation String Format 2.3 The Frame Description Entry Format 三、The .eh_frame_hdr section四、libunwind五、基于Frame Pointer和基于unwind 形式的栈回溯比较…

【计算机网络】初识Tcp协议

💻文章目录 📄前言Tcp基础概念Tcp 的报文格式三次握手四次挥手 Tcp的滑动窗口机制概念超时重传机制高速重传 TCP传输控制机制流量控制拥堵控制慢启动 Tcp的性能优化机制延迟应答捎带应答 📓总结 📄前言 TCP三次握手、四次挥手&…

【qt】QListWidget 组件

QListWidget 组件 一.QListWidget的用途二.界面设计三.QListWidget的添加1.界面添加2.代码添加 四.列表项的设置1.文本2.图标3.复选框4.列表大小 五.字体和图标的设置1.字体:2.图标: 六.设置显示模式1.图标2.列表 七.其他功能实现1.删除2.全选3.反选4.ad…

IO端口编址

统一编址 特点 独立编址 特点 内存地址分配 区别 应用 IO端口地址译码 硬件上的实现 示例1: 示例2: IO指令 软件上的实现 示例

Vue - JavaScript基础学习

一、语言概述 JavaScript 中的类型应该包括这些: 1.数字(默认双精度区别于Java) console.log(3 / 2); // 1.5,not 1 console.log(Math.floor(3 / 2)); // 10.1 0.2 0.30000000000000004NaN(Not a Number&#x…

为什么 buffer 越大传输效率越低

先看 从边际效益递减看 buffer 中挤占带宽 中的两个模型: E1 inflight_prop - inflight_buff: y 2 t x − b x a − x y2tx-\dfrac{bx}{a-x} y2tx−a−xbx​E2 bw / delay: y a x − x 2 b t a − t x y\dfrac{ax-x^2}{bta-tx} ybta−…

OpenMV学习笔记1——IDE安装与起步

目录 一、OpenMV IDE下载 二、OpenMV界面 三、Hello World! 四、将代码烧录到OpenMV实现脱机运行 五、插SD卡(为什么买的时候没送?) 一、OpenMV IDE下载 浏览器搜索OpenMV官网,进入后点击“立即下载”&#xff0…

深度学习基于Tensorflow卷积神经网络VGG16的CT影像识别分类

欢迎大家点赞、收藏、关注、评论啦 ,由于篇幅有限,只展示了部分核心代码。 文章目录 一项目简介 二、功能三、系统四. 总结 一项目简介 一、项目背景 随着医疗技术的快速发展,CT(Computed Tomography)影像已成为医生…

面试准备【面试准备】

面试准备【面试准备】 前言面试准备自我介绍:项目介绍: 论坛项目功能总结数据库表设计注册功能登录功能显示登录信息功能发布帖子评论私信点赞功能关注功能通知搜索网站数据统计热帖排行缓存 论坛项目技术总结Http的无状态cookie和session的区别为什么要…

Linux-应用编程学习笔记(二、文件I/O、标准I/O)

一、文件I/O基础 文件 I/O 指的是对文件的输入/输出操作,就是对文件的读写操作。Linux 下一切皆文件。 1.1 文件描述符 在 open函数执行成功的情况下, 会返回一个非负整数, 该返回值就是一个文件描述符(file descriptor&#x…

Python3 笔记:sort() 和 sorted() 的区别

1、sort() 可以对列表中的元素进行排序,会改变原列表,之前的顺序不复存在。 list.sort(key, reverse None) key:默认值是None,可指定项目进行排序,此参数可省略。 reverse&#…

零基础PHP入门(一)选择IDE和配置环境

配置环境 官网下载安装包,windows https://windows.php.net/download#php-8.3 我是下载的最新版,也可以切换其他版本 https://windows.php.net/downloads/releases/archives/ 下载好压缩文件后,双击解压到一个目录 D:\soft\php 复制ph…

Vue 3 的 setup语法糖工作原理

前言 我们每天写vue3项目的时候都会使用setup语法糖,但是你有没有思考过下面几个问题。setup语法糖经过编译后是什么样子的?为什么在setup顶层定义的变量可以在template中可以直接使用?为什么import一个组件后就可以直接使用,无需…

匝间冲击耐压试验仪产品介绍及工作原理

产品简介 武汉凯迪正大KD2684S匝间冲击耐压试验仪适用于电机、变压器、电器线圈等这些由漆包线绕制的产品。因漆包线的绝缘涂敷层本身存在着质量问题,以及在绕线、嵌线、刮线、接头端部整形、绝缘浸漆、装配等工序工艺中不慎而引起绝缘层的损伤等,都会造…