five

a-SiO2 structures|材料科学数据集|机器学习数据集

收藏
arXiv2024-12-20 更新2024-12-25 收录
材料科学
机器学习
1,000条
下载链接:
http://arxiv.org/abs/2412.15063v1
下载链接
链接失效反馈
资源简介:
该数据集包含1000个非晶态二氧化硅(a-SiO2)结构,通过熔融-淬火-退火分子动力学模拟生成,涵盖了从2.0到2.7 g/cm³的密度范围。数据集的创建过程包括使用LAMMPS进行分子动力学模拟,并采用CHIK势能模型进行淬火和退火处理,以确保结构的多样性和高质量。该数据集主要用于训练和评估机器学习模型,特别是在预测固态核磁共振参数方面,旨在解决复杂材料系统中的静态和动态行为预测问题。
提供机构:
牛津大学
开放时间:
2024-12-20
创建时间:
2024-12-20
AI搜集汇总
数据集介绍
main_image_url
构建方式
a-SiO2 structures数据集的构建基于分子动力学模拟(MD)和机器学习(ML)技术的结合。首先,通过LAMMPS软件进行熔融-淬火-退火模拟,生成了1000个不同密度的非晶二氧化硅(a-SiO2)结构,密度范围从2.0到2.7 g cm−3。为了增加局部原子环境的多样性,采用了三种不同的淬火速率。随后,使用Gaussian Approximation Potential(GAP)对这些结构进行退火处理,以确保其高质量。最终,数据集被划分为训练集(800个结构)、验证集(50个结构)和测试集(150个结构),用于训练和评估基于图神经网络(GNN)的ML模型。
使用方法
a-SiO2 structures数据集的使用方法主要围绕基于图神经网络的机器学习模型展开。首先,数据集用于训练和验证NequIP架构的GNN模型,以预测NMR张量参数。通过两种张量分解策略(不可约球张量分解和张量积分解),模型能够准确预测各向同性和各向异性的NMR性质。训练完成后,模型可用于生成静态一维NMR光谱,模拟不同密度下的非晶二氧化硅结构,并研究其动态行为,如α-β相变。此外,该数据集还可用于验证和优化其他ML模型,推动NMR参数预测在材料科学中的应用。
背景与挑战
背景概述
a-SiO2 structures数据集由牛津大学无机化学实验室的研究团队于2024年创建,主要研究人员包括Chiheb Ben Mahmoud、Louise A. M. Rosset、Jonathan R. Yates和Volker L. Deringer。该数据集的核心研究问题是通过图神经网络(GNN)预测固态核磁共振(NMR)参数,特别是各向异性磁屏蔽和电场梯度张量。NMR技术对材料的局部原子结构极为敏感,但其参数的计算通常依赖于昂贵的密度泛函理论(DFT)方法。该数据集的构建旨在通过机器学习(ML)模型加速NMR参数的预测,从而为实验数据的解释和结构模型的验证提供高效途径。该数据集涵盖了不同密度和局部有序度的非晶二氧化硅(a-SiO2)结构,扩展了传统第一性原理方法的适用范围,并对复杂材料的静态和动态行为进行了探索。这一研究为ML驱动的NMR预测提供了新的思路,并缩小了第一性原理建模与实验数据之间的差距。
当前挑战
a-SiO2 structures数据集在构建和应用过程中面临多重挑战。首先,NMR参数的预测需要高精度,尤其是各向异性张量的计算,这对ML模型的表达能力提出了极高要求。尽管图神经网络在处理对称性和化学信息方面表现出色,但如何准确捕捉NMR张量的复杂物理特性仍是一个难题。其次,数据集的构建依赖于分子动力学模拟和第一性原理计算,这些方法本身具有较高的计算成本,尤其是在处理大规模和非晶结构时。此外,ML模型在预测各向异性参数(如化学位移、四极耦合常数和张量取向)时,需要克服数据稀疏性和局部环境多样性的问题。最后,如何将ML预测结果与实验数据有效结合,并验证其在真实材料系统中的适用性,也是该领域亟待解决的关键问题。
常用场景
经典使用场景
a-SiO2 structures数据集在固态核磁共振(NMR)领域中被广泛用于研究非晶态二氧化硅(SiO2)的局部原子结构和动态行为。通过结合图神经网络(GNN)和球张量分解技术,该数据集能够高效预测固态NMR参数,如磁屏蔽(MS)和电场梯度(EFG)张量。这些预测不仅帮助解释实验数据,还为验证结构模型提供了重要依据。
解决学术问题
a-SiO2 structures数据集解决了传统第一性原理计算方法在计算复杂材料NMR参数时的高计算成本问题。通过机器学习模型,该数据集能够在保持高精度的同时,显著加速NMR参数的预测,尤其是在处理大尺度结构和动态行为时。这一突破为研究复杂材料的结构和动态特性提供了新的工具,填补了第一性原理建模与实验数据之间的鸿沟。
实际应用
在实际应用中,a-SiO2 structures数据集被用于模拟非晶态二氧化硅的静态和动态NMR光谱。通过预测NMR张量参数,研究人员能够生成与实验数据高度吻合的模拟光谱,从而更好地理解材料的局部结构和动态行为。此外,该数据集还被用于研究二氧化硅的相变过程,如α-β晶型转变,为材料设计和优化提供了重要参考。
数据集最近研究
最新研究方向
近年来,a-SiO2结构数据集在固态核磁共振(NMR)参数预测领域取得了显著进展。通过图神经网络(GNN)技术,研究者能够高效地预测各向异性的磁屏蔽和电场梯度等张量参数,从而为复杂材料的静态和动态行为提供精确的NMR谱图预测。这一研究方向不仅突破了传统第一性原理方法在计算成本上的限制,还为材料设计和实验数据的解释提供了新的工具。特别是在非晶态SiO2结构中,GNN模型能够处理大尺度的结构配置,并捕捉局部原子环境的多样性,进一步推动了材料科学领域对无序系统的理解。此外,该数据集的应用还扩展到了晶体相变动力学的研究,展示了机器学习在模拟复杂材料动态行为中的潜力。
相关研究论文
  • 1
    Graph-neural-network predictions of solid-state NMR parameters from spherical tensor decomposition牛津大学 · 2024年
以上内容由AI搜集并总结生成