
Mar 06, 2025
- 公司
- 新闻稿
- 研发
ShotgunCSP 的开发:一种结合机器学习和第一性原理计算的晶体结构预测算法
在晶体结构预测基准中取得世界领先的表现
用于预测晶体对称性的机器学习算法极大地提高了复杂和大规模晶体系统结构预测的性能。
统计数学研究所和松下控股株式会社的研究团队开发了一种机器学习算法 ShotgunCSP,该算法可以根据材料成分快速准确地预测晶体结构。该算法在晶体结构预测基准中取得了世界领先的性能。
晶体结构预测旨在确定特定条件下任何给定化合物的稳定或亚稳态晶体结构。传统上,该过程依赖于使用耗时的第一性原理计算进行迭代能量评估并解决能量最小化问题以找到稳定的原子构型。自 20 世纪初以来,这一挑战一直是材料科学的基石。最近,计算技术和生成式 AI 的进步为该领域带来了新方法。然而,对于大规模或复杂的分子系统,对广阔相空间的详尽探索需要巨大的计算资源,这使其成为材料科学中尚未解决的问题。
研究团队发现,利用机器学习算法可以高度准确地预测稳定晶体结构固有的对称模式。通过使用这些预测器大幅减少搜索空间,他们消除了迭代第一性原理计算的需要。这种简化的方法表明,即使对于大型复杂系统,也可以以极高的准确性和效率预测稳定的结构。
这一突破性成果于 2024 年 12 月 20 日发表在 npj Computational Materials 上。
晶体是由原子或分子周期性排列形成的固体,用于半导体、药物、电池和许多其他应用。晶体的结构对材料的特性有重大影响。在材料开发过程中,材料的合成需要大量的时间和精力,因此提前预测晶体结构的技术极其重要。根据化学成分预测能量稳定或亚稳态晶体结构一直是材料科学领域的长期挑战。原则上,可以通过解决原子配置空间内的能量最小化问题来确定晶体结构,能量评估通常使用基于密度泛函理论的第一性原理计算进行。
晶体结构预测 (CSP) 通常通过将第一性原理计算与优化算法相结合来解决。例如,通常采用遗传算法沿能量梯度迭代修改原子构型,以寻找能量景观上的全局或局部最小值。然而,这些传统方法需要在每个步骤中通过第一性原理计算迭代放松大量候选结构,导致计算成本极高。对于每个晶胞含有 30-40 个或更多原子的大规模系统,这种限制尤为严重,现有方法在准确解析晶体结构方面面临巨大困难。最近的基准研究表明,当前的 CSP 算法只能预测不到 50% 的晶体系统1, 2,突显其性能存在很大局限性。
研究团队致力于开发一种无需重复进行第一性原理计算的非迭代式 CSP 算法(图 1)。首先,他们利用机器学习构建能量预测器,以近似第一性原理计算的能量计算。通过应用迁移学习,他们发现只需少量训练数据即可构建出高精度的能量预测器。接下来,他们使用新开发的晶体结构生成器创建有前景的虚拟晶体结构。然后利用能量预测器缩小最有可能形成稳定结构的候选结构范围。最后,他们应用第一性原理计算来放宽所选候选结构的能量,并根据达到最低能量的晶体结构预测稳定结构。该算法被命名为 ShotgunCSP,灵感来自于霰弹枪在广阔区域散开并仅仔细分析命中情况的形象。
ShotgunCSP 的一个关键组件是晶体结构生成器。由于大规模系统的结构空间巨大,因此有效缩小搜索空间至关重要。该团队发现,机器学习可用于以极高的精度预测任何给定成分(例如空间群和 Wyckoff 位置)的稳定结构的对称性。这一突破使得搜索空间得到有效缩小,在保持高精度预测的同时显著降低了计算成本。
空间群是表征晶体对称性的数学框架,代表一组几何操作(例如平移、旋转、反转和反射),将晶格中的原子排列映射到其原始位置。所有晶体都分为 230 个不同的空间群。研究小组证明,通过使用在晶体结构数据库上训练的模型,他们可以将稳定结构的可能空间群缩小到前 30 个左右,从而几乎可以完全识别任何给定成分的空间群。
威科夫位置描述了特定空间群的对称操作允许的原子配置自由度。每个原子都被分配一个威科夫标签,根据相应规则位移的原子位置保留了原始对称性。该团队表明,通过利用机器学习,他们可以有效地缩小任何给定组合物中每个原子的威科夫标签分配范围。
利用这些对称性预测因子,可以大大减少晶体系统的搜索空间,从而显著提高 CSP 的准确性。根据本研究进行的大规模性能评估,ShotgunCSP 能够准确预测大约 80% 的晶体系统。其性能远远超过了团队之前开发的基于元素替换的 CSP 算法 CSPML 2,该算法在最近的基准测试中名列前茅1。
CSP 算法是加速新材料开发和科学发现的基础技术。通过识别材料的稳定结构,可以对高温超导体、电池材料、催化剂、热电材料、药物分子,甚至高温高压等极端条件下的材料结构进行重大探索。研究团队通过发现一种不同于传统方法的新方法,利用机器学习来缩小稳定相的晶体对称性,成功显著提高了 CSP 算法的预测性能。此外,ShotgunCSP 算法设计简单,与并行计算具有很高的兼容性,随着计算规模的扩大,性能有望进一步提升。
标题:使用机器学习的形成能预测散弹枪晶体结构
作者:刘畅、玉木宏正、横山智康、若杉健介、四桥智、草场稔、Artem R. Oganov、吉田亮
期刊:npj 计算材料 10, 298 (2024)
DOI:10.1038/s41524-024-01471-8
这项工作得到了日本学术振兴会(JSPS:19H05820、19H01132、23K16955)和日本科学技术振兴机构(JST:JPMJCR19I3、JPMJCR22O3、JPMJCR2332)的部分支持。
图 1:使用 ShotgunCSP 进行非迭代晶体结构预测
图 2:通过使用机器学习缩小空间群和 Wyckoff 位置,大规模系统晶体结构预测的准确性得到了显著提高。
Ryo Yoshida, Professor (Director)
E-mail: yoshidar@ism.ac.jp
Research Center for Materials Informatics, The Institute of Statistical Mathematics, Research Organization of Information and Systems
URA Station, Planning Unit, Administration Planning and Coordination Section
The Institute of Statistical Mathematics, Research Organization of Information and Systems
TEL: +81-50-5533-8580
E-mail: ask-ura@ism.ac.jp
Technology PR Section, Corporate R&D Strategy Office,
Panasonic Holdings Corporation
E-mail: crdpress@ml.jp.panasonic.com
本网站内容在发布时准确无误,但可能随时更改,恕不另行通知。
因此请注意,这些文档可能并不总是包含最新信息。
请注意,德语、法语和中文版本均为机器翻译,因此质量和准确性可能有所不同。