机器学习势能(MLPs) 第一章 基础理论与核心概念 第二章 数据生成与训练集构建

本专栏系统阐述机器学习势能(MLPs)从理论根基到工业级部署的完整技术栈。从第一性原理计算的精度-成本瓶颈出发,深入剖析E(3)等变神经网络、原子中心表示与消息传递机制的数学本质;对比解析HD-NNP、GAP、NequIP、MACE、Deep Potential等主流架构的设计哲学与适用边界;并涵盖主动学习框架、预训练模型微调、不确定性量化等前沿方法。无论您是从事材料模拟、计算化学还是AI for Science研究,本指南都将成为连接量子力学精度与分子动力学效率的桥梁。
 


目录直达

第一章 基础理论与核心概念

第二章 数据生成与训练集构建

第三章 模型训练与超参数优化

第四章 模型验证与性能评估

第五章 软件工具与生产部署

第六章 高级应用与前沿方向 一

第六章 高级应用与前沿方向 二


目录

第一章 基础理论与核心概念

1.1 机器学习势能概述

1.1.1 从第一性原理到机器学习势能的演进

1.1.2 MLPs的基本数学框架

1.1.3 对称性与等变性基础

1.2 描述符(Descriptors)体系

1.2.1 局域原子环境表征方法

1.2.2 图神经网络中的消息传递表示

1.2.3 描述符的工程化选择

1.3 主流MLP架构对比

1.3.1 高维神经网络势能(HD-NNP)

1.3.2 高斯近似势能(GAP)

1.3.3 等变图神经网络架构

1.3.4 深度势能(Deep Potential)系列

第二章 数据生成与训练集构建

2.1 参考数据计算方法

2.1.1 第一性原理计算设置

2.1.1.1 DFT泛函与基组选择:PBE、SCAN、r²SCAN对比

2.1.1.2 色散校正(DFT-D3/D4)与范德华相互作用

2.1.1.3 自旋极化与磁性体系处理

2.1.1.4 计算参数收敛性测试(k点、截断能、smearing)

2.1.2 数据格式与标准化

2.1.2.1 XYZ、EXTXYZ格式的结构与属性标注

2.1.2.2 能量、力、应力、维里张量的单位统一

2.1.2.3 孤立原子能量(E0s)的精确计算与扣除

2.1.2.4 数据集划分:训练集、验证集、测试集的策略

2.2 构型采样策略

2.2.1 经验采样方法

2.2.1.1 平衡结构微扰(Rattle)与晶格变形

2.2.1.2 从头算分子动力学(AIMD)轨迹提取

2.2.1.3 增强采样方法:元动力学、伞形采样、温度加速

2.2.1.4 相变与缺陷结构的定向采样

2.2.2 主动学习(Active Learning)框架

2.2.2.1 不确定性量化(UQ)方法:委员会查询、贝叶斯神经网络、证据学习

2.2.2.2 查询策略:不确定性阈值、特征空间最远点采样、密度加权

2.2.2.3 迭代训练循环:MLP驱动MD→不确定性筛选→DFT标注→模型更新

2.2.2.4 反应性体系的主动学习:Reactive Active Learning (RAL)策略

2.2.3 数据增强与扩充

2.2.3.1 温度与压力范围覆盖策略

2.2.3.2 化学空间探索:组分变化与掺杂效应

2.2.3.3 表面、界面、缺陷结构的系统采样

2.3 数据集质量评估

2.3.1 结构多样性度量

2.3.1.1 SOAP核距离与结构相似性矩阵

2.3.1.2 主成分分析(PCA)与t-SNE可视化

2.3.1.3 力场能量分布与相空间覆盖度

2.3.2 数据清洗与异常值检测

2.3.2.1 能量排序异常与结构合理性检查

2.3.2.2 力的大小分布与异常力剔除

2.3.2.3 重复结构与近冗余样本去重


第一章 基础理论与核心概念

1.1 机器学习势能概述

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

VectorShift

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值