一种基于深度均衡模型的求解分子系统稳态方法

    专利查询2025-12-25  11


    本发明属于人工智能,具体为一种基于深度均衡模型的求解分子系统稳态方法。


    背景技术:

    1、捕捉一个系统几何状态的演变对于多个科学领域来说是至关重要的。通常,几何状态描述了系统在特定时间每个物体的位置。随着系统的演变,可以确定某些感兴趣的几何状态,例如平衡状态。从初始状态预测这些特定状态对于揭示系统的行为和功能至关重要,从而在实践中为诸如药物发现、反应建模和催化剂分析等重要问题提供有价值的见解。

    2、尽管至关重要,但从一个复杂系统的初始状态准确预测感兴趣的未来几何状态并非易事。实验方法虽然对于直接观察很有价值,但往往在严格的环境条件和仪器物理限制下面临障碍。计算方法试图通过求解牛顿运动方程来模拟动力学演化,并通过迭代几何优化获得平衡状态。虽然提供了更大的灵活性,但这类计算通常由第一性原理方法或经验定律驱动,要么需要大量的计算成本,要么牺牲准确性。

    3、近年来,深度学习已经成为许多领域科学发现的关键工具,为捕捉几何状态演化的挑战提供了新的途径。一种直接的方法是训练神经网络直接从初始状态预测目标几何状态。通过适当编码几何状态的内在对称性,通常采用等变网络(equivariant networks),并在初始状态和目标状态的成对数据上进行端到端的监督训练。在模型训练好后,其一次前向传播与传统方法相比可以显著提高预测效率。然而,这种范式也迫使神经网络将迭代演化压缩到一步,使得学习过程困难,可能导致准确性降低。另一种研究路线是通过机器学习力场(mlffs)预测基于系统当前几何状态的力。训练后的mlffs可以模拟演化并促进几何优化以确定目标几何状态,显示出比第一性原理方法更好的效率-准确性平衡。然而,mlffs严重依赖于中间标签(如势能)的可用性和质量,以确保稳定性和精确性,这在复杂场景中的应用受到限制。


    技术实现思路

    1、发明目的:为解决采用深度学习在捕捉几何状态演化时存在的学习过程困难、准确性低等问题,以及为解决通过机器学习力场(mlffs)预测基于系统当前几何状态的力时存在的对中间标签(如势能)的可用性和质量严重依赖、应用场景受限等问题,本发明提出了一种基于深度均衡模型的求解分子系统稳态方法,利用更改后的桥匹配框架生成满足特定物理对称性约束的分子稳态构象,取名为gdb(geometric diffusion bridge)框架,用于精准、高效的分子稳态构象求解和轨迹生成。

    2、技术方案:一种基于深度均衡模型的求解分子系统稳态方法,包括以下步骤:

    3、构建数据集,所述数据集中的数据为初始构象-稳态构象的配对数据;将数据集中的数据划分为训练样本和测试样本;

    4、对训练样本先进行时间采样t~u(0,1),u(0,1)表示(0,1)区间上的均匀分布,而后按照布朗桥的路径概率xt~n(x0+(x1-x0)t,σt(1-t))进行采样,得到预处理后的训练样本;其中,xt∈rd代表动力学演化中t时刻的构象,σ表示噪声尺度,x0,x1分别为代表初始构象与稳态构象的随机变量;

    5、构建基于图transformer或球谐函数表示的se(3)等变神经网络模型;

    6、利用预处理后的训练样本对se(3)等变神经网络模型进行训练,直至se(3)等变神经网络模型收敛,得到训练好的se(3)等变图神经网络模型;

    7、先从初始构象分布∏0中采样,生成一个粗糙构象;再通过模拟以下sde从联合分布π0,1中抽样,得到t=1的x1即为所需的稳态构象:

    8、dxt=vθ(xt,x0,t)dt+σdbt,x0~π0

    9、式中,vθ(xt,x0,t)表示训练好的se(3)等变图神经网络模型一个含时向量场,π0表示初始构象分布,xt∈rd代表动力学演化中t时刻的构象,bt为一个标准的布朗运动。

    10、进一步的,对se(3)等变神经网络模型训练过程等价于最小化如下目标函数lgdb(θ):

    11、

    12、其中,p1|t表示给定xt时x1的条件分布,表示对xt求梯度。

    13、进一步的,所述布朗桥表示为:

    14、

    15、本发明还公开了一种基于深度均衡模型的求解分子系统稳态方法,包括以下步骤:

    16、构建数据集,所述数据集中的数据包括若干帧组成轨迹数据,轨迹数据包括n帧(x0,x1/n,...,x1),xi∈r3n;

    17、构建基于图transformer或球谐函数表示的se(3)等变神经网络模型;

    18、在每一帧上分别使用以下损失函数对se(3)等变神经网络模型进行训练;

    19、

    20、训练完成后,通过分帧模拟以下sde从联合分布π0,1中抽样,得到的x1即为所需的稳态构象:

    21、

    22、其中,[nt]表示取整数部分。

    23、有益效果:本发明与现有技术相比,具有以下优点:

    24、(1)本发明引入了一种新颖而系统的生成建模方法,用于桥接几何状态。从概率的角度来看,几何状态的演变实际上反映了它们分布的传输。本发明建立了一个gdb框架,它代表了一个预先确定的扩散过程,由初始和目标几何状态作为固定端点,并由旋转-平移等变转换核控制,确保演变遵循内在的对称性。这是通过doobh-变换来实现的,模拟几何状态的演变,为精确高效地桥接几何状态提供了一条新途径;

    25、(2)本发明提出的gdb框架通过建模几何状态的联合状态分布,精确地连接几何状态,并全面利用可用的轨迹作为动态的精细描述,以提高性能。从数学上讲,本发明已证明通过(链式)等变扩散桥技术,不同时间步之间几何状态的联合分布可以完全保持,这证实了它在连接几何状态方面的表达能力,并强调了在本发明提出的gdb框架中做出设计选择的重要性。此外,在温和且实用的假设下,本发明已证明,在收敛性方面,本发明提出的gdb框架可以以可忽略的误差逼近控制几何状态轨迹演化的潜在动态,说明了在不同场景下,本发明提出的gdb框架的完整性和实用性。这些优点显示了本发明提出的gdb相比现有方法的优越性;

    26、(3)为了验证其有效性和普遍性,本发明进行了广泛的实验,涵盖了不同的数据模态(简单分子和吸附剂-催化剂复合物)、规模(小、中和大尺度)和场景(有和没有轨迹指导)。数值结果表明,本发明提出的gdb框架始终显著优于现有最先进的机器学习方法。特别是,本发明方法甚至在oc22中具有挑战性的结构松弛任务中超过了训练数据是10倍以上的强大机器学习力场基线,而轨迹指导可以进一步增强本发明方法的性能。显著优越的性能证明了本发明提出的gdb框架在捕捉几何状态的复杂演变动态方面的强大能力,以及在关键的现实世界挑战中确定有价值和关键的感兴趣几何状态的能力。



    技术特征:

    1.一种基于深度均衡模型的求解分子系统稳态方法,其特征在于:包括以下步骤:

    2.根据权利要求1所述的一种基于深度均衡模型的求解分子系统稳态方法,其特征在于:对se(3)等变神经网络模型训练过程等价于最小化如下目标函数lgdb(θ):

    3.根据权利要求1所述的一种基于深度均衡模型的求解分子系统稳态方法,其特征在于:所述布朗桥表示为:

    4.一种基于深度均衡模型的求解分子系统稳态方法,其特征在于:包括以下步骤:


    技术总结
    本发明公开了一种基于深度均衡模型的求解分子系统稳态方法,包括:构建数据集,所述数据集中的数据为初始构象‑稳态构象的配对数据;将数据集中的数据划分为训练样本和测试样本;对训练样本先进行时间采样,而后按照布朗桥的路径概率进行采样,得到预处理后的训练样本;构建基于图Transformer或球谐函数表示的SE(3)等变神经网络模型;利用预处理后的训练样本对SE(3)等变神经网络模型进行训练,直至SE(3)等变神经网络模型收敛,得到训练好的SE(3)等变图神经网络模型;先从初始构象分布∏<subgt;0</subgt;中采样,生成一个粗糙构象;再通过模拟以下SDE从联合分布Π<subgt;0,1</subgt;中抽样,得到t=1的X<subgt;1</subgt;即为所需的稳态构象。

    技术研发人员:王立威,许一先,贺笛
    受保护的技术使用者:北京大学
    技术研发日:
    技术公布日:2024/11/26
    转载请注明原文地址:https://tc.8miu.com/read-33125.html

    最新回复(0)