热门话题
#
Bonk 生态迷因币展现强韧势头
#
有消息称 Pump.fun 计划 40 亿估值发币,引发市场猜测
#
Solana 新代币发射平台 Boop.Fun 风头正劲

Jorge Bravo Abad
物理@UAM_Madrid教授 |教授。材料人工智能实验室负责人 |材料人工智能实验室主任。
深度学习破解金属蛋白质对接——药物发现中的盲点
金属蛋白质在生物学中无处不在——癌症中的基质金属蛋白酶、神经退行性疾病中的超氧化物歧化酶、病毒复制中的内切酶。它们是重要的药物靶点,但计算工具在处理它们时却面临困难。问题在于:金属离子采用多样的配位几何形状,具有灵活的键合偏好和强极化效应,而传统的评分函数无法捕捉到这些特征。大多数对接工具要么完全忽略金属,要么仅限于锌系统。
Hui Zhang及其合著者介绍了MetalloDock,这是第一个专门为金属蛋白质构建的深度学习对接框架。关键创新在于自回归生成策略,从金属中心开始,首先预测哪个配体原子与金属配位(供体原子),然后按照共价拓扑向外构建分子的其余部分。物理感知约束确保整个过程中的配位几何形状是现实的。
在他们策划的8836个金属蛋白质-配体复合物基准测试中,涵盖了Zn²⁺、Mg²⁺、Ca²⁺、Mn²⁺、Fe²⁺和Co²⁺,MetalloDock实现了78.6%的对接成功率——超越了AlphaFold3、Glide和所有其他测试方法。它以88.9%的准确率预测供体原子,并在0.12 Å内重现配位距离与晶体结构相符。
真正的考验:前瞻性实验。针对PSMA的虚拟筛选识别出两种新型抑制剂(IC₅₀ = 0.22–0.38 μM)。针对流感PA内切酶的合理设计——一种具有挑战性的双核锰酶——产生了IC₅₀低至191 nM的抑制剂。
信息:金属配位一直是计算药物发现中的一个持续盲点。通过将物理先验直接构建到架构中,深度学习终于可以解决这个问题——为金属酶打开与其他靶类相同的高通量筛选的大门。
论文:

38
一种物理信息化的GNN,从数据中学习牛顿定律——并外推到35倍大的系统
大多数用于物理模拟的神经网络都需要大量数据且脆弱。在一个配置上训练它们,当你改变边界条件、扩大系统规模或进行长时间的滚动时,它们就会崩溃。根本问题在于:这些模型学习的是相关性,而不是守恒定律。
Vinay Sharma和Olga Fink采用了不同的方法,使用Dynami-CAL GraphNet。与其希望网络发现物理规律,他们直接将其嵌入到架构中。关键的见解是:牛顿第三定律保证了内部力保持线性和角动量的守恒——即使在能量通过摩擦或非弹性碰撞耗散时也是如此。
他们通过一种新颖的边局部参考框架实现了这一点,该框架是SO(3)-等变的、平移不变的,并且在节点互换下是反对称的。从边嵌入解码的力自动相等且方向相反。角动量也得到了同样的处理:网络预测内部扭矩和力的施加点,将自旋与轨道贡献隔离开来。
结果令人瞩目。在仅用五条轨迹训练60个碰撞球体的静止箱子后,该模型能够外推到一个具有2073个粒子的旋转圆柱形料斗——在16000个时间步长内保持稳定、物理一致的滚动。对于受限的N体系统、人类运动捕捉和蛋白质分子动力学,它在需要更少数据的情况下超越了专业基准。
信息是:当你将守恒定律嵌入架构中而不是损失函数时,你会得到能够跨尺度、几何和边界条件进行泛化的模型——因为它们从一开始就学习到了正确的归纳偏差。
论文:

61
弯曲空间以匹配能量:几何如何使分子结构预测达到化学精度
预测分子的三维结构——每个原子在空间中的确切位置——是计算化学的基础。如果稍有错误,你的能量计算可能会偏差很大。金标准是密度泛函理论,但DFT速度慢且成本高。机器学习提供了一条更快的途径:训练一个模型将粗略的初始猜测去噪成准确的结构。
问题在于,大多数去噪模型在普通的欧几里得空间中操作,在那里所有方向被视为平等。但分子并不是这样工作的。拉伸一个键的能量成本远高于围绕它旋转的能量成本。在笛卡尔坐标中,相等的距离并不意味着相等的能量变化。
Jeheon Woo及其合著者直接解决了这一不匹配。他们构建了一个黎曼流形——一个具有位置依赖度量的弯曲空间——旨在使测地距离与能量差相关联。该度量是由物理信息内部坐标构建的,这些坐标根据改变它们所需的能量来加权原子间距离:刚性键的权重高于柔性扭转。当他们将测地距离与标准RMSD进行比较时,能量的相关性从0.37跃升至0.90。
在这个弯曲空间上训练去噪模型改变了模型的学习内容。在欧几里得空间中,添加各向同性噪声可能会破坏键或创建不可能的几何结构——结构的能量高出最低值数百kcal/mol。在黎曼流形上,相同的噪声幅度保持分子在化学上合理,保持在同一势阱内。去噪路径本身遵循测地线,追踪能量最小化,而不是通过笛卡尔空间的任意直线。
结果达到了重要的阈值:化学精度,定义为能量误差低于1 kcal/mol。在QM9基准测试中,黎曼模型实现了0.177 kcal/mol的中位误差——大约比力场起始结构好20倍,并且显著优于欧几里得版本。当这些预测作为DFT精化的起始点时,计算成本下降超过一半。
更深层次的观点:在分子建模中,表示空间的几何形状并不是中立的。欧几里得空间将所有原子位移视为等价;黎曼空间可以编码物理。当你将几何距离与能量成本对齐时,去噪变成了优化,模型学会遵循势能表面,而不是与之对抗。
论文:

200
热门
排行
收藏
