龙空技术网

伽利略:实现三维药效搜索,在化学库中高效发现化合物的算法

AIDDPro 107

前言:

此时咱们对“查找算法的比较实验总结”可能比较看重,小伙伴们都需要分析一些“查找算法的比较实验总结”的相关知识。那么小编也在网络上收集了一些关于“查找算法的比较实验总结””的相关资讯,希望姐妹们能喜欢,大家一起来了解一下吧!

今天为大家带来的是汉堡大学Matthias Rarey教授的文章Galileo: Three‑dimensional searching in large combinatorial fragment spaces on the example of pharmacophores。

摘要

片段空间利用小片段和连接规则可以有效地模拟大型化学空间。Enamine's REAL Space表明,通过这种方法可以创建大量随时可用的化合物库。然而,这些空间内的导航和搜索主要局限于拓扑方法。为了解决这一局限性,作者引入了新颖的遗传算法伽利略(Galileo)。伽利略可以对片段空间进行采样,并与多种评分函数相结合。该方法与新颖的药效映射技术 Phariety 结合使用,可在片段空间内进行三维搜索。作者利用一个小型片段空间展示了伽利略的有效性,并将其应用于 Enamine's REAL Space 中的药效搜索,得到了数百种与 HSP90 和 FXIa 药效相匹配的化合物。

方法

2.1 解决方案

受 Lauck 等人的启发,分子不再使用传统的位向量,而是使用片段树来表示。片段被描述为顶点,代表连接原子的潜在连接点将它们连接起来。只有当片段可以按照有效的连接规则进行连接时,两个顶点才是相邻的。这种表示方法可以容纳通过片段组合产生的各种分子。

2.2 初始化

Population从随机初始化开始,包括使用随机生长程序生成随机片段树。该程序通过选择片段、枚举其链接原子、寻找兼容片段并将其连接到片段树上,直到片段树达到饱和或达到预设的片段限制,从而迭代地将片段添加到片段树上。

2.3 交叉

在两个片段树之间进行交叉需要考虑连接规则的特殊性。由于连接规则数量庞大,直截了当的方法往往无法奏效。取而代之的是一种更为细致的方法。第一个片段树中的每条边都会被依次检查,以寻找潜在的交叉点。在某条边上剪切片段树,然后从第二棵树中找出兼容的边(具有兼容的连接点)。然后将这些边缘作为第二棵树的交叉点。这个过程通过合并两棵父树的子树来生成有效的子树。这种方法可以为每对父树创建数量不等的子树。

2.4 片段空间探索中的变异算子

本节概述在探索片段空间的遗传算法(GA)框架中使用的三种变异操作符--替换插入删除

替换:

在替换突变中,片段树中的单个片段(基因)被片段空间中的兼容片段替换。这一过程包括选择一个片段,识别与其相邻顶点兼容的片段,然后根据其与原始片段的相似度选择一个片段。所选片段的链接原子分配将被确定,以确保有效的连接。这种突变旨在引入多样性,同时保持片段之间的相似性。

插入:

插入突变通过随机选择一个链接原子或一条现有的边,为片段树引入一个新的末端片段。如果选择的是链接原子,那么过程就是从该原子中生长出一个新的末端片段,与初始化过程类似。如果选择了一条边,树会在这条边上被分割,然后使用替换法插入一个兼容的片段。

删除:

当片段从片段树中删除时,就会发生删除突变。如果片段是末端,或者有两个相邻的片段具有兼容的连接原子,就会发生这种情况。在后一种情况下,周围的片段会使用现在可用的链接原子连接起来。

这些突变算子通过对片段树中的单个片段引入变化来促进片段空间的探索,从而使潜在解决方案的数量多样化。

评分

伽利略提供了一个接口,用于整合符合特定标准的外部评分程序。这些程序必须可编写脚本,接受 SDF 文件作为输入,为分子分配正分数,并按照与输入分子相同的顺序输出分数。系统还提供内置功能,如药效图谱(稍后介绍)和理化性质建模。分子量、logP、氢键供体/受体、氮原子/氧原子和芳香环等属性可用作评分标准。评分函数可以合并和加权,合并分数由归一化加权分数的线性组合计算得出。

药效图谱--Phariety

Phariety 是集成到伽利略系统中的药效图谱算法。它建立在NAOMI框架之上,用于在化合物库中搜索三维药效学匹配。该算法包括三个主要步骤:

预处理: 去除不合适的分子。使用 Conformator 生成分子的构象。使用 NAOMI 相互作用模型确定相互作用类型(疏水相互作用、氢键供体/受体相互作用、芳香族相互作用、带电基团相互作用)。检查相互作用点的兼容性,并允许部分映射。映射算法: 查询药效特征点与候选分子相互作用点的映射是通过回溯式深度优先行走来实现的。该算法试图为每个查询特征点找到兼容的相互作用点,确保几何和特征类型的兼容性。当所有点都被映射或所有可能性都被穷尽时,算法就会停止。后过滤: 有效的映射需要经过后过滤。对查询药效模型的约束条件进行验证,包括距离偏差、方向角度偏差和排除体积重叠检查。根据距离和方向偏差,为有效映射计算 [0, 1] 范围内的分数。

该算法会返回候选分子的得分,以便用户评估三维药效学匹配的质量。

总之,伽利略的评分机制涉及外部评分程序和内置函数的整合。药效库映射算法 Phariety 提供了一种在化合物库中进行三维药效库搜索的方法,可评估候选分子与查询药效库模型的匹配程度。

结果Phariety基准

- Phariety是一种集成到伽利略平台中的药效图谱绘制算法,该算法以分子操作环境(MOE)为基准,用于基于药效图谱的虚拟筛选。

- 使用了两种药效模型:热休克蛋白 90 (HSP90) 和因子 XIa (FXIa)。

- 就检索到的先导化合物数目而言,Phariety 的表现与 MOE 相似,这证明了它在药效图谱方面的有效性。

伽利略验证

- 对三种已知药物进行了概念验证实验,比伽利略与随机抽样的性能。

- 随着代数的增加,伽利略的性能比随机抽样有所提高,这证明了遗传算法方法的有效性。

利用 Phariety 进行三维药效搜索

- Phariety 用于在完全枚举的 ZB 样本空间中搜索匹配的药效。

- 利用伽利略和 Phariety 作为拟合函数,为 HSP90 和 FXIa 药效优化化合物。

- 与随机抽样相比,伽利略在HSP90和FXIa药效中检索到的先导化合物数都比较合理,显示了其在三维搜索中的有效性。

- 虽然氢键特征的某些方向性方面具有挑战性,但伽利略检索到的先导化合物总体上符合药效模型的要求。

先导化合物分布和得分分析

- 各次运行的得分和先导化合物数分布情况表明,伽利略能够针对给定的药效模型生成多种多样的相关先导化合物结果。

- 评分函数中距离和方向项之间的平衡被认为是获得合理评分的关键。

总之,实验凸显了伽利略在三维药效搜索和优化方面的优势。与随机抽样相比,该平台的性能有所提高,并有望生成具有理想药效学特征的新药。

参考资料:Meyenburg, C., Dolfus, U., Briem, H. et al. Galileo: Three-dimensional searching in large combinatorial fragment spaces on the example of pharmacophores. J Comput Aided Mol Des 37, 1–16 (2023).

版权信息

本文系AIDD Pro接受的外部投稿,文中所述观点仅代表作者本人观点,不代表AIDD Pro平台,如您发现发布内容有任何版权侵扰或者其他信息错误解读,请及时联系AIDD Pro (请添加微信号sixiali_fox59)进行删改处理。

原创内容未经授权,禁止转载至其他平台。有问题可发邮件至sixiali@stonewise.cn

标签: #查找算法的比较实验总结