本帖最后由 MolAICal 于 2022-5-27 14:45 编辑
使用MolAICal进行药物ADMET的预测和分子属性的计算
作者:Qifeng Bai(update 2022-5-11) 更多教程(含英文教程)请见如下: MolAICal QQ学术讨论群: 1151656349
1.简介 由于毒性和不可接受的疗效,导致大约有 40%的候选药物研发失败。在这种情况下,药物 ADMET(吸收,分布,代谢,排泄和毒性)的预测在候选药物研发中起到重要作用。在本教程中,介绍了使用 MolAICal和FP-ADMET [1] 进行药物 ADMET和分子属性的预测。有关更详细的 MolAICal介绍,请阅读本文 (https://doi.org/10.1093/bib/bbaa161)。
2.方法和材料 2.1. 软件要求 注意: 请确保MolAICal安装正确! 本教程需要使用目前开发版本的MolAICal(Development version),本功能会添加在MolAICal v2.x(含版本2.0)。
2.2.本教程所需文件 1) 所有在教程中的重要文件可以从该网址下载:
Part I. 药物的ADMET计算 1. 安装FP-ADMET 目前只支持Linux版本的MolAICal实现Part I的教程。
然后在打开的网址上依次打开 “AImodels-->ADMET-->FPADMET-->linux64”,并下载文件“fpadmet.tar.gz”
2) 将“fpadmet.tar.gz”移到文件夹“MolAICal-xxx/mtools”中。其中“MolAICal-xxx”是MolAICal的解压安装目录。而“mtools”是“fpadmet.tar.gz”要移入的目录。
3)解压文件 - #> tar -xzvf fpadmet.tar.gz
复制代码 切换到目录fpadmet: 4)安装fpadmet - #> chmod +x install.sh
- #> ./install.sh
复制代码
现在已成功安装fpadmet。
2. 计算药物的ADMET步骤
2.1. ADMET计算所需文件的格式 用户需要输入正确的文件格式,如图1所示:每一行包含一个分子的SMILES序列和分子名称,其中第一列是分子的SMILES序列,第二列是分子名称;且第一列与第二列之间至少含有1个空格。
图1.输入文件的格式
2.2. 计算所有SMILES格式分子的ADMET条目 切换到目录018-admet, 并运行如下命令: - #> molaical.exe -model fpadmet -s all -i mols.smi -o results.dat
复制代码
结果的解释:命令运行完毕后将输出一个结果文件“results.dat”。打开文件“results.dat”, 可以发现里面包含了所有分子的所有ADMET条目的计算结果。例如,预测Blood–brain-barrier penetration (条目2) 和pKadissociation constant (条目50) 的结果如下: - 2: Blood–brain-barrier penetration
- Predicted Confidence Credibility
- lig1 Yes 0.93 0.32
- ………………………………………….
- 50: pKa dissociation constant
- Predicted quantile_0.025 quantile_0.975
- lig1 5.19 -1.60 13.06
复制代码
“lig1”是药物或配体的名称。化合物“lig1”的标签“Yes”表明该化合物预测适用于血脑屏障穿透。置信值为0.93表示分类器非常确定,并且预测可能是单个标签。可信度相对较低的值(0.32)表明:像“lig1”这样的化合物在训练集中没有足够的代表性,用户应谨慎处理预测。对于第50项的回归示例,计算了95%的预测区间(pKa在0.025和97.5%的预测),并给出了单个观察的预测范围。正如FP-ADMET的原始论文所说:狭窄的预测区间表明与预测相关的不确定性较低[1]。有关预测结果的更详细解释,请查看与本教程文档放一起的文件夹“doc”中名为“ADMETModels doc.pdf”、“FP-ADMET.pdf”和“FP-ADMET-SI.pdf”的文件。
2.3. 计算所有SMILES格式分子的单个ADMET条目 切换到018-admet,并使用如下命令: - #> molaical.exe -model fpadmet -s single -i mols.smi -n 1
复制代码
结果的解释: 由于选择了任务项1,它将生成一个名为“1.dat”的文件。如果选择任务项2,它将生成一个名为“2.dat”的文件。如果选择任务项3,它将生成一个名为“3.dat”的文件……因此生成的结果文件的前缀名称与所选任务项相同。打开文件“1.dat”,“1.dat”的内容如下: - Predicted Confidence Credibility
- lig1 Negative 0.77 0.31
- lig2 Negative 0.90 0.59
- lig5 Negative 0.80 0.35
- lig6 Negative 0.91 0.64
- lig10 Negative 0.96 0.86
-
复制代码
它仅显示了ADMET中所有分子的“1: Anticommensal Effect on Human GutMicrobiota”项的计算结果。要了解ADMET的所有项目,请查看MolAICal手册,或与本教程文件放在一起的文件夹“doc”中名为“ADMETModels doc.pdf”、“FP-ADMET.pdf”和“FP-ADMET-SI.pdf”的文件。
Part II. 使用MolAICal计算ADME和分子属性 本部分教程适用Linux或Windows版的MolAICal。
在Part II教程中,将展示MolAICal计算分子ADME和分子属性的步骤,具体如下: 1) 如果“-s”是0,将会输出药物分子的所有属性信息 - #> molaical.exe -model admepro -s 0 -i "O=C(C)Oc1ccccc1C(=O)O"
复制代码
2) 如果“-s”是1,将会输出一个药物分子简短的ADME信息 - #> molaical.exe -model admepro -s 1 -i "O=C(C)Oc1ccccc1C(=O)O"
复制代码
例如,输出结果如下: - # 1. Pharmacokinetics:
- GI absorption: High
- BBB permeant: Yes
- # 2. Lipinski Rule of 5 Violations:
- No violations found
- # 3. Medicinal Chemistry:
- PAINS filter: False
- Brenk filter: True
复制代码
3)如果“-s”是2,将会输出分子的一些基础信息,如分子量、氢键供体数等。 - #> molaical.exe -model admepro -s 2 -i "O=C(C)Oc1ccccc1C(=O)O"
复制代码
更多属性预测的条目信息,请参考MolAICal手册。
Reference 1. Venkatraman V. FP-ADMET: a compendium offingerprint-based ADMET prediction models. J Cheminform. 2021;13(1):75.
|