计算化学公社
标题: 使用MolAICal计算药物化学过滤器MCFs及MCE-18描述符 [打印本页]
作者Author: MolAICal 时间: yesterday 04:37
标题: 使用MolAICal计算药物化学过滤器MCFs及MCE-18描述符
本帖最后由 MolAICal 于 2026-1-24 23:25 编辑
1. 引言 药物化学过滤器(MCFs)的作用是剔除含有所谓 “结构警示” 的化合物。含有此类结构单元的分子要么具有不稳定或反应性基团,要么会发生生物转化,进而产生有毒代谢物或中间体。PAINS(泛测定干扰化合物)过滤器由一系列子结构过滤器组成,旨在减少筛选库中的假阳性结果、测定伪影以及非特异性生物活性分子。其设计依据是:结构中的某些片段可能会引发不良性质 —— 如反应性、螯合作用、胶体聚集形成以及染料相关效应等,这些都会干扰测定结果。由于 MCFs 和 PAINS 均涉及反应性,因此在 MolAICal 中,MCFs 的功能涵盖了 MCFs 和 PAINS 所涉及的结构。
“MCE-18”全称为 “药物化学演进,2018”,是一种原创分子描述符,用于有效评估具有药理学相关性分子的新颖性和先导化合物潜力。MCE-18 计算公式:
(, 下载次数 Times of downloads: 0)
参数说明 1. AR:芳香环或杂芳香环的存在情况(0 = 不存在,1 = 存在)。
2. NAR:脂环或杂脂环的存在情况(0 = 不存在,1 = 存在)。
3. CHIRAL:手性中心的存在情况(0 = 不存在,1 = 存在)。
4. SPIRO:螺原子的存在情况(0 = 不存在,1 = 存在)。
5. sp³:sp³ 杂化碳原子的比例(范围为 0 至 1)。
6. Cyc:sp³ 杂化的环碳原子比例(范围为 0 至 1)。
7. Acyc:sp³ 杂化的非环碳原子比例(范围为 0 至 1)。
8. NCSPTR:复合项,计算公式为(sp³ + Cyc - Acyc)。
9. Q¹:归一化二次指数,用于表征结构骨架的支化程度。
2. 材料 2.1. 软件要求 注意:确保 MolAICal 安装正确!
2.2. 示例文件 1. 所有必要的教程文件可从以下网址下载:
第一部分:使用MolAICal 计算化学过滤器(MCFs)
- 1. 为单个 SMILES 字符串计算 MCFs
- #> molaical.exe -tool mcf -s "CC(=O)OC1=CC=CC=C1C(=O)O"
- 2. 为单个 SMILES 字符串计算 MCFs(不输出属性)
- #> molaical.exe -tool mcf -s "CC(=O)OC1=CC=CC=C1C(=O)O" -p false
-
- 3. 计算 MCFs 并指定输出文件及格式(如 “text”“json” 或 “csv”)
- #> molaical.exe -tool mcf -s "CC(=O)OC1=CC=CC=C1C(=O)O" -o result.csv -f csv
- 4. 计算 MCFs 并指定输出文件(不输出属性)
- #> molaical.exe -tool mcf -s "CC(=O)OC1=CC=CC=C1C(=O)O" -o result.csv -f csv -p false
复制代码
默认情况下,还会输出一些属性用于分子的进一步评估:
1 SMILES:输入分子的 SMILES 序列。
2 Valid:判断分子是否有效,值为 True(有效)或 False(无效)。
3 Passes filters:判断分子是否通过 MCFs 评估,值为 True(通过)或 False(未通过)。若值为 True,表明该分子通过了 MCFs 和 PAINS 过滤器。
4 LogP:辛醇 - 水分配系数,指物质在辛醇相中的浓度与在水相中的浓度之比。
5 SA Score:即合成可及性分数,用于粗略评估特定分子的合成难度(评分 10 表示难,1 表示易)。该分数由分子片段的综合贡献得出。
6 NP Score:即类天然产物分数,是一种贝叶斯指标,用于评估分子与天然产物所涵盖的结构空间的相似程度。
7 QED:即药物相似性定量估计,是一个 [0,1] 区间内的值,用于评估分子成为可行药物候选物的可能性。与 SA 分数类似,QED 中的描述符阈值在过去十年中有所变化,当前阈值可能未涵盖最新药物。
8 Molecular weight(MW):化合物中原子量的总和。
从上述网址下载 “024-mcf_mce18/molecules.smi”;“molecules.smi” 可包含多个SMILES 字符串,因此 MolAICal 可一次性为一个或多个分子计算MCFs。请尝试以下示例:
1. 从文件中计算 MCFs(文件可包含多行 SMILES,每行代表一个分子的 SMILES)
- #> molaical.exe -tool mcf -i molecules.smi -o result.csv -f csv
复制代码
2. 从文件中计算 MCFs(不输出属性,文件可包含多行 SMILES,每行代表一个分子的 SMILES)
- #> molaical.exe -tool mcf -i molecules.smi -o result.csv -f csv -p false
复制代码注意:用户可选择上述任一方式计算 MCFs。如需更详细的帮助,请参考 MolAICal 手册。
第二部分:使用MolAICal 计算 MCE-18
- 1. 为单个 SMILES 计算 MCE-18
- #> molaical.exe -tool mce18 -s "CC(=O)OC1=CC=CC=C1C(=O)O"
- 2. 仅输出 SMILES 和 MCE-18 值
- #> molaical.exe -tool mce18 -s "CC(=O)OC1=CC=CC=C1C(=O)O" -sm true
- 3. 输入 SMILES 并输出 CSV 格式文件
- #> molaical.exe -tool mce18 -s "CC(=O)OC1=CC=CC=C1C(=O)O" -o output.csv
- 4. 输入 SMILES 并输出 CSV 格式文件(不输出详细内容)
- #> molaical.exe -tool mce18 -s "CC(=O)OC1=CC=CC=C1C(=O)O" -o output.csv -q true
- 5. 输入 SMILES 并输出 CSV 格式文件(仅包含 SMILES 和 MCE-18 值)
- #> molaical.exe -tool mce18 -s "CC(=O)OC1=CC=CC=C1C(=O)O" -o output.csv -sm true
- 6. 输入包含 SMILES 字符串的文件(每行一个)并输出 CSV 格式文件
- #> molaical.exe -tool mce18 -i molecules.smi -o results.csv
- 7. 输入包含 SMILES 字符串的文件(每行一个)并输出 CSV 格式文件(仅包含 SMILES 和 MCE-18 值)
- #> molaical.exe -tool mce18 -i molecules.smi -o results.csv -sm true
复制代码
对MCE-18的 值进行分析:
从实际应用场景来看,45-78 是一个相对理想的范围
对供应商化合物库(如 ChemDiv、Enamine)的分析显示:
MCE-18 <45:分子结构简单、新颖性低,多为 “旧骨架”,吸引力有限;
MCE-18: 45-78:新颖性足够,符合当前药物化学趋势(45-63),与制药公司近期专利化合物的结构相似性高(63−78);
MCE-18 > 78:需要手动评估靶点适应性和药物相似性,因为过度复杂可能导致开发困难。
注意:用户可选择上述任一方式计算 MCE-18。如需更详细的帮助,请参考 MolAICal 手册。
| 欢迎光临 计算化学公社 (http://bbs.keinsci.com/) |
Powered by Discuz! X3.3 |