计算化学公社

 找回密码 Forget password
 注册 Register
Views: 2127|回复 Reply: 13
打印 Print 上一主题 Last thread 下一主题 Next thread

[程序/脚本开发] 一个傻瓜式(只需要输入smiles)快速构象搜索的exe程序(基于rdkit)

[复制链接 Copy URL]

13

帖子

0

威望

330

eV
积分
343

Level 3 能力者

基于我很多时候只是想看一下大概的分子可能构象,或者给一个靠谱的计算输入。
但是做完整的基于动力学的构象搜索又比较耗时,所以尝试写一个简单程序快速的进行构象筛选原理是利用rdkit的EDKDG方法生成一大批初始构象,然后调用MMFF94力场进行优化和能量计算,然后进行能量和结构RMSD的去重,最后进行排序和玻尔兹曼分布计算,得到可能性大于1%的所有构象。


声明:该方法只是快速的大致看可能的分子构象,如果需要高精度的分子构象MMFF94是不够用的。
经过测试,100个原子以内的分子基本上都能找到比较靠谱的构象。

这是程序界面,只需要输入smiles,可以自定义初始生成构象,也可以程序默认,因为是快速检索一下,所以限定了最多2000个。
然后自动计算完后输入保存名词就可以导出结果到文件夹中,保存为.xyz文件。
据课题组同门要求,顺手计算了一下分子直径和体积,还顺手输出了.html文件可以直接点开查看一下3D结果,效果如下。


下载地址:构象搜索工具


评分 Rate

参与人数
Participants 8
eV +31 收起 理由
Reason
Nakoooo + 4 谢谢
AxiEJohn + 1 好物!
fffmmmzck + 1 好物!
dreamyeye + 5 好物!
北大-陶豫 + 5 好物!
zsu007 + 5 赞!
qlyfe + 5 好物!
wal + 5 GJ!

查看全部评分 View all ratings

410

帖子

5

威望

1638

eV
积分
2148

Level 5 (御坂)

鸩羽

2#
发表于 Post on 2025-4-30 07:58:15 | 只看该作者 Only view this author
好东西 我正寻思写一个这样的玩意
某不知名实验组从苞米地里长出来的计算选手

389

帖子

1

威望

4824

eV
积分
5233

Level 6 (一方通行)

3#
发表于 Post on 2025-4-30 10:06:12 | 只看该作者 Only view this author
把XTB打包进去?

13

帖子

0

威望

330

eV
积分
343

Level 3 能力者

4#
 楼主 Author| 发表于 Post on 2025-4-30 10:24:40 | 只看该作者 Only view this author
exity 发表于 2025-4-30 10:06
把XTB打包进去?

好主意,之后可以打包一个基于xtb动力学的构象搜索程序。这个就是快速检索一下,普通笔记本也能算的很快

8

帖子

0

威望

210

eV
积分
218

Level 3 能力者

5#
发表于 Post on 2025-5-15 10:20:55 | 只看该作者 Only view this author
期待更新!

3

帖子

0

威望

47

eV
积分
50

Level 2 能力者

6#
发表于 Post on 2025-5-15 17:29:28 | 只看该作者 Only view this author
给楼主点赞,工作原因,之前试过类似方法做构象生成,提醒下在力场精度下算玻尔兹量分布意义不大,力场本身的误差会在计算构象分布时被进一步放大,可能导致优势构象被错误排除,当时我们做的时候在力场阶段只排除相对能量非常高的构象,其它的都会进入下一轮;另外,如果分子自由度大(可旋转二面角比较多),ETKDG可以提供合理的初始构象,但不能保证覆盖低能构象(它毕竟是一种随机方法),有这方面需求的可能需要(联合)使用其它构象生成方法

3

帖子

0

威望

77

eV
积分
80

Level 2 能力者

7#
发表于 Post on 2025-6-7 12:18:20 | 只看该作者 Only view this author
楼主你好,我上传smiles结构680个原子 程序显示警告时间过长,,此时程序是否还能正常运行

410

帖子

5

威望

1638

eV
积分
2148

Level 5 (御坂)

鸩羽

8#
发表于 Post on 2025-6-7 15:08:45 | 只看该作者 Only view this author
tcntcn 发表于 2025-6-7 12:18
楼主你好,我上传smiles结构680个原子 程序显示警告时间过长,,此时程序是否还能正常运行

够呛 我搜123个原子的结构 4个小时没出来 感觉适合做小一些的
某不知名实验组从苞米地里长出来的计算选手

601

帖子

1

威望

4776

eV
积分
5397

Level 6 (一方通行)

9#
发表于 Post on 2025-6-9 14:06:22 | 只看该作者 Only view this author
楼主这个程序非常好,但是似乎去重这步的时间太长了。可能可以优化一下去重的算法?首先只比较能量相近的结构是否相同,然后可以计算分子的转动惯量矩阵,对角化之后得到转动主轴和相应的转动惯量,转动惯量明显不同的不需要比较,转动惯量相同的可以先把转动主轴对齐。这样应该可以快很多吧。
现代化学以狄拉克的一句“一切化学问题业已解决”为嚆矢。滥觞于经验主义传统的期望正失去它们的借鉴意义。但面对看似不可达的通往天堂之阶梯,我想循伍德沃德“最好的模型是你底物的对映异构体”的信仰好过过早地振翮。
我们怀揣热忱的灵魂天然被赋予对第一性的追求,不屑于单一坐标的约束,钟情于势能面彼端的芬芳。但

13

帖子

0

威望

330

eV
积分
343

Level 3 能力者

10#
 楼主 Author| 发表于 Post on 2025-6-12 20:49:07 | 只看该作者 Only view this author
tcntcn 发表于 2025-6-7 12:18
楼主你好,我上传smiles结构680个原子 程序显示警告时间过长,,此时程序是否还能正常运行

680个原子确实太多了。。。现在这个方法没办法做这么大分子量的,680个原子的感觉光生成构象都很慢。要不你只生成几个构象大概看看

13

帖子

0

威望

330

eV
积分
343

Level 3 能力者

11#
 楼主 Author| 发表于 Post on 2025-6-12 20:51:10 | 只看该作者 Only view this author
wal 发表于 2025-6-7 15:08
够呛 我搜123个原子的结构 4个小时没出来 感觉适合做小一些的

原子数一多就慢了。所以生成初始构象数量那里设置了自定义,可以少生成一些。因为原子数一多这个方法就不能完全覆盖构象了,所以也只能参考一下。

13

帖子

0

威望

330

eV
积分
343

Level 3 能力者

12#
 楼主 Author| 发表于 Post on 2025-6-12 20:54:21 | 只看该作者 Only view this author
daemonice 发表于 2025-5-15 17:29
给楼主点赞,工作原因,之前试过类似方法做构象生成,提醒下在力场精度下算玻尔兹量分布意义不大,力场本身 ...

是的,所以现在这个程序只是大致做一个参考,因为不吃计算资源,主要是方便计算输入的。高精度的构象搜索这个做不到。最近在尝试结合动力学和一些机器学习势来做,之后有空的时候看看能不能打包一个比较完整的构象搜索程序,但是可能就得上服务器跑了。

13

帖子

0

威望

330

eV
积分
343

Level 3 能力者

13#
 楼主 Author| 发表于 Post on 2025-6-12 21:07:42 | 只看该作者 Only view this author
北大-陶豫 发表于 2025-6-9 14:06
楼主这个程序非常好,但是似乎去重这步的时间太长了。可能可以优化一下去重的算法?首先只比较能量相近的结 ...

这个程序的去重是比较0.5Kcal/mol内的构象,然后比较RMSD,阈值0.5A,现在调用的Allchem的模块。现在主要是尝试结合了一些机器学习势的算法加速高精度的构象优化和能量计算,后续有空的时候可能打包一个结合动力学的构象搜索。不过我也是属于半吊子,边学边干。怎么加速计算还可以研究研究。

2

帖子

0

威望

105

eV
积分
107

Level 2 能力者

14#
发表于 Post on 2025-6-29 13:06:05 | 只看该作者 Only view this author
楼主你好,我近期在做构象搜索时发现耗时会增加很多,60原子数生成200个构象,在去重步骤上用时一个晚上都没有结束,此前并未出现这个情况,想请教一下楼主是什么原因?

本版积分规则 Credits rule

手机版 Mobile version|北京科音自然科学研究中心 Beijing Kein Research Center for Natural Sciences|京公网安备 11010502035419号|计算化学公社 — 北京科音旗下高水平计算化学交流论坛 ( 京ICP备14038949号-1 )|网站地图

GMT+8, 2025-8-13 07:20 , Processed in 0.168724 second(s), 24 queries , Gzip On.

快速回复 返回顶部 返回列表 Return to list