计算化学公社

 找回密码 Forget password
 注册 Register
楼主 Author: sjkcn
打印 Print 上一主题 Last thread 下一主题 Next thread

[算法与编程] 如何使用rdkit正确产生高斯坐标

[复制链接 Copy URL]

465

帖子

1

威望

2318

eV
积分
2803

Level 5 (御坂)

16#
发表于 Post on 2025-6-4 10:12:03 | 只看该作者 Only view this author
sjkcn 发表于 2025-6-4 09:32
pip show rdkit
Name: rdkit
Version: 2024.9.6

之前有个搞高通量计算的人说过,实际操作中上了规模后,总有约5%~10%的比例会出问题。你要走通流程的话,相当一部分力气会花在处理异常情况上。

你可以直接把write_xyz_file这个函数修改成写高斯输入文件的函数。如果对python不是太熟悉的话,先让DeepSeek或Gemini来改,然后自己再对代码做出一些调整。

227

帖子

6

威望

1712

eV
积分
2059

Level 5 (御坂)

17#
发表于 Post on 2025-6-4 10:17:52 | 只看该作者 Only view this author
本帖最后由 wxyhgk 于 2025-6-4 10:19 编辑

这个根本就实现不了,除非你针对你自己特定的一系列物质做了优化,否则根本就是实现不了的事情。

稍微复杂一点的就不行了,例如含有刚性结构,链稍微长一点的就不行了

SMILES 本身就没有三维信息,上哪去生成坐标

19

帖子

0

威望

29

eV
积分
48

Level 2 能力者

18#
 楼主 Author| 发表于 Post on 2025-6-4 10:36:46 | 只看该作者 Only view this author
wxyhgk 发表于 2025-6-4 10:17
这个根本就实现不了,除非你针对你自己特定的一系列物质做了优化,否则根本就是实现不了的事情。

稍微复 ...

smiles二维的,在chemdraw显示的很好,但是在转换成三维的过程中确实有不少问题,这个我承认。那么,我看到有文章先用rdkit reactions smarts 生成了新的smiles。然后进行计算。假如你单个的,还可以优化下,但是数据量一大就不行了。一个个检查,忙不过来的。刚性结构比如DBCO TCO这种大环。即便我smiles定义好了顺反要求,确实输出不好,这个我发现了。

227

帖子

6

威望

1712

eV
积分
2059

Level 5 (御坂)

19#
发表于 Post on 2025-6-4 10:45:52 | 只看该作者 Only view this author
sjkcn 发表于 2025-6-4 10:36
smiles二维的,在chemdraw显示的很好,但是在转换成三维的过程中确实有不少问题,这个我承认。那么,我看 ...

chemdraw 是专门做了 SMILES 的优化的,你用开源的试试看?

文章里面的都是些简单东西,根本没有实际用处,我做工业化的,很清楚,我最近也在研究这些,他们这些都是扯淡

410

帖子

5

威望

1630

eV
积分
2140

Level 5 (御坂)

鸩羽

20#
发表于 Post on 2025-6-4 10:54:23 | 只看该作者 Only view this author
sjkcn 发表于 2025-6-4 10:36
smiles二维的,在chemdraw显示的很好,但是在转换成三维的过程中确实有不少问题,这个我承认。那么,我看 ...

我室友做ML的 也是RDkit批量生成 听他说这种数据后面还要做清洗
我也没听太明白 听起来像是要用脚本来判断他想研究的特征结构有没有被力场胡搞 如果乱了就肃反掉
某不知名实验组从苞米地里长出来的计算选手

19

帖子

0

威望

29

eV
积分
48

Level 2 能力者

21#
 楼主 Author| 发表于 Post on 2025-6-4 11:06:22 | 只看该作者 Only view this author
wal 发表于 2025-6-4 10:54
我室友做ML的 也是RDkit批量生成 听他说这种数据后面还要做清洗
我也没听太明白 听起来像是要用脚本来判 ...

我只希望用保守的方式生成,就可以了。至于forcefield那些设置啥的,我又不是专门做这块,我的目的只是希望计算能生成合适的坐标。基本的键长、二面角不太离谱就可以了

19

帖子

0

威望

29

eV
积分
48

Level 2 能力者

22#
 楼主 Author| 发表于 Post on 2025-6-4 11:08:55 | 只看该作者 Only view this author
Daniel_Arndt 发表于 2025-6-4 10:12
之前有个搞高通量计算的人说过,实际操作中上了规模后,总有约5%~10%的比例会出问题。你要走通流程的话, ...

我已经做了很多次了。当时原先是想电荷和自旋多重度都要让代码跑,后面算了,自己手动确认,因为有些结构相似的,自己在文件命名中是清楚的。另外,代码上,我也用不同的GPT,感觉claude想的try except比较多。其他的不太行,deepseek经常你懂的问题。

19

帖子

0

威望

29

eV
积分
48

Level 2 能力者

23#
 楼主 Author| 发表于 Post on 2025-6-4 11:10:19 | 只看该作者 Only view this author
wxyhgk 发表于 2025-6-4 10:45
chemdraw 是专门做了 SMILES 的优化的,你用开源的试试看?

文章里面的都是些简单东西,根本没有实际 ...

我是一个小白,那么就您的看法而言,现在用什么方法比较稳妥呢? 工业界是一般怎么做呢?

410

帖子

5

威望

1630

eV
积分
2140

Level 5 (御坂)

鸩羽

24#
发表于 Post on 2025-6-4 12:18:18 | 只看该作者 Only view this author
sjkcn 发表于 2025-6-4 11:06
我只希望用保守的方式生成,就可以了。至于forcefield那些设置啥的,我又不是专门做这块,我的目的只是希 ...

用"只是"来形容一项极其复杂的任务并不能使其实际上变简单

评分 Rate

参与人数
Participants 1
eV +1 收起 理由
Reason
Uus/pMeC6H4-/キ + 1 233333

查看全部评分 View all ratings

某不知名实验组从苞米地里长出来的计算选手

227

帖子

6

威望

1712

eV
积分
2059

Level 5 (御坂)

25#
发表于 Post on 2025-6-4 21:02:26 | 只看该作者 Only view this author
sjkcn 发表于 2025-6-4 11:10
我是一个小白,那么就您的看法而言,现在用什么方法比较稳妥呢? 工业界是一般怎么做呢?

目前没有解决办法,论文都是吹牛的,计算化学找个构象都得搞半天,你一个缺少三维信息的 SMILES 怎么可能成功?从原理上就搞不了好吧

19

帖子

0

威望

29

eV
积分
48

Level 2 能力者

26#
 楼主 Author| 发表于 Post on 2025-6-4 21:14:55 | 只看该作者 Only view this author
wxyhgk 发表于 2025-6-4 21:02
目前没有解决办法,论文都是吹牛的,计算化学找个构象都得搞半天,你一个缺少三维信息的 SMILES 怎么可能 ...

既然这样,开发这种力场和算法的都是无用功咯。不是所有结构都有X-ray的表征。三维信息微观水平本身就是一个假想。基于现有的条件去算去解释,应该说搞了也不一定准。是这样吗?

8

帖子

0

威望

361

eV
积分
369

Level 3 能力者

27#
发表于 Post on 2025-6-4 22:02:42 | 只看该作者 Only view this author
sjkcn 发表于 2025-6-4 11:06
我只希望用保守的方式生成,就可以了。至于forcefield那些设置啥的,我又不是专门做这块,我的目的只是希 ...

最近一直在做类似的事情,我目前的经验是:对于一些常见的有机化合物(成键方式没有太离谱,也不包含金属配位键之类的),可以用RDKit解析SMILES,生成包含包含原子三维坐标信息和键连关系的mol/mol2文件,再用xtb调用GFN-FF力场(避免键的断裂)进行快速的结构优化,同时也会输出优化后结构的mol文件,这时候的坐标、键长、二面角等参数基本是比较合理的

19

帖子

0

威望

29

eV
积分
48

Level 2 能力者

28#
 楼主 Author| 发表于 Post on 2025-6-5 09:58:34 | 只看该作者 Only view this author
Peng14 发表于 2025-6-4 22:02
最近一直在做类似的事情,我目前的经验是:对于一些常见的有机化合物(成键方式没有太离谱,也不包含金属 ...

xtb我不是很熟悉,rdkit用的针对大环张力效果不是很好。我一直有一个疑问,对于力场优化。是不是类似药物小分子在受体的结合那种力的计算啊

227

帖子

6

威望

1712

eV
积分
2059

Level 5 (御坂)

29#
发表于 Post on 2025-6-5 10:14:23 | 只看该作者 Only view this author
Peng14 发表于 2025-6-4 22:02
最近一直在做类似的事情,我目前的经验是:对于一些常见的有机化合物(成键方式没有太离谱,也不包含金属 ...

你这种都是些小分子/简单分子完全达不到工业化的标准,发论文吹吹牛还行,一用到实际就不行了

880

帖子

3

威望

1662

eV
积分
2602

Level 5 (御坂)

傻傻的木瓜

30#
发表于 Post on 2025-6-5 11:07:32 | 只看该作者 Only view this author
wxyhgk 发表于 2025-6-5 10:14
你这种都是些小分子/简单分子完全达不到工业化的标准,发论文吹吹牛还行,一用到实际就不行了

复读半天差不多得了,敢问可有哪怕半点建设性的、可重复的切实提议?工业化能赚钱就是清高就是了不起哦,指指点点这么多连搞简单小体系的科研努力都要否定(注意这不代表我就不反感学术界灌水的行为),除了逞口舌之快毫无意义(流汗黄豆)想反驳我随意,我不会浪费时间跟进的。

√546=23.36664289109

本版积分规则 Credits rule

手机版 Mobile version|北京科音自然科学研究中心 Beijing Kein Research Center for Natural Sciences|京公网安备 11010502035419号|计算化学公社 — 北京科音旗下高水平计算化学交流论坛 ( 京ICP备14038949号-1 )|网站地图

GMT+8, 2025-8-12 17:48 , Processed in 0.215940 second(s), 21 queries , Gzip On.

快速回复 返回顶部 返回列表 Return to list