计算化学公社
标题: chatGPT辅助生成molclus懒人脚本:一键完成对复杂天然产物NMR和ECD计算 [打印本页]
作者Author: 欢乐多 时间: 2023-11-11 11:03
标题: chatGPT辅助生成molclus懒人脚本:一键完成对复杂天然产物NMR和ECD计算
本帖最后由 欢乐多 于 2025-4-22 11:33 编辑
chatGPT辅助生成molclus懒人脚本:一键完成对复杂天然产物NMR和ECD计算
前言
复杂天然产物往往需要进行NMR和ECD的计算,由于多数天然产物专业人员量子化学计算机操作能力有限,所以NMR和ECD的计算困难重重。为了便于计算,尽量减少计算操作,笔者在chatGPT的帮助下,设计了一套计算复杂天然产物NMR和ECD的脚本,脚本经历多次修改和测试,终于实现了一键计算操作,此脚本能自动处理计算结果,计算完成后直接获得NMR和ECD结果,因此拿出来与诸位先进朋友分享交流,还请多多指教,批评指正。
本脚本及其配套的相关输入文件主要是在前人基础进行再次修改和创作,在使用本脚本进行科学研究,研究结果发表时,如若能正确引用,笔者将万分感激!
注:脚本在2025年3月进行了更新,简单的介绍请看
(, 下载次数 Times of downloads: 63)
,视频介绍请B站《Molclus懒人脚本:一键完成复杂天然产物 NMR 和ECD 计算》,直接使用可以去更新的部分,更加方便。
1. molclus懒人脚本简介
2. 脚本的依赖程序
脚本依赖Molclus 1.12,xtb -191025及crest功能,Gaussian 16 A03,ORCA 5.04 ,Shermo 2.4,Multiwfn 3.8 (dev) 等程序,在运行脚本前确保服务器中能使用这些程序。这些程序的安装及使用可参考社长大人Sobereva老师的相关博文:
以上软件可正常使用,最好将软件的路径加入系统环境变量,以达到输入软件名就可直接启动软件,准备完毕,就可启动脚本了,该脚本即是压缩包里00autorunall.sh,即是一个简单的Shell命令的组合,在CentOS 7.6和CentOS Stream 9中均可正常运行。
3. 首次使用需要的设定
脚本依赖的程序可正常使用后。
- 将本压缩包解压,进入该目录,赋予执行权限
- unzip molclus112.zip
- cd molclus112
- chmod +x *
复制代码
- 给解压之后的目录文件中,提供一个输入文件traj.xyz,如果未提供traj.xyz文件将会出现错误提示coord file does not exit。(脚本在2025年3月进行了更新,不再需要提供原始的traj.xyz文件,更新的6molclus112中放入由Chemdraw3D 保存的.pdb格式的结构,比如004rs.pdb,此外还需要放入ECD实验得到的.csv文件和实验的碳谱数据.txt,比如004rs_nmr.txt和004rs.csv,便于计算后的数据分析。)
- 修改00autorunall.sh中第27行,37行中xtb程序crest在本机中的实际绝对路径,例子中为:/root/soft/xtb/crest
- 修改05_set.ini中第15行,orca在本机中的实际路径,例子为:orca_path= "/root/soft/orca504/orca"
- (脚本在2025年3月进行了更新,已不需要手动修改,脚本自动识别甲基编号)修改09_H01_nmr.txt,09_H02_nmr.txt,09_H03_nmr.txt中第9-18行的相关甲基或次甲基的编号,比如例子结构甲基氢编号为45-47,36-38,39-41,24-26,30-32,编号上一个命令10为Multiwfn屏蔽效应平均化的功能选项,所以第9-18行输为以下:
(, 下载次数 Times of downloads: 69)
- 10
- 45-47
- 10
- 36-38
- 10
- 39-41
- 10
- 24-26
- 10
- 30-32
复制代码- 如果系统有发邮件功能,将脚本最后一行“echo " Normal termination of " | mail -s "MASTER complete " tttt@163.com”中邮箱部分,换成自己的邮箱,计算完成会发邮件提示。如何给系统安装发邮件功能,感兴趣者可自行Google。
- 准备就已经完成了。接着就是一行命令./00autorunall.sh即可获得NMR和ECD结果。如需要放进后台运行,输入命令nohup ./00autorunall.sh &> output.txt &,计算结束还会有邮件提示。
4. 脚本的计算流程
为了便于管理,笔者将脚本的计算流程分为10步:
4.1 构象搜索
使用Gentor, Spartn, XTB, Gromacs等均可,主要为脚本开始计算提供traj.xyz文件。压缩包中含一个例子的traj.xyz,请替换为自己的构象搜索结果文件。笔者《Windows系统Gromacs进行分子动力学构象搜索》的B站视频及计算化学论坛的博文中提到如何在Windows系统中用Gromacs进行分子动力学搜索,并产生traj.xyz。 有三个原因推荐用Gromacs的分子动力学的方法进行构象搜索。1,在NMR和ECD的计算中,能量最低的构象,或者接近能量最低的构象非常关键,如果没有找到或者找到的构象不接近实际实验中分子的构象或在自然界中可能存在的构象,那么之后步骤再高明的计算,再高精度的基组和泛函的计算,都会存在不容忽视的误差,因此,强烈推荐用分子动力学方法进行构象搜索,特别是含有环状体系的分子,因为分子动力学方法能够搜索到环的船椅式构象,而非分子动力学方法几乎连普通6元环船椅式构象都不能搜索到,根本不能指望出现多元环的环状构象的变化。比如,一个普通的共轭芳香分子,11和20位羰基并不在一个平面上,理论上共轭芳香环存在至少两种构象,结构如下:
(, 下载次数 Times of downloads: 51)
(, 下载次数 Times of downloads: 56)
分子动力学构象搜索,可以搜索到多种芳香环的构象,下图是用VMD对齐显示出1-1000个构象的叠加图,11和20位的羰基出现多次的上下摆动,如下:
(, 下载次数 Times of downloads: 51)
另外通过这种叠加图的显示,我们也可以清楚的知道,构象搜索是否充分,如果我们发现侧链上下不对称,侧链只在环的一面摆动,那么构象搜索就不充分,一般这种情况很少发生。
而非分子动力学只是对侧链可旋转的键进行搜索,并不能对共轭大芳香环进行构象搜索,下图是用VMD对齐显示出1-1000个构象的叠加图,可以看到,侧链搜索比较充分,环的上下都有出现,而共轭芳香环构象并没有发生该有的变化,如下:
(, 下载次数 Times of downloads: 59)
2,分子动力学构象搜索可以用XTB,Gromacs,Amber等;3,笔者推荐Gromacs,易安装,易用,关键一个字“快”。
4.2 XTB 快速优化
产生初始能量由低到高排列稳定的构象,为Gaussian进一步优化提供可靠的输入文件。注意,首次使用请修改脚本中crest 的路径为本机的实际路径。crest为XTB中的一个辅助插件,当安装好XTB程序后,还需要下载相应版本的crest.tgz插件,解压后,赋予权限,可以放到XTB文件夹中。在使用中需要输入crest的实际绝对路径,比如脚本的路径在/root/soft/xtb/crest。
4.3 对上步中前15个能量最低的构象调佣Gaussian进行精确耗时的优化
如果不想做任何修改,本脚本默认设置数量为15,15基本不会漏掉搜索到的能量最低的构像,熟悉Molclus程序者可以自由调节03_set.ini中参数。计算结束后,并会输出能量由低到高排列的文件0003_output.xyz。压缩包中含有以下几个本步计算所需的文件,如果需要可自行调节相关参数。
03_set.ini
03_tem1.gjf
03_tem2.gjf
03_tem3.gjf
4.4 对0003_output.xyz进行振动分析
排除虚频的结构,得到0004_input.xyz 和能量由低到高排列的0004_output.xyz。压缩包中含有以下几个本步计算所需的文件:
04_set.ini
04_tem.gjf
4.5 调用ORCA
用较高级别的基组和泛函计算单点能。压缩包中含有以下几个本步计算所需的文件:
05_set.ini
05_tem.inp
注意,首次使用,需要修改05_set.ini中orca的路径
4.6 计算0004_input.xyz文件中所有构象的NMR
由于NMR相对不耗时,而复杂天然产物的NMR往往也不是一种泛函和基组就能确定的,所以选用三组基组和泛函对所有构象NMR进行计算,以便选取与实验结果比较接近的结果。以下文件是本步计算所需:
06_set_nmr.ini
06_tem01_nmr.gjf
06_tem02_nmr.gjf
06_tem03_nmr.gjf
4.7 计算0004_input.xyz文件中前5个构象的ECD
由于ECD较为耗时,在以往计算经验中发现第6之后的构象占比在1%以下,对整体ECD图谱影响甚微,所以选择前五个。确保我们选择了主要的构象之后,我们又选用三套基组和泛函对前5个构象的ECD进行计算,以便选取与实验结果比较接近的结果。以下文件是本步计算所需:
07_set_ecd.ini
07_tem01_ecd.gjf
07_tem02_ecd.gjf
07_tem03_ecd.gjf
4.8 Shermo计算Bloztmann比例
首先脚本会自动创建Shermo的输入文件0008_sher01_input.txt,文件第一列是寻找当前目录振动分析结果文件004_freq_gau*.out,第二例是orca计算结果的单点能。0008_sher02_input.txt是前五个构象的信息。结果输出为,前15个构象的Bloztmann比例0008_re_sher01rate.txt和前5个构象的比例0008_sher02_input.txt
4.9 Multiwfn处理得到权重之后的NMR结果
首先脚本会自动生成0009_nmr01_rate.txt文件,第一列是NMR的Gaussian计算结果文件,第二列是由Shermo计算的Bloztmann比例。
此步计算涉及以下文件,
09_C01_nmr.txt
09_C02_nmr.txt
09_C03_nmr.txt
09_H01_nmr.txt
09_H02_nmr.txt
09_H03_nmr.txt
熟悉Multiwfn的人会知道,以上文件就是Multiwfn的输入命令,由于链上C-C单键可以自由旋转,一般实验所得的甲基或有的次甲基的氢化学位移是一样的,而计算中对于一个特定构象上的三个氢化学位移不一样,为了与实验接近,需要对相应的氢进行平均化,因此需要设定09_H01_nmr.txt,09_H02_nmr.txt,09_H03_nmr.txt文件中相应的氢的编号。
由三套基组和泛函因此生成三个Multiwfn输入文件0009_nmr01_rate.txt,0009_nmr02_rate.txt,0009_nmr03_rate.txt。
此步计算结束,会有相应的三组权重之后H NMR和C NMR结果。
0009_HNMRdata01.txt 0009_CNMRdata01.txt
0009_HNMRdata02.txt 0009_CNMRdata02.txt
0009_HNMRdata03.txt 0009_CNMRdata03.txt
4.10 Multiwfn处理得到权重之后的ECD结果
首先脚本会自动生成00010_ecd01_rate.txt文件,第一列是Gaussian计算ECD结果文件,第二列是由Shermo计算的前五个构象的Bloztmann比例。如有需要可适当调节如下文件的相关参数:
10_ecd01.txt
10_ecd02.txt
10_ecd03.txt
由三套基组和泛函因此生成三个Multiwfn输入文件00010_ecd01_rate.txt,00010_ecd01_rate.txt,00010_ecd01_rate.txt。
此步计算结束,会有相应的三组权重之后ECD结果。
00010_dislin01.png 00010_spectrum01_curve.txt 00010_curveall01.txt
00010_dislin02.png 00010_spectrum02_curve.txt 00010_curveall02.txt
00010_dislin03.png 00010_spectrum03_curve.txt 00010_curveall03.txt
计算完成之后,进行实验图谱与计算图谱的拟合,参考B站视频,一般实验图谱是.csv格式的数据,笔者以前使用origin进行拟合,目前有了chatgpt之后,改用python中matlab功能进行数据分析,脚本是
(, 下载次数 Times of downloads: 8)
,更加方便。具体如下,将实验数据改名为*.csv, 比如名字是511rr.csv, 511sr.csv, 当前目录如果有511rr_traj.xyz,511sr_traj.xyz,运行脚本
(, 下载次数 Times of downloads: 7)
,就会产生拟合图谱:
(, 下载次数 Times of downloads: 59)
可根据需要调节10_ecd01.txt,10_ecd02.txt,10_ecd03.txt,sim_ecd.py中的参数,首次用sim_ecd.py时,需要修改
首行:#!/root/soft/anaconda3/envs/tjenv/bin/python(自己python的路径,笔者用的conda;若改脚本在window系统中使用,该行为空)
11行:def normalize_y(data, column_name='Y', scale=10): 10为纵坐标的高度,
66行 :data1 = data1.iloc[35:445](意思是提取实验数据35行-445行),
134行: input_folder = r"/root/6molclus112/"(改为自己目录的实际路径)。
最后,在10step文件中还有每一步的.sh文件,可以分别对每一步进行运算。在molclus112目录中还有一个01.sh脚本,还可将每步命令放入其中,分步测试。
脚本还保留了.pbs文件的部分命令行,如果使用openpbs作业提交管理功能,只需将00autorunall.sh 修改为00autorunall.pbs,并修改其中的节点就可使用。
5. 总结
对于该脚本00autorunall.sh 中每一行的含义,感兴趣者可以输入到chatGPT中去了解命令的具体含义,同时也可以按照自己需要进行适当修改和改进。
6. 更新提示
2025年3月,在使用的过程中持续的对脚本进行更新,文件12M,将文件拆开上传
(, 下载次数 Times of downloads: 17)
和
(, 下载次数 Times of downloads: 14)
,下载后在Linux中合并这两个压缩包cat 6molclus112_part_aa 6molclus112_part_ab > 6molclus112.zip,就可以正常解压。 如果网站下载出现问题,可以百度网盘下载
通过网盘分享的文件:6molclus112_202503sample.zip
更新的脚本如下:
6molclus112中放入由Chemdraw3D 保存的.pdb格式的结构,比如004rs.pdb,此外还需要放入ECD实验得到的.csv文件和实验的碳谱数据.txt,比如004rs_nmr.txt和004rs.csv,以便于对计算结果与实验结果进行分析,碳谱数据按照SVM方法的对比原理,对碳谱的实验值和计算值的相似度进行打分。脚本最明显的更新是可以直接得到发表文章和演讲展示所需要的图表、图片和数据。
脚本的整个运行过程包括:动力学构象搜索——xtb优化——gaussian 优化和振动分析——orca计算单点能——gaussian计算NMR和ECD——Multiwfn 和python脚本结合进行实验和计算值的比对——给出高清的3D结构图和ECD对比图——各个构象的能量和权重比例Excel——各个构象XYZ分子坐标word文档。最终结果可以直接放在PPT、文章或者支持材料部分,非常方便。如果有其他需求,理解脚本中的命令后,可以灵活调节。
使用这个更新的脚本之前,需要安装sobtop、acanda、obabel、python、Gromacs、vmd、ImageMagick等程序,DeepSeek非常有助于指导我们安装和使用这些程序。
仔细检查以上程序可用,就可开始计算了。
首选运行./11cal_nmr_ecd.sh这个脚本,脚本大体计算流程如下:obabel对004rs.pdb转换成004rs.mol2——sobtop计算电荷,为Gromacs准备动力学搜索文件——Gromacs动力学模拟搜索构象——VMD 提取搜索轨迹到004rs_traj.xzy——接下来进行优化等计算……..,计算完成,我们还会收到邮件提醒,会得到如下图文件。
(, 下载次数 Times of downloads: 58)
上图是计算任务完成的高斯及相关文件
计算任务完成后,进行提取和分析数据,运行./12ana_nmr.sh,主要是提取三组基组泛函的NMR数据,我们可以进行DP4+的碳谱对比,确定分子相对构型。
(, 下载次数 Times of downloads: 55)
上图是提取的计算NMR数据,有碳谱化学位移值和屏蔽常数值
(, 下载次数 Times of downloads: 54)
上图是提取的是word格式的xyz文件
(, 下载次数 Times of downloads: 57)
上图是提取的各个构象能量及权重
运行./13ana_ecd.sh,提取ECD实验和计算图谱的对比结果,各个构象的三维结构图,并保存到PPT中,我们可以打开PPT非常方便的浏览多个分子的三种基组泛函和实验的对比图,当我们有多个化合物时这个脚本用起来就相当的丝滑和优雅。
(, 下载次数 Times of downloads: 53)
上图是提取到PPT中的实验和计算ECD对比图及结构图
(, 下载次数 Times of downloads: 53)
上图是高清的3D结构图
运行./14ana_svm.sh,将实验的碳谱和计算的碳谱用SVM的对比方法打分,与DP4一样,辅助确定化合物的相对构型。
在使用过程中请注意这些脚本的路径问题,具体每个脚本的命令含义,DeepSeek讲解非常清楚。
欢迎使用2025年3月的更新,谢谢!!!!
下面的内容就是2024年对脚本做的优化过程,感兴趣这个脚本的发展经过的朋友可以了解一下:
依然保存原来版本molclus112,增加了一个新的版本6molclus112
(, 下载次数 Times of downloads: 48)
新版本6molclus112中:
6.1 增加了一个python脚本,能够自动提取提取分子中甲基氢编号,因此,不需要提供09_H01_nmr.txt,09_H02_nmr.txt,09_H03_nmr.txt,需要有一个只含有一个分子构象的名字为*_traj2.xyz的文件,比如2R4S_traj2.xyz,后缀名“_traj2.xyz”是必须的。并且更改09_H_nmrstat.py脚本中第一行为自己系统的python路径,比如笔者python3.7路径如下#!/usr/local/python37/bin/python3.7,如何安装并行系统自带python版本和python3.7,请自行谷歌搜索安装。
6.2 增加了一个for循环,天然产物中往往好几个相对构型需要计算,比如2S3R4R, 2S3S4S, 2R3R4S等(温馨提示,几个构型的原子编号最好一致,以供与实验对比,若编号不一致,提取化学位移与实验对比将会非常麻烦),加入for循环后,可将这些分子统统放进一个文件,脚本将进行逐个计算。因此需要有多个构象的 “*_traj.xyz”和只有一个构象的“*_traj2.xyz”,比如
511rr_traj.xyz
511rr_traj2.xyz
511sr_traj.xyz
511sr_traj2.xyz
在当前目录下,即6molclus112的目录下,如果只想获得NMR结果,运行./01_mol_nmr.sh,或者nohup ./01_mol_nmr.sh &
6.4 如果想获得NMR和ECD结果,运行./00_mol_nmrecd.sh 或者nohup ./00_mol_nmrecd.sh &
6.5 脚本增加了记录脚本运行时长,运行结束会将运行时间发送到邮箱进行提醒,这个功能是笔者的最爱,非常的方便。
6.6 注意脚本./01_mol_nmr.sh 中第222行:
- head -n 3 "${base_name}_08_sher00_input.txt" > "${base_name}_08_sher01_input.txt"
复制代码数字3需要与文件06_set_nmr.ini中第二行计算NMR构象ngeom= 3的数字一致,请根据计算机的繁忙程度自行调节,如果需要快速获得结果的话,可以选3,如果想保险一些,计算资源非常充足,可用7, 10等。此外,如果NMR和ECD计算完成后,若发现Gaussian正常完成,而分布比例有问题,或未能成功产生权重的结果,检查错误出现的位置,比如./01_mol_nmr.sh 中第222行数字与实际的06_set_nmr.ini数字不一样,相应修改后,可单独运行./002_shermo.sh。
6.7 增加了一个python脚本dp4.py,提取*_09_*NMRdata*.txt中权重之后的最终结果到excel, 这样可以一次获得每个构型的最终的化学位移及屏蔽常数。使用python脚本还需要安装一些数据库,如下:
- python -m pip install numpy pandas
- python -m pip install xlsxwriter
- python -m pip install Workbook
- python -m pip install numpy
- python -m pip install pandas
- python -m pip install glob
- python -m pip install openpyxl
复制代码
6.8 增加了一个python脚本nmrstat.py和shell脚本004_motosvm.sh,提供一个实验获得的C谱数据exp.txt,运行./004_motosvm.sh将会给出每个构型与实验的差异,判断是哪个构型。该nmrstat.py来自于SVM-M计算NMR方法。
提取码:qcl0
6.10 每次运行molclus程序时,该程序都会检查当前文件的.out,并删除,所以最新的6molcus112脚本多了一步将产生的out转变log的命令,以避开molclus的清理.out作业,相应的Multiwfn需要识别当前目录的.log文件,初始版本molclus112没有相关命令,因此建议使用较新6molclus112相关脚本。
最后,感谢中科院第一海洋研究所崔博士好友设计完成的09_H_nmrstat.py脚本,此外该脚本还得到其他很多人的帮助和支持,在此表示真诚的感谢!
本文中相关脚本及其配套的输入文件主要是在前人基础进行再次修改和创作,在使用它进行科学研究,研究结果发表时,如若能正确引用,笔者将万分感激!
由于本人非计算机出身,才疏学浅,脚本中难免有错误,请各位多多指教,谢谢大家!
作者Author: kimariyb 时间: 2023-11-12 20:48
楼主有试试文献中的结构不
作者Author: 欢乐多 时间: 2023-11-13 04:52
先算的自己的结构,文献结构值得一试
作者Author: Acee 时间: 2023-11-13 10:45
第五步可以用用gaussian算吗,为什么这一步不用gaussian要用orca
作者Author: 欢乐多 时间: 2023-11-13 11:00
用相同基组和泛函,特别是高精度的,显然ORCA更快。
当然您习惯用Gaussian,完全可以修改一下,调用Gaussian算单点能。
作者Author: abdoman 时间: 2023-11-14 14:45
第一步生成初始构象集的时候,想知道比如 常见软件里面包含的MMFF94, gromacs 或者xtb里面的动力学(瑞德西韦的例子) 生成构象。
这个该如何确保初始构象够全呢? 长的模拟时长,高温度?
作者Author: abdoman 时间: 2023-11-14 14:49
第三步 “如果不想做任何修改,本脚本默认设置数量为15",
这个地方还不如 基于xtb的计算结果,用isostat 进行聚类,玻尔兹曼分布,找出代表性的构象,再高精度计算。
这样肯定没有15个构型。计算量少。
作者Author: 欢乐多 时间: 2023-11-14 15:12
本帖最后由 欢乐多 于 2023-11-14 15:32 编辑
如果时间充足,喜欢折腾,使用三种构象搜索软件,比如spartan,shcordiner, xtb, gromacs, tinker等,将他们的构象合并,统一计算,就不怕构象不全面了。
如果不想折腾,较高温度,多跑一些时间,获得2000-3000个构象就行。
温度选择看分子,有的200k 或300k就跑散架了,有的2000 K还能跑不散,需要自己去尝试哈,跑上两三个分子就有经验了。
我自己常做的如下
1,用Gromacs在300, 1000,2000K分别跑100个构象,普通笔记本,一般几分钟就完成了
2,如果2000、1000k跑散了,再试300,500,800k
3, 若800不散,用800k跑出2000个构象
作者Author: 欢乐多 时间: 2023-11-14 15:14
就是xtb优化后,再次isostat聚类的cluster的结果脚本里很清楚
作者Author: 星纹c 时间: 2023-11-14 19:34
好物,自己也曾经编过这东西,当然了,目的也不一样,你是为了给外行一键操作,我是为了方便点。这些意见可能对达成你的目的没啥用
首先就是,crest好像有点bug,所以导致我没敢用,不知道现在怎么样了;
其次,有些模块最好独立出来,集成太好也不见得好,因为会报错,就比如几何优化不收敛,加完帮助收敛的关键词后,总不能又从头开始算。再者,多少个构象算是够,也不见得就15个,有些体系一看就俩仨,根本没必要,有些柔性的,之能说,根据算力量力而行吧
最后,关键词最好能分出个文件专门存,这些脚本好久才看一次,如果遇到要改溶剂、自旋多重度啥的,真是改的头大
漏了一点,算出的波函数文件最好收集一下,不然如果有后续分析需求,又要重新算
作者Author: 欢乐多 时间: 2023-11-15 03:29
非常感谢您中肯的建议,如果在使用的过程中感觉别扭,不顺当的话,将进一步修改,并对脚本进行更新。
本脚本可以自由调节,按需调节更改,灵活性极高,在压缩包10steps文件夹中有各步独立运行命令。
对于模板文件,如果需要完全可以自己设置,非常方便。
波函数的话,完全可以稍微设定.ini的文件就可实现。
作者Author: 星纹c 时间: 2023-11-15 16:02
模块那块是我没注意到还有分块的,乱提意见了。
关键词模块说的跟你不是一回事,我说的是最好把所有要调节的东西放一块。我的个人经历是,大多数人还是能看懂常见的输入文件,但是不敢直接修改程序,对编程有恐惧感。就比如有时候要算高自旋的分子,他们不敢改程序,但是要是给个配置文件,就写:
电荷 : xxx
自旋多重度 yyy
脚本运行的时候从这里读取,他们就敢修改了,而且xtb里的参数貌似不是自旋多重度,而是单电子数还是怎么样,好像是Nα-Nβ,可以跟自旋多重度换算,好久没用了我也迷糊了。如果这些设置直接放在一个专门用于调节的文件里,怎么换算就用程序封装好,我就算迷糊也能用
而且专门的调节文件的另一个优势是可以把一些参数以注释的形式放进去,就比如溶剂如何缩写之类的。
你这个好像是投超算的吧,对于组里自己有服务器,但是没有任务队列系统的,设置使用核心数也是一大问题,每次修改也很费事。
至于波函数,配置文件里的默认的只会保留gau00001.chk这种形式,如果一次运行好几个搜索,那么说不定会覆盖,就算不覆盖也搞不清哪个是哪个,最好是用脚本生成一个命名的文件夹,把文件改名之后放进去,名字就从最开始的输入的XXXX.xyz文件名里截取
等我找完工作可能会自己改一改这个, 我一开始学的shell,后来为了找工作改用python,麻烦之处在于,如果shell学太深我觉得亏,可是用python操作Linux有点麻烦,自然不如原生的shell。希望早日能闲下来
作者Author: 欢乐多 时间: 2023-11-16 01:51
好的,兄弟,您有空的话帮忙更新一下子吧
非常感谢您的建议
作者Author: fdjkein_13 时间: 2023-12-7 15:54
挺实用的小工具,感谢楼主分享。ECD部分参照相应的方法改一下,应该也能用于算荧光磷光一类的光谱吧?有机会准备自己试试。
作者Author: 欢乐多 时间: 2023-12-8 01:42
可以,替换一下模版文件中的关键词即可。
欢迎使用!
作者Author: wlgwhr 时间: 2024-2-1 10:36
Representative geometry of each cluster along with their energies have been outputted to cluster.xyz in current folder
Temperature for calculating Boltzmann distribution: 350.00 K
# 1 Count: 2 Ratio: 67.68%
# 2 Count: 2 Ratio: 31.96%
# 3 Count: 1 Ratio: 0.27%
# 4 Count: 7 Ratio: 0.06%
# 5 Count: 3 Ratio: 0.02%
mv: cannot stat '04_tem.gjf': No such file or directory
Molclus: A flexible program for searching cluster configurations and molecular conformations
Molclus official website: http://www.keinsci.com/research/molclus.html
Developed by Tian Lu (sobereva@sina.com) Last update: 2023-Aug-23
Beijing Kein Research Center for Natural Sciences (http://www.keinsci.com)
P-L-E-A-S-E properly cite this code as mentioned in the official site
Inputted trajectory file: 0003_output.xyz
Loading basic information from the inputted trajectory file ...
There are totally 5 geometries in the inputted trajectory file
Setting file: 04_set.ini
Loading setting file ...
Program to be invoked: Gaussian
Task: Frequency
forrtl: No such file or directory
forrtl: severe (29): file not found, unit 12, file /home/ubuntu/molclus112/template.gjf
Image PC Routine Line Source
molclus 000000000041DBEB Unknown Unknown Unknown
molclus 00000000004383E0 Unknown Unknown Unknown
molclus 0000000000412689 Unknown Unknown Unknown
molclus 0000000000407A0D Unknown Unknown Unknown
molclus 0000000000404422 Unknown Unknown Unknown
libc-2.31.so 000014B8410F5083 __libc_start_main Unknown Unknown
molclus 0000000000404329 Unknown Unknown Unknown
mv: cannot stat 'template.gjf': No such file or directory
Command of invoking isostat:
./isostat isomers.xyz -Nout 50 -Eout 10.0 -Edis 0.5 -Gdis 0.2 -T 350 -nt 24
Isostat: A statistical analysis tool for a batch of isomers (64 bit)
Released as a component of Molclus, last update of isostat: 2022-May-28
Developed by Tian Lu, contact: sobereva@sina.com
Beijing Kein Research Center for Natural Sciences (http://www.keinsci.com)
Error: Unable to find isomers.xyz
mv: cannot stat 'cluster.xyz': No such file or directory
mv: cannot stat 'isomers.xyz': No such file or directory
ls: cannot access 'gau00*.out': No such file or directory
Molclus: A flexible program for searching cluster configurations and molecular conformations
Molclus official website: http://www.keinsci.com/research/molclus.html
Developed by Tian Lu (sobereva@sina.com) Last update: 2023-Aug-23
Beijing Kein Research Center for Natural Sciences (http://www.keinsci.com)
P-L-E-A-S-E properly cite this code as mentioned in the official site
Trajectory file 0004_input.xyz cannot be found
版主我看了半天也没看出来哪里的问题,看样子是载入template.gjf文件出了问题,版主可以帮忙看一下如何解决嘛,不胜感激!
作者Author: 欢乐多 时间: 2024-2-2 09:10
wlgwhr 发表于 2024-2-1 10:36
Representative geometry of each cluster along with their energies have been outputted to cluster.xyz ...
mv: cannot stat '04_tem.gjf': No such file or directory.
缺少这个文件
作者Author: herbertsun 时间: 2024-2-8 09:49
Optimizing all 1 structures of file traj.xyz
forrtl: severe (122): invalid attempt to assign into a pointer that is not associated
Image PC Routine Line Source
crest 00000000007454D8 crest_restartlog_ 399 restartlog.f90
crest 000000000073FC40 crest_restartlog_ 86 restartlog.f90
crest 0000000000517B1D crest_oloop_ 213 parallel.f90
crest 00000000004CEBAC crest_ensemble_op 229 optimization.f90
crest 000000000040425E MAIN__ 241 crest_main.f90
crest 000000000040334D Unknown Unknown Unknown
crest 00000000026279A0 Unknown Unknown Unknown
crest 000000000040322E Unknown Unknown Unknown
Command of invoking isostat:
./isostat crest_ensemble.xyz -Edis 0.5 -Gdis 0.2 -T 350 -nt 24
Isostat: A statistical analysis tool for a batch of isomers (64 bit)
Released as a component of Molclus, last update of isostat: 2022-May-28
Developed by Tian Lu, contact: sobereva@sina.com
Beijing Kein Research Center for Natural Sciences (http://www.keinsci.com)
Error: Unable to find crest_ensemble.xyz
mv: cannot stat 'cluster.xyz': No such file or directory
Molclus: A flexible program for searching cluster configurations and molecular conformations
Molclus official website: http://www.keinsci.com/research/molclus.html
Developed by Tian Lu (sobereva@sina.com) Last update: 2023-Aug-23
Beijing Kein Research Center for Natural Sciences (http://www.keinsci.com)
P-L-E-A-S-E properly cite this code as mentioned in the official site
Trajectory file as_02_gfn2.xyz cannot be found
Input the path of trajectory file, e.g. /K-ON/Akiyama_MIO.xyz
版主,这个是什么问题呢?
作者Author: 欢乐多 时间: 2024-2-8 10:31
crest_ensemble.xyz这个文件没有,或者这个文件太大了,结构太多,isostat处理不过来
作者Author: Jpzzz 时间: 2024-4-2 16:18
想请问一下楼主如果是超算提交作业(slurm管理系统),是不是可以直接修改10step文件夹里面的.sh文件然后按照顺序提交作业就行
作者Author: wzkchem5 时间: 2024-4-2 19:31
报这个错,应该是CREST的bug。正常来说,即使因为用户输入文件写错了,或者文件格式有其他的问题,导致出现这种野指针的问题,程序也有义务在出现野指针问题之前明确告诉用户哪里写错了,并报错退出,无论如何不应该继续执行程序直到真的遇到野指针。
如果你用的CREST不是最新版的话,升级到最新版;如果已经是最新版了,那么建议去CREST的github页面报bug
作者Author: 欢乐多 时间: 2024-4-3 10:00
4振动分析、5单点能、NMR和ECD输入文件都是用的3优化的结果输出文件,3的输入文件是2的快速优化的结果,具体你可以试一试吧,molculs不能同时运行这几步,只能一步完成再进行下一步。具体啥情况,可以试一试。
作者Author: niduhz 时间: 2024-5-9 12:35
本帖最后由 niduhz 于 2024-5-9 15:11 编辑
Energy and geometry of all successful configurations have been collectively outputted to isomers.xyz in current folder.
In this file, the value after "Frame:" is the frame index in the isomers.xyz, "Step:" is the step number in this time of molclus execution, "Geom:" is geometry index in the inputted trajectory file
grep: 6R_05_sp_orca00*.out: No such file or directory
Shermo: A general code for calculating molecular thermochemistry properties
Version 2.6 Release date: 2024-Feb-11
Developer: Tian Lu (sobereva@sina.com)
Beijing Kein Research Center for Natural Sciences (http://www.keinsci.com)
Official website: http://sobereva.com/soft/shermo
**** If this code is utilized in your work, PLEASE CITE following paper ****
Tian Lu, Qinxue Chen, Shermo: A general code for calculating molecular thermodynamic properties, Comput. Theor. Chem., 1200, 113249 (2021) DOI: 10.1016/j.comptc.2021.113249
Loading running parameters from settings.ini...
Running parameters:
Printing individual contribution of vibration modes: No
Temperature: 298.150 K
Pressure: 1.000 atm
Scale factor of vibrational frequencies for ZPE: 1.0000
Scale factor of vibrational frequencies for U(T)-U(0): 1.0000
Scale factor of vibrational frequencies for S(T): 1.0000
Scale factor of vibrational frequencies for CV: 1.0000
Low frequencies treatment: Grimme's interpolation for entropy
Vibrational frequency threshold used in the interpolation is 100.00 cm^-1
Error: Unable to find /home/test123/calculation/6molclus112/6R_04_freq_gau00*.out
Press ENTER button to exit program
想问下楼主为什么我直接使用这个脚本时产生的6R_xx_xxxx_gau00*.out会被删掉(报错是找不到(尝试重新计算频率时发现算好的nmr和ecd文件又被删掉了,想问下是为什么
经过测试好像是每一步开始的时候这些输出文件会被删掉,看了一眼脚本代码也没发现什么可能会删掉这些文件的部分(搞不懂
作者Author: 欢乐多 时间: 2024-5-9 23:45
本帖最后由 欢乐多 于 2024-5-9 08:01 编辑
niduhz 发表于 2024-5-8 20:35
Energy and geometry of all successful configurations have been collectively outputted to isomers.xyz ...
这是molclus程序删掉的,每次运行前都会检查当前文件的.out,并删除,所以最新的6molcus112脚本多了一步将产生的out转变log,以避开molclus的清理作业。
作者Author: niduhz 时间: 2024-5-10 14:37
明白了,感谢感谢,但是看起来只有度盘链接那个例子里面的6molclus112做了这个更改,感觉楼主可以更新一下附件里的版本(?
作者Author: 欢乐多 时间: 2024-5-11 04:28
好的
作者Author: chinchilla 时间: 2024-10-11 15:51
我把NMR计算那段注释掉,只计算ECD可以吗
作者Author: 欢乐多 时间: 2024-10-12 02:40
可以的
作者Author: chinchilla 时间: 2024-10-12 13:39
感谢!
作者Author: Duoo 时间: 2024-10-19 15:12
请问TJ老师,这个流程的第三步,优化结构似乎没有带溶剂么?但是溶剂对于结构优化不是也影响挺大的么?如果我们NMR和ECD测试的溶剂不一样的情况下是不是需要修改第三步分别用两个溶剂去优化构象供后续调用呢?
另外请问各位老师如果是在超算集群上进行工作的话,如何修改配置以增加应用上述程序时的计算速度呢?我尝试增加节点数目,但是似乎没有变化.
#SBATCH --nodes=1 #增加到10计算时间没有变化
#SBATCH --ntasks-per-node=16
作者Author: 欢乐多 时间: 2024-10-26 06:08
您好,
如果优化需要带溶剂可以加上相应溶剂;
溶剂是否影响很大,这要看具体的分子结构,有些分子加上溶剂优化后的变化不是很大,有些很大;我的经验,溶剂没有初始构象的影响大,初始构象是关键,因此构象搜索更加重要;
Gaussian的计算速度是需要设置运行的核数,有两种途径,加入到关键词或改变Gaussian的default设置;
你们计算节点我也不是很了解,我之前用的是,一个节点中有几百核可用,如果用户太多,有些任务会暂停;一个节点任务太多,提交任务可换其他节点。
谢谢
作者Author: Newbee_Ccc 时间: 2025-4-3 10:20
感谢博主,非常感谢分享,也还是想请教下,一般小分子化合物,1000k,2000个conformer,基本上也能涵盖能量最低构象了吧?
作者Author: wzkchem5 时间: 2025-4-3 10:22
“一般小分子化合物”太宽泛
我前段时间搜六正丁基二锡的构象,6kcal/mol以内有几万个
作者Author: 欢乐多 时间: 2025-4-4 02:21
用Gromacs动力学进行构象搜索,如果温度合适,应该可以。所以本脚本中提供了3个不同温度下的构象搜索,选择合适的温度,基本可以满足。
作者Author: 欢乐多 时间: 2025-4-4 02:22
如果用XTB优化后还有几万个,这种情况天然产物还没出现过。
| 欢迎光临 计算化学公社 (http://bbs.keinsci.com/) |
Powered by Discuz! X3.3 |