计算化学公社

标题: 用orca_2mkl处理omol25数据库中的gbw文件出现问题 [打印本页]

作者
Author:
dfghjk    时间: 2025-11-25 21:50
标题: 用orca_2mkl处理omol25数据库中的gbw文件出现问题
本帖最后由 dfghjk 于 2025-11-26 10:49 编辑

最近刚接触orca,想要用orca_2mkl处理omol25数据库中数据的gbw文件(geom_orca6的geom_100004943_0_1,图上的是low_spin_23的),然后就报错gbw文件的版本太旧了。今天试了orca6.1.0和5.0.1,都不可以。然后用6.1.0,在inp文件开头加了一行!RESCUE!,再跑了一遍,后续可以用orca_2mkl转换成modern文件。没放到服务器上跑,重跑一个用了27分钟,但是下载的数据有十万多,全部重跑不太现实,也还没确定是不是每个都这样。请问一下有什么解决办法吗?

作者
Author:
Uus/pMeC6H4-/キ    时间: 2025-11-25 22:08
是从https://huggingface.co/facebook/OMol25/tree/main下载的数据集文件么?分享ORCA的.gbw文件就和分享Gaussian的.chk文件一样离谱,毕竟.gbw是ORCA私有二进制文件且不同版本对应不同格式,开发者在论坛表示过表示不希望用户乱碰.gbw文件,而应当用新版ORCA的json接口来导出导入波函数信息。
https://orcaforum.kofo.mpg.de/vi ... &hilit=gbw+json
https://orcaforum.kofo.mpg.de/vi ... &hilit=gbw+json
这么大的问题或许联系原文作者是最合适的,看论坛里有没有关系硬的大佬去沟通了……
作者
Author:
sobereva    时间: 2025-11-26 06:34
那叫molden文件不叫modern文件
这种事直接问数据库的维护者问用的是ORCA什么版本,或者找发表这个数据库的原文(包括补充材料)看是什么版本算的,没必要自己折腾。非要自己鼓捣,就把ORCA从4开始到目前最新版本每一个小版本都凑齐了挨个试
作者
Author:
dfghjk    时间: 2025-11-26 10:53
Uus/pMeC6H4-/キ 发表于 2025-11-25 22:08
是从https://huggingface.co/facebook/OMol25/tree/main下载的数据集文件么?分享ORCA的.gbw文件就和分享Ga ...

谢谢,sob老师下面也说了去文章里找一找orca的版本,提到用的是6.0.0,我昨天用的6.1.0。再就是之前邮件联系数据库的负责人,给的我一个globus的链接,这个里面的内容和hugging face都是一样的吗
作者
Author:
Uus/pMeC6H4-/キ    时间: 2025-11-26 11:53
dfghjk 发表于 2025-11-26 10:53
谢谢,sob老师下面也说了去文章里找一找orca的版本,提到用的是6.0.0,我昨天用的6.1.0。再就是之前邮件 ...

这个链接是私密的不允许公开的吗?我看globus需要注册订阅才能访问,不像zenodo啊figshare啊github之类的开放下载,那我自然没法知道你看到的文件是什么样了。在hugging face放的应该是ai模型的检查点,不是训练集本身,我看错了。

话说下载该数据集是打算训练新的大模型么,这个数据规模哪怕是能顺利读取波函数文件也会花不少时间吧
作者
Author:
zjxitcc    时间: 2025-11-26 14:48
完全没有必要重跑。搞清楚/问清楚对方使用具体哪一个ORCA版本做的计算,自己用对应版本的orca_2mkl就行了。




欢迎光临 计算化学公社 (http://bbs.keinsci.com/) Powered by Discuz! X3.3