计算化学公社

标题: MDAnalysis编码出错 [打印本页]

作者
Author:
Jam_    时间: 2022-11-8 18:15
标题: MDAnalysis编码出错
请问各位老师,我在使用MDAnalysis调用Universe函数时候出现gbk编码错误,请问这是什么原因产生的?应该怎么解决
我从网上获得一些解决方法,但是都不管用:1.使用encoding = 'utf-8',2.使用notepad++进行编码转换


作者
Author:
Jam_    时间: 2022-11-8 18:16
(, 下载次数 Times of downloads: 25) (, 下载次数 Times of downloads: 25)
作者
Author:
laoman    时间: 2022-11-8 18:23
Jam_ 发表于 2022-11-8 18:16

一个可以在Linux尝试的命令是 dos2unix *.top
而且这里提示7565行出问题了,你检查一下top的7565行,是不是有什么特殊符号?
作者
Author:
Jam_    时间: 2022-11-8 18:29
laoman 发表于 2022-11-8 18:23
一个可以在Linux尝试的命令是 dos2unix *.top
而且这里提示7565行出问题了,你检查一下top的7565行,是 ...

谢谢回答,刚试了您的方法,把top文件转换了下,还是没能解决这个问题
我的文件没有7565行,总字数也不错160多。我把用到的trr和top附上,麻烦您帮我看看
作者
Author:
Jam_    时间: 2022-11-8 18:33
(, 下载次数 Times of downloads: 1)
不好意思,trr文件太大了,上传不了
这里有top应该也能测试
作者
Author:
Frozen-Penguin    时间: 2022-11-8 18:58
Jam_ 发表于 2022-11-8 18:29
谢谢回答,刚试了您的方法,把top文件转换了下,还是没能解决这个问题
我的文件没有7565行,总字数也不 ...

这里说的7565行应该指的是考虑所有#include的情况,所以只有top文件不一定能看出来问题在哪里,可以考虑用tpr和trr文件,这样可能更方便,mda.Universe('abc.tpr','abc.trr')
作者
Author:
laoman    时间: 2022-11-8 19:06
你这个是在top里面nclude了其他top/itp文件,没法检查include的文件。grompp有-pp选项,可以把所有参数到提取到一个top(大概几千到几万行)文件。你用那个top文件再试试吧

作者
Author:
Jam_    时间: 2022-11-8 21:49
本帖最后由 Jam_ 于 2022-11-8 21:52 编辑

(, 下载次数 Times of downloads: 12)
@laoman 老师,我用了你的方法把所有include放在一起,然后运行程序,还是会出错,我找到具体位置,私以为和别的字符没什么区别
(, 下载次数 Times of downloads: 31)
作者
Author:
Jam_    时间: 2022-11-8 21:53
@Frozen-Penguin 老师,我使用你的方法,不知道为什么程序没有结果输出
(, 下载次数 Times of downloads: 25)
(, 下载次数 Times of downloads: 29)
作者
Author:
laoman    时间: 2022-11-8 23:53
Jam_ 发表于 2022-11-8 21:49
@laoman 老师,我用了你的方法把所有include放在一起,然后运行程序,还是会出错,我找到具体位置,私以 ...

你的topol文件有25301个原子,我随便找了个相同原子的pdb来当轨迹,可以正常读取。gbk编码涉及中文路径或者中文字符以及标点符号之类的。你再仔细检查一下吧。
(, 下载次数 Times of downloads: 32)
(在ipython中先运行了import MDAnalysis as mda)


作者
Author:
Jam_    时间: 2022-11-9 09:23
laoman 发表于 2022-11-8 23:53
你的topol文件有25301个原子,我随便找了个相同原子的pdb来当轨迹,可以正常读取。gbk编码涉及中文路径或 ...

谢谢老师,我昨晚试了别的方法,用tpr代替top文件配合trr生成轨迹,已经解决了
(top = 'mdd.tpr'
trj = 'md.trr'
sys = mda.Universe(top, trj, topology_format='TPR', format='XTC')

我也认为我的top文件出问题了,position 283应该代表是283个字符,但是我认真检查了第283个字符(是TAB键)和别的TAB没什么区别,很是奇怪
作者
Author:
Jam_    时间: 2022-11-9 09:24
Frozen-Penguin 发表于 2022-11-8 18:58
这里说的7565行应该指的是考虑所有#include的情况,所以只有top文件不一定能看出来问题在哪里,可以考虑 ...

谢谢老师,昨晚我认真检查了代码,用您的方法生成了最终结果




欢迎光临 计算化学公社 (http://bbs.keinsci.com/) Powered by Discuz! X3.3