计算化学公社
标题:
怎么写关于从文件中搜索结构并删去重复结构的shell脚本
[打印本页]
作者Author:
lyfchem
时间:
2017-4-19 19:46
标题:
怎么写关于从文件中搜索结构并删去重复结构的shell脚本
各位老师,就是我一个sdf文件 里面有多个分子 但是有的分子有多个重复的结构 我想通过脚本 把重复的结构都找到 只保留第一个分子的结构 其余都删掉 并且其余没有重复的结构按照原来的顺序不变和保留,请问怎么实现啊
作者Author:
sobereva
时间:
2017-4-19 21:42
具体怎么实现、怎么写看你喜欢用什么语言
基本过程就是先把每个分子的坐标部分读进去,然后计算其每一对原子间距离并且进行排序,构成一个数组。然后对每个分子都这样构建数组,之后比较每个分子之间的这个数组,差异小于一定阈值就认为是相同的(这个也正是molclus程序里的gentor判断结构相似程度的方式)。最终就知道哪些分子是唯一的了,之后把sdf文件中那些唯一的分子对应的字段输出到新文件里即可。
作者Author:
ggdh
时间:
2017-4-21 11:43
本帖最后由 ggdh 于 2017-4-21 12:12 编辑
不太确定你是要消除重复构象。还是消除重复的化学结构?如果是后者,用
babel input.sdf unique.sdf --unique
如果是前者,除了sob提供的办法之外,用macromodel的redundant conformer elimination也行。
欢迎光临 计算化学公社 (http://bbs.keinsci.com/)
Powered by Discuz! X3.3