计算化学公社

 找回密码 Forget password
 注册 Register
Views: 9428|回复 Reply: 2
打印 Print 上一主题 Last thread 下一主题 Next thread

[程序/脚本开发] 怎么写关于从文件中搜索结构并删去重复结构的shell脚本

[复制链接 Copy URL]

93

帖子

0

威望

5308

eV
积分
5401

Level 6 (一方通行)

跳转到指定楼层 Go to specific reply
楼主
各位老师,就是我一个sdf文件 里面有多个分子 但是有的分子有多个重复的结构 我想通过脚本 把重复的结构都找到 只保留第一个分子的结构  其余都删掉 并且其余没有重复的结构按照原来的顺序不变和保留,请问怎么实现啊

6_molecules.sdf

36.04 KB, 下载次数 Times of downloads: 11

树欲静而风不止

6万

帖子

99

威望

5万

eV
积分
120109

管理员

公社社长

2#
发表于 Post on 2017-4-19 21:42:47 | 只看该作者 Only view this author
具体怎么实现、怎么写看你喜欢用什么语言
基本过程就是先把每个分子的坐标部分读进去,然后计算其每一对原子间距离并且进行排序,构成一个数组。然后对每个分子都这样构建数组,之后比较每个分子之间的这个数组,差异小于一定阈值就认为是相同的(这个也正是molclus程序里的gentor判断结构相似程度的方式)。最终就知道哪些分子是唯一的了,之后把sdf文件中那些唯一的分子对应的字段输出到新文件里即可。
北京科音自然科学研究中心http://www.keinsci.com)致力于计算化学的发展和传播,长期开办极高质量的各种计算化学类培训:初级量子化学培训班中级量子化学培训班高级量子化学培训班量子化学波函数分析与Multiwfn程序培训班分子动力学与GROMACS培训班CP2K第一性原理计算培训班,内容介绍以及往届资料购买请点击相应链接查看。这些培训是计算化学从零快速入门以及进一步全面系统性提升研究水平的高速路!培训各种常见问题见《北京科音办的培训班FAQ》
欢迎加入北京科音微信公众号获取北京科音培训的最新消息,并避免错过网上有价值的计算化学文章!
欢迎加入人气极高、专业性特别强的理论与计算化学综合交流群思想家公社QQ群(群号见此链接),合计达一万多人。北京科音培训班的学员在群中可申请VIP头衔,提问将得到群主Sobereva的最优先解答。
思想家公社的门口Blog:http://sobereva.com(发布大量原创计算化学相关博文)
Multiwfn主页:http://sobereva.com/multiwfn(十分强大、极为流行的量子化学波函数分析程序)
Google Scholar:https://scholar.google.com/citations?user=tiKE0qkAAAAJ
ResearchGate:https://www.researchgate.net/profile/Tian_Lu

908

帖子

37

威望

5435

eV
积分
7083

Level 6 (一方通行)

3#
发表于 Post on 2017-4-21 11:43:54 | 只看该作者 Only view this author
本帖最后由 ggdh 于 2017-4-21 12:12 编辑

不太确定你是要消除重复构象。还是消除重复的化学结构?如果是后者,用
babel input.sdf unique.sdf --unique
如果是前者,除了sob提供的办法之外,用macromodel的redundant conformer elimination也行。

评分 Rate

参与人数
Participants 1
eV +1 收起 理由
Reason
sobereva + 1

查看全部评分 View all ratings

本版积分规则 Credits rule

手机版 Mobile version|北京科音自然科学研究中心 Beijing Kein Research Center for Natural Sciences|京公网安备 11010502035419号|计算化学公社 — 北京科音旗下高水平计算化学交流论坛 ( 京ICP备14038949号-1 )|网站地图

GMT+8, 2025-8-14 14:17 , Processed in 0.180258 second(s), 26 queries , Gzip On.

快速回复 返回顶部 返回列表 Return to list