计算化学公社

标题: 并行计算溶剂可及表面积(SASA)的VMD脚本sasa-dmp.tcl [打印本页]

作者
Author:
ene    时间: 2020-2-14 18:47
标题: 并行计算溶剂可及表面积(SASA)的VMD脚本sasa-dmp.tcl
本帖最后由 ene 于 2020-3-2 12:13 编辑

        2020.03.02更新:sasa-dmp-v1.1.tcl,可在6楼下载。无特殊情况请使用最新版。
        楼主最近在研究中用到了溶剂可及表面积(SASA)来对分子特征进行一些表征,但同时也发现,利用自写的Tcl脚本结合VMD计算SASA时,只能做串行计算,体系稍微大一些或者轨迹稍微长一些时计算起来简直是龟速……因此楼主开始考虑能不能把Tcl脚本中的计算过程做并行化。因为普通的Tcl解释器只能利用一个cpu核心进行计算,所以如果需要解释器进行并行计算,必须借助Tcl扩展包进行实现,例如使用Thread库:https://wiki.tcl-lang.org/page/Tcl+and+threads。但是使用这个库有前提,也就是Tcl解释器在进行编译时必须打开多线程支持(在configure时加入--enable-threads选项)。不巧的是VMD内置的Tcl解释器并没有启动这一选项,导致VMD根本没法使用Thread库(没尝试直接源码编译VMD,或许通过改源码的方式可以实现启动多线程支持)。(楼主千辛万苦编译好Thread库,在VMD console里面输入package require Thread时却只得到一条报错:Tcl core wasn't compiled for threading。f**k VMD)
        无奈之下楼主又在VMD mail list中搜索了相关信息,结果发现了一封邮件里面提到可以在后台启动多个VMD进行来实现并行化计算:https://www.ks.uiuc.edu/Research/vmd/mailing_list/vmd-l/19665.html。这种方法很脏,看起来也比较难做线程间的通信,但是由于SASA计算的特点是每计算一个结构时,并不依赖上一个结构的结果,所以这种方法可能正合用。
        然后楼主就写出了sasa-dmp.tcl脚本,可以在这里下载。需要注意的是楼主没在windows下面测试过,linux系统下可用:
(, 下载次数 Times of downloads: 95)
        脚本的思路很简单:首先根据要使用的核心数量,将模拟轨迹切割成相应多的小片段,再在后台启动相应多的VMD进程,每个进程计算一段轨迹的SASA,最后汇总各个进程的结果。这样就实现了并行化的计算。脚本中的参数分别如下:
  1. vmdexec:你的vmd可执行文件名称,也就是在终端输入这个命令,可以启动VMD。(VMD安装好后的默认命令貌似是run_vmd_tmp)
  2. dcdfile:轨迹文件
  3. psffile:结构文件
  4. nproc:并行使用的核心数
  5. outfile:输出文件名
  6. select1:要计算SASA的结构,而且必须是完整的,例如all and protein
  7. select2:应该被定义为由select1选中的结构的一部分,在计算中会只计算这部分的SASA
  8. srad:探针半径(建议使用默认值1.4)
  9. freq:每间隔多少帧计算一次
复制代码

关于select1和select2的关系可以参考sob老师的ppt,select2就是-restrict后面的部分:
(, 下载次数 Times of downloads: 59)
最后附上用于串行计算SASA的普通脚本sasa.tcl:
(, 下载次数 Times of downloads: 141)
作者
Author:
naoki    时间: 2020-2-14 20:45
很强,mark一下。顺便请教下楼主zeo++如何并行计算,以及sob的电子版ppt是怎么得到的
作者
Author:
snljty    时间: 2020-2-14 21:01
naoki 发表于 2020-2-14 20:45
很强,mark一下。顺便请教下楼主zeo++如何并行计算,以及sob的电子版ppt是怎么得到的

卢老师以前好像发过这张图
作者
Author:
ene    时间: 2020-2-14 21:12
naoki 发表于 2020-2-14 20:45
很强,mark一下。顺便请教下楼主zeo++如何并行计算,以及sob的电子版ppt是怎么得到的

zeo++是啥啊,以及这张图是以前sob老师回复我帖子里面的内容
作者
Author:
exity    时间: 2020-2-21 16:41
强!!!!
作者
Author:
ene    时间: 2020-3-2 12:09
本帖最后由 ene 于 2020-3-2 12:19 编辑

今日更新:sasa-dmp-v1.1.tcl
修复了轨迹总帧数不能被核心数整除时会丢掉几帧的bug,加入了usecatdcd选项,对于大轨迹,在可以使用CatDCD插件进行轨迹分割,从而避免了轨迹过大时内存不够的问题。新参数如下:
  1. set usecatdcd on     # 是否使用catdcd (on/off)
  2. set catdcdexe catdcd # catdcd 可执行文件名称。如果你的VMD版本大于1.9.3,这一项可以设置为:$env(VMDDIR)/plugins/LINUXAMD64/bin/catdcd5.2/catdcd。如不使用catdcd可以保持默认值
复制代码
从此版本开始,vmdexec参数被改为vmdexe,定义与原先相同。
(, 下载次数 Times of downloads: 88)





欢迎光临 计算化学公社 (http://bbs.keinsci.com/) Powered by Discuz! X3.3