计算化学公社

 找回密码 Forget password
 注册 Register
Views: 6188|回复 Reply: 2

[蛋白质建模] 在本地运行RoseTTAFold和AlphaFold2

[复制链接 Copy URL]

15

帖子

1

威望

143

eV
积分
178

Level 3 能力者

发表于 Post on 2021-10-13 21:44:26 | 显示全部楼层 Show all |阅读模式 Reading model
本帖最后由 wendao 于 2021-10-18 16:05 编辑

本文介绍如何在本地GPU服务器上安装和使用RoseTTAFold和AlphaFold2。

我们的显卡是RTX2080ti,小一些的蛋白跑起来无压力但四五百的就可能会挂,最好有V100,A100显存10G以上多多益善。

如果没有GPU也不要紧,推荐ColabFold,*墙在谷歌的服务器上免费且快速进行结构预测,还可以进行很多复杂建模,感兴趣可以参考B站教程

下面是安装简介,首先要安装GPU驱动和CUDA,官方都推荐cuda11但我们测试cuda10也可以。

RoseTTAFold来自华盛顿大学David Baker(aka. 上帝之手)组,他们在看到alphafold2在CASP14的巨大成功之后,卧薪尝胆、师夷长技,最终在几个月的时间内破壁成功,开源了代表目前学界最高预测精度的结构预测3-track网络,成功整合一维序列(MSA),二维接触图谱,三维结构信息。

image.png

克隆代码库:
git clone git@github.com:RosettaCommons/RoseTTAFold.git
下载建立MSA用的数据库:
BFD:
https://bfd.mmseqs.com/bfd_metaclust_clu_complete_id30_c90_final_seq.sorted_opt.tar.gz
下载模板数据库:
https://files.ipd.uw.edu/pub/RoseTTAFold/pdb100_2021Mar03.tar.gz
下载预训练参数:
根据github上的说明自动建立conda环境即可,如果需要可能需要手动调整正确的cuda版本
运行这个脚本 (./install_dependencies.sh)安装需要的建库外部程序,不大,很快,如果需要也可以在scripts里的脚本中手动指定这些工具的路径。
最后在example文件夹中有完整pipeline的例子:
结构预测,简单的运行: ../run_[pyrosetta, e2e]_ver.sh input.fa。这里有pyrosetta和端到端两个版本。
复合物建模见 example/complex_modeling/README,先生成配对的msa再进行预测。

AlphaFold2来自谷歌deepmind团队,他们在围棋、游戏对战、蛋白折叠等领域一次次打破传统认知。这次他们更是开源了CASP14夺冠的程序代码,在多数target的结构预测的结果达到惊人的tmscore>90,被认为达到了实验解析的精度。为共享精神点赞。
克隆代码库:
下载建立MSA的数据库:
BFD和RoseTTAFold一样,其它几个用scripts文件中的脚本下就行,一两天的样子
建立conda虚拟环境:
conda create -n af2 python=3.8
conda activate af2
pip install -r requirements.txt
pip install tensorflow-gpu==2.3.0 #cuda101, 2.5.0 for cuda110, 2.0.0 for cuda100
pip install --upgrade jax==0.2.14 jaxlib==0.1.69+cuda101 -f https://storage.googleapis.com/jax-releases/jax_releases.html
#这里注意cuda版本和实际一致
conda install -c omnia pdbfixer
pip install mock
还需要打几个patch,更多细节参考:https://github.com/kalininalab/alphafold_non_docker

这两个程序运行最耗时的部分其实是msa的生成,但ColabFold提供了一套mmseq2的解决方案,可以不用本地数据库,直接调用网络api,在几分钟内得到和本地搜索类似的msa非常推荐。
除了可以在线colab上运行外,也可以参考这个repo在本地运行colabfold。













评分 Rate

参与人数
Participants 6
威望 +1 eV +25 收起 理由
Reason
pika02 + 5 GJ!
qczgzly + 5 好物!
DZW + 5
lonemen + 5 谢谢
ChrisZheng + 5 谢谢
sobereva + 1

查看全部评分 View all ratings

2

帖子

0

威望

582

eV
积分
584

Level 4 (黑子)

发表于 Post on 2021-10-14 12:20:18 | 显示全部楼层 Show all
RoseTTAFold和AlphaFold2 做同一段序列,结果差异很大,谁更可信?

15

帖子

1

威望

143

eV
积分
178

Level 3 能力者

 楼主 Author| 发表于 Post on 2021-10-14 13:46:23 | 显示全部楼层 Show all
arix 发表于 2021-10-14 12:20
RoseTTAFold和AlphaFold2 做同一段序列,结果差异很大,谁更可信?

你可以检查模板和MSA质量,同时两个软件都会给出自己对质量的估计如plddt,它自己知道自己预测的好不好。
整体上AlphaFold2表现要好一截。

本版积分规则 Credits rule

手机版 Mobile version|北京科音自然科学研究中心 Beijing Kein Research Center for Natural Sciences|京公网安备 11010502035419号|计算化学公社 — 北京科音旗下高水平计算化学交流论坛 ( 京ICP备14038949号-1 )|网站地图

GMT+8, 2023-2-2 23:09 , Processed in 0.403464 second(s), 25 queries .

快速回复 返回顶部 返回列表 Return to list