计算化学公社

 找回密码 Forget password
 注册 Register
Views: 13286|回复 Reply: 5
打印 Print 上一主题 Last thread 下一主题 Next thread

[蛋白质建模] 在本地运行RoseTTAFold和AlphaFold2

[复制链接 Copy URL]

17

帖子

1

威望

158

eV
积分
195

Level 3 能力者

本帖最后由 wendao 于 2021-10-18 16:05 编辑

本文介绍如何在本地GPU服务器上安装和使用RoseTTAFold和AlphaFold2。

我们的显卡是RTX2080ti,小一些的蛋白跑起来无压力但四五百的就可能会挂,最好有V100,A100显存10G以上多多益善。

如果没有GPU也不要紧,推荐ColabFold,*墙在谷歌的服务器上免费且快速进行结构预测,还可以进行很多复杂建模,感兴趣可以参考B站教程

下面是安装简介,首先要安装GPU驱动和CUDA,官方都推荐cuda11但我们测试cuda10也可以。

RoseTTAFold来自华盛顿大学David Baker(aka. 上帝之手)组,他们在看到alphafold2在CASP14的巨大成功之后,卧薪尝胆、师夷长技,最终在几个月的时间内破壁成功,开源了代表目前学界最高预测精度的结构预测3-track网络,成功整合一维序列(MSA),二维接触图谱,三维结构信息。


克隆代码库:
git clone git@github.com:RosettaCommons/RoseTTAFold.git
下载建立MSA用的数据库:
BFD:
https://bfd.mmseqs.com/bfd_metaclust_clu_complete_id30_c90_final_seq.sorted_opt.tar.gz
下载模板数据库:
https://files.ipd.uw.edu/pub/RoseTTAFold/pdb100_2021Mar03.tar.gz
下载预训练参数:
根据github上的说明自动建立conda环境即可,如果需要可能需要手动调整正确的cuda版本
运行这个脚本 (./install_dependencies.sh)安装需要的建库外部程序,不大,很快,如果需要也可以在scripts里的脚本中手动指定这些工具的路径。
最后在example文件夹中有完整pipeline的例子:
结构预测,简单的运行: ../run_[pyrosetta, e2e]_ver.sh input.fa。这里有pyrosetta和端到端两个版本。
复合物建模见 example/complex_modeling/README,先生成配对的msa再进行预测。

AlphaFold2来自谷歌deepmind团队,他们在围棋、游戏对战、蛋白折叠等领域一次次打破传统认知。这次他们更是开源了CASP14夺冠的程序代码,在多数target的结构预测的结果达到惊人的tmscore>90,被认为达到了实验解析的精度。为共享精神点赞。
克隆代码库:
下载建立MSA的数据库:
BFD和RoseTTAFold一样,其它几个用scripts文件中的脚本下就行,一两天的样子
建立conda虚拟环境:
conda create -n af2 python=3.8
conda activate af2
pip install -r requirements.txt
pip install tensorflow-gpu==2.3.0 #cuda101, 2.5.0 for cuda110, 2.0.0 for cuda100
pip install --upgrade jax==0.2.14 jaxlib==0.1.69+cuda101 -f https://storage.googleapis.com/jax-releases/jax_releases.html
#这里注意cuda版本和实际一致
conda install -c omnia pdbfixer
pip install mock
还需要打几个patch,更多细节参考:https://github.com/kalininalab/alphafold_non_docker

这两个程序运行最耗时的部分其实是msa的生成,但ColabFold提供了一套mmseq2的解决方案,可以不用本地数据库,直接调用网络api,在几分钟内得到和本地搜索类似的msa非常推荐。
除了可以在线colab上运行外,也可以参考这个repo在本地运行colabfold。













评分 Rate

参与人数
Participants 7
威望 +1 eV +30 收起 理由
Reason
mizu-bai + 5 好物!
pika02 + 5 GJ!
qczgzly + 5 好物!
DZW + 5
lonemen + 5 谢谢
ChrisZheng + 5 谢谢
sobereva + 1

查看全部评分 View all ratings

3

帖子

0

威望

1052

eV
积分
1055

Level 4 (黑子)

2#
发表于 Post on 2021-10-14 12:20:18 | 只看该作者 Only view this author
RoseTTAFold和AlphaFold2 做同一段序列,结果差异很大,谁更可信?

17

帖子

1

威望

158

eV
积分
195

Level 3 能力者

3#
 楼主 Author| 发表于 Post on 2021-10-14 13:46:23 | 只看该作者 Only view this author
arix 发表于 2021-10-14 12:20
RoseTTAFold和AlphaFold2 做同一段序列,结果差异很大,谁更可信?

你可以检查模板和MSA质量,同时两个软件都会给出自己对质量的估计如plddt,它自己知道自己预测的好不好。
整体上AlphaFold2表现要好一截。

18

帖子

0

威望

169

eV
积分
187

Level 3 能力者

4#
发表于 Post on 2023-9-20 14:05:00 | 只看该作者 Only view this author
请问localcolabfold有数据库吗

17

帖子

1

威望

158

eV
积分
195

Level 3 能力者

5#
 楼主 Author| 发表于 Post on 2023-10-16 16:25:56 | 只看该作者 Only view this author
yph 发表于 2023-9-20 14:05
请问localcolabfold有数据库吗

params是需要的,序列数据库不需要

2

帖子

0

威望

17

eV
积分
19

Level 1 能力者

6#
发表于 Post on 2023-11-8 21:25:40 | 只看该作者 Only view this author
请问大佬,我自己的单人工作站是1T的固态,4080的显卡,这个配置够整一个rosettafold本地版吗,如果不行的话我需要加点什么呢?

本版积分规则 Credits rule

手机版 Mobile version|北京科音自然科学研究中心 Beijing Kein Research Center for Natural Sciences|京公网安备 11010502035419号|计算化学公社 — 北京科音旗下高水平计算化学交流论坛 ( 京ICP备14038949号-1 )|网站地图

GMT+8, 2025-8-16 17:20 , Processed in 0.199321 second(s), 30 queries , Gzip On.

快速回复 返回顶部 返回列表 Return to list