计算化学公社

 找回密码 Forget password
 注册 Register
Views: 235|回复 Reply: 4
打印 Print 上一主题 Last thread 下一主题 Next thread

[综合交流] Ubuntu 下安装 NPVAE

[复制链接 Copy URL]

196

帖子

5

威望

1211

eV
积分
1507

Level 5 (御坂)

本帖最后由 wxyhgk 于 2024-9-18 17:11 编辑

最近在公司搞了下 NP-VAE 的安装,记录一下

NP-VAE 是一个 AI 工具,它帮助科学家设计新药物。它通过学习分子结构,可以创造并优化可能用于治疗疾病的新分子,加速寻找新药的过程。

测试平台:



更好的排版可以看我博客:https://wxyhgk.com/article/ubuntu-npvae-install

1. conda 环境的安装
1.1 访问 Anaconda 官方下载页面:

https://www.anaconda.com/download/success


针对 Linux x86_64 系统,使用以下链接下载安装脚本:

https://repo.anaconda.com/archive/Anaconda3-2024.06-1-Linux-x86_64.sh

使用 wget 命令获取 sh 文件
  1. wget https://repo.anaconda.com/archive/Anaconda3-2024.06-1-Linux-x86_64.sh
复制代码



1.2 安装过程

1. 运行以下命令以开始安装:

  1. bash Anaconda3-2024.06-1-Linux-x86_64.sh
复制代码


按照屏幕提示完成安装过程。


回车即可


用户协议
下方方向键,一直下滑

最后出现让你同意的文字,


输入 `yes` 然后回车


直接回车即可




输入 `yes` 即可,会自动配置好 conda 的环境变量


1.3 重新加载环境变量

安装完成后,可以选择关闭当前终端并重新打开一个新的终端窗口

或者根据你使用的 shell,执行以下相应命令使环境变量生效:

- 命令
    1. 对于 Bash 用户(大多数 Linux 系统默认):
      
  1. source ~/.bashrc
复制代码


    2. 对于 Zsh 用户(某些用户自定义的的):
  1. source ~/.zshrc
复制代码




2. NPVAE的安装

2.1 拉取项目

安装好 conda 环境后,我们拉取远程项目到本地

  1. git clone https://github.com/toshikiochiai/NPVAE
复制代码


2.1 创建 conda 环境

然后进入 env 文件夹

  1. cd  NPVAE/env
复制代码

接着在 env 文件夹中,使用预定义的环境配置文件来创建一个新的 conda 环境,此过程时间较长,主要取决于网速,会下载相应的 Python 包

  1. conda env create -f npvae_env.yml
复制代码






然后激活环境

  1. conda activate npvae_env
复制代码



注意:每次重新打开终端,这个环境都会消失,所以每次需要用的时候需要使用上面的代码进行激活

3. NPVAE 项目的运行测试

3.1 准备

根据 GitHub 项目我们需要在 NPVAE 根目录下面创建下面的文件夹

  1. # === 预处理阶段文件夹结构 ===
  2. # 目的:在预处理阶段,需要保存生成的数据,因此需要在指定的路径下创建文件夹。
  3. save_data/          # 预处理保存路径
  4. └── input_data/     # 保存预处理生成的数据
  5.     └── weights/    # 保存权重的文件夹

  6. # === 训练阶段文件夹结构 ===
  7. # 目的:在训练阶段,需要保存训练过程中生成的模型参数。
  8. param_data/         # 保存训练生成的模型参数
复制代码






在 NPVAE 根目录下使用以下命令可以一次性创建预处理和训练阶段需要的所有文件夹:

  1. mkdir -p save_data/input_data/weights param_data
复制代码








3.2 运行

数据预处理 (preprocessing)

  1. python preprocessing.py --smiles_path ./smiles_data/drugbank_smiles.txt --save_path ./save_data
复制代码



模型训练 (training)

  1. python train.py --smiles_path ./smiles_data/drugbank_smiles.txt --prepared_path ./save_data --save_path ./param_data
复制代码


使用命令

  1. nvidia-smi
复制代码


可以看到目前显卡的情况


- 显卡工作状态:
    - 风扇速度:34%(显卡风扇目前以34%的功率在运行)
    - 温度:65°C,显卡的温度略高,但还在正常范围内。
    - 性能等级 (Perf):P0,代表最高性能状态,说明显卡正在工作或准备处理负载。
    - 功耗:显卡目前消耗的功率是38W,而它的最大功率上限是125W,所以它并没有满负荷工作。
    - 显存使用情况:显卡的总显存为8192MiB(约8GB),目前使用了2171MiB,约占26.5%,显存并没有被完全占用。
- GPU利用率:
    - GPU利用率:25%,表示你的GPU正在处理一定量的任务,但负载并不算太高。








评分 Rate

参与人数
Participants 1
威望 +1 收起 理由
Reason
sobereva + 1

查看全部评分 View all ratings

5万

帖子

99

威望

5万

eV
积分
112353

管理员

公社社长

2#
发表于 Post on 2024-9-18 16:33:35 | 只看该作者 Only view this author
image 11.png和image 13.png没插入文中,导致自动无序地出现在了帖子末尾,请检查是否应该插入
北京科音自然科学研究中心http://www.keinsci.com)致力于计算化学的发展和传播,长期开办高质量的各种计算化学类培训:初级量子化学培训班中级量子化学培训班高级量子化学培训班量子化学波函数分析与Multiwfn程序培训班分子动力学与GROMACS培训班CP2K第一性原理计算培训班,内容介绍以及往届资料购买请点击相应链接查看。这些培训是计算化学从零快速入门以及进一步全面系统性提升研究水平的高速路!培训各种常见问题见《北京科音办的培训班FAQ》
欢迎加入“北京科音”微信公众号获取北京科音培训的最新消息、避免错过网上有价值的计算化学文章!
欢迎加入人气非常高、专业性特别强的综合性理论与计算化学交流QQ群“思想家公社QQ群”:1号:18616395,2号:466017436,3号:764390338,搜索群号能搜到哪个说明目前哪个能加,合计9000人。北京科音培训班的学员在群中可申请VIP头衔,提问将得到群主Sobereva的最优先解答。
思想家公社的门口Blog:http://sobereva.com(发布大量原创计算化学相关博文)
Multiwfn主页:http://sobereva.com/multiwfn(十分强大的量子化学波函数分析程序)
ResearchGate:https://www.researchgate.net/profile/Tian_Lu
Money and papers are rubbish, get a real life!

196

帖子

5

威望

1211

eV
积分
1507

Level 5 (御坂)

3#
 楼主 Author| 发表于 Post on 2024-9-18 17:02:01 | 只看该作者 Only view this author
sobereva 发表于 2024-9-18 16:33
image 11.png和image 13.png没插入文中,导致自动无序地出现在了帖子末尾,请检查是否应该插入

好的我检查一下,谢谢

2301

帖子

1

威望

5473

eV
积分
7794

Level 6 (一方通行)

4#
发表于 Post on 2024-9-18 20:38:36 | 只看该作者 Only view this author
建议增加国产镜像地址

GitHub 能不能访问,是很玄幻的事情……

另,如果要发挥GPU的性能,当前硬件中,
处理器太弱了。
High-Performance Computing for You
为您专属定制的高性能计算解决方案

更多讯息,请访问:
https://labitc.top
http://tophpc.top:8080
电邮: ask@hpc4you.top

196

帖子

5

威望

1211

eV
积分
1507

Level 5 (御坂)

5#
 楼主 Author| 发表于 Post on 2024-9-19 07:38:06 | 只看该作者 Only view this author
abin 发表于 2024-9-18 20:38
建议增加国产镜像地址

GitHub 能不能访问,是很玄幻的事情……

1. 国内流氓公司太多,不考虑

2. GPU 只是测速平台,不是实际运行平台的

本版积分规则 Credits rule

手机版 Mobile version|北京科音自然科学研究中心 Beijing Kein Research Center for Natural Sciences|京公网安备 11010502035419号|计算化学公社 — 北京科音旗下高水平计算化学交流论坛 ( 京ICP备14038949号-1 )|网站地图

GMT+8, 2024-11-23 12:20 , Processed in 0.189162 second(s), 26 queries , Gzip On.

快速回复 返回顶部 返回列表 Return to list