计算化学公社

标题: Ubuntu 下安装 NPVAE [打印本页]

作者
Author:
wxyhgk    时间: 2024-9-18 15:00
标题: Ubuntu 下安装 NPVAE
本帖最后由 wxyhgk 于 2024-9-18 17:11 编辑

最近在公司搞了下 NP-VAE 的安装,记录一下

NP-VAE 是一个 AI 工具,它帮助科学家设计新药物。它通过学习分子结构,可以创造并优化可能用于治疗疾病的新分子,加速寻找新药的过程。

测试平台:
(, 下载次数 Times of downloads: 141)



更好的排版可以看我博客:https://wxyhgk.com/article/ubuntu-npvae-install

1. conda 环境的安装
1.1 访问 Anaconda 官方下载页面:

https://www.anaconda.com/download/success

(, 下载次数 Times of downloads: 149)

针对 Linux x86_64 系统,使用以下链接下载安装脚本:

https://repo.anaconda.com/archive/Anaconda3-2024.06-1-Linux-x86_64.sh

使用 wget 命令获取 sh 文件
  1. wget https://repo.anaconda.com/archive/Anaconda3-2024.06-1-Linux-x86_64.sh
复制代码

(, 下载次数 Times of downloads: 145)


1.2 安装过程

1. 运行以下命令以开始安装:

  1. bash Anaconda3-2024.06-1-Linux-x86_64.sh
复制代码


按照屏幕提示完成安装过程。
[attach]98047[/attach]


回车即可

(, 下载次数 Times of downloads: 147)

用户协议
下方方向键,一直下滑

最后出现让你同意的文字,

(, 下载次数 Times of downloads: 150)

输入 `yes` 然后回车

(, 下载次数 Times of downloads: 146)

直接回车即可



(, 下载次数 Times of downloads: 143)

输入 `yes` 即可,会自动配置好 conda 的环境变量


1.3 重新加载环境变量

安装完成后,可以选择关闭当前终端并重新打开一个新的终端窗口

或者根据你使用的 shell,执行以下相应命令使环境变量生效:

- 命令
    1. 对于 Bash 用户(大多数 Linux 系统默认):
      
  1. source ~/.bashrc
复制代码


    2. 对于 Zsh 用户(某些用户自定义的的):
  1. source ~/.zshrc
复制代码


(, 下载次数 Times of downloads: 146)


2. NPVAE的安装

2.1 拉取项目

安装好 conda 环境后,我们拉取远程项目到本地

  1. git clone https://github.com/toshikiochiai/NPVAE
复制代码
(, 下载次数 Times of downloads: 141)


2.1 创建 conda 环境

然后进入 env 文件夹

  1. cd  NPVAE/env
复制代码

接着在 env 文件夹中,使用预定义的环境配置文件来创建一个新的 conda 环境,此过程时间较长,主要取决于网速,会下载相应的 Python 包

  1. conda env create -f npvae_env.yml
复制代码


(, 下载次数 Times of downloads: 144)




然后激活环境

  1. conda activate npvae_env
复制代码


(, 下载次数 Times of downloads: 143)

注意:每次重新打开终端,这个环境都会消失,所以每次需要用的时候需要使用上面的代码进行激活

3. NPVAE 项目的运行测试

3.1 准备

根据 GitHub 项目我们需要在 NPVAE 根目录下面创建下面的文件夹

  1. # === 预处理阶段文件夹结构 ===
  2. # 目的:在预处理阶段,需要保存生成的数据,因此需要在指定的路径下创建文件夹。
  3. save_data/          # 预处理保存路径
  4. └── input_data/     # 保存预处理生成的数据
  5.     └── weights/    # 保存权重的文件夹

  6. # === 训练阶段文件夹结构 ===
  7. # 目的:在训练阶段,需要保存训练过程中生成的模型参数。
  8. param_data/         # 保存训练生成的模型参数
复制代码






在 NPVAE 根目录下使用以下命令可以一次性创建预处理和训练阶段需要的所有文件夹:

  1. mkdir -p save_data/input_data/weights param_data
复制代码




(, 下载次数 Times of downloads: 142)




3.2 运行

数据预处理 (preprocessing)

  1. python preprocessing.py --smiles_path ./smiles_data/drugbank_smiles.txt --save_path ./save_data
复制代码
(, 下载次数 Times of downloads: 141)



模型训练 (training)

  1. python train.py --smiles_path ./smiles_data/drugbank_smiles.txt --prepared_path ./save_data --save_path ./param_data
复制代码

(, 下载次数 Times of downloads: 147)

使用命令

  1. nvidia-smi
复制代码


可以看到目前显卡的情况
(, 下载次数 Times of downloads: 142)


- 显卡工作状态:
    - 风扇速度:34%(显卡风扇目前以34%的功率在运行)
    - 温度:65°C,显卡的温度略高,但还在正常范围内。
    - 性能等级 (Perf):P0,代表最高性能状态,说明显卡正在工作或准备处理负载。
    - 功耗:显卡目前消耗的功率是38W,而它的最大功率上限是125W,所以它并没有满负荷工作。
    - 显存使用情况:显卡的总显存为8192MiB(约8GB),目前使用了2171MiB,约占26.5%,显存并没有被完全占用。
- GPU利用率:
    - GPU利用率:25%,表示你的GPU正在处理一定量的任务,但负载并不算太高。









作者
Author:
sobereva    时间: 2024-9-18 16:33
image 11.png和image 13.png没插入文中,导致自动无序地出现在了帖子末尾,请检查是否应该插入
作者
Author:
wxyhgk    时间: 2024-9-18 17:02
sobereva 发表于 2024-9-18 16:33
image 11.png和image 13.png没插入文中,导致自动无序地出现在了帖子末尾,请检查是否应该插入

好的我检查一下,谢谢
作者
Author:
abin    时间: 2024-9-18 20:38
建议增加国产镜像地址

GitHub 能不能访问,是很玄幻的事情……

另,如果要发挥GPU的性能,当前硬件中,
处理器太弱了。
作者
Author:
wxyhgk    时间: 2024-9-19 07:38
abin 发表于 2024-9-18 20:38
建议增加国产镜像地址

GitHub 能不能访问,是很玄幻的事情……

1. 国内流氓公司太多,不考虑

2. GPU 只是测速平台,不是实际运行平台的




欢迎光临 计算化学公社 (http://bbs.keinsci.com/) Powered by Discuz! X3.3