计算化学公社

 找回密码 Forget password
 注册 Register

Gaussian在集群LSF作业调度系统中的使用和权限问题

查看数: 2360 | 评论数: 32 | 收藏 Add to favorites 1
关灯 | 提示:支持键盘翻页<-左 右->
    组图打开中,请稍候......
发布时间: 2024-7-22 18:07

正文摘要:

前期工作: 1. 参照卢老师439博文中的步骤对Gaussian16进行了安装,对环境变量进行了配置,见图1; 2. 通过root账户对g16文件夹进行了chmod 750 -R *的权限设置,建立了新的gaussian分组并将本人使用的用户添加至 ...

回复 Reply

syarnold 发表于 Post on 2024-7-29 08:42:37
wxyhgk 发表于 2024-7-26 19:38
因为是在mac os 上压缩的,可能有些兼容性问题,不能使用命令行

感谢回复!

想方设法也没能解压好(只解压出来单独一个12G的无后缀文件),能麻烦大佬帮忙重新发一个版本的吗
wxyhgk 发表于 Post on 2024-7-26 19:38:23
syarnold 发表于 2024-7-26 17:50
感谢回复!

试了好几遍一直都无法unzip,也尝试了jar -xvf但是集群没有安装jar也没连外网装不了。不知 ...

因为是在mac os 上压缩的,可能有些兼容性问题,不能使用命令行
syarnold 发表于 Post on 2024-7-26 17:50:18
wxyhgk 发表于 2024-7-26 10:21
怀疑是 Gaussian 版本的问题,我这里有 Gaussian16  C.01 的版本,你试试

https://www.123pan.com/s/U ...

感谢回复!

试了好几遍一直都无法unzip,也尝试了jar -xvf但是集群没有安装jar也没连外网装不了。不知道是什么原因

[root@Master software]# unzip G16-C01-AVX.zip
Archive:  G16-C01-AVX.zip
  End-of-central-directory signature not found.  Either this file is not
  a zipfile, or it constitutes one disk of a multi-part archive.  In the
  latter case the central directory and zipfile comment will be found on
  the last disk(s) of this archive.
unzip:  cannot find zipfile directory in one of G16-C01-AVX.zip or
        G16-C01-AVX.zip.zip, and cannot find G16-C01-AVX.zip.ZIP, period.
wxyhgk 发表于 Post on 2024-7-26 10:21:41
syarnold 发表于 2024-7-26 09:59
感谢回复!

不用集群直接sh脚本也是和25#楼同样的报错。

怀疑是 Gaussian 版本的问题,我这里有 Gaussian16  C.01 的版本,你试试

https://www.123pan.com/s/U8JrVv-HIVEH.html
syarnold 发表于 Post on 2024-7-26 09:59:57
wxyhgk 发表于 2024-7-25 22:43
先不用集群来,直接用 sh 脚本

感谢回复!

不用集群直接sh脚本也是和25#楼同样的报错。

我们这个应该是LSF,不是slurm。我这边一般是用个人用户进行计算,需要修改配置等我也可以登录root用户进行操作。

NFS挂载选项我不太懂,尝试显示了一下您帮忙看下这里有无问题:
[root@Master software]# mount -o remount,exec /opt
[root@master software]# cat /proc/mounts
rootfs / rootfs rw 0 0
sysfs /sys sysfs rw,nosuid,nodev,noexec,relatime 0 0
proc /proc proc rw,nosuid,nodev,noexec,relatime 0 0
devtmpfs /dev devtmpfs rw,nosuid,size=65709876k,nr_inodes=16427469,mode=755 0 0
securityfs /sys/kernel/security securityfs rw,nosuid,nodev,noexec,relatime 0 0
tmpfs /dev/shm tmpfs rw,nosuid,nodev 0 0
devpts /dev/pts devpts rw,nosuid,noexec,relatime,gid=5,mode=620,ptmxmode=000 0 0
tmpfs /run tmpfs rw,nosuid,nodev,mode=755 0 0
tmpfs /sys/fs/cgroup tmpfs ro,nosuid,nodev,noexec,mode=755 0 0
cgroup /sys/fs/cgroup/systemd cgroup rw,nosuid,nodev,noexec,relatime,xattr,release_agent=/usr/lib
/systemd/systemd-cgroups-agent,name=systemd 0 0pstore /sys/fs/pstore pstore rw,nosuid,nodev,noexec,relatime 0 0
cgroup /sys/fs/cgroup/cpu,cpuacct cgroup rw,nosuid,nodev,noexec,relatime,cpuacct,cpu 0 0
cgroup /sys/fs/cgroup/perf_event cgroup rw,nosuid,nodev,noexec,relatime,perf_event 0 0
cgroup /sys/fs/cgroup/devices cgroup rw,nosuid,nodev,noexec,relatime,devices 0 0
cgroup /sys/fs/cgroup/freezer cgroup rw,nosuid,nodev,noexec,relatime,freezer 0 0
cgroup /sys/fs/cgroup/net_cls,net_prio cgroup rw,nosuid,nodev,noexec,relatime,net_prio,net_cls 0
0cgroup /sys/fs/cgroup/hugetlb cgroup rw,nosuid,nodev,noexec,relatime,hugetlb 0 0
cgroup /sys/fs/cgroup/memory cgroup rw,nosuid,nodev,noexec,relatime,memory 0 0
cgroup /sys/fs/cgroup/pids cgroup rw,nosuid,nodev,noexec,relatime,pids 0 0
cgroup /sys/fs/cgroup/blkio cgroup rw,nosuid,nodev,noexec,relatime,blkio 0 0
cgroup /sys/fs/cgroup/cpuset cgroup rw,nosuid,nodev,noexec,relatime,cpuset 0 0
configfs /sys/kernel/config configfs rw,relatime 0 0
/dev/mapper/centos_master-root / xfs rw,relatime,attr2,inode64,noquota 0 0
systemd-1 /proc/sys/fs/binfmt_misc autofs rw,relatime,fd=32,pgrp=1,timeout=0,minproto=5,maxproto=
5,direct,pipe_ino=24308 0 0mqueue /dev/mqueue mqueue rw,relatime 0 0
hugetlbfs /dev/hugepages hugetlbfs rw,relatime 0 0
debugfs /sys/kernel/debug debugfs rw,relatime 0 0
nfsd /proc/fs/nfsd nfsd rw,relatime 0 0
/dev/sda2 /boot xfs rw,relatime,attr2,inode64,noquota 0 0
/dev/mapper/master1 /home xfs rw,relatime,attr2,inode64,noquota 0 0
sunrpc /var/lib/nfs/rpc_pipefs rpc_pipefs rw,relatime 0 0
tmpfs /run/user/1029 tmpfs rw,nosuid,nodev,relatime,size=13152052k,mode=700,uid=1029,gid=1029 0 0
tmpfs /run/user/0 tmpfs rw,nosuid,nodev,relatime,size=13152052k,mode=700 0 0
tmpfs /var/log/rtlog tmpfs rw,relatime,size=61440k 0 0
cu01:/opt /opt nfs4 rw,relatime,vers=4.1,rsize=1048576,wsize=1048576,namlen=255,hard,proto=tcp,ti
meo=600,retrans=2,sec=sys,clientaddr=192.168.100.1,local_lock=none,addr=192.168.100.11 0 0tmpfs /run/user/1021 tmpfs rw,nosuid,nodev,relatime,size=13152052k,mode=700,uid=1021,gid=10 0 0
tmpfs /run/user/1023 tmpfs rw,nosuid,nodev,relatime,size=13152052k,mode=700,uid=1023,gid=1023 0 0
tmpfs /run/user/1020 tmpfs rw,nosuid,nodev,relatime,size=13152052k,mode=700,uid=1020,gid=1020 0 0
tmpfs /run/user/1010 tmpfs rw,nosuid,nodev,relatime,size=13152052k,mode=700,uid=1010,gid=1010 0 0
tmpfs /run/user/1007 tmpfs rw,nosuid,nodev,relatime,size=13152052k,mode=700,uid=1007,gid=1007 0 0
tmpfs /run/user/1030 tmpfs rw,nosuid,nodev,relatime,size=13152052k,mode=700,uid=1030,gid=1030 0 0
wxyhgk 发表于 Post on 2024-7-25 22:43:05
先不用集群来,直接用 sh 脚本

  1. #!/bin/bash
  2. export g16root=/home/software
  3. export GAUSS_SCRDIR=/home/$USER/scratch
  4. source /home/software/g16/bsd/g16.profile
  5. export PGI_FASTMATH_CPU=sandybridge
  6. EXEC_CMD="/home/software/g16/g16"
  7. INPUTFILE=2molecules-2-1.gjf
  8. $EXEC_CMD < $INPUTFILE > 2molecules-2-1.log
复制代码


如果是 NFS 文件挂载,看看挂载选项

  1. sudo mount -o remount,exec /路径/to/mount
复制代码


你的 slurm 是什么用户?root 吗还是什么?
乐平 发表于 Post on 2024-7-25 21:56:38
本帖最后由 乐平 于 2024-7-25 22:18 编辑
syarnold 发表于 2024-7-25 17:52
感谢回复!

改成您说的之后error文件报错如下:

你看看 g16 目录下的 g16, 以及所有的 *.exe (也就是 l101.exe, l102.exe ..... )是不是都是   -rwxr-x--- 属性呢?
你 cd 到 bsd 目录里,看看的 bsd 目录里面的 g16.profile 文件是不是 -rwxr-x--- 属性呢?



wxyhgk 发表于 Post on 2024-7-25 17:31:06
本帖最后由 wxyhgk 于 2024-7-25 17:40 编辑
syarnold 发表于 2024-7-25 17:22
感谢回复!

[root@Master software]# setenforce 0
改成这个
  1. #!/bin/bash
  2. # embedded options to bsub - start with #LSF
  3. # -- our name ---
  4. #BSUB -J 2molecules-2-1
  5. # -- choose queue --
  6. #BSUB -q normal
  7. # -- specify that we need 2GB of memory per core/slot --
  8. #BSUB -R "rusage[mem=40GB]"
  9. # -- parallel environment requests --
  10. #BSUB -n 20
  11. # -- specify that the cores MUST BE on a single host! It's a SMP job! --
  12. #BSUB -R "span[hosts=1]"
  13. # -- Specify the output and error file. %J is the job-id --
  14. #BSUB -o Output_%J.out
  15. #BSUB -e Error_%J.err
  16. # -- end of LSF options --
  17. # -- setup of the gaussian 16 environment --
  18. export g16root=/home/software
  19. export GAUSS_SCRDIR=/home/$USER/scratch
  20. source /home/software/g16/bsd/g16.profile
  21. export PGI_FASTMATH_CPU=sandybridge
  22. # -- commands you want to execute --
  23. EXEC_CMD="/home/software/g16/g16"
  24. INPUTFILE=2molecules-2-1.gjf
  25. $EXEC_CMD < $INPUTFILE > 2molecules-2-1.log
复制代码


使用 strace 工具跟踪执行过程,查找具体的权限问题
  1. strace -o output.txt $EXEC_CMD < $INPUTFILE > 2molecules-2-1.log
复制代码



syarnold 发表于 Post on 2024-7-25 17:22:17
wxyhgk 发表于 2024-7-25 16:41
先试试这个命令

感谢回复!

[root@Master software]# setenforce 0
setenforce: SELinux is disabled

之后尝试提交.sh脚本依旧提示:permission denied

/home/suiyi/.lsbatch/1721899048.27065.shell: line 21: /home/software/g16/bsd/g16.profile: Permission denied

哦对,有个点之前没有讲,通过个人账户直接g16 <xxx.gjf是可以提交运行的,但是提交.sh脚本就会提示权限不足

下面是脚本文件:
#!/bin/sh
# embedded options to bsub - start with #LSF
# -- our name ---
#BSUB -J 2molecules-2-1
# -- choose queue --
#BSUB -q normal
### -- specify that we need 2GB of memory per core/slot --
#BSUB -R "rusage[mem=40GB]"
# -- parallel environment requests --
#BSUB -n 20
### -- specify that the cores MUST BE on a single host! It's a SMP job! --
#BSUB -R "span[hosts=1]"
### -- Specify the output and error file. %J is the job-id --
### -- -o and -e mean append, -oo and -eo mean overwrite --
#BSUB -o Output_%J.out
#BSUB -e Error_%J.err
# -- end of LSF options --
# -- setup of the gaussian 16 environment --
export g16root=/home/software
export GAUSS_SCRDIR=/home/$USER/scratch
source /home/software/g16/bsd/g16.profile
export PGI_FASTMATH_CPU=sandybridge
# -- commands you want to execute --
#
EXEC_CMD="/home/software/g16"
INPUTFILE=2molecules-2-1.gjf
###g16 <2molecules-2-1.gjf> 2molecules-2-1.log

乐平 发表于 Post on 2024-7-25 16:56:40
本帖最后由 乐平 于 2024-7-25 17:26 编辑
syarnold 发表于 2024-7-25 16:14
感谢回复!

一开始解压到/root是因为之前课题组的软件也是安装此处的,我也不太懂就装这里了。在您的 ...

从你的图10 可以看到 /home/software/g16 的组是 root ……  你的用户组没有设置对……

下面是你帖子的截图  




下一个是我集群的截图



wxyhgk 发表于 Post on 2024-7-25 16:41:02
syarnold 发表于 2024-7-25 16:14
感谢回复!

一开始解压到/root是因为之前课题组的软件也是安装此处的,我也不太懂就装这里了。在您的 ...

先试试这个命令

  1. sudo setenforce 0
复制代码


然后运行 g16  看看是不是这个问题

手机版 Mobile version|北京科音自然科学研究中心 Beijing Kein Research Center for Natural Sciences|京公网安备 11010502035419号|计算化学公社 — 北京科音旗下高水平计算化学交流论坛 ( 京ICP备14038949号-1 )|网站地图

GMT+8, 2025-8-13 05:43 , Processed in 0.199005 second(s), 25 queries , Gzip On.

快速回复 返回顶部 返回列表 Return to list