目录

集群管理系统

misaraty 更新 | 2024-10-05
前言
集群管理系统简述。

常用命令

管理系统 队列信息 资源信息 提交作业 查看作业 取消作业
Slurm yhi/sinfo sbatch squeue scancel
PBS(PBS Pro, Torque1) qstat -q pestat qsub qstat qdel
LSF bqueues bhosts bsub bjobs bkill
SGE qconf -sql qhost qsub qstat qdel

OpenPBS

2018年5月起:Altair将开源许可的PBS pro命名为OpenPBS2

注意

OpenPBS v23.06.06只有以下4个预编译版:

  • OpenSuse Leap 15.4
  • RockyLinux 8.8
  • Ubuntu 18.04
  • Ubuntu 20.04

Slurm

  • SlurmOpenPBS一道成为目前最主流的集群管理系统,但前者核数控制麻烦,&&任务不友好。

Torque

Torque自2018年6月起:转为非自由软(none-free software)。2

OpenHPC

  • OpenHPC 3.1提供基于RHEL 9.3/AlmaLinux/RockyOpenSUSE Leap 15.5openEuler 22.03 LTS SP3Warewulf + OpenPBSWarewulf + Slurm预编译版。

  • OpenHPC 2.8提供基于RHEL 8.8/RockyOpenSUSE Leap 15.3Warewulf + OpenPBSWarewulf + Slurm预编译版。


  1. Torque显示作业信息不友好。 ↩︎

  2. PBS系列变迁 ↩︎