台灣杉三號 T3 & 創進一號 F1
使用說明 與 Slurm 常用指令
登入節點:
f1-ilgn01.nchc.org.tw
f1-ilgn02.nchc.org.tw
ThinLinc 互動式繪圖節點
t3-c3.nchc.org.tw
f1-intgpn01.nchc.org.tw (140.110.122.206)
f1-intgpn02.nchc.org.tw (140.110.122.207)
登入節點:
f1-ilgn01.nchc.org.tw
f1-ilgn02.nchc.org.tw
ThinLinc 互動式繪圖節點
t3-c3.nchc.org.tw
f1-intgpn01.nchc.org.tw (140.110.122.206)
f1-intgpn02.nchc.org.tw (140.110.122.207)
在 terminal 輸入 sbatch <name.sh> (intel.sh) 進行任務遞交後,將會獲得一個 Job ID (job 84684)。
>> sbatch qscript_S
squeue 顯示任務或任務集的狀態,它具有各種過濾,排序和格式選項。
預設是按優先順序顯示正在運行的任務,然後按優先順序顯示正在等待的任務,是常用檢視任務的指令。
範例如下:
>> squeue
sacct 用於列出帳號的相關任務或任務集之狀態,例如運行中、已終止或是已完成,是最基本的檢視任務指令。
使用 Slurm 調度任務的相關紀錄在本系統中是儲存在 Log 以及資料庫中,透過 sacct 指令預設可顯示任務、任務步驟、相關狀態,以及退出碼(exitcodes)。也可以透過 --format 選項指定要輸出的內容。
需注意,Slurm 資料庫的資訊預設只以小寫英文字母保存與維護,建議使用者在指定任務名稱以及相關參數時使用小寫輸入。
範例如下:
>> sacct
用於取消正在等待中,或運行中的任務或任務集。
scancel 用於發出信號或取消特定的任務、任務陣列,或者任務步驟。
範例如下:
>> scancel -i [job ID]
台灣杉一號每個節點40核心,台灣杉三號每個節點56核心。
#!/bin/bash
#Batch Job Paremeters
#SBATCH --nodes=4 # (-N) Maximum number of nodes to be allocated
#SBATCH --cpus-per-task=56
#SBATCH --partition=ctest # (-p) Specific slurm partition
#SBATCH --job-name=sample_job # (-J) Job name
#SBATCH --account=ACD111034 # (-A) Account/project number
mpirun -n 224 /home/j30yll00/Smilei/smilei tst2d_04_laser_wake.py
ctest
可用核心數 = 1~1120
可執行時間 (hour) = 0.5
ct56
可用核心數 = 1~56
可執行時間 (hour) = 96
ct224
可用核心數 = 57~224
可執行時間 (hour) = 96
ct560
可用核心數 = 225~560
可執行時間 (hour) = 96
ct2k
可用核心數 = 561~2240
可執行時間 (hour) = 48
ct8k
可用核心數 = 2241~8400
可執行時間 (hour) = 24