1. 在机群上执行Matlab程序
用putty远程登录,ssh到服务器
用WinSCP或者psftp上传文件
- 有监控和同步功能,比较好用
写像下面的ph.sh一样的slurm脚本
cluster使用slurm管理任务,常用的几个命令
- sbatch 提交
- scontrol show -u name 显示任务
- scontrol show -job=xxx 显示任务
- sinfo 查看所有设备的信息
- scontrol show node=soemaster01 查看某台主机的信息,有GPU的一台
查询任务状态
- squeue -u name 按用户名查询
- sstat -j <jobid>
其它常用命令参见:http://ecs.rutgers.edu/slurm_commands.html
监控GPU的运行状态
- nvidia-smi -i 1 -l 5 每隔5秒显示一次GPU 1的状态
- watch -n 10 nvidia-smi -i 1 利用watch实现监控GPU状态,显示效果更好一些
cluster上的matlab过期了,使用网上搜索来的证书强行验证,命令如下
- matlab -nodesktop -nodisplay -nosplash -c $MYHDIR/license.lic -r "Work_06_PatchedCRTBP, exit"
- 主要是其中的 -c 参数和网上找来的证书 license.lic
在slurm上运行matlab注意程序最后要加exit
- 或者如前一例所示,加在调用中,这样原程序方便在本地调试