使用指南
当前位置 上机指南 > 使用指南
科学与工程计算中心高性能集群使用指南
南方科技大学科学与工程计算中心成立于2018年10月5日。中心目前拥有两套高性能集群,分别命名为“启明”和“太乙”。目前,两套集群已经开放使用。
有需要申请账号的老师请按账户申请表格式提供相关信息。如有疑问,请联系hpc@sustech.edu.cn。
集群目前规定如下:
1. 账户申请:每位PI可以申请一个Group,不允许多位PI共同申请一个Group。每个Group会有一个PI自己的User Account。如需要在Group下添加课题组成员的User Account,请填写附件表格,以邮件形式发送到hpc@sustech.edu.cn。如果账户申请邮件由课题组成员发送,请抄送相应PI。
2. 存储划分:“太乙”集群存储分三个区(data,scratch,work),每个group在data下拥有8.0 TB的磁盘配额(quota),在work下拥有1000 GB磁盘配额,scratch分区没有限制,但是会做定期清理配置。预计每次清理10天前的数据(视具体使用情况而定,不清理近期数据)。“启明”集群目前有home分区和work分区scratch,用户家目录位于home分区,如需扩容,可以联系hpc@sustech.edu.cn。
3. 队列使用:在测试期间,作业提交排队系统的细节将视具体使用数据进行调整,以达到最大限度使用计算资源和满足用户需求。“太乙”集群目前共开放以下五个队列:
a. smp—大内存节点队列(6 TB/节点),每个节点192核,建议作业使用的核心数为24的整数倍。运行时长限制为168小时,中等优先级。
b. large—长时间作业队列,每个节点40核,建议作业使用的核心数为20的整数倍,运行时长限制为72小时,低优先级。
c. medium—长时间作业队列,每个节点40核,建议作业使用的核心数为20的整数倍,运行时长限制为168小时,低优先级。
d. short—短时间作业队列,每个节点40核,建议作业使用的核心数为20的整数倍,运行时长限制为168小时,高优先级。
e. debug—调试作业队列,运行时长限制为20分钟,高优先级。
f. ser—串行作业队列,运行时长限制为168小时,低优先级。
4. 软件安装协助:如需软件安装协助,请仔细填写并提交软件安装协助申请表和软件源码包,源码包请上传至集群,并在申请表中正确填写存放路径。商用软件需把相关版权证明文件发送至hpc@sustech.edu.cn,同时把手签纸质申请表送至慧园5栋307李云老师处。我们会尽最大努力为大家提供相关服务,但是由于中心人手有限,我们不保证所有软件安装的时效性,还请谅解。
详细的集群使用方法见“太乙”用户手册和“启明”用户手册。如有使用上的疑问或者发现集群运行状态问题,请及时联系hpc@sustech.edu.cn。或者工程师。

“启明”和“太乙”集群