使用指南

当前位置 上机指南 > 使用指南

科学与工程计算中心高性能集群使用指南

        南方科技大学科学与工程计算中心成立于2018年10月5日。中心目前拥有两套高性能集群,分别命名为“启明”和“太乙”。目前,两套集群已经开放使用。

        有需要申请账号的老师请按账户申请表格式提供相关信息。如有疑问,请联系hpc@sustc.edu.cn。

        集群目前规定如下:

        1. 账户申请:每位PI可以申请一个Group,不允许多位PI共同申请一个Group。每个Group会有一个PI自己的User Account。如需要在Group下添加课题组成员的User Account,请填写附件表格,以邮件形式发送到hpc@sustc.edu.cn。如果账户申请邮件由课题组成员发送,请抄送相应PI。

        2. 存储划分:“太乙”集群存储分三个区(data,scratch,work),每个group在data下拥有8.0 TB的磁盘配额(quota),在work下拥有1000 GB磁盘配额,scratch分区没有限制,但是会做定期清理配置。预计每次清理10天前的数据(视具体使用情况而定,不清理近期数据)。“启明”集群目前有home分区和work分区scratch,用户家目录位于home分区,如需扩容,可以联系hpc@sustc.edu.cn。

        3. 队列使用:在测试期间,作业提交排队系统的细节将视具体使用数据进行调整,以达到最大限度使用计算资源和满足用户需求。“太乙”集群目前共开放以下五个队列:

        a. smp—大内存节点队列(6 TB/节点),每个节点192核,建议作业使用的核心数为24的整数倍。运行时长限制为168小时,中等优先级。

        b. large—长时间作业队列,每个节点40核,建议作业使用的核心数为20的整数倍,运行时长限制为72小时,低优先级。

        c. medium—长时间作业队列,每个节点40核,建议作业使用的核心数为20的整数倍,运行时长限制为168小时,低优先级。

        d. short—短时间作业队列,每个节点40核,建议作业使用的核心数为20的整数倍,运行时长限制为168小时,高优先级。

        e. debug—调试作业队列,运行时长限制为20分钟,高优先级。

        f. ser—串行作业队列,运行时长限制为168小时,低优先级。

       “启明”集群共开放以下六个队列:

        a. fat—大内存节点队列(6TB/节点),每个节点144核,建议作业使用的核心数为18的整数倍。运行时长限制为360小时,中等优先级。

        b. cal-s—短时间作业节点,每个节点24核,建议作业使用的核心数为12的整数倍。运行时长限制为240小时,高优先级。

        d. gpu—gpu作业节点,每个节点24核和4张Tesla K80 GPU卡,只有使用GPU的作业才允许提交到该队列。运行时长限制为24小时,中等优先级。

        e. debug—调试作业队列,每个节点24核,运行时长限制为20分钟,高优先级。

        f. ser—串行作业队列,每个节点24核,运行时长无限制,低优先级。

       4. 软件安装协助:如需软件安装协助,请仔细填写并提交软件安装协助申请表和软件源码包,源码包请上传至集群,并在申请表中正确填写存放路径。商用软件需把相关版权证明文件发送至hpc@sustech.edu.cn,同时把手签纸质申请表送至慧园5栋307李云老师处。我们会尽最大努力为大家提供相关服务,但是由于中心人手有限,我们不保证所有软件安装的时效性,还请谅解。

       详细的集群使用方法见“太乙”用户手册和“启明”用户手册。如有使用上的疑问或者发现集群运行状态问题,请及时联系hpc@sustech.edu.cn。或者工程师。


“启明”和“太乙”集群

 

使用指南
资料下载
常见问题