南方科技大学科学与工程计算中心高性能计算集群共分两期建设。两期集群分别命名为“启明2.0”(QiMing 2.0)和“太乙”(TaiYi)。两套集群总共拥有4.9万核,每年可向用户提供约4.2亿核时。
“启明2.0”集群配备1PB的并行文件系统,实测读写带宽超过36GB/s,集群队列和对应的计算资源配置情况如下:
队列 | 配置 |
---|---|
38 | CPU: 2 * Intel第三代至强可扩展处理器 (单颗CPU: 2.0GHz, 32核); 内存: 512 GB; |
33 | CPU: 2 * Intel第一代至强可扩展处理器 (单颗CPU:2.5GHz, 20核); 内存: 192 GB; |
42 | CPU: 2 * Intel第二代至强可扩展处理器 (单颗CPU:2.3GHz, 48核); 内存: 384 GB或768 GB; |
48 | CPU: 4 * Intel第一代至强可扩展处理器 (单颗CPU:2.4GHz, 20核); 内存: 768 GB; |
75m | CPU: 2 * Intel第一代至强可扩展处理器 (单颗CPU:2.5GHz, 24核); 内存: 192 GB; |
ot38 | CPU: 2 * Intel第三代至强可扩展处理器 (单颗CPU:2.0GHz, 32核); 内存: 512 GB + 2TB Optane; |
2t50c | CPU: 2 * Intel第三代至强可扩展处理器 (单颗CPU:2.6GHz, 32核); 内存: 2TB; |
1t75c | CPU: 2 * Intel第三代至强可扩展处理器 (单颗CPU:2.9GHz, 32核); 内存: 1 TB; |
1t88c | CPU: 2 * Intel第四代至强可扩展处理器 (单颗CPU:2.3GHz, 48核); 内存: 1 TB; |
1t81c | CPU: 2 * Intel第五代至强可扩展处理器 (单颗CPU:2.1GHz, 60核); 内存: 1 TB; |
73x | CPU: 2 * AMD第三代霄龙处理器 (单颗CPU:2.2GHz, 64核); 内存: 512 GB; |
52 | CPU: 2 * AMD第二代霄龙处理器 (单颗CPU:2.3GHz, 24核); 内存: 512 GB; |
63 | CPU: 2 * AMD第三代霄龙处理器 (单颗CPU:2.45GHz, 64核); 内存: 512 GB; |
9654 | CPU: 2 * AMD第四代霄龙处理器 (单颗CPU:2.4GHz, 96核); 内存: 384 GB; |
9754 | CPU: 2 * AMD第四代霄龙处理器 (单颗CPU:2.25GHz, 128核); 内存: 384 GB; |
v4-3t | CPU: 4 * Intel至强 E5 v4处理器 (单颗CPU:2.2GHz, 18核); 内存: 3 TB; |
v3-6t | CPU: 8 * Intel至强E7 v3处理器 (单颗CPU:2.3GHz, 18核); 内存: 6 TB; |
sk-6t-96 | CPU: 4 * Intel第一代至强可扩展处理器 (单颗CPU:2.1GHz, 24核); 内存: 6 TB; |
sk-6t-104 | CPU: 4 * Intel第一代至强可扩展处理器 (单颗CPU:2.1GHz, 26核); 内存: 6 TB; |
sk-6t-112 | CPU: 4 * Intel第一代至强可扩展处理器 (单颗CPU:2.5GHz, 28核); 内存: 6 TB; |
v3-64 | CPU: 2 * Intel至强E5 v3处理器 (单颗CPU:2.6GHz, 12核); 内存: 64 GB; |
ser-e5 | CPU: 2 * Intel至强E5 v4处理器 (单颗CPU:3.2GHz, 8核); 内存:128 GB; |
ser-sc | CPU: 2 * Intel第一代至强可扩展处理器 (单颗CPU:3.5GHz, 8核); 内存:192 GB; |
2a100-40 | CPU: 2 * Intel第二代至强可扩展处理器 (单颗CPU:2.1GHz, 20核); 内存:192 GB; GPU: 2 * NVIDIA A100 (40GB显存); |
4a100-40 | CPU: 2 * Intel第二代至强可扩展处理器 (单颗CPU:2.7GHz, 28核); 内存: 384 GB; GPU: 4 * NVIDIA A100 (40GB显存+NV-Bridge); |
2a100-80 | CPU: 2 * Intel第二代至强可扩展处理器 (单颗CPU:2.1GHz, 20核); 内存: 192 GB; GPU: 2 * NVIDIA A100 (80GB显存); |
4a100-80 | CPU: 2 * AMD第三代霄龙处理器 (单颗CPU:2.45GHz, 64核); 内存: 512 GB; GPU: 4 * NVIDIA A100 (80GB显存); |
hgx | CPU: 2 * AMD第三代霄龙处理器 (单颗CPU:2.45GHz, 64核); 内存: 1TB; GPU: 8 * NVIDIA A100 (80GB显存+SXM); |
4-4080-e5 | CPU: 2 * Intel至强E5 v3处理器 (单颗CPU:2.6GHz, 12核); 内存: 128 GB; GPU: 4 * NVIDIA RTX 4080 (16GB显存); |
4-4090 | CPU: 2 * AMD第三代霄龙处理器 (单颗CPU:2.75GHz, 32核); 内存: 512 GB; GPU: 4 * NVIDIA RTX 4090 (48GB); |
4a6000-e5 | CPU: 2 * Intel至强E5 v3处理器 (单颗CPU:2.6GHz, 12核); 内存: 128 GB; GPU: 4 * NVIDIA RTX A6000 (48GB显存); |
2h100-80 | CPU: 2 * AMD第四代霄龙处理器 (单颗CPU:2.4GHz, 96核); 内存: 768 GB; GPU: 2 * NVIDIA H100 (80GB); |
4h100-80 | CPU: 2 * AMD第四代霄龙处理器 (单颗CPU:2.4GHz, 96核); 内存: 768 GB; GPU: 4 * NVIDIA H100 (80GB); |
8h100-80 | CPU: 2 * AMD第四代霄龙处理器 (单颗CPU:2.4GHz, 96核); 内存: 768 GB; GPU: 8 * NVIDIA H100 (80GB); |
2h200-141 | CPU: 2 * AMD第四代霄龙处理器 (单颗CPU:2.4GHz, 96核); 内存: 768 GB; GPU: 2 * NVIDIA H100 (141GB); |
4h200-141 | CPU: 2 * AMD第四代霄龙处理器 (单颗CPU:2.4GHz, 96核); 内存: 768 GB; GPU: 4 * NVIDIA H100 (141GB); |
8h200-141 | CPU: 2 * AMD第四代霄龙处理器 (单颗CPU:2.4GHz, 96核); 内存: 768 GB; GPU: 8 * NVIDIA H100 (141GB); |
2v100-16-sc | CPU: 2 * Intel第一代至强可扩展处理器 (单颗CPU:2.4GHz, 20核); 内存: 384 GB; GPU: 2 * NVIDIA V100 (16GB显存); |
4v100-16-e5 | CPU: 2 * Intel至强E5 v3处理器 (单颗CPU:2.6GHz, 12核); 内存: 64GB; GPU: 4 * NVIDIA V100 (16GB显存); |
4v100-16-sc | CPU: 2 * Intel第一代至强可扩展处理器 (单颗CPU:2.5GHz, 20核); 内存: 192 GB; GPU: 4 * NVIDIA V100 (16GB显存); |
2v100-32-e5 | CPU: 2 * Intel至强E5 v3处理器 (单颗CPU:2.6GHz, 12核); 内存: 256 GB; GPU: 2 * NVIDIA V100 (32GB显存); |
2v100-32-sc | CPU: 2 * Intel第二代至强可扩展处理器 (单颗CPU:2.1GHz, 20核); 内存: 192 GB; GPU: 2 * NVIDIA V100 (32GB显存); |
8v100-32-sc | CPU: 2 * Intel第二代至强可扩展处理器 (单颗CPU:2.5GHz, 24核); 内存: 384 GB; GPU: 8 * NVIDIA V100 (32GB显存); |
spec | 节点:包含整机所有计算节点; 优先级:最高,不限制时间,可全系统提供资源; |
“太乙”集群配置5.5PB的并行文件系统,实测读写带宽超过40GB/s,集群队列和对应的计算资源配置情况如下:
队列 | 配置 |
---|---|
short、 medium、 large、 ser、 debug | CPU: 2 * Intel第一代至强可扩展处理器 (单颗CPU:2.4GHz, 20核); 内存: 192 GB; |
smp | CPU: 8 * Intel第一代至强可扩展处理器 (单颗CPU:2.1GHz, 24核); 内存: 6 TB; |
gpu | CPU: 2 * Intel第一代至强可扩展处理器 (单颗CPU:2.4GHz, 20核); 内存: 384 GB; GPU: 2 * NVIDIA V100 (16GB显存); |
spec | 节点:包含整机所有刀片节点; 优先级:最高,不限制时间,可全系统刀片提供资源; |