您现在的位置: 首页 >> 平台概况 >> 计算资源

计算资源


计算资源包括公共服务计算资源、ChinaGrid二期中南大学节点计算资源和托管计算资源
公共服务计算资源关键参数:10T计算能力,20T存储,78个刀片服务器,3台SMP胖节点,20Gb InfiniBand高速计算网络。
平台硬件系统配置
–346个通用处理器,1420个CPU核。(AMD Opteron 8347HE 1.9 GHz 四核低功耗处理器,AMD Opteron 8350HE 2.0 GHz 四核低功耗处理器,AMD Opteron 2350HE 2.0GHz 四核低功耗处理器,AMD Opteron 2376 2.3GHz四核处理器);
–内存总容量2756GB;
–点点通信带宽20Gbps;
–磁盘阵列存储空间总容量为20TB。
 

硬件系统
–计算集群、管理、I/O和Web节点,I/O存储系统,一体化管理、监控和诊断系统,计算网络系统等。
 
计算集群
–78个刀片节点,每个刀片节点配置4个4核低功耗AMD CPU,32GB内存;
–3个胖节点,每个胖节点配置8个4核低功耗AMD CPU,64GB内存。

管理、I/O和Web节点
–2个管理节点,每个管理节点配置2个4核低功耗AMD CPU,16GB内存;
 –2个I/O节点,每个管理节点配置2个4核低功耗AMD CPU,16GB内存;
–1个Web节点,配置2个4核AMD CPU,4GB内存。

I/O存储系统
–采用全局分布共享并行I/O系统结构;
–45块3.5寸450GB(15000转)热插拔SAS硬盘,磁盘总容量为20TB。

一体化管理、监控和诊断系统
–采用分布式集中管理结构,实现全系统的实时管理、安全监测、系统控制和调试诊断等功能

计算网络系统
–采用Infiniband互联,单个通信链路的通信带宽为20Gbps。

UPS后备电源系统
–采用80KVA 2小时的不间断电源。

 

操作系统
–操作系统采用64bit的SuSE Linux 10.0 64bit,MS Windows Compute Cluster Server 2003 64bit和MS Windows Server Enterprise 2008。

峰值性能
–机器峰值:10.2144TFlops,LINPACK测试值:8.27368TFlops,效率:0.810,位于2009高性能TOP100高校排名第8。

 

 
 

组成单元

说明

配置内容与参数细节

单位

数量

品目1:集群服务器计算节点系统(10T FLOPS

Blade Engine(刀片平台)[曙光TC2600刀片]

机箱

机架式刀片柜 1个(7U标准机架式,最大支持10个刀片)

8

交换模块

千兆交换模块 1个(对内提供10个千兆互联,对外提供4RJ45端口)

管理模块

管理模块 1个(集成KVMUSB以及RJ45管理端口)

风扇模块

散热模块 3组(带线性预补偿功能的冗余风扇)

电源模块

电源模块 6个(具有负载均衡和故障切换的热插拔1000W交流电源模块)

IB高速交换模块

Infiniband高速交换模块 1个(全线速交换,对内、外均提供1020GbpsIB接口)

计算刀片[曙光CB85-F]

CPU

AMD Opteron 8347HE1.9 GHz)四核低功耗处理器 4

78

内存

32 GB DDRII 667MHz ECC Register内存

硬盘

160GB SATA硬盘 1

网卡

千兆以太网网卡 2

SMP节点

[曙光天阔A950r-F]

规格

5U机架式

3

CPU

AMD Opteron 8350HE2.0 GHz)四核低功耗处理器 8

内存

64GB DDRII 667MHz ECC Register内存

硬盘

450GB SAS15000转)热插拔硬盘 1

网卡

千兆以太网网卡 3

IB网卡

20Gb 4×DDR Infiniband网卡1

电源

1350W 31冗余电源 1套(每电源模块配置独立散热风扇)

品目2:集群机柜系统

曙光天潮标准刀片机柜

标准刀片机柜

标配PDU 2套(每个PDU36个电源插口)、双侧门,无电源箱,无监控液晶触摸一体机

4

曙光机柜SKVM内置控制台

内置控制台

1U手动伸缩控制台(含曙光17"液晶显示器1台、鼠标1个、键盘1个、1口切换器一台)

1

监控中心

监控中心

安装在机柜的前门上。通过该触摸屏可以监控整个系统的软、硬件运行状态。用户无需培训即可以直接对触摸屏进行操作,集群应用状态一目了然。

1

2U电源箱

HPC-PMU 电源管理单元

曙光HPC-PMU 电源管理单元,为整个集群进行供电分配和电源管理

2

品目3I/O节点系统

I/O节点

[曙光天阔A620r-FX]

规格

2U机架式

2

CPU

AMD Opteron 2350HE2.0GHz)四核低功耗处理器 2

内存

16GB Register ECC DDRII 667MHz

硬盘

450GB SAS15000转)热插拔硬盘 2

网卡

千兆以太网网卡 2

HBA

8Gb 光纤HBA1

IB网卡

20Gb 4×DDR Infiniband网卡 1

光驱

CD-RW/DVD-ROM Combo 1

电源

600W 11冗余电源 1套(每个电源模块配置独立散热风扇)

品目4:管理、登录系统

管理、登录节点

[曙光天阔A620r-FX]

规格

2U机架式

2

CPU

AMD Opteron 2350HE2.0GHz)四核低功耗处理器 2

内存

16GB Register ECC DDRII 667MHz

硬盘

450GB SAS15000转)热插拔硬盘 4块(其中1块装系统,3RAID5

网卡

千兆以太网网卡 2

IB网卡

20Gb 4×DDR Infiniband网卡 1

光驱

CD-RW/DVD-ROM Combo 1

电源

600W 11冗余电源 1套(每个电源模块配置独立散热风扇)

Web服务器[曙光天阔A620r-FX]

规格

2U机架式

1

CPU

AMD Opteron 23762.3 GHz)四核处理器 2

内存

4GB DDRII 667MHz ECC Register内存

硬盘

146GB 15000转)热插拔SAS硬盘 2

网卡

千兆以太网网卡 2

外设

CD-RW/DVD-ROM Combo1台

电源

600W 单电源 1

品目5:网络系统

IB计算和存储网络

Infiniband交换机

Voltaire 24 端口 Infiniband ISR 9024D交换机(每接口速率20Gb,交换机背板双向带宽可达960Gb

4

管理/监控网络

千兆以太网交换机

H3C 5100-24P-EI交换机,24端口10/100/1000baseT铜接口(支持3层路由协议)

1

IB 连接线缆

线缆

Infiniband 铜缆,用于连接Infiniband交换机到Infiniband网卡的线缆

86

品目6:存储系统

 

光纤交换机

存储交换机

博科(BrocadeBR-3108Gb16端口交换机,8端口激活,含88Gb/s短波SFP

1

曙光DS-6312FE磁盘阵列

规格

3U标准机架式

1

控制器

双控

数据Cache

每个控制器配置2GB Cache,合计4GB数据Cache

电池保护

标配锂电池(可以保护Cache中数据72小时不丢失)

RAID

RAID级别:011E565060

后台支持

支持多个全局/本地热备份盘后台同步;重建,冗余检测,SMART condition polling;在线扩容;支持RAID0510501E之间互相迁移

主机通道

44Gb FC主机通道

扩展通道

2SAS 4×扩展接口

单柜硬盘插槽数量

硬盘插槽数量 16个,支持SASSATA硬盘混插

最大扩展硬盘数量

最大扩展硬盘数:80(需增加磁盘扩展柜)

电源

500W 11冗余电源,双冗余散热模块

曙光JB6312EE磁盘扩展柜

扩展柜

3U标准机架式,16盘位,支持SATASAS硬盘,双扩展模块,每扩展模块2SAS 4×接口,500W 11冗余电源,双冗余散热模块

2

硬盘

硬盘

3.5450GB15000转)热插拔SAS硬盘

45

光纤线缆

线缆

FC线缆:3M多模光纤线缆(LC-LC

6

品目7:控制和视频切换系统(KVM

SKVM II Over IP

曙光SKVM II控制系统

支持 OVER IP

1

CIM

控制模块

KVM节点控制I/O模块,每台服务器一个

16

品目8:集群管理和监控软件系统

集群监控软件系统

作业调度软件

调度软件

曙光作业调度系统DCJM,平台采用统一界面的作业调度、系统管理和监控,采用B/S架构,商业软件,不限处理器数

1

曙光大型管理监控软件

管理监控软件

曙光大型机管理监控软件GridView

1

状态监控模块

支持显示物理机柜视图、网络拓扑视图、性能分析视图、应用监控视图

告警管理模块

可以实现实时告警管理、历史告警管理、告警统计报表、告警关联分析等功能

性能报表模块

可以实现系统分类报表、自定义报表、图示化统计分析功能

集群管理模块

可以实现集群网络和服务、集群用户和进程、集群文件的管理和关机功能

集群部署模块

可以实现点到点部署、镜像管理功能

曙光节能软件

节能软件

powerconf,与监控系统和调度系统结合,探测空闲资源,通过CPU降频、关闭CPU核心、休眠节点等措施降低空闲资源能耗,并具有网络唤醒功能

1

曙光刀片管理软件

刀片管理软件

Dawning Blade Full View Manager System,支持节点资源监控,节点开关机,节点系统配置和风扇电源管理

1

操作系统

集群操作系统

微软高性能计算集群操作系统WCCS 2003

1

 

Copyright©2009 High Performance Computing Center of CSU All Rights Reserved
电话:0731-88877295  邮件:hpc@csu.edu.cn(使用中的问题请截图并准确描述后通过电子邮件咨询)
地址:湖南省长沙市岳麓区中南大学新校区外语网络楼3楼 邮编:410083  主页访问:1672345