 |
|
 |
| 您现在的位置: 先创网 >> 网络应用 >> 服务器技术 >> 文章正文 |
|
|
| [技术]电脑高性能计算理论基础 |
| 木棉论坛 |
| 2005-2-10 10:32:00文/佚名 |
|
|
|
|
|
四、英特尔架构高性能计算系统:
4.1. 英特尔的高性能计算生态系统
高性能计算系统含有众多组件。实际上,这需要开发生态系统来推动HPC系统的进一步发展。英特尔一直积极致力于技术计算各个方面的研发。
4.1.1. 处理器
英特尔至强?处理器系列提供了独特解决方案,具有出色性价比,可满足各级企业计算需求。
英特尔安腾?处理器系列为高端计算带来了出色价值:通用构建模块(可选)、规模经济、可兼容显式并行指令计算(EPIC)技术、充足的寻址空间、媲美RISC的卓越性能和价值。
4.1.2. 主板和平台
除CPU构建模块之外,英特尔还提供了一系列其它平台构建模块。英特尔的平台部门是全球第三大服务器制造商。该部门负责对1路1U高密集平台到4路5U高平台进行构建和验证,并为众多OEM和非品牌集成商提供支持。
4.1.3. 互连 - InfiniBand*
InfiniBand是英特尔和另外的几家公司为计算机之间的高速通信而专门设立的新的技术。由于它有很高的带宽和很低的延时,是新一代高性能计算互连系统的最佳选择。其特点如下:
针对计算机间有效通信进行了专门优化 非常适用于多计算机环境(如互联网数据中心和集群)中的共享I/O设备 其结构针对互联网数据中心标准和可扩展性要求进行了专门优化 4.1.4. 软件和优化工具
KAI是并行软件设计工具及编译器技术开发领域的全球领先厂商。KAI已并入英特尔公司旗下,现仍位于伊利诺斯州尚佩恩-HPC的实际测试基地,与NCSA(美国国家超级计算应用中心)相毗邻。通过收购KAI,英特尔能够在英特尔体系结构上全面整合平台、处理器、网络、软件工具和中间件、编译器以及服务等,并对其进行优化。我们能够提供众多产品以及高性能兼容工具和具有各项授权的英特尔重要客户支持,以帮助开发商更轻松地开发可移植性并行应用。
英特尔提供的Fortran和C++编译器针对英特尔奔腾?4处理器和英特尔安腾处理器进行了专门优化。英特尔编译器支持最新的体系结构增强特性,如SSE2、超线程和英特尔NetBurst?微体系结构等。此外,编译器还具有先进的优化特性:外形优化、程序间优化和整体程序优化。英特尔编译器已在Windows和Linux操作环境中进行了测试和验证。英特尔Vtune?性能分析器有助于提高用户的工作效率。它可识别热点并提出代码改进意见,从而有助于提高代码性能和缩短代码实施时间。
英特尔运算内核库(Math Kernel Library)是一个包括线性代数、快速傅里叶变换(Fourier transforms)和矢量超越函数(vector transcendental functions)在内的软件库,可用于需要在英特尔平台上获得高性能的工程设计、科学和金融应用。英特尔MKL针对最新英特尔处理器进行了专门优化,并可与Windows和Linux环境进行兼容。其中包括Microsoft Windows 95、Windows 98、Windows NT*、Windows 2000和Windows Millennium Edition。Linux支持包括带有2.x内核的Linux发行版。
OpenMP应用编程接口(API)支持各种体系结构(包括Unix*平台和Windows NT平台)上的C/C++及Fortran中的多平台共享内存并行程序设计。该规范是由多家主要计算机软硬件厂商联合定义,具有可移植性和可扩展性。它为共享内存并行程序设计员提供了一个简单灵活的接口,来为从台式机到超级计算机的各类平台开发并行应用。
4.2. 典型的英特尔高性能计算系统配置
下面我们简单介绍基于英特尔架构的高性能计算系统的两种典型的系统配置,这些配置仅仅供参考。在具设计时应该根据项目的实际情况灵活考虑。
4.1.1. 中小型HPC系统配置
1. 系统目标: 目标为理论计算值大于每秒1000亿次浮点运算。
2. 计算节点: 采用基于双路英特尔至强处理器的服务器平台。共32台。
由于系统要求达到1000亿次浮点运算,从理论上讲,每个英特尔至强处理器(>2.0GHz)的浮点运算指标为20亿次,50个至强处理器可以满足要求。但考虑到其他因素对系统性能的影响,建议采用32台双路英特尔至强服务器。
3. 互联系统 由于系统的节点数不是非常多,而且处理器的配置从理论上大于系统需求。因此可以采用相对便宜的千兆以太网来作为互联设备。
4.1.1. 大型HPC系统配置
1. 系统目标: 目标为理论计算值大于每秒1万亿次浮点运算。
2. 计算节点: 采用基于四路英特尔Itanium 2处理器的服务器平台。共80台。
由于系统要求达到1万亿次浮点运算,从理论上讲,每个英特尔至强处理器(1.0GHz)的浮点运算指标为32亿次,320个至强处理器可以满足要求。
3. 互联系统 由于系统的节点数非常多,而且每个节点的处理能力非常高。作为大型高性能计算系统,应该采用高带宽、低延时的互联系统。建议使用Myrinet互联系统。上一页 [1] [2] [3] |
|
|
|
|
|
|
 |
|
 |
|
|
|