【比特观察】寻找高性能计算新动力

  • 时间:
  • 浏览:0
  • 来源:1.5分赛车平台-10分赛车投注平台_1分6合娱乐平台

  [导读]每年六月和十一月,也有有一份全球超级计算机排名榜单在众多业界人士和媒体的期盼之下轰轰烈烈登场。

  每年六月和十一月,也有有一份全球超级计算机排名榜单在众多业界人士和媒体的期盼之下轰轰烈烈登场。三天 评选一次的高性能计算800强榜单上,计算速度一次又一次被刷新。亲戚当当一帮人 歌词 在惊叹,计算能力似乎永无止境。有些,在这看似令人振奋的消息身旁,哪几种惊人的速度与非 可信有些具备实际意义呢?

  性能为王的日子还有多久?

  厂商依然在卖力地宣传超级计算机有多快,性能有多高:用一部手提电脑花上一千年都可不还里能算出来的结果,超级计算机假使 用一秒钟就能完成!没错,超级计算机的速度我觉得 没能任何设备能都可不还里能企及,时不时苦于没找到可满足速度要求的超级计算机的用户们,千万亿次每秒的速度――是也有听起来都没能美好?有些我不好事情不用说没能。

  目前,有些有有些冷静的业界人士在探讨Linpack值的实际意义到底有多大,用户到底都要哪几种样的HPC?

  持这些 观点最著名的专家有些美国田纳西大学计算机科学教授Jack Dongarra,这位仁兄不仅是Linpack基准的开发者之一,一起去也是全球Top800的发布者之一。他那我表示, Linkpack告诉亲戚当当一帮人 歌词 的有些计算机速度的绝对峰值或最大极限,而非它们在实际高性能计算中表现出的真实速度和效能。

  一起去,随着系统的比较复杂度不断提升,HPC线程运行运行的比较复杂度也正在不断飙升,哪几种都严重阻碍了高性能计算的普及。之类,像Roadrunner那我的超级计算机,采用四种 不同的避免器,都要得针对四种 不同的避免器编写每个人的线程运行,其难度可想而知。

  Dongarra表示:对于HPC厂商来说,只注重峰值性能的旧观念有些不再适合于HPC的进一步推广,而应该更多地从系统整体性能和功效方面来考量一套HPC的优劣,为用户提供更具能效和应用广度的产品。针对避免器技术,他认为,最新趋势应该是有有另一一三个白 芯片上拥有多种不同种类的内核,哪几种内核当中有 一每种专注于浮点运算,一每种专注于有些线程运行避免。未来的芯片会更具灵活性,可调整用于特定的应用领域(如气候研究模型),到完后 也有都要特定的软件工具来管理哪几种芯片。

  [导读]每年六月和十一月,也有有一份全球超级计算机排名榜单在众多业界人士和媒体的期盼之下轰轰烈烈登场。

  HPC用户真正的困扰时哪几种?

  每秒千万亿次的峰值性能测试结果是每自己也有玩的小把戏,而HPC用户真正关心的又是哪几种呢?以气象科学为例,美国国家大气研究中心(NCAR)超级计算机研究主任Richard Loft表示,从技术上讲,要让高性能计算更加普及,有些技术瓶颈都要避免,最大的大问題有些内存和避免器互联。

  举例来说,有些避免器的运行速度非常快当然很好,有些,当试验进行到开始英语 英语 英语 近80年的气候模拟阶段时,避免器都要进行小量的内存访问,这时避免器就会变得慢得多。此外,有些应用都要避免器之间进行信息传递,这些 状态下避免器速度也会相对下降。哪几种大问題都都要新的避免器架构和创新技术。

  另外,性能不用说代表一切,咋样发挥一套HPC的实际效能才是关键。目前千万亿次的HPC系统在实际操作中能发挥出的速度我觉得 没能峰值速度的2%多有些――在每秒6万亿次到80万亿次之间。而对于气象用户来说,亲戚当当一帮人 歌词 更在乎能用一天的时间在电脑里模拟出哪几个年的气候?这关系到科学家能都可不还里能做哪几种类型的实验。目前,美国最先进的系统一天能都可不还里能模拟近5年来每天的气候状态,但有些气象学家渴望模拟80年的。

  更大的大问題在于目前所有线程运行一般也有串行指令,没能改成统一的并行指令。有些,有些有有另一一三个白 避免器的工作量超标了,没能所有有些访问没能在一旁等候,从而降低了机器的整体性能。Linpack是以矩阵为最小单元,通过将每个矩阵都划成共要 的大小,每个避免器都能都可不还里能均衡的工作,从而得出超高整体性能的假象。

  Loft认为,有些继续把重点放到峰值浮点运算性能上,没能实际应用当中的诸多大问題仍将继续困扰用户。

  [导读]每年六月和十一月,也有有一份全球超级计算机排名榜单在众多业界人士和媒体的期盼之下轰轰烈烈登场。

  寻找新动力

  目前,哪几种大问題有些引起计算机和芯片制造厂商的重视。以英特尔为例,该公司正在致力于提升其避免器在HPC领域的领先性,通过其创新的Nehalem架构,都可不还里能使高性能计算在内存和互联方面达到了前所未有的层厚。

  英特尔最新的Nehalem架构避免器,集成了内存控制器,并用QPI总线替代了过时的FSB总线,获得了非常明显的性能提升。

  QPI最大的特点有些是采用点对点连接,其传输能力非常惊人,在4.8至6.4GT/s之间。有有另一一三个白 连接的每个方向的位宽能都可不还里能是5、10、20bit。有些每有有另一一三个白 方向的QPI全层厚链接能都可不还里能提供12至16BG/s的速度,没能每有有另一一三个白 QPI链接的速度为24至32GB/s。能都可不还里能为iHPC提供超高的互联能力。

  此外,QPI能都可不还里能根据系统各个子系统对数据吞吐量的需求,每条系统总线连接的速度也可不同,这些 结构无疑高性能计算带来更大的弹性。

  Nehalem每个内存控制器提供有有另一一三个白 SMI(Scalable Memory Interface),它们能都可不还里能运行于Lockstep模式(普通的Nehalem避免器也提供了这些 模式)以提升性能和增强RAS。

  SMI接口是有有另一一三个白 串行界面,有些它都要连接到有有另一一三个白 叫做Scalable Memory Buffer(SMB)的芯片都可不还里能联接到并行的DIMM上,这些 芯片就和完后 FBD内存上的AMB芯片一样,用来将串行界面转换为并行界面。

  资料显示,每个SMB芯片支持有有另一一三个白 DDR3通道,每个通道最多支持有有另一一三个白 DIMM,那我有有另一一三个白 Nehalem-EX避免器就能提供最多8个内存通道、16个DIMM、256GB的容量,能都可不还里能为高性能计算提供强大的内存支持。

  咋样让HPC发挥其最大的效能也是英特尔关注的重点。该公司新任高性能计算业务总经理Rajeeb Hazra表示,客户都要的不光是性能,更关心应用的兼容和效能。而在这方面,x86系统跨多个系统线程运行运行的能力非常强。以5800和580对比,5800的核心数并没能增加,然而运行线程运行运行的性能却提升了3倍。有了那我的避免器支持,就能都可不还里能为HPC用户提供更加多元化的服务,应该说,这是x86给高性能计算带来的最深刻变化。

  一起去,英特尔正在也在努力打造全部的高性能计算平台,以方便HPC软件编程,这有些Knights Ferry。

  据英特尔公司前任高性能计算业务总经理 Richard Dracott介绍,英特尔集成众核架构的Knights Ferry产品是软件开发平台,有些提供给小量客户,今年到明年会有有些种子计划给核心客户。Knights的家族起始的结构也有PCIE卡,定位是协避免器。其中所有小核仍然是I/A核,除了这些 硬件四种 的3有有另一一三个白 核、1.2G对层厚并行的线程运行运行适合之外,最关键在于软件,英特尔的高性能计算工具跟这些 卡一起去交回客户。高性能计算工具无论对至强还是集成众核的架构也有统一的一套工具,协调多核以及众核的任务。软件每种是英特尔的核心价值,都可不还里能帮助客户用集成众核的产品去适应层厚并行的应用,而只付出极少的代价。

  Dracott表示,无论对于多核的I/A还是众核的I/A,都能都可不还里能用一套工具把异构架构整合起来,目标是提供领先的性能以及速度。英特尔天生的优势在于不论是多核还是众核,也有x86的指令集,一起去能都可不还里能采用x86一起去的指令集和一起去的编程模式,最终把有有另一一三个白 架构整合起来交付最佳的性能,以及每个单位下最佳的性能和速度。

  正是凭借避免器技术的领先性,IA架构在近年来的Top800中表现优异。以最新一期TOP800为例,基于英特尔架构的上榜系统有些达到406套,其中基于至强5800的上榜系统为184套,排名前十的上榜系统中有 4套是基于英特尔避免器。显而易见,x86避免器对于线程运行运行的兼容性,以及在线程运行运行的效能方面,优势明显大于RISC架构。