继去年底向NVIDIA、IBM投资3.2亿美元研发10亿亿次(100PFLOPS)超级计算机之后,美国能源部再次投资2亿美元给Intel、Cray公司研发18-45亿亿次超级计算机,主要部署在能源部下属的阿尔贡国家实验室,此前NVIDIA、IBM研发的10亿亿次计算机则部署在橡树岭、劳伦斯利弗莫尔国家实验室。 这次2亿美金投资研发的超级计算机有两台,其中代号Theta的那台计算性能只有8.5PFLOPS(8500万亿次),使用的是Intel的Xeon处理器及代号Kingts Landing的Xeon Phi加速卡,这套HPC使用的都是成熟部件,性能较低,不过功耗也只有1.7兆瓦。 真正值得关注的是其中代号Aurora(欧若拉,极光)的HPC,因为要等到2018年才能部署,所以这台计算机,集各种黑科技高科技于一身,理论浮点性能可达180PFLOPS(18亿亿次),最高可扩展到450PFLOPS(45亿亿次),比NVIDIA、IBM的10亿亿次性能要高得多,也要比目前TOP500排名第一的天河2号的54.9PFLOPS(5.49亿亿次)高出2-7倍多,除非中国能在未来两年内解决高性能计算芯片,否则Aurora在2018年登顶TOP500第一应该没什么悬念了,HPC领域除了中国能与美国争锋之外,其他国家不论财力还是需求都小得多。
我们再来详细看下Intel的Aurora超级计算机的架构组成,要想实现高达18-45亿亿次的性能(对比的Mira是目前的HPC),Aurora得使用新一代硬件,其中Intel已经证实Xeon处理器在其中只起到管理作用,计算主力是新一代的Xeon Phi处理器,代号为Kinghts Hill,详情不多,但今年的Kinghts Landing已经使用了14nm工艺,这个Knights Hill加速卡不出意外将使用2018年的10nm工艺,单卡性能估计在4-4.5TFLOPS之间,目前Knights Landing加速卡的性能约为3TFLOPS。
整套HPC将有超过5万个节点,基于Cray公司的Shasta新一代HPC平台设计,板载内存容量超过7000TB,内存带宽高于30PB/s,每个节点的带宽超过2.5PB/s,带宽超过500TB/s。存储系统则会使用Intel第一、第二代Omni-Path架构,容量不低于150PB,文件吞吐量1TB/s。 整套系统功耗为13兆瓦,比目前的Mira计算机的4.8兆瓦高了1.7倍,但其性能是后者的18倍还多,因此整体的每瓦性能比实际上从2GFLOPS/W提升到了13GFLOPS了,能效比提升了5倍多。
|