(原标题:挑战神威太湖之光,日本超级计算机有什么独到之处?)
摘要: 在中国神威太湖之光率先将性能冲到100P后,日本也按捺不住了,日本富士通发布了要建1000P超算的PPT,而且还引ARM为外援。也许有人会问,能成么?其实,日本在超算上的技术实力并不差,而且还曾经有过京这样曾经雄踞TOP500榜首的大机器,虽然在TOP500上被后来者超越,但在Graph500上依旧雄踞榜首。只是日本经济持续低迷和时运不济,日本超算逐步被中国和美国拉出了距离。
(日本京)
日本超算京才是世界第一?
就在神威太湖之光在TOP500荣登榜首之际,日本经济新闻报道,“神威太湖之光虽然排名比较靠前,但其适合的领域有限,对于用户而言是比较难用的机器”,日本很多相关人士表示,“超级计算机要有用才行”。
日本东京工业大学教授松冈聪说——
“京与神威背后的设计思想有很大的不同,京是通过扩充海量内存,可广泛应对各种现实运算的超级计算机。在500强中速度虽然仅为神威的九分之一,但京即使面对复杂的运算也不容易减速。神威虽然排名比较靠前,但被认为其适合的领域有限。松冈表示神威对于用户而言是比较难用的机器,这点不可否认。”
为此,笔者咨询了业内专家,他认为松冈说的有一定道理,并表态:
“客观地说,如果我自己出钱买的话,我选择京”。
也有业内专家表示——
“毕竟异构众核是大趋势......从计算性能上看,神威太湖之光依然是世界第一”
京有什么独到之处?
虽然京在Linpack性能上大约是神威太湖之光的九分之一,尽管日本目前并没有建设出能与天河2号、神威太湖之光相匹敌的超算,但就京本身而言,还是有其独到之处的。
2016年7月,在Graph500排行榜上,京连续第三次夺得冠军——
在测试中京用0.45秒时间成功解开了由大约1万亿个根节点及16万亿个分支节点组成的大规模图表广度优先搜索问题 。基准测试得分为38621GTEPS。排名第二的是中国的神威太湖之光,成绩为23756GTEPS;排名第三的是美国的红杉,为23751GTEPS,排名第四的是美国米拉,14982GTEPS。什么是Graph500呢?其实,除了强调Linpack性能的TOP500,还有强调内存带宽和延迟的Graph500,和强调节能环保的Green500。
Graph500对全系统的内存带宽和内存延迟有很高的要求,而计算能力本身已经不影响测试结果了,这种测试偏向于访存密集型运算,在大数据分析以及大规模图表分析等场景下比较有意义。
近年来,有观点认为Linpack测试已经过时了,TOP500创始人之一的田纳西大学教授Jack Dongarra就提出了HPCG测试 ,与Linpack关注线性方程的计算性能不同,HPCG更加看中整体性能的平衡,能代表了共轭梯度迭代法的一类应用的计算和通信特征,但也仅仅代表了某一个方面的特征,并不能涵盖超算的所以特征。如果计算性能和通信不是一个量级的,即便两项指标分开看都很强,但也会导致HPCG偏低的结果。截至目前,HPCG还没有被业界广泛接受。
在HPCG测试中,京的表现也不错,仅次于天河2号,成绩为554.4TFLOPS,天河2号的成绩为580TLFOPS,位列第三的神威太湖之光HPCG性能是371.2TFLOPS。 如果用代表运算实际效率的HPCG/HPL这项指标看,天河2号的HPCG/HPL参数为1.1%,神威太湖之光的HPCG/HPL参数为0.4%,而京的HPCG/HPL参数为4.9%。HPCG更看重综合性能,要求计算性能、内存带宽、延迟等指标兼顾,一旦出现某项性能特别强的情况,也就是出现偏科的情况,即便几项指标都不差,也会出现HPCG运算速度偏低的情况。
计算和通信的不平衡导致HPCG/HPL偏低
神威太湖之光HPCG/HPL偏低的原因就在于计算性能和通信等要素之间的不平衡程度较高 ——神威太湖之光之所以能在TOP500排名第一、Green500排名第三、在Linpack浮点性能93PFLOPS、Linpack效率高达74.16%的情况下,性能功耗比达到6G/W,做到了兼顾计算性能和节能环保,而且这还是在处理器的制造工艺落后Intel两代,采用28nm制造工艺的情况下做到的,原因就在于借助大量处理器并行来提高运算速度,同时通过降低耗电极大的存储器性能来削减能耗,这会加重综合性能上的不平衡——这种不平衡并非是计算性能差,或者互联网络差——在计算性能上神威太湖之光是顶级的,在互联网络方面,神威太湖之光只是主流水平,还称不上顶级的互联网络正是因为计算和通信上的不平衡,导致神威太湖之光HPCG/HPL参数偏低。
而京在这项参数上之所以高,就是因为虽然在计算性能和通信并非顶级水平,但因为计算性能和通信属于一个量级,加上属于同构超算的因素,所以HPCG/HPL参数会比较高。
这两个测试的意义在于说明了京的易用性较好,而且通过扩充海量内存,可广泛应对各种现实运算,具有较广的应用面,而且在计算性能和通信上做的非常均衡。相比之下,神威太湖之光就属于各方面性能都不错,但计算性能特别强悍的类型,在均衡性上是不如京的。但这并不意味着神威太湖之光就不如一台几年前的大机器,实际上,在绝对性能和在神威太湖之光所擅长的应用上,京是无法企及的。
日本下一代超算会是什么样?
在德国法兰克福举办的国际超级计算机大会上,日本富士通公司透露它的下一代超级电脑Post-K将使用ARMv8 架构,根据富士通公布的计划Post-K计划在2020年推出,计划应用性能是K的100倍,也就是性能将达到1000 PFLOPS,换言之就是神威太湖之光性能的10倍。
另外,富士通还公布了可以用于建设100P超算的技术储备——SPARC64 XIfx处理器,该款处理器有32个核心用于计算,2核心用于运行OS服务,有点类似于BlueGene/Q,采用20nm制造工艺,双精浮点性能超过1TFlops。至于日本能不能将技术图纸变成现实,只能有时间来检验了。