EDA365欢迎您登录!
您需要 登录 才可以下载或查看,没有帐号?注册
x
日前,国际TOP500组织发布新一期全球超级计算机500强榜单。中国超算“神威·太湖之光”与“天河二号”连续第三次占据榜单前两位,美国超算“泰坦”则被瑞士的“代恩特峰”挤到第四。这是20年来美国首次跌出前三名。
" {6 z4 t/ T$ h; K4 P/ p' ^2 v' j美国能源部近日宣布,将在未来3年拨给6家科技公司总额2.58亿美元的资金,以加速下一代超级计算机技术的研制,目标是到2021年交付至少一台每秒可进行百亿亿次计算的超级计算机系统。科工力量就此专访了中国计算机学会高性能计算专业委员会秘书长、国家超算济南中心主任张云泉,解读美国为何跌出TOP500前三,以及中美超算未来的发展。 6 Y+ D$ _# C/ f3 g0 s+ A% D& v3 n
科工力量:这次瑞士的“代恩特峰”超越美国的“泰坦”,美国超算跌出TOP500前三,对于这件事您怎么看?到底是美国超算技术逐渐跟不上时代了,还是另有原因? 5 e2 h2 n/ q$ c) @( @% [
张云泉:这应该是一个大的周期吧,中国超算发展最好的时期,正好恰逢美国超算发展的低谷,这两个叠加在一块。显得中国很强,美国很弱。这是中国超算这几年发展较快的一个延续,中国最好的机器刚好在这个时间段。美国的机器布局太晚了,打了一个时间差。这也是国际超算发展经常出现的现象。 " p2 |0 J) f. A/ q
另外,美国在明年下半年会强力反弹,会拿出180P的机器,超越太湖之光。而中国将来要超越美国的这台机器,也要一个周期。 ' U2 T C5 t' \/ N5 R1 [
代恩特峰
8 {' s& O, {) o0 n
科工力量:美国有诸多科技公司的技术很强,比如Intel、IBM、英伟达、AMD等,到底是什么原因导致美国的超算落后了? ' Y; [7 N" R. f
张云泉:美国超算技术依然非常强,也有能力研发更强的超算,只不过美国研制计划落后,使得中国可以打一个时间差,后来居上。从美国的计划来看,在明年下半年公布的下一代超算会采用很多新技术。比如全闪存技术、最新Power处理器、三维存储、克雷公司动态超算结构等等。美国下一代180P超算上会有很多中国超算上没有的技术。
" j: S& ^/ P- j% {( Q- H4 E% p科工力量:“代恩特峰”在芯片上采用了Intel的Xeon E5-2690v3和英伟达的NVIDIA Tesla P100 ,加上美国克雷公司在其中扮演了关键作用,有观点认为,“代恩特峰”其实是名为瑞士打造,但实为美国技术的超算。对这种观点您怎么看?
- D& `! |$ |" }张云泉:这个确实是美国为瑞士打造的。主要是因为欧洲的超算研制能力比较弱,一直用美国和日本的超算。除了法国稍微独立一些,能够研制自己的超算。由于欧洲市场很大,中国超算公司会打进欧洲,联想、浪潮、华为、曙光现在都在做这个事情,已经签了不少合同,将来可以看到欧洲用中国的超算做应用。 1 V+ h* L/ o' F8 s2 M
科工力量:欧洲超算制造能力相对一般,但超算应用能力却着实不弱,而中国近年来在超算制造能力上取得长足的进步,但在应用方面,虽然也有应用取得了戈登贝尔奖,但总体而言,和中国的超算制造能力相比,还是逊色一筹。这其中的原因何在?
$ f n! p: z3 H0 g张云泉:欧洲超算的应用水平是比较强的,总体来说,中国超算应用水平还是比欧洲稍逊一筹。欧洲的商业化应用特别强,原因在于欧洲的超算制造能力弱,主要精力放在怎么把买来的超算尽可能用好。而且一直以来重视商业模式,超算都是很多大公司联合购买,因为公司花钱买了超算,有动力去充分挖掘超算潜能,把超算用好。
+ B; ^/ o' E3 R$ V- b. p这方面对于中国也是有借鉴意义的。
+ m( r; _* m# `9 a9 D科工力量:一直有网络舆论声称,美国不制造100P超算是因为美国够用就好,而中国为了夺第一,所以制造高性能超算。您对这种说法怎么看?
; _( H4 W6 @' ]张云泉:从历史上看,美国也一直追求性能,在有一段时间,美国和日本超算争霸,日本的地球模拟器曾经连续5次拿了冠军。美国就紧急拨款投资建设了蓝色基因。因此美国也是一直追求性能的,并不是说够用就好。 0 i0 `- E' c2 h% x4 b
科工力量:美国的这一计划是不是驳斥了网络上一些人说的“因为现有的超算性能够用,所以美国不需要比拼超算”? ; r5 F7 w# Z0 I3 |+ I, C; U$ H7 M
张云泉:超算的性能是永远不够用的,学科需求、计算的精度和规模是无止境地向前发展,我们现在超算的性能是无法满足使用的。往往是超算应用降低精度要求、规模要求来配套现在超算的性能。
0 S+ ?; q$ w7 Y. {" V$ G国家计算流体力学实验室基于“神威·太湖之光”超级计算机,对“天宫一号”飞行器两舱简化外形陨落飞行绕流状态大规模并行模拟 + ^: o5 z0 i: u& v; n8 P
其实美国一直想把第一抢回去。奥巴马在下台前就发过总统令,只不过因为当时发总统令的时候快下台了,作用有限,本来3个月就应该做好的事情,结果1年才做完。川普虽然砍了很多科研经费和医疗方面的钱,但他没砍超算的钱,反而给超算增加钱。
# _0 |" B% z) O" |这其实也可以看出超算的重要性。
3 a) \- V6 g' M* L# p科工力量:美国政府资助国际商用机器公司、超威半导体公司、克雷公司、惠普公司、英特尔公司和英伟达公司开发下一代1000P超算,而且美国在下一代超级计算机技术方面的研发总投资将达到至少4.3亿美元。对于美国1000P超算的发展,您怎么看? 1 O8 }, e5 ^0 p' ]7 ^! o
张云泉:超算是国家工程,计算机技术发展的龙头,需要的资金投入非常高。之前已经介绍了,超算非常重要,所以会有政府高额投资。很多技术都是现在超算里做出来,然后再民用化。而且超算研发回报也很高,投入一美元,可以获得十几美元,只不过回报周期会长一些,而且风险比较高。
0 Z* e) u1 E8 m# _科工力量:从媒体报道看,美国政府承担了1000P超算的60%研发成本,国际商用机器公司、超威半导体公司、克雷公司、惠普公司、英特尔公司和英伟达公司大约承担40%的项目经费。为何超算项目如此依赖政府资金投入?
' A+ I/ u5 [; |( b. u张云泉:超算的发展一定要政府投入,体现国家综合国力,仅仅靠公司创新去做,公司的动力不大,因为公司不会考虑国家战略需求。而且超算研发风险很大,一旦失败损失很大,这对于公司和股东都是非常不利的。所以世界各国超算都是政府主导,政府牵头,委托公司来做。美国的做法是政府投入60%,公司也投入一部分。而中国现在还是以政府投入为主,怎么把公司的财力用起来,这个其实也是中国可以借鉴的。
5 F! B: s8 Z$ H% P7 Y' f科工力量:神威太湖之光采用了申威26010芯片,下一代中国1000P超算还会采用国内单位自主研发的芯片么? T% J! L0 a9 I' k( W, ~# u8 y; n# A
张云泉:三台1000P超算原型机用的都是自主芯片。神威会用申威,曙光会用海光,天河会用飞腾。
' W! `' }% B( J, z7 U2 N R一名研发工程师展示“神威太湖之光”所使用的“申威26010”众核处理器
0 u% u3 i) U5 q- p4 [& ^ y( }
科工力量:中国计划在2020年左右建成1000P超算,美国也计划在2021年建成1000P超算,日本也有这方面的规划,对于中美日1000P超算竞赛,您怎么看?
" g8 a D! t' `7 x6 J3 C- h张云泉:现在中美日欧竞争都是白热化的。现在来看中国的规划最早,在2020年前后,日本、欧洲、美国都在往后推。日本已经推迟到2021年,欧洲推迟到2022年,美国推迟的更远到2023-2025年。
; a, D: R- F0 A+ q' v' h5 `但是美国部署了2条线,一条是成熟路线,用相对成熟的技术研发1000P超算,并保证商业应用。另一条是非常激进的1000P超算路线,不考虑任何商业目的和应用,任何能用的技术都用上去,争取在2021年抢第一。 + q3 Q& B% E+ p8 ]+ |
我估计中国的1000P超算也可能会延期,因为功耗的要求太苛刻了。当然也不排除中国能按照计划在2020年建成1000P超算。
* i3 P' \7 ?% Z |