"神威·太湖之光":开机1分钟=72亿人算32年

科技工作者之家  |   2018-03-15 17:49

6月20日,德国法兰克福国际超算大会(ISC)公布了新一期全球超级计算机TOP500榜单,由国家并行计算机工程技术研究中心研制的“神威·太湖之光”以超第二名近三倍的运算速度夺得第一。更令人振奋的是,该套系统实现了包括处理器在内的所有核心部件全国产化。

超级计算机新霸主运算速度到底有多快?全国产化意味着什么概念,中国超算是否已经迈上世界之巅?记者走进负责该系统运营和维护的国家超级计算无锡中心,为你揭开“神威·太湖之光”的神秘面纱。

到底有多快

共有40960块处理器,性能相当于200多万台普通电脑

系统的峰值性能125.436PFlops,世界第一;

持续性能93.015PFlops,世界第一;

性能功耗比6051MFlops/W,还是世界第一。

国际超算大会上传来的消息光看数据让人不明就里。

“简单来说,这套系统1分钟的计算能力,相当于全球72亿人同时用计算器不间断计算32年;如果用2016年生产的主流笔记本电脑或个人台式机作参照,‘太湖之光’相当于200多万台普通电脑。”国家超级计算无锡中心主任杨广文介绍。

走进国家超级计算无锡中心,1000平方米的房间内,记者看到了“神威·太湖之光”的“真身”:

由40个运算机柜和8个网络机柜组成。每个运算机柜比家用的双门冰箱略大,打开柜门,4块由32块运算插件组成的超节点分布其中。每个插件由4个运算节点板组成,一个运算节点板又含2块“申威26010”高性能处理器。一台机柜就有1024块处理器,整台“神威·太湖之光”共有40960块处理器。

致力超算研究的意义不仅仅是“速度战”,更重要的是赢得“应用战”。

国家超级计算无锡中心副主任付昊桓介绍,依托“神威·太湖之光”,以清华大学为主体的科研团队首次实现了百万核规模的全球10公里高分辨率地球系统数值模拟,这一成果将全面提高我国应对极端气候和自然灾害的减灾防灾能力;国家计算流体力学实验室对“天宫一号”返回路径的数值模拟结果令人振奋,将为“天宫一号”顺利回家提供精确预测;上海药物所开展的药物筛选和疾病机理研究,短短两周就完成常规需要10个月的计算,大大加速了白血病、癌症、禽流感等方向的药物设计进度……

此外,“神威·太湖之光”还在绿色节能方面取得突破。杨广文说,过去超级计算机的用电量堪比一个中小城市,业界因此把能效比作为衡量其先进性的重要指标。“从低功耗、高集成度的处理器设计,到高速高密度的工程实现技术;从世界领先的高效水冷技术,到软硬件协同、智能化的功耗控制方法,‘神威·太湖之光’实现了层次化、全方位的绿色节能。”

究竟有多难

从“玻璃房”到“限售”,25平方厘米的中国芯打破30年技术封锁

30年前,中国的超级计算机用户有一个神秘的“玻璃房”:美国人把一台超级计算机卖给中国,用不透明的玻璃包裹得严严实实,中国技术人员没有授权不得入内。

北京师范大学全球变化与地球系统科学研究院王兰宁教授至今记得这个中国土地上的“技术飞地”。“全国只有几个有授权的科学家能够进入玻璃房,而且是在美国人的监视下,一旦程序运行完,机器立即被锁回玻璃房。那个所谓的超算速度,在今天看来充其量是一台高性能电脑,但对于当时的中国来说,却是一个难以企及的高峰。”

上世纪80年代,我国已逐步迈入独立设计和制造巨型机的国家之列,但却因核心处理器等关键部件与技术的短板只能受制于人,直接导致了我国虽是国外超级计算机“大买家”,却无法拥有匹配的“议价权”。

步入“十二五”,在国家863项目重点支持下,我国超级计算发展不断取得突破。“天河二号”问鼎“六连冠”的同时,在全球超级计算机500强榜单上,中国制造的名单正越来越长,这引起了美国的警惕。2015年4月,美国政府宣布,把与超级计算机相关的4家中国机构列入限制出口名单,目的就在于通过限售,锁死中国超算快速发展的脚步。

正是这种封锁带来的激励,让我国下大力气研发全国产化的“神威”系列超级计算机,直至此次登顶国际榜单。

由此,只有5厘米见方的薄块“申威26010”不仅成为“神威·太湖之光”的心脏,也成为我国自主研发打破30年技术封锁的一柄利器。25平方厘米的方寸之间,集成了260个运算核心,数十亿晶体管,达到了每秒3万多亿次计算能力。

中科院计算所研究员、并行计算专家张云泉表示,与“天河二号”使用英特尔芯片不一样,“神威·太湖之光”是首次完全用“中国芯”制造的中国最强大的超级计算机。国际TOP500组织在一份声明中写道:“中国在国际TOP500组织第四十七期榜单上保持第一名的位置,凭借的是一个完全基于中国设计、制造处理器而打造的新系统。”

杨广文说,关于是否应该自主研发核心处理器的争议一直存在,有人说做了这么多年没有做起来,干脆不要做了,“抱养”一个好了。还有声音说,引进、吸收、再创新的高铁模式就很好,为什么非要关起门搞自主生态?“如果没有坚持完全自主生态,没有搞十几年不行,再搞十几年的劲头,不可能有今天核心指标齐头并进的神威。”国家并行计算机工程技术研究中心副主任梁军说。

还有啥短板

应用能力不足,相关软件为国外垄断,中国超算离世界之巅仍有差距

超级计算机是国家科技综合实力的体现,从高端材料,到生命科学,再到深海探测、空间技术各领域,都离不开超算的支撑。这次好消息一出,有人认为中国超算从此稳稳地屹立世界之巅了。

真的是这样吗?

杨广文表示,不可否认,“神威·太湖之光”的成功,标志着我国超级计算机研制能力已位居世界领先水平,但在技术储备、系统稳定性方面与发达国家仍有明显差距。

速度之争是超算领域最为直接的对决。与“天河二号”“六连冠”的辉煌相比,此次登顶的“神威·太湖之光”要想长期占据世界第一的地位变得异常艰难。去年7月,美国启动“国家战略计算计划”,目标是到2025年建造世界上运算最快的计算机。

“未来五到十年,从每秒十亿亿次到每秒百亿亿次是超算发展的决胜之地。”国家并行计算中心的相关科研人员表示,虽然超算大国都在进行部署,但其中需要解决的技术关键环节非常多,以能耗为例,“神威·太湖之光”一年的用电量达到15兆瓦,相当于3个清华大学的用电量。以现有技术即使能够实现百亿亿次,能源消耗将十分惊人。

更为关键的是,无论速度有多快,发展超算始终是为了“致用”,而这仍然是当前我国超算发展的短板。

中科院计算机网络信息中心研究员张鉴表示,我国利用超算系统解决问题的能力长期不足,相关商业应用软件仍为国外垄断,在软件研制、应用开发和人才培养方面有待进一步提高。将“制好”转化为“用好”,才能真正实现对产业创新与升级的带动。

来源:人民日报


相关推荐 换一换