最强超级计算机
解读地球上最强超级计算机的运行项目
出处:pconline 2010年07月06日 作者:菠萝果汁 责任编辑:liuyu1
今天要为大家带来的是有关超级计算机的一些故事,看看世界上最快的超级计算机都在做些什么。 美洲豹超级计算机
Cray 美洲豹超级计算机
作为到现在为止全世界最快的超级计算机(Cray XT5-HE Opteron Six Core 2.6 GHz 内核数224162个, 实测运算速度1759000GFLOPS ,理论峰值运算速度2331000GFLOPS) ,Cray 美洲豹隶属于美国能源部,坐落于美国橡树岭国家实验室。说到橡树岭国家实验室,作为“曼哈顿计划”的一部分,(曼哈顿计划就是美国于1942年利用核裂变反应研制原子弹的计划。曼哈顿计划成功实施后为美国留下了巨大的财富——洛斯阿拉莫斯国家实验室和橡树岭国家实验室)最近的项目是将建设核能创新中心。
橡树岭国家实验室
美国能源部于5月28日宣布,为激励创新和实现清洁能源突破,由橡树岭国家实验室领导的团队将获得1.22亿美元的支持,目的是在五年内建立和运营一座核能建模与仿真能源创新中心。该中心的人员将来自大学、产业界和其他国家实验室,将利用世界上性能最先进、功能最强大的美洲豹超级计算机,推动核反应堆在设计和工程方面的重大飞跃。
创新能源
能源创新中心将要求工程师对目前运行的反应堆进行仿真建模,建立一个“虚拟模型”。然后利用“虚拟模型”来解决有关反应堆运作与安全方面的重要问题,解决包括诸如增加电力产出、延长反应堆寿命等
问题。通过从“虚拟模型”和现实反应堆中获得的数据相结合来解决核能在近期、中期和长期内所面临的技术问题。
美洲豹的科学应用
在已经披露过的美洲豹超级计算机的科学应用中,上图从左到右从上到下依次为:
1:极端气候模拟。
该项目是在美国国家能源部、美国国家大气研究中心通过其古气候计划的支持下。在地球45亿年的历史中,气候总在冷热间徘徊。而通过美洲豹超级计算机现在可以完整的连续的模拟这个过程,利用全球气候模型,包括大气之间的相互作用耦合,海洋,陆地之间的移动。提供了有关全球气候变化根源和影响的珍贵数据。
2:超新星研究。
该项目是由加州大学圣克鲁兹分校的教授负责。Ia 型超新星在性质上是最大的热爆炸,规模之大远超过太阳以及其他生命元素,这些爆炸的恒星最神秘的地方在于它们的爆炸方式。美洲豹超级计算机模拟运行了Ia 型超新星的爆炸过程,模拟出了在爆炸的不同时间段产生出的放射性碎片等。这些资料为美国宇航局的相关研究提供了宝贵的数据。
3:生命和半衰期。
碳-14的衰变速度永远慢于它的同位素,使得研究人员可以通过植物或者生物中所含有的碳-14元素追溯到六万年。碳-14的原子核内有6个质子与8个中子,在使用美洲豹超级计算机之前,研究人员只能考虑两个核子相互作用,因为需要描述不同的组合数量非常大,这是一个内存密集型的计算。通过美洲豹超级计算机研究人员能够更深入的了解碳-14的半衰期为何如此之长。
4:从光合作用到新燃料
该项目是由橡树岭国家实验室的美洲豹超级计算机与美国田纳西州大学的挪威海怪超级计算机共同参与的。替代能源是全球的一个热点话题也是全人类必须要关注的话题,纤维素是地球上最古老、最丰富的天然高分子,是取之不尽用之不竭的人类最宝贵的天然可再生资源。找到如何合理分解释放葡萄糖就有希望利用植物作为一种新燃料。
5:聚变加速
很少有代码要求比现有聚变加速粒子更快的I/O和更大的规模。例如,GTC 和XGC-1是运行在NCCS Jaguar Cray XT5超级计算机12000多个内核上的。面对最大数据集的运行,超级计算机的速度总是需要不断提高的。
6:模仿火山爆发应激气候
火山喷发,重力气溶胶粒子通常会在2至3年之内回落。相反,人为排放的有害物质长期持续,并可能改变未来的气候。有几种类型的气体,包括二氧化碳,是火山爆发时喷出,二氧化硫的排放和硫酸盐气溶胶的产生尤其重要。如果通过超级计算机可以模拟运行该大气环境模型对于火山喷发的灰尘反应,便可以预测出该大气环境对于人为长期排放的反应。
走鹃超级计算机
IBM 走鹃超级计算机
了解了美洲豹超级计算机之后,我们一同走进同样隶属于美国能源部的洛斯阿拉莫斯国家实验室。该实验室以研制了世界上第一颗原子弹而闻名于世。这里这里部署了另一台赫赫有名的超级计算机,IBM 走鹃超级计算机(BladeCenter QS22/LS21 Cluster, PowerXCell 8i 3.2 Ghz / Opteron DC 1.8 GHz,内和数122400个,实测运算速度1042000GFLOPS ,理论峰值运算速度1375776GFLOPS )。
洛斯阿拉莫斯国家实验室
洛斯阿拉莫斯国家实验室(Los Alamos National Laboratory, LANL)由加利福尼亚大学运作,位于新墨西哥州的洛斯阿拉莫斯。该实验室是世界上最大的多学科研究机构之一。它是新墨西哥州北部最大的研究机构和雇员最多的机构,有大约10,400名加利福尼亚大学雇员,以及大约2,800名合同雇员。
洛斯阿拉莫斯国家实验室
实验室约三分之一的技术人员是物理学专家、四分之一是工程师、六分之一是化学和材料专家,其余的工作在数学和计算科学、生物科学、地质科学等其他学科。也有外部的专家和学生来实验室做访问研究工作。实验室联合大学和工业界进行能源方面的基础和应用研究。实验室年度预算约为22亿美元。
洛斯阿拉莫斯“一弹成名”
现在走鹃超级计算机在实验室里又在做些什么呢?
走鹃超级计算机的科学应用
走鹃的科学应用
1:纳米技术。
现在我们可以开始了解材料的行为一直到纳米尺度,在那里,即使是单个原子的运动有时也可以改变机械或电气性能。我们模拟金属纳米线拉伸过程。使用走鹃超级计算机,可以减缓模拟,看看到底是什么,在拉伸的时候,多次发生变化。比以前在更可能的情况下观察原子间的堆叠错误(用红色突出显示)网络的形成。
2:核聚变、激光技术。
该项目是由洛斯阿拉莫斯国家实验室的走鹃超级计算机与劳伦斯利弗莫尔国家实验室共同参与的。美国计划在2010年秋季由劳伦斯利弗莫尔国家实验室实施核聚变,激光技术的实验。该项目是人类历史上最重要的激光技术,在实验室中取得核聚变能源。规模动力学模拟在三维激光等离子体相互作用的激光散斑。在走鹃超级计算机的协助下,可以实现前所未有的规模,速度和保真度。(值得一提的是现运行速度世界排名第8的Blue Gene L超级计算机就隶属于劳伦斯利弗莫尔国家实验室,我们也将于下次给大家带来相关介绍)
3:磁重联技术
方向相反的磁力线因互相靠近而发生的重新联结现象。在此过程中,磁能可转化为其他能量。涉及到各种形式的等离子体的磁场能量快速转换动能。通过走鹃超级计算机,使这些类型的动态变化都在方便的观测形态下,从而了解磁重联的过程。
4:艾滋病毒
这是一个彩色树组序列的艾滋病毒,收集后找到传染艾滋病毒的原因。基本的计算问题,是要这个序列数据(这里的10442〜3873核苷酸字符串),找到该病毒如何随时间演变模型中的所有序列。当树上的节点附近生成另一个节点,这意味着有一个病毒是另一种病毒类似。走鹃超级计算机的进化模式,找到了一个病人的序列很少与另一位病人的序列重叠。其中一个重要目标是要找出可能存在疫苗的目标地区。
走鹃的科学应用
5:暗物质
暗物质和暗能量是宇宙的主要组成部分。宇宙的基本构成是由:23%的暗物质(其中很大一部分是所谓的光环在局部的团块)73%暗能量组成。在该项目中宇宙的构成物质分布在有史以来(由走鹃超级计算机运行的)规模最大的高清晰度模拟宇宙中。走鹃超级计算机模拟的宇宙综合数据库将成为研究暗物质科学的重要组成部分。
6:铜反应
我们在研究铜反应时感到震惊,用可扩展并行短程分子动力学,计算机代码,模拟过程,如固体中冲击波在纳秒的时间尺度上。许多现象基本材料需要在长度和时间尺度上超越这些地方,目前获得的分子动力学(MD )模拟,随着方法的改进,使更多的现实空间和时间尺度模拟成为可能。在可扩展并行短程分子动力学上已成功用于执行迄今最快的MD 模拟,在走鹃超级计算机上达到369 TFlop/S。
7:流体动力学
在流体动力学领域了解湍流,流体的压力下的行为,仍然是物理学中未解决的问题之一。复杂条件下,作为那些在1A 型超新星爆炸的早期阶段出现。有一种复杂的现象与这些活动有关的,这是一种相关的超新星建模重要的未决问题。通过走鹃超级计算机有助于在使用大型流体动力学结构的规范和处理复杂问题方面的相关研究。
我们将在之后为大家带来更多超级计算机的相关报道,挪威海怪,红色天空,蓝色基因P/L等等。还有更多相关实验室的靓图!
拥有世界排名第9位蓝色基因P 超级计算机的阿贡国家实验室
阿贡国家实验室周边环境
前言:在笔者为这期超算系列内容搜集材料的时候,读到了很多有关LLNL 国家点火实验的资料,感触颇深。在这已持续16年的项目背后,是人类不断探究文明追求科技的缩影。笔者也愿意相信,核聚变能源必将被人类所控制。很幸运,我们也许就将在2010年见证人类21世纪这最伟大的发明,真正的清洁能源,永恒之光。
在上一期《解读地球上最强超级计算机的运行项目》一文中,为大家介绍了部署于橡树岭国家实验室的Cray 美洲豹超级计算机和洛斯阿拉莫斯国家实验室的IBM 走鹃超级计算机。而今天我们先要为大家带来的是劳伦斯利佛摩尔国家实验室(LLNL)的蓝色基因L 超级计算机(Blue Gene L ),同样隶属于美国能源部。 Blue Gene/L超级计算机
部署于劳伦斯利佛摩尔国家实验室的IBM 蓝色基因L
Blue Gene/L基于IBM PowerPC440,主频700MHz ,内核数为212992个,理论运算峰值速度596378GFLOPS ,实测运算速度478200GFLOPS 。(2007年11月TOP500运算速度排名世界第1,在最新榜单中位列第8) 劳伦斯利佛摩尔国家实验室
劳伦斯利佛摩尔国家实验室
劳伦斯利佛摩尔国家实验室与洛斯阿拉莫斯国家实验室颇有渊源。(1952年,洛斯阿拉莫斯国家实验室研制的第一颗氢弹试爆成功后,在“氢弹之父”爱德华·特勒的推动下,美国政府成立了劳伦斯利佛摩尔国家实验室)这两家实验室也是至今为止地球上最知名的两家核实验室。
劳伦斯利佛摩尔国家实验室每年经费预算约16亿美元,工作人员超过8000人,包括3500名科学家、工程师以及技术人员。LLNL 拥有价值数十亿美元的研究设备。其中建有现代化的新炸药合成实验室,并配有新型的含能材料合成、分析、测试设备,通过超级计算机可设计预测新炸药性能、结构以及对其它材料的影响。
国家点火装置NIF
巨大的点火封闭型装置
在上一期介绍洛斯阿拉莫斯国家实验室的走鹃超级计算机时,我们曾经提到过现在两家实验室正在利用自己所能利用的一切资源,准备着一项伟大的实验(国家点火装置National Ignition Facility,走鹃和Blue Gene/L超级计算机模拟核聚变实验中的激光发散的全部过程)。如果实验成功这也许将是21世纪人类最伟大的发明,也是为全人类做出的最杰出的贡献。为什么这么说?众所周知,随着地球可用资源的逐渐枯竭,各地地貌气候变化愈发明显。人类急需寻找可以替代煤炭,石油等常用能源的资源。
核聚变激光技术
前一项科研项目我们上次曾经提到过,是由洛斯阿拉莫斯国家实验室的走鹃超级计算机与劳伦斯利佛摩尔国家实验室共同参与的。美国计划在2010年秋季由劳伦斯利佛摩尔国家实验室实施核聚变,激光技术的实验。该项目是近60年最重要的激光技术,在实验室中取得核聚变能源。规模动力学模拟在三维激光等离子体相互作用的激光散斑。在走鹃超级计算机的协助下,可以实现前所未有的规模,速度和保真度。 一种新的诊断系统,光栅驱动瞬态光学记录仪(该装置被称为鳄鱼),由LLNL 科学家和工程师通过Blue Gene/L超级计算机共同开发,能取得一个万亿焦耳的X 射线或可见光图像。这种诊断工具可以详细
的测量在点火(国家点火装置实验)条件下,采取的研究高能量密度物理热烧伤的条件、天体物理实验和核武器运作。这将使新的研究,以推进天体物理科学理解,以及核库存管理。通过超级计算机,该模拟系统在提高了“鳄鱼”的精度后,时间分辨率可以超过现有的仪器50倍,可以用形象的事件表现如何创建使用高功率激光器,以及其他高能量密度的物体。
基于超级计算机的模拟计算结果,由广大LLNL 的数学家,物理学家,化学家和工程师通过近16年的研究设计了以下NIF 项目的设备。
工作人员正在封闭型点火装置上工作
封闭型核聚变(ICF )装置是使用外部的热能来源注入其中,以达到封闭区内的高温高压。封闭区中央的目标是一个包含若干核燃料的小球,可能使用氢或氚。高温激光会使小球表面等离子化,表面也会炸开。其余中心材料受到牛顿第三定律(作用力和反作用力定律)驱使,最终会向中央塌缩。而爆炸波会使塌缩均匀向中央浓缩达到高温高压下的极高浓度。只要浓度够高应该就会发生核聚变 。
核聚变
人类为什么需要核聚变技术?
太阳的能量源自于核聚变
核聚变是指由质量小的原子,主要是指氘或氚,在一定条件下(如超高温和高压),发生原子核互相聚合作用,生成新的质量更重的原子核,并伴随着巨大的能量释放的一种核反应形式。原子核中蕴藏巨大的能量,原子核的变化(从一种原子核变化为另外一种原子核)往往伴随着能量的释放。如果是由重的原子核变化为轻的原子核,叫核裂变,如原子弹爆炸;如果是由轻的原子核变化为重的原子核,叫核聚变,如太阳发光发热的能量来源。
核聚变是氢弹爆炸的基础,可在瞬间产生大量热能,但目前尚无法加以利用。如能使热核反应在一定约束区域内,根据人们的意图有控制地产生与进行,即可实现受控热核反应。这正是目前在进行试验研究的重大课题。受控热核反应是聚变反应堆的基础。聚变反应堆一旦成功,则可能向人类提供最清洁而又是取之不尽的能源。
为地球带来恒星之光
绝大多数恒星都是通过质子的衰变而发出光芒
核聚变会放出大量产物,其中一些(主要是阿尔法粒子)碰撞到外层高浓度燃料材料就会减速下来。期间产生的碰撞热能侦测到后就可以断定发生核聚变反应。只要对燃料球给予正确的高温高压就能发生链式反应,当出现由内而外的震波时。这现象就称为" 点火" ,这是引发核聚变的重点过程,并且会放出大量能源。
工程人员调整点火装置
通过IBM 蓝色基因L 超级计算机的计算显示,必须要在燃料球被震暴波爆开前的数微秒之间注入足够能量才能核聚变成功。而且加诸小球上的能量必须要极度高能却又均匀才能使球体向中央均匀塌缩至高浓度。虽然考虑过其他施加能量的方法,例如重粒子加速器,但目前还是只有激光科技能达成此种要求。
技术人员整理蓝色基因L 的线路
NIF 目标是造成500兆兆瓦(TW ,中文称之为太瓦)能量的激光在1微微秒的同一瞬间击中球体。设计中是采用192门总成激光光束,每四具激光产生器一组共48组 每组经过16道强化过滤器。为了保证激光产生器同步化,所有激光的最初光源都是来自单一产生器再分割强化。因此最初的激光能量只有一具1053nm 的镱红外线激光主控振荡器搭配光纤引导分裂进入48具扩大器。扩大器会让光束循环经过四次钕玻璃,每层增强6焦耳能量。原本的设计中这层扩大器会将建筑物分割成两半。改良设计后可以达到更大功率所以也就缩小了体积。
激光产生器
主扩大器原理一样但是更大且位于激光末端。发射后第一层扩大器会点燃7680具高能量氙灯,其中每层小扩大器还有自己的氙灯。所有灯是用大量电容器的能量发出400百万焦耳(MJ )的光能。当光波经过,扩大器会把储存的能量加入其中,这并非是很有效率的机器,也只有约1/4的能量会成功加入到光束中;所以为了解决这问题,光束才要使用光纤导轨进入反射腔重复通过四次。一系列扩大最后会把原本的6焦耳激光加强到4百万焦耳。虽然只能维持几十亿分之一秒,但是能量可以达到极高,瞬间超过500TW 。 实验设备
当扩大器把能量加入激光中后,激光会直接射往末端的目标球。整条激光光束贯穿建筑物长达305米而不中断。其中大量的长度都是在滤光器中渡过,它是一种瞄准最终目标点的类似望远镜的管状物,并能切断任何偏离的光束还能确保激光以极高精确度命中。
激光发射器前端
工程人员正在调整
采用点火式核聚变的好处就是一但开启核聚变可以自行聚变燃料球后就可以中断外部能量供应。因为链式反应的能量可以自动聚变剩下的材料。因此点火式核聚变成为目前最有希望迈入实用化的唯一途径。
NIF 定制的激光扩大器是史上最大的
NIF 设计上首次采用间接驱动运作方法,激光全部能量集中在一个环状物中的小球。环状物被称为hohlraum 环空器,可以重复激发X 光频谱,比传统激光光束更均匀对称。
镀金环空器
经过处理的激光将会通过hohlraum 环空器生成极强的X 射线,聚焦在直径为0.44厘米的氘-氚粒状物上(D-T 气体或D-T 结冰体)。在高温和辐射的作用下,粒状物将转化为等离子体,且压力不断升高,直至发生核聚变。
按照走鹃和蓝色基因L 超级计算机的模拟计算,核聚变反应时间很短,大约只有百万分之一秒。但该实验所释放的能量是引发核聚变所需能量的50到100倍。在这种类型的反应堆中,需要相继点燃多个目标,才能产生持续的热量。
超级计算机模拟激光散射效果
另据科学家估计,每个目标的成本可控制在0.25美元左右,从而大大降低了核电厂的成本。
科技才能挽救地球?
点火装置俯视图
点火装置解剖说明图
现在,我们可以轻易的在网上找到很多对于NIF 项目的非议。但是对于这样可能改变我们未来生活的科研项目,除了支持与期待,难道我们还应做些其他的事情吗?这不是开发个iPhone4或者Windows7那么
简单的事情!历经16的研发,35亿美金的资金投入,也许会失败。但是人类需要在还能改变的时候去努力为未来进行实验。否则等待我们的就是能源枯竭后的毁灭。
NIF 代表的是全人类的希望
曾有媒体指出,NIF 项目的隐藏目的是美国政府为确保老式核武器的安全性。或是借助点火实验中超高的密度和热度模拟外星环境,完成天体物理实验。最后才是建立核聚变能源站。
NIF:为地球带来恒星之光
有人说,每个人站的高度不同,所以看待问题的角度就不同。
后记:上一期《解读地球上最强超级计算机的运行项目》最后,预计介绍的本来有部署于阿贡国家实验室的Blue Gene/P超级计算机。因时间所限,会在下一期登场,同时也会补充一下劳伦斯科利莫尔国家实验室的Blue Gene/L超级计算机其他的科学应用。
阿贡国家实验室周边环境
愿太阳永远照耀着地球。
全球上演超算大战 日本K 超级计算机夺冠 出处:pconline 2011年06月22日 作者: Echo 责任编辑: xujian1
【PConline 资讯】最新一期的全球超级计算机500强排名本周一在德国汉堡举行的2011年国际超级计算机会议上出炉,由富士通制造的日本超级计算机“K”排名首位,成为全球运算速度最快的超级计算机,结束了中国超级计算机保持6个月的排名第一位置。日本K 计算机每秒浮点运算次数为百万的四次方,比接下来的五个超级计算机合在一起的性能还要强大。今天除了来揭晓这次榜单排名第一的面貌,同时也来看下推动着高性能计算不断向前的几个全球最牛超级计算机。
日本超级计算机“K”
K 计算机的性能是使用68,544个SPARC64VIIIfx 处理器衡量的,每个处理器配置8个内核,一共有548,352个内核,几乎是其它世界500强超级计算机处理器内核数量的一倍。这台超级计算机仍在建造之中。
据这台超级计算机的制造商富士通称,当它在2012年11月开始服务的时候,这台超级计算机将配置8万多个SPARC64VIIIfx 处理器。
最新的每年两次的世界500强超级计算机排行榜是本周一在德国汉堡举行的2011年国际超级计算机会议上发布的。
据Top500.org 称,与其它最近发布的超级计算机不同,K 计算机没有使用图形处理器或者其它加速器。但是,它使用的是这个排行榜中最强大的和最节能的系统。
这台超级计算机将安装在神户的日本理化学研究所(RIKEN)。当建造完成时,这台超级计算机的运行速度将达每秒10千万亿次浮点运算。
超级计算机K 的运行速度为每秒8.16千万亿次浮点计算(Petaflops),由68544个SPARC64VIIIfx 处理器组成,每个处理器均内置8个内核,总内核数量为548352个。据富士通称,该款超级计算机仍在建造之中,将于2012年11月投入运行,届时处理器数量将增加到8万个。
此前排名首位是中国的天河一号(Tianhe-1A),在最新榜单中排名第二位,运算速度为每秒2.57千万亿次浮点计算。与此同时,中国也在提升天河一号的运算速度。排在第三位的是美国的“美洲虎”(Jaguar),运算速度为每秒1.759千万亿次浮点计算。
未来是并行的 探秘世界最快超算天河一号
出处:pconline 2010年12月24日 作者:佚名 责任编辑: heyaorong 处理器的性能提升一直决定着全球超级计算机运算能力的发展。过去的约10年里,TOP500全球最高速超级计算机的总运算性能提升速度基本上和摩尔定律保持一致。然而在2007年左右,TOP500超级计算机的性能开始明显的加速上涨,这一时间点,正是GPU 被引入超级计算机的开端。从此GPU 作为超级计算机中重要的性能部件彰显着不可替代的作用,CPU+GPU的异构超算能带来比同样规模的纯CPU 提供数以倍计的浮点科学计算能力。
这种“异构计算”应用的典型例子就是中国的天河一号A ,它使用了超过14000颗CPU ,辅以7168颗Tesla M2050 GPU,总运算能力2.5PFLOPS ,成为当今全球最强的超级计算机。天河一号主任设计师,国防科大计算机学院系统软件研究室主任杨灿群今天也到场介绍了该机的设计过程。据称,从去年的试验性系统,到今年的天河一号A ,他们将GPU 加速的效率从20%提升到了70%,同时使用自主开发的节点网络系统,规模和性能是去年使用的进口成套网络系统的两倍。
NV 创始人黄仁勋在2010高性能计算峰会上专门讲述了天河一号A 跟随NVidia2010高性能计算峰会的脚步,我们有幸参观了国家超级计算天津中心,并进距离的深入了解其中的天河一号A 超级计算机,这种机会非常难得。
国家超级计算天津中心 天河一号所在
国家超级计算天津中心
天河的命名来自于国防科大“银河”系列超级计算机与天津的结合。天河一号A 配备了14336颗Intel Xeon X5670 2.93GHz六核心处理器(32nm
Westmere-EP) ,2048颗我国自主研发的飞腾FT-1000八核心处理器,以及7168块NVIDIA Tesla M2050高性能计算卡,总计186368个核心,224TB 内存,使用自主研制的互连网络架构、Linux 操作系统,Linpack 最大性能2.566PFlops(每秒千万亿次浮点运算) 、峰值性能4.701PFlops ,系统效率54.6%,技压群雄获最新全球超算TOP500排名首位,成为全球最强超级计算机。
黄仁勋与国家超级计算天津中心主任刘光明
天河一号A 其实就这这一排排的机柜
真名应该叫:天河高效能计算机系统
天河一号A 中的GPU 运算节点
黄仁勋与国家超级计算天津中心杨灿群教授展示天河一号A 中的GPU 运算节点。杨灿群教授是天河一号主任设计师,国防科大计算机学院系统软件研究室主任。
天河一号A 配备了14336颗Intel Xeon X5670 2.93GHz六核心处理器(32nm Westmere-EP) ,2048颗我国自主研发的飞腾FT-1000八核心处理器,以及7168块NVIDIA Tesla M2050高性能计算卡,总计186368个核心,224TB 内存。
传说中的完全自主知识产权的飞腾CPU 计算节点
八核64线程的飞腾1000处理器
现场展示的各种超算应用
天河一号A 配备了14336颗Intel Xeon X5670 2.93GHz六核心处理器(32nm Westmere-EP) 以及7168块NVIDIA Tesla M2050高性能计算卡,总计186368个核心,224TB 内存,
GPU 计算节点,其上为两路
MV TeslaM2050
至强CPU 计算节点
黄仁勋先生与刘光明主任在天河一号前合影留念
参观行程之后,黄仁勋、中国国家超级计算天津中心主任刘光明和天河一号主任设计师,国防科大计算机学院系统软件研究室主任杨灿群在现场接受了媒体的采访,以下为采访全文。
问:天河一号A 使用了14336颗Intel Xeon 和7168块NVIDIA Tesla 。HPC 中CPU 和GPU 搭配的数量比例平衡由什么因素决定?
刘光明:是这样。基本上,我们在天河一号A 中主要使用通用CPU 做一些复杂计算,一些比较规程的大规模并行计算放到GPU 上来做。我们在去年的9月份做了一次试验,根据现在的研究情况,这种2:1的比例比较合理,效率比较高。现在这台机器已经在硬件设计的时候设定了这种比例,不会再做改变。不过现在是千万亿次,未来到万万亿次的时候,根据到时候的应用状况可能比例还会有变化,这个还需要继续的研究。
问:NVIDIA 未来有怎样的计划来推广Tesla 产品?
黄仁勋:CPU+GPU的架构已经被证明在并行计算领域拥有非常高的性能和非常高的能效。这个道理非常简单,用最适合的处理器来运行最合适的应用,就能获得最高的效率。就像所有中国的年轻人都知道的那样,要打造一台游戏PC ,获得最高性能、最高效率的方法就是购买GeForce GPU 。我们在设计GPU 的时候已经加入了通用计算的思想,因此我们的产品现在不仅仅可以用来加速游戏图形,还可以将GPU 运用在通用科学计算领域。
杨博士、刘博士的团队有这样的远见,在几年前就看到了将GPU 应用在HPC 中的潜力。事实上今天在科学计算、高性能计算领域的每一位研究者都认识到,在超级计算机中使用GPU 是一种非常有效的提升性能的方式。高性能计算领域的
权威杂志《HPC Wire 》本周刚刚撰文指出,GPU 加速已经是超级计算机领域的头号趋势。虽然现在这种趋势已经非常明显,但在两年前,当天河刚刚启动开发的时候,这种选择还是有相当高的风险。我在这里首先要感谢杨博士、刘博士,感谢他们卓有远见的选择。
天河一号A 现在为全球的超级计算机设定了一个新标准,提升了人们对HPC 的期待值。中国政府也已经认识到,在超级计算机领域的投资,实际上是对知识基础设施的投入。计算能力已经成了科研的命脉,投资超级计算机实际上和投资建设道路、高速互联网一样的重要。投资高性能计算可以引领我们实现新的探索、新的发现,最终使各个产业受益。
天津超算中心的这台超计算机,不仅对科研领域相当重要,对各个行业也都有相当关键的意义。就像刘博士介绍的那样,他们的超级计算机被应用在医疗领域研发新药延长我们的生命,设计更好的汽车、飞机,甚至创造出色的电影、电视节目。超级计算已经渗透到了我们生活的各个方面。虽然Tesla 已经在遍布全球的超级计算领域得到了相当大的成功,但我们的信仰,我们的策略是让Tesla 应用在各行各业当中,让企业自己使用Tesla 来进行产品开发、设计,让他们的产品更早的投放市场,创造更好、更具竞争力的产品。
目前,全球最高能效超级计算机的前十名中,已经有7台使用了Tesla 。我相信,这呈现了一种趋势,未来将有越来越多的企业使用基于GPU 通用计算的超级计算机,Tesla HPC 将成为一个非常庞大的市场。因此我们才和包括惠普、戴尔、IBM 、Cray 、SGI 、浪潮等全球所有主流的高性能计算、服务器厂商合作,向用户提供Tesla 产品。用户现在可以在全球任何一个国家,通过任何一家主流厂商购买Tesla 产品。
问:如今硬件的销售越来越依赖于软件应用的发展。NVIDIA 有没有类似苹果App Store那样的软件应用平台计划,吸引软件开发者的加入?
黄仁勋:不错,每当你造出了一颗新的处理器,你必须要提供新的应用软件。我们在传播如何进行并行计算编程的领域,投入了大量的资源。CPU 代表着顺序执行,每次一个任务,而GPU 拥有着大量的流处理核心,可以同步运作。我们必须创建一个有效的并行计算架构,同时也需要教导普及全球的软件开发人员,如何来用全新的并行思想编程。
我们一直在CUDA 教育领域持续进行着推广,如今全球有接近400所大学在教授CUDA 编程课程。CUDA 教材已经以英语、中文、日语、俄语等多种语言全球出版。全球注册CUDA 开发人员超过10万人。设计、分析、数字创作等领域重要的第三方软件,包括Adobe 、MATLab 、ANSYS 、AMBER 、3DStudio MAX 等都已经支持CUDA 。我们现在还有很多的软件开发工作正在进行当中。
如今,全球CUDA 软件开发群体的增长势头非常迅猛。这是因为,全世界最快、中国最快、日本最快、俄国最快的超级计算机都在使用CUDA ,开发者们都希望能够使用这些最强的HPC 来进行工作。同时,从苹果、惠普、戴尔、联想,
到全球每一家网吧中的电脑,每一台拥有GeForce 显卡的PC 也都支持CUDA ,开发者们可以在自己的电脑上进行开发。CUDA 无处不在。
有一点非常重要,在每家企业的多种计算应用中,往往只有一两个应用占用绝大部分的运算性能。不是所有的应用都同样重要,只要我们在这些关键应用上应用GPU 实现大幅提速,就能极大的提升他们的效率。
问:天河一号A 在性能、效率、能耗方面相比上代都有了大幅提升,这背后主要是在哪些方面进行了改进?
杨灿群:天河1A 这一代系统的实际性能、计算效率大幅度的提高,主要有几个方面的原因,包括自主研发的新高速网络系统,软件优化后提升了应用效率,以及NVIDIA Tesla并行计算GPU 的加入。
问:天河一号A 如今已经是全球最快超级计算机,为了保持这种优势,我们未来需要有怎样的努力和创新?NVIDIA 未来将对中国的超级计算机发展提供怎样的支持?
刘光明:中国的高性能计算机发展经历了30多年的历程,从1978年的银河1开始,一直到现在的天河一号A 。这些努力并不是为了争得一个世界第几的排名,确确实实是我们国家急需这样的高性能计算能力。作为天河来讲,在突破千万亿次大关的过程中,遇到了世界性的难题。从2005年到2007年,我们一直在进行研究,最终决定采用异构架构,即通用处理器和专用加速处理器结合的方式突破这一难题。这中间我们试验过自己的军用流处理器FT100,去年也尝试过AMD 的GPU ,最后发现了NVIDIA 的芯片性能更好。
这里大家需要注意一点,高性能计算机能够做出来,做出Linpack 测试到世界第一,并不等于能够在实际应用中用好。这是两个问题,如何在异构结构下有效的编程是下一个大的挑战。我们有一个专门的团队从几年前就在开展这项工作,现在已经得到了不错的成绩,但未来还有很多的任务要做。
黄仁勋:刘博士说的很对,并行计算面临的困难非常多,但正确解决这些困难带来的效益也非常可观。整个行业过去30年都在努力想要解决并行计算的难题,却几乎没有一家得到成功。直到CUDA 的出现,我们终于找到了CPU+GPU的异构计算模式。这项革命性的技术花费了NVIDIA 公司多年的时间和数十亿美元的投资。NVIDIA 在并行计算领域的投资超过世界上任何一家企业。因为CUDA ,并行计算现在有一个非常光明的前景。不过,在这一领域我们仍然面临着非常多的挑战。未来,我们将更加紧密的同刘博士的团队合作,创造下一台更强的超级计算机系统。
中国已经认识到超级计算机对未来各个领域的重要性,NVIDIA 非常荣幸能够在中国的超级计算机发展中提供自己的支持。世界现在已经越来越小,科技领域的发展能够让全世界每一个人受益,中国超级计算机的进步实际上可以造福整个人类。我们将提供自己最出色的工程师来帮助中国建造更高速的超级计算机,帮助他们更有效的进行并行计算编程,并在中国的所有高校普及并行计算教育。我相信,未来每一个从高校毕业的计算机技术人员都将必
备并行计算知识。串行计算是过去式,并行计算才代表了未来。