西西河

主题:【原创】从超算的发展看中国科技的进步---神威蓝光的问世 -- ★kg90

共:💬49 🌺173 新:
全看树展主题 · 分页首页 上页
/ 4
下页 末页
家园 【原创】从超算的发展看中国科技的进步---神威蓝光的问世

最近,国内又有一套系统出世---神威蓝光超算系统。这套系统超越了曙光公司的“星云”系统,目前国内排第二(第一是国防科学技术大学的“天河1A”)。

话得从2010 TOP500.org组织公布了全球超级计算机500强,来自国防科学技术大学的天河一号毫无悬念拔得头筹说起---这是中国超级计算机第一次夺冠,在全球范围内引起关注。由此关注下我国超级计算机的发展。进入21世纪,我国超算的发展进入一个井喷期,形成超算研发的三驾马车---国防科学技术大学、曙光公司和江南计算所。三家都推出了有代表性的超算系统---国防科学技术大学的“天河一号”,曙光公司的“星云”系统,江南所的“神威蓝光”。可以说,已经形成了你追我赶的良性竞争态势。

值得关注的是,天河系统和星云系统都是采用CPU+GPU异构混合体系;而神威蓝光则采用的是多核高性能处理器实现了千万亿次的运算速度。这是异构混合体系已经成为主流趋势的另一个方向。另外值得关注的是,天河系统使用了部分国产“飞腾-1000”CPU;神威蓝光采用的是全国产的申威-1600。

下面是这几个系统的详细资料

天河一号A:配备了Intel Xeon X5670 2.93GHz六核心处理器(32nm Westmere-EP)、我国自主研发的飞腾FT-1000八核心处理器、NVIDIA Tesla M2050高性能计算卡、224TB内存、专有互连架构、Linux操作系统,总计186368个核心,Linpack最大性能2.566PFlops(每秒千万亿次浮点运算)、峰值性能4.701PFlops,系统效率54.6%。

星云系统:曙光星云是中国第一台实现双精度浮点计算超过千万次的超级计算机,系统由x86架构处理器 GPU计算卡组成。CPU为9280颗Intel Xeon X5650,主频2.66GHz,6核12线程,GPU为4640块NVIDIA费米架构的Tesla C2050。

神威蓝光:全部采用国产高性能CPU搭建。(只有9个机柜,“京”有672个机柜......)

可见我国在超级计算机方面取得了很大的成就。但我们距世界先进水平还有较长的路要走。

国防科学技术大学“飞腾”芯片,仿自SUN公司开源的“UltraSparc T2”芯片。

江南所“申威”来自DEC公司的alpha处理器(risc架构)。(DEC公司被康柏收购,康柏被惠普收购,已经停止了ALPHA处理器的研发。基于RISC的alpha处理器技术上并不落后。)

下面贴上一些2011年国内TOP100超算的资料

点看全图

外链图片需谨慎,可能会被源头改

点看全图

外链图片需谨慎,可能会被源头改

点看全图

外链图片需谨慎,可能会被源头改

点看全图

外链图片需谨慎,可能会被源头改

点看全图

外链图片需谨慎,可能会被源头改

美国超算详情一览

点看全图

外链图片需谨慎,可能会被源头改

点看全图

外链图片需谨慎,可能会被源头改

点看全图

外链图片需谨慎,可能会被源头改

点看全图

外链图片需谨慎,可能会被源头改

练了北冥神功、乾坤大挪移、九阴真经、九阳神功、易筋经....各种神功,拥有屠龙刀、倚天剑的美国,强到无以复加......

------------------------------------------

我国超算行业已经取得长足进步,在TOP500排名里,我国进入前十的计算机已经有两台,排名2和4,超算总数量不断增长,如今已达62台,甩开德国、英国、日本和法国稳居第二名,不过因为“京”的遥遥领先,就性能而言亚军属于日本。

不得不承认的是,目前超算方面最强的是美国,其次是日本。日本此次打榜的是“京”系统,峰值是天河的两倍,功耗更低,采用的是富士的芯片。(“京”多消耗了1.45倍的功耗,获得3.18倍的计算性能,是能效最高的超级计算系统之一。)而天河和蓝光,都是仿制美国公司的芯片。不过,这是一种好的方向,迟早会有自己的指令集出来。可以看出,申威1600采用的制程是比较落后的(65NM),如果采用目前最先进的32NM制程,性能会更优异,能和目前主流的服务器CPU媲美。(ps:蓝光的能效比“京”更胜一筹。)

超算巨擘CRAY已经发布下一代产品规格,使用AMD最新推土机架构16核心处理器和NVIDIA费米架构Telsa计算卡。整套系统将包含18000颗CPU和GPU,最终运算速度将达到70万亿次/秒,完成后将夺回超级计算机王座的位置,并将其他系统远远甩在身后。超算的竞争是一场未完成的比赛,我们还在追赶的路上。

点看全图

外链图片需谨慎,可能会被源头改

最后,撇除技术的比较,我们可以看出,我国TOP500超算系统越来越多,这说明应用需求的旺盛,也可以看出未来我国科学技术发展已经有了强大的计算支持。我国的科学技术发展将迎来一个黄金时期......

路边社消息:

蓝光是出来打榜的,神威系列有更好的东西,在军方手里。

所谓的自主指令集,实际是由alpha指令集基础上扩展、改进而来。

记得原来有说神威是IA64指令集,也就是兼容安腾。但是好像没有Intel授权,只能偷偷摸摸自己用。

看参数,16核心,很可能是OpenSPARC核心,强化浮点部分。安腾核心比较复杂,集成16核心比较难。就算这样,140.8GFlops的速度也是非常恐怖的,有可能是向量引擎的速度。

sw1600主要是面向超级计算进行的优化,跟完全面向商用的处理器相比,spec成绩大概不会那么好看。

就超级计算的关键技术:互联来说,神威蓝光是非常出色的。神威蓝光的LINPACK效率是:单个处理器核80.28%,单CPU 75.20%,单机舱75.07%,整机74.37%,可以看到从单cpu到单机柜1024个cpu互联, 效率只下降了0.13%,单机柜到整机效率下降0.7%,这个说明其互联系统做得相当好。

实际整机的效率的瓶颈在单核的效率,我想主要还是在65nm工艺下单个die里塞进16个核,芯片面积还是有点捉襟见肘,

在最大芯片面积受限的条件下,cache容量肯定受到相当的限制,由于不能放进更多的内存控制器,访存带宽受到的限制也很明显。

PS:欢迎转帖!请注明作者及出处。

关键词(Tags): #超级计算机(大圆)#超算系统(大圆)#天河一号(大圆)#星云系统(大圆)#神威蓝光(大圆)通宝推:原味酸奶,Parsifa,njyd,喜欢喝冰茶,
家园 能介绍一下中国的互联芯片吗?我记得天河1a的是国产的。
家园 互联芯片是国防科学技术大学搞的。

叫做“飞腾-1000”,其实是仿的sun公司的UltraSparc T2开源产品。天河升级用的芯片就是飞腾,性能有大幅提升(也不完全是飞腾的作用。)

家园 看起来不错

[email protected]/16Core,就是8浮点运算/核/周期。现代RISC应该都是多发射,目前的话肯定要上到4发射了。这样的话,运算通道是128位的SIMD,每次处理2个浮点数。这些数据和目前CPU架构的常用设置可以匹配得上。

不过,要把16*8个128位浮点SIMD放到一个芯片,这怕是有点变态吧。再加上互连,这得多大的芯片面积啊,除非大大降低缓存容量。这样,对linpack可能影响不大,但对稍复杂的任务,性能影响就大了。

另外,SIMD/4发射/16核这些都是影响并行效率的因素,在这么多因素影响下还有这么高的效率,编译软件上是不是做了什么手脚却悄悄地不说?这要真有,可比硬件的进步还令人振奋。

家园 貌似在alpha的基础上做了改进。这个消息来自

CHINAUNIX论坛。

家园 应该是国防科技大学吧?不是国防大学。
家园 记得有报道说,曙光的机子要用“龙芯”的啊,现在还没有具体

产品出来吗?

家园 龙芯更多的时候是个噱头!
家园 国防科学技术大学,谢指出!
家园 呵呵

实际整机的效率的瓶颈在单核的效率,我想主要还是在65nm工艺下单个die里塞进16个核,芯片面积还是有点捉襟见肘,

错了, 是interconnect,所以天河的interconnect都是自己设计而不是用商用的。

家园 设计思想恐怕和knights ferry更接近
呵呵
家园 呵呵,这是路边社消息。

我有一个想法:是否可以用国防科大的“飞腾”芯片做互联,用申威和nviDIA的显卡做运算,能不能攒出“推土机”+tesla的效果?

家园 没有意义

如果申威的设计思想是类似于knights ferry的话,为什么要回头去学tesla?

家园 山猫兄是这方面的专家啊。我只是爱好者,半路出家。
家园 而且互联最重要的恐怕不是用什么芯片

而是通讯协议开支和本身互联的拓扑结构。

本猫以前有个老师,就是专门做拓扑结构的,经常和学生吹牛当年和cray本人谈cray机的设计。

全看树展主题 · 分页首页 上页
/ 4
下页 末页


有趣有益,互惠互利;开阔视野,博采众长。
虚拟的网络,真实的人。天南地北客,相逢皆朋友

Copyright © cchere 西西河