动力设备网 加入收藏  -  设为首页
您的位置:动力设备网 > 科技 > 正文
曙光5000的介绍
曙光5000的介绍
提示:

曙光5000的介绍

曙光5000A高性能计算机是国家863计划高性能计算机及其核心软件重大专项支持的研究项目,是面向网格的高性能计算机,可以为网格提供计算服务,同时也是面向信息服务的超级服务器。系统计算节点机采用四路四核AMD Barcelona (主频2.0GHz)处理器,每个节点64GB内存,胖节点机采用八路四核AMD Barcelona(主频 2.0GHz)处理器,每个节点128GB内存,整个系统由1650个节点组成庞大机群,共有6000颗CPU与100T海量内存,其理论浮点峰值为每秒230万亿次,采用20GB,延迟小于1.3us的Infiniband高速网络进行互联,采用了WCCS + SuSe Linux 双操作系统。

曙光5000的创新
提示:

曙光5000的创新

曙光5000方案中的创新点很多,现简要描述以下三点。1、在世界上首次提出既能应对千万亿次科学计算又能十分有效地支持能力计算(utility computing)、应用面广的HPP体系结构(Hyper Parallel ProCESsing)。高效能超级计算机的主要用途有两种,一种是以最快的计算速度解决某个领域的科学问题,如IBM的BlueGene主要适用于解决蛋白质折叠计算;另一种是用于计算中心或数据中心的能力服务,即能有效地提供大量用户需要的计算、存储和I/O能力。迄今为止,全世界还没有一种高效能超级计算机能较好地满足这两方面的要求。这是因为不同的应用需要不同的体系结构。国外已有和正在研制的高效能超级计算机的体系结构的基本思路主要是大规模并行机(MPP)、机群(Cluster & Constellation)和分布式共享存储(NUMA)三种,不管采用哪一种都有局限性。曙光5000准备采用的HPP体系结构是计算所、曙光公司和多位国外著名学者反复研讨后提出的一种标新立异的结构。HPP是具有全局地址空间和三级并行的分布式系统,即片内是可扩展通用多处理器核并具有寄存器传输级通信机制;通过三层高速互联实现片内、节点内、系统三级并行;具有全局共享地址空间,通过节点内和节点间两级互连构成分布式系统;支持多通道并发的核到核通信;节点操作系统具有单一系统映像,并保持节点独立性;有效支持“多线程分割全局地址空间”编程模型。通过实现以上独创技术,可以得到以下前所未有的好处:(1)基于HPP体系结构,可通过虚拟化技术使曙光5000体现不同体系结构的优点,从应用的角度看,它既可以是MPP,也可以是Cluster或NUMA结构的计算机系统,显著地扩大了应用范围;(2)曙光5000能有效地支持能力计算这一计算中心和大企业需要的新型计算模式,能根据用户的需求动态地调度和优化利用计算机资源;(3)曙光5000缓解了大规模可扩展和编程困难的矛盾,既增强了高效能计算机的可扩展性,又实现了全局共享地址空间,一定程度上克服了目前的分布式机群系统编程难的瓶颈,而且使目前商用机群上的大量应用软件可以兼容运行;(4)目前IBM BlueGene、Cray XT4、NEC ES等高端计算机技术下移至中低端系统时缺乏竞争力,而通过采用HPP体系结构,不但千万亿次计算机具有极高的性能价格比和性能功耗比,而且向下辐射做百万亿次甚至几万亿次计算机时都有很强的竞争力,十分有利于产业化。以上这些创新点国际上千万亿次计算机研制中还没有看到,如果这些设计都能得到有效实现,曙光5000很有可能在一些方面处于世界领先水平。2、创新的设计主要体现在三款核心芯片上,曙光5000具有(百)千万亿次计算机的实实在在的自主知识产权。从曙光一号到曙光4000,计算所和曙光公司在高效能超级计算机的研制过程中,曾设计、流片过Wormhole Routing等关键芯片,但基本上没有量产。目前大量销售的曙光高性能计算机的各种芯片几乎都是进口的,CPU等芯片占到高端计算机成本的80%以上。曙光5000与过去我们研制的高端计算机的重要区别是,(百)千万亿次计算机的三款核心芯片都将由计算所和曙光公司自己设计。这三款核心芯片是:龙芯多核CPU,连接一块板上多个CPU的系统控制器(System Controller),和连接各节点的交换芯片(Switch)。这三款核心芯片难度都很大。如果能按计划如期完成,我们可以十分自信地宣布,中国已完全掌握了高效能超级计算机设计的核心技术。在我们的研制计划中,这些芯片不是仿制国外的芯片,必须要按照HPP体系结构的要求独立设计,包含许多原始创新:例如:我们争取在世界上首次实现CPU内多核之间的寄存器级(RTL)数据传输机制,使得CPU内通信速度有可能超过计算速度,从根本上消除通信瓶颈;系统控制器和交换芯片中内置可直接寻址的Test & Set硬件锁,可显著提高进程间同步的效率,硬件“同步”也会大大提高并行应用同步的效率;利用全局地址空间实现“赋值”式通信,降低CPU中核与核之间的通信延迟;利用多层网络提高了多核与多核之间并发数据交换的聚合带宽和吞吐率,打破通信壁垒等等。必须指出,研制(百)千万亿次计算机在工程实现上难度很大,不同于一般的科研课题。曙光5000必须解决一系列世界性难题:如千万亿次计算机的全系统模拟器;高频数字模拟混合、光电混合信号;多核心(Kernel)操作系统容忍单个处理器故障,能够支持节点之间的隔离性;对消息传递机制和全局地址空间两种并行计算模式同时提供有效支持;上千个客户端在多用户并发访问模式下保持稳定的I/O性能;改造现有算法并利用并行编译技术使应用与千万亿次计算机的体系结构相适应,以达到数万个处理器的可扩展性等等。这些都是国际学术界和企业共同面对的难点。我国在工程技术上与国外还有较大的差距,掌握这些技术还需要我们付出艰苦的努力。3、曙光5000创新技术还体现在低成本、低功耗和低占地面积方面,曙光5000在单位性能的成本、功耗和占地面积上的目标是瞄准世界领先水平。龙芯多核CPU在可扩展多核结构、多指令集支持以及在低成本和低功耗的基础上获得高效能等方面有独特的优势。如果全部采用龙芯多核CPU,曙光5000在成本上将有极大的优势。即使只采用一半龙芯多核CPU,另一半用国外CPU芯片(曙光5000的体系结构具有很大的灵活性,也可以支持其他主流CPU,不限于龙芯CPU),成本上也有较大优势,比国外正在研制的千万亿次计算机成本要低得多。曙光5000计划分两期进行,在2008年通过一台百万亿次曙光5000A系统、一台数万亿次原型机、一个模拟器分别验证曙光5000在软件、硬件、体系结构上的创新,在2010年推出千万亿次曙光5000L系统。曙光5000在满足国家千万亿次高效能计算机的战略需求的同时,还要将关键技术辐射到企业服务器、个人高效能计算机(万亿次)、箱式高效能计算机(十万亿次)、可扩展高效能计算机(百万亿次)等多种产品形态,到“十一五”末高效能计算机平均每万亿次的硬件成本要比曙光4000A时降低30倍,使得国产品牌高效能计算机的销售量增加8-10倍,达到每年4000台以上,大大提高国内品牌高效能计算机的市场竞争力,有力地促进高效能计算机在中国的普及。

中国的曙光超级电脑有多厉害?
提示:

中国的曙光超级电脑有多厉害?

中国曙光信息产业有限公司最新发布的超级计算机曙光5000A,按照国际通行的计算机运行速度测试标准,它的运算速度超过每秒160万亿次,运算能力相当于世界第七。 这是在主要由美国垄断的全球超级计算机领域里,中国科学家取得的历史性突破。 由于芯片供应商推迟供货,曙光5000A错过了上周推出的世界超级计算机500强排位。从性能上比,这台中国造超级计算机仅次于IBM安装在德国尤利希研究中心的一套运算速度居世界第六的“蓝色基因”系统。 6月中旬在德国德累斯顿举行的世界超级计算机大会公布了世界超级计算机500强最新排名。IBM的产品“走鹃”以每秒1000万亿次的运算速度雄居榜首。 尽管曙光有意参加11月的排名,但是否仍能排进世界前十却是未知数。超级计算机领域的发展速度飞快,“蓝色基因”在去年11月的排名中还高居世界第二,7个月后就落到第六。 由于采用创新设计和低功耗控制,占地面积约75平方米的曙光5000A满负荷运行时耗电量为700千瓦/时,比世界500强中多数对手要省电得多。 [ 转自铁血社区 http://bbs.tiexue.net/ ]世界500强中四分之三采用了美国英特尔公司出品的芯片,而曙光5000A配装了6600枚AMD巴塞罗那型四核处理器。 在曙光5000A发布前,业界推测,曙光公司将首次在超级计算机上使用中国科学家自主研发的“龙芯”中央处理器。“龙芯”的特色之一是运行LINUX操作系统。开发“龙芯”的中国科学院计算技术研究所也是曙光公司的控股方。 “上海超级计算中心的大量运算需要采用基于微软视窗操作系统的商业软件,我们采用AMD芯片是根据客户的需求。虽然‘龙芯’能力强大,但目前只适合科研等定向应用。”聂华说,“现阶段我们研发的超级计算机中,是有‘龙芯’平台的,但‘龙芯’的大规模推广和产业化情况限制了它的应用。” 曙光公司计划在2009年底推出与IBM“走鹃”比肩的千万亿次级超级计算机。“从目前的情况看,千万亿次超级计算机有可能使用‘龙芯’平台。但将根据客户的使用需求来决定。”聂华说。 据估算,芯片成本大约要占高端计算机成本的80%以上。负责曙光系列高性能计算机总体设计的孙凝晖博士说:“曙光5000系列比国外正在研制的千万亿次超级计算机成本要低得多。” 数据显示,曙光5000A的研制成本约为2亿元人民币。 [ 转自铁血社区 http://bbs.tiexue.net/ ]世界500强名单对曙光系列高性能计算机来说并不陌生。2004年6月,曙光4000A的运算能力排名世界第十。 1995年,当中国科学家首次推出运算能力为每秒10亿次的曙光1000时,落后发达国家同类产品约8年。而推出千万亿次超级计算机与世界领先水平将只有两年左右的差距。 此次入选世界十强的超级计算机只有一台装备在亚洲地区,那是塔塔集团投资建在印度的一套系统。不过,这套计算机是由美国惠普公司生产。 作为目前中国速度最快的商用高性能计算机,曙光5000A将于今年11月装备上海超级计算中心

现在最牛的超级电脑是那个国家的?
提示:

现在最牛的超级电脑是那个国家的?

超级计算机技术已不再是一个新鲜的话题,美国IBM、日本NEC、中国曙光都已推出自己的超级计算机,但比较而言,以美国两院院士、“世界超级涡轮式刀片计算机之父”陈世卿博士为首的专家团队回归祖国后研发出的超级计算机仍然具有绝对的优势。
新一代的超级计算机采用涡轮式设计,每个刀片就是一个服务器,能实现协同工作,并可根据应用需要随时增减。单个机柜的运算能力可达460.8千亿次/秒,理论上协作式高性能超级计算机的浮点运算速度为100万亿次/秒,实际高性能运算速度测试的效率高达84.35%,是名列世界最高效率的超级计算机之一。通过先进的架构和设计,它实现了存储和运算的分开,确保用户数据、资料在软件系统更新或CPU升级时不受任何影响,保障了存储信息的安全,真正实现了保持长时、高效、可靠的运算并易于升级和维护的优势。

曙光5000A的曙光1000
提示:

曙光5000A的曙光1000

曙光10001995年5月,由中科院计算所研制的曙光1000大规模并行计算机系统通过国家级鉴定,该系统达到了国际先进水平,其峰值运算速度每秒25.6亿次,实际运算速度每秒15.8亿次,内存容量为1024兆字节,为国内最高水平。该系统突破了一批大规模并行处理的关键技术,采用了国际90年代的最新技术它的峰值速度达到25亿次/秒,实际运算速度达到15.8亿次/秒浮点运算,内存容量达1024兆字节,居中国之首。该系统能解决工作站和大型机难以解决的问题。如,一个全国范围内的48小时天气预报程序只需运行3小时左右,而一般计算机要运行60小时以上,这就提高了预报的准确度。这是中国研制成功的第一家有自己版权的并行操作系统。曙光1000 1可扩展性好。连接网络、输入输出(I/O)、系统软件等均可以扩展。它可以扩展到包括成百上千个结点计算机的MPP系统。它与对称式多处理机(SMP)系统和传统的向量(巨型)机相比,具有明显的优势。2计算能力强,内存容量大,能解决工作站和大型机难以解决的大问题。它的实际运算速度达到每秒15.8亿次浮点运算。它能在30分钟内解出含15000个未知数的线性方程组,能在40小时内完成天然DNA整体电子结构计算,而小型机要连续计算3个月以上才能完成。3独立设计的蛀洞(Wormhole)路由器芯片创造性地采用了异步和同步相结合的工作方式,消息传送速度快,稳定可靠。4并行系统软件(操作系统、优化编译器及工具)高效实用。5全面采用并行编程和调试环境。6广泛采用国际标准,系统开放程度高,用户移植软件容易。 1系统总框图 曙光1000是一个基于Message-passing机制的松散耦合大规模并行计算机系统。它包括32个基于i860的计算结点,1~2个系统服务结点子系统和2~3个I/O结点组成的外存子系统。这些结点由一个6×6的二维mesh网连接,每一个Mesh网络上有一个Wormhole路由器。整个系统有一个系统控制台,它负责系统的初始化和硬件故障诊断工作。用户工作平台是SUN Sparc-2工作站(或其他工作站,如SGI等)和一些终端设备。由每秒10Mb的Ethernet局域网将系统服务结点、控制台、Sparc-2工作站及终端设备连接起来。2Mesh网 mesh是可扩充的。每一个结点机(包括系统服务结点机和I/O结点机)和一个Wormhole路由器(WRC)相连。结点的编号(物理地址)由X方向编号和Y方向编号两部分组成。结点的相对地址信息包含在Message中,一个WRC有10个输入或输出通道,每一个通道包含8条数据线,一个表示Message结束的TAIL信号、一个请求传输线REQ和一条回答信号线ACK。当一个Message由初始结点传到一个目的结点时,它只“穿过“途中的WRC,而不“进入“与这些WRC相连的结点机。Mesh采用X-Y路由算法。有多条虚通道共用一条单方向的物理通道。3计算结点 一个计算结点机为一块插件板,其核心是一块i860XR芯片,主频为40MHz,字长64位,浮点运算速度为单精80MFlops,双精度60MFlops,标量运算速度为40MIPS。DRAM容量为32MB,带奇偶检测;EPROM容量为8KB。NVRAM容量为2KB,由电池供电。结点-mesh接口模块包含容量各为16KB的两个FIFO。结点-mesh间传输带宽为33MB/s,有CRC循环冗余码检测。结点板的RS-232模块直接同控制台系统的一块多用户卡相连,为系统控制台提供监视和为诊断结点机提供支持。计算结点机运行860 OS和用户程序。4系统服务结点 服务结点主要是为管理系统资源(主要是结点机)而设置的。一个服务结点由一台带有ISA总线的486 PC担任,主频为50MHz。在EISA总线和Mesh网之间有一个EISA-Mesh Interface(EMI)模块。EMI具有DMA机制,是一块EISA插板。同样,数据通路FIFO-mesh-FIFO上具有CRC检测。EMI与mesh网间的通讯速率为16MB/s。在用户较多、图形显示较频繁的情况下,可以设两个服务结点,它们通过共享一个资源表来协调工作。5I/O结点机 一个I/O结点机由一台带EISA总线的486 PC充任,同服务结点机一样,带有一块EMI插板。通过插在EISA总线上的SCSI卡,一个I/O结点机可配容量为4GB的硬磁盘。系统可设1~2个I/O结点机。I/O流量要求大的用户,可配更多的I/O结点机,但要相应减少计算结点机的数量。一个I/O结点机与Mesh网间传输数据的速度为16MB/s,各个I/O结点机运行并行文件系统,以实现并行文件操作。6系统控制台 整个系统设一系统控制台,运行UNIX。该机上插有一块多用户卡。同32块计算结点机板上的RS-232串口相连。控制台同计算结点机可以点对点地通讯,也可以以广播方式同时同所有计算结点机通讯。它的主要功能是系统初始化,监视计算结点操作系统和用户程序的运行状态,动态查询结点机资源配置表和对计算结点机硬件故障进行诊断。7前端机网络系统 曙光1000的用户工作平台是一台或多台SUN Sparc-2彩色图形工作站(或SGI图形工作站)及一些终端。这些设备通过局域网(以太网)与系统服务结点机连接。局域网遵从TCP/IP协议,其数据传输率为10Mb/s。实际上,Mesh网系统是前端网络系统的计算服务器,用户程序在前端机上编辑、编译、链接和调试,然后通过服务结点发往计算结点运行,计算结果在前端机上显示。

曙光5000A的曙光4000
提示:

曙光5000A的曙光4000

曙光4000系列高性能计算机(HPC)是由具有十万亿次浮点运算能力面向网格的曙光4000A、具有百万亿字节海量数据处理能力面向网络安全的曙光4000L、具有五千亿次通用运算能力和四万亿次专用处理能力面向生物信息处理的曙光4000H、具有异构特性面向SAR实时成像处理的曙光4000I组成。曙光4000系列研制成功,缩小了我国与国外在HPC技术上的差距,为中国在HPC技术和产业超过欧洲位居世界第三做出了重要贡献;为在中国发展HPC及其产业化方面探索了一条可行的技术道路;使中国商品化HPC的制造水平达到世界先进水平,已经并正在产生巨大的经济和社会效益,为促进石油等行业国民经济发展和满足网络安全等国家战略需求做出了突出贡献。曙光4000采用网格技术,体系结构以构件性(Component)、标准性(Standard)、协作性(Coordinate)为基准,采用服务化(Service)、安全化(Security)、专业化(Specialization)、智能化(Intellengce)的3SI技术路线。项目研究的目标包括:曙光4000L Linux超级服务器、曙光4000A高性能超级计算机、10Tflops曙光4000面向网格的高性能计算机、曙光4000H生物信息处理高密度专用机群系统、曙光4000T具有自主知识产权的服务器。