动力设备网 加入收藏  -  设为首页
您的位置:动力设备网 > 科技 > 正文
史上最快700元级娱乐显卡 镭HD4770首测
史上最快700元级娱乐显卡 镭HD4770首测
提示:

史上最快700元级娱乐显卡 镭HD4770首测

   基于ATI RV740图形芯片打造的Radeon HD 4770显卡也许是史上最强的100美元娱乐型产品…… 史上最快700元级娱乐显卡 镭HD4770首测   【IT168 评测】即将过去的2009年4月份无疑是属于AMD公司的,他们的图形部门和处理器部门分别在这个月的2号和23号拿出了新的旗舰级产品——ATI Radeon HD 4890显卡和Phenom II X4 955 BE处理器,其中前者是业界首款“GHz”频率级别的娱乐型显卡,而后者则是现时工作频率最快的台式机处理器之一。巧合的是,两者的官方报价均为245美元,即1700元人民币,且均比计划的发布时间来的早。就在我们觉得AMD在这个月的表现足够抢眼的时候,他们的图形部门又给我们带来了更大的惊喜…… Radeon HD 4770显卡的原定发布日期应该是在5月4日的那一周   一方面,市场本身的成长空间加之经济环境的低迷让100美元即人民币700元以下的市场需求有增无减;另一方面,AMD已经凭借RV770的成功在100美元至200美元即人民币700元至1500元这一市场上站稳了脚跟,250美元至300美元以上即人民币2000元以上有双芯片产品坐镇,此番又在200美元至250美元即人民币1500元至2000元间导入RV790,其产品布局已经不可谓不完善,AMD接下来显然是想耕耘好100美元即人民币700元以下的市场了,而导入更为先进的制造工艺无疑是最有助于他们做到这一点的。    事实上早在两个月以前,国外知名硬件站点Guru3D.com就曾经放出过一篇显卡测试文章,当时的主角是一张40nm制造工艺、RV740图形核心的ATI Radeon HD 4750显卡。从产品定位上来说,这张显卡应该是更靠近现有的Radeon HD 4600系列的,因为它只搭载了128-bit的显存界面,而从产品规格上来说,其640个流处理器、32个纹理单元以及16个光栅单元的配备已经和主流的Radeon HD 4830显卡无异了。除此之外,它甚至还搭载了GDDR5显存颗粒,在工作频率上向Radeon HD 4870显卡看齐。 Radeon HD 4830显卡在99美元这一价位上的位置接下来将被Radeon HD 4770所取代    在出货量庞大的100美元左右即人民币599元~699元的娱乐型显卡市场上,8个月前你买到的会是Radeon HD 4600系列,而现在你已经可以买到Radeon HD 4830了。根据下面这张产品路线图显示,Radeon HD 4830显卡在99美元这一价位上的位置接下来将被Radeon HD 4770所取代,而后者正是本文的主角。值得一提的是,当时Guru3D.com测试的那张RV740图形核心的显卡有着介乎于HD 4830和HD 4850两者之间的性能表现,而当时那张Radeon HD 4750显然就应该是现在的Radeon HD 4770了。 你更看好下面哪一款显卡? ATI Radeon HD 4770 ATI Radeon HD 4830 ATI Radeon HD 4850 NVIDIA GeForce 9800 GT 创新与更名    就在这个月初AMD发布RV790图形核心的Radeon HD 4890显卡的同一天,NVIDIA公司也同时拿出了新的次顶级单卡——GeForce GTX 275,这可以被看做是ATI RV770和NVIDIA GT200(b)这对第三代DirectX 10 API图形核心较量的延续。而当AMD拿出RV740图形核心的Radeon HD 4770显卡时,你会发现它暂时还没有新的竞争对手,因为在人民币599元~699元这一价格区间上,NVIDIA的产品仍然是9800 GT,而其使用的G92图形核心应该和ATI的RV670图形核心同属于第二代DirectX 10产品。 你不得不肯定其中描述的事实    上面这张截图虽然是出自AMD公司的一份PDF文档,但是你却不得不肯定其中描述的事实。由于第一波G92核心产品8800 GT/GTS的命名方式是延续G80核心的8800 GTX/GTS的,因此NVIDIA在2008年6月份拿出的9800 GT实际上就是8800 GT的55nm更名版本,这也在一定程度上反映出它们的性能表现是不会比G80核心的8800 GTX好的,直到G92核心的补足版本9800 GTX出现。当然,类似的情况还有GTS 250,它虽然使用了向GT200核心看齐的产品命名方式,但实际上却仍然是55nm的G92核心而已。 Radeon HD 4770的对手是NVIDIA 55nm G92核心的GeForce 9800 GT    事实上当AMD在2007年11月份拿出业界首颗55nm RV670图形核心的Radeon HD 3800系列显卡时,它的对手是NVIDIA 65nm G92核心的GeForce 8800 GT。而当AMD在2008年6月拿出业界首款单精度浮点运算能力超过1TFLOPs且搭载GDDR5显存颗粒的RV770核心Radeon HD 4800系列显卡时,它的对手仍然有一半是NVIDIA G92核心的GeForce 9800 GTX。当AMD拿出业界首款40nm RV740图形核心的Radeon HD 4770显卡时,它的对手却暂时还是NVIDIA 55nm G92核心的GeForce 9800 GT。 走进Radeon HD 4770 Radeon HD 4770显卡正面照 Radeon HD 4770显卡背面照 取消散热器的样子 取下显存颗粒散热片和顶部加固条的样子 输出接口为传统的双DVI-I加上S-Video DVI接口带有EMI屏蔽罩 Radeon HD 4770的供电 Radeon HD 4770的显存供电模块 控制芯片为位于PCB背面的ST L6788A Radeon HD 4770的核心供电模块 有源晶振芯片 Radeon HD 4770的散热 Radeon HD 4770的散热器正面照 铝制接触面加铜制热导管 台达风扇 Radeon HD 4770温度及功耗测试 Radeon HD 4770空载    在空载状态下,Radeon HD 4770显卡的风扇转速为32%,即1080转左右,这足以把RV740图形芯片的温度控制在42摄氏度左右。值得一提的是,0.3.3版本的GPU-Z软件对此时核心工作频率的识别是错误的,在PowerPlay技术下它实际只有250MHz。 Radeon HD 4770满载    我们对Radeon HD 4770显卡的满载动作是通过ATITool软件里的Show 3D View达成的,此时显卡的风扇转速提高到了42%,也只是1455转左右,而RV740图形芯片的温度此时仍然不会超过70摄氏度,风扇对于显卡温度和噪音的控制均是让人满意的。    功耗控制方面,Radeon HD 4770显卡在空载状态下并不会比Radeon HD 4830和GeForce 9800 GT低上多少,毕竟它的核心工作频率要更高些。而到了满载状态下就不一样了,Radeon HD 4770分别比HD 4830和 9800 GT省下了25W和15W的电力。 Radeon HD 4770的超频性能测试 这显然是无法满足我们对于Radeon HD 4770显卡的超频需求的    就在这个月初,AMD拿出了业界首颗“GHz”级别的图形芯片——ATI RV790。如果说Intel的4004算是业界第一颗CPU的话,那么其从诞生到达成1GHz时钟频率足足用了近30年时间(Intel 4004于1971年问世),而若将1999年定义为GPU元年的话,那么其从诞生到达成1GHz时钟频率则仅仅用了不到10年时间。要知道,芯片制造工艺的进步带来的不仅仅是更快的速度和更低的功耗,往往还有更好的超频性能,而做为业界首颗40nm制造工艺的台式机GPU,我们没有理由不对RV740超频性能的抱以期望。 RivaTuner工具对其进行初步的识别并通过它进行显卡的工作频率调节    遗憾的是,做为现时唯一正式支持Radeon HD 4770显卡工作频率调节的ATI Catalyst软件,其OverDrive工具仅仅给出了830MHz/850MHz的核心工作频率和显存工作频率调节上限,这显然是无法满足我们对于Radeon HD 4770显卡的超频需求的,因此我们修改了老牌显卡软件RivaTuner的Config文件,你只需要在Rivatuner.cfg文本下找到RV770 = 9440h-9443h,944Ch并在其后面加入表示Radeon HD 4770显卡ID的94B3h,即可让RivaTuner工具对其进行初步的识别并通过它进行显卡的工作频率调节。 由750MHz/800MHz超频至925MHz/1175MHz    我们最终将手上这张Radeon HD 4770显卡的工作频率由750MHz/800MHz超频至925MHz/1175MHz,而能够稳定通过半合成、3D游戏以及负载测试的工作频率也可以在900MHz/1125MHz左右,这对一张100美元级别的显卡而言,已经相当恐怖了。 回过头来说40nm制造工艺    自图形核心制造工艺跨入“nm”级别后,ATI便始终处于领跑者的位置上。最近的一次图形核心制造工艺更迭出现在第二波DirectX 10 API产品——ATI RV670和NVIDIA G92b身上,与TSMC本就良好的合作关系加之AMD在芯片制造方面的经验,让ATI RV670成了业界首颗55nm制造工艺的图形芯片。与处理器芯片面积大部分被缓存所占据不同,图形芯片的面积大部分来自于逻辑电路,因此它在制造工艺上不可能和前者走的一样快,这也就是为什么你会在图形芯片上看到80nm、55nm和40nm这样的数字。 当AMD拿出40nm ATI RV740芯片时,这也就意味着图形芯片的制造工艺超过了通用处理器芯片    事实上早在上个月初的CeBIT大展期间,AMD的图形部门便已经拿出了业界首颗的40nm制造工艺图形芯片——RV740-M97,并率先应用于ATI Mobility Radeon HD 4860/4830两款移动显卡产品上,而Radeon HD 4770显卡的发布则是40nm RV740图形芯片在台式机领域的首次亮相。有趣的是,虽然Intel公司的32nm制造工艺Clarkdale芯片已经浮出水面,但是其上市甚至是发布时间都还未最终敲定,因此当AMD拿出40nm ATI RV740芯片时,这也就意味着图形芯片的制造工艺超过了通用处理器芯片。    AMD选择在RV740图形芯片上植入40nm制造工艺应该是相当稳妥的做法。传统的图形芯片设计思路是先行拿出完整的版本,随后对其相应的单元进行屏蔽以满足各阶层的市场划分。当然,完整版本的图形芯片需要更大的芯片面积和晶体管数量来提高性能,换言之,它对新制造工艺的需求是最为迫切的。不过考虑到新型制造工艺在初期往往良率不高,加之旗舰级产品并不能对图形芯片进行单元屏蔽,因此若先行为其导入新的制造工艺,一旦良率出现问题,也就意味着旗舰级产品不得不面对“难产”的窘境。 RV740图形芯片架构图    ATI RV740图形芯片的Radeon HD 4770显卡虽然只搭载了128-bit的显存界面,不过其640个流处理器、32个纹理单元以及16个光栅单元的配备和主流的Radeon HD 4830显卡是完全一样的。55nm制造工艺的RV770图形芯片有着256平方毫米的芯片面积和9.56亿个的晶体管数量,而40nm制造工艺RV740图形芯片的芯片面积和晶体管数量则分别是137平方毫米和8.26亿个,每平方毫米芯片面积上可容纳的晶体管数量由0.037亿个增至0.06亿个,这是因为新的制造工艺可以让晶体管之间的连接线宽变的更短。 128-bit界面与GDDR5颗粒    虽然Radeon HD 4770显卡640个流处理器、32个纹理单元以及16个光栅单元的配备和Radeon HD 4830是一样的,不过不要忘了它毕竟还是一张100美元级别的产品,因此为了简化显卡在PCB布局走线上的设计进而控制成本,AMD只是给Radeon HD4770显卡搭载了128-bit的显存界面,这和上代Radeon HD 4600系列是一样的。在主流级娱乐型显卡早已普及256-bit的显存界面的今天,你会不会觉得Radeon HD 4770有些另类呢?更另类的是,它把GDDR5颗粒第一次带到了100美元左右的主流市场上。 奇梦达的GDDR5显存颗粒    如果使用GDDR3的显存颗粒,那么128-bit的显存界面显然会成为Radeon HD 4770显卡的瓶颈。那样虽然可以让产品的成本更低,但是AMD现在需要取代的产品是100美元级别的Radeon HD 4830而不是更便宜的Radeon HD 4600系列。虽然GDDR5显存颗粒的单一采购成本是要高于GDDR3的,但是它却能够利用更快的数据传输率把显存界面控制在一个相对更加合理的;例如Radeon HD 4770显卡的显存界面虽然只有128-bit,但GDDR5颗粒仍然能够帮助它获得51.2 GB/s的带宽,4830则是57.6GB/s。 GDDR5显存颗粒的优势    NVIDIA当初就表示将跨过GDDR4而直接使用GDDR5颗粒,不过和40nm制造工艺一样,率先将GDDR5颗粒付诸于现实的还是AMD。当然,在Radeon HD 4770显卡问世之前,你还只能在Radeon HD 4870、Radeon HD 4890以及Radeon HD 4870 X2这样的高阶产品上看到GDDR5颗粒。这样看来,AMD在100美元级别的显卡产品上使用GDDR5颗粒不能不说是个突破了,毕竟对于高带宽和低功耗的渴求,主流级产品一点不会比高端产品来的差,而强调成本控制的前者在这方面的需求甚至会更强烈一些。 更快的运算效能和更低的电力消耗    R600芯片是ATI以AMD图形部门身份亮相后拿出的首款产品,它和NVIDIA的G80芯片同属于第一代DirectX 10图形核心,那个时候的AMD仍然遵循着较为传统的GPU研发思路,即性能至上。而在和NVIDIA G92的第二代DirectX 10图形核心竞争中,ATI RV670已经开始逐步转换了这一传统思路,变性能至上为性价比先行,主攻主流市场,高阶市场则拿出“单卡双芯”概念,加之TSMC 55nm制造工艺以及DirectX 10.1等技术支持,均为日后第三代DirectX 10图形核心RV770的诞生和成功奠定了坚实的基础。    因此在上面这张PDF文档的截图中,你可以看到从R520核心的Radeon X1800到R580核心的Radeon X1900再到R600核心的Radeon HD 2900,虽然在这其间经过了从制造工艺到微架构体系再到DirectX API接口的多重改变,但是你会发现图形芯片的每瓦浮点运算量和每平方毫米浮点运算量是趋于水平的。而从RV670核心的Radeon HD 3800系列到RV770核心的Radeon HD 4800系列,即便是图形核心的制造工艺没有更迭,你还是能够看到上述两项指标出现了几何形的增长,这亦是设计思路转变的体现。    RV740图形芯片的出现又一次让每瓦浮点运算量和每平方毫米浮点运算量有了几何形的增长,这显然和40nm制造工艺是不无关系的。一方面,晶体管之间连接线宽的变短帮助RV740图形芯片在137平方毫米的面积上容纳了8.26亿个的晶体管,因此它能够做到和Radeon HD 4830一样的640个流处理器数量;另一方面,RV740的芯片面积从RV770的256平方毫米大幅缩减至137平方毫米,而每平方毫米芯片面积上可容纳的晶体管数量也从0.037亿个增至0.06亿个,因此出现单位运算效能的几何攀升就很正常了。 Radeon HD 4770配备了一组6-Pin的PCI Express供电接口    值得一提的是,TSMC在40nm图形芯片上同样使用了High-K介质的新型材料,这对控制终端显卡产品的功耗无疑是大有益处的。AMD给出Radeon HD 4770显卡的参考功耗值是80W,这仅比PCI Express插槽所能够提供的75W电力高出了5W而已,而同样具有640个流处理器,且核心工作频率还要比Radeon HD 4770慢上不少的Radeon HD 4830显卡则需要110W左右的电力。不过为了稳妥起见,AMD还是为Radeon HD 4770配备了一组6-Pin的PCI Express供电接口,以保证其在工作中足够的电力供应。 DirectX 10.1:真正的DirectX 10   随着Windows Vista SP2和Windows 7两大操作系统测试版的到来,下一代应用编程接口(API)DirectX 11也浮出了水面,而ATI R7xx亦将随之成为AMD的末代DirectX 10图形核心。既然说到DirectX 10,那么我们就不能提及另外一个概念——“DirectX 10.1”。事实上除了第一代的DirectX 1.0和夭折了的DirectX 4.0两者外,历代DirectX API均至少要经历一次小版本号的变更,只不过在这一次升级上,AMD选择了提供对DirectX 10.1的支持,而身为其最直接竞争对手之一的NVIDIA则并不感冒。 DirectX 10.1特性表一 DirectX 10.1特性表二   无论是按照常理,还是按照微软公司自己的说法,DirectX 10.1才是完整的DirectX 10,不过其中的强制4倍多重采样反锯齿(Minimum 4x MSAA)和FP32纹理过滤(FP32 Filtering)以及Gather4等特性均是DirectX 10硬件已经具备的,而DirectX 10.1真正引入的新特性则主要是立方体地图阵列(Cube Map Array)、可编程反锯齿采样模式(Programmable AA Sample Patterns)、Int 16 Blending以及多重缓冲读写(Multi-Sample Buffer Read and Writes)等,上面便是DirectX 10.1的特性列表。 Radeon HD 4770显卡能够开启DirectX 10.1 NVIDIA GeForce 9800 GT则不可以   事实上早在ATI RV670图形核心上,AMD便率先实现了对于DirectX 10.1的硬件支持,而当ATI RV790问世的时候,DirectX 10.1的应用也早已经不仅仅只有那款AMD自家的“PingPang Demo”了。曾经的“刺客信条门”事件早已经烟消云散,从孤岛惊魂二到潜行者:晴空,从鹰击长空到风暴觉醒,从BattleForge到Continent of the Ninth再到Unigine Tropics Demo,我们已经可以看到从单机到网络,从游戏大作到半合成测试的诸多DirectX 10.1应用了,而我们也将在近期制作关于DirectX 10.1的专题。 ATI Stream:OpenCL是助推器   下面我们再来看看现时正方兴未艾的“ATI Stream”吧。AMD为我们列举了诸多能够从ATI Stream上获益的应用,这其中包括了视频、音频编辑,2D、3D图形图像设计,办公应用和搜索功能,更好的游戏画面、人工智能以及物理效果等等……也许你已经注意到了,我们今天所提及的这些应用距离每一个人都不遥远,甚至是息息相关,因为我们每天都会用我们的电脑进行上述一种或多种工作,而ATI Stream简单说便是一种能够充分释放图形核心并行运算能力的技术,它为图形核心带来了更为广阔的应用空间。 ATI Stream SDK v2.0开发包中实现对OpenCL 1.0标准的支持   现时ATI Stream技术是通过DirectX API接口实现的。当然,接下来它也可以使用OpenCL——首个开放且免费的通用并行计算接口。AMD已经在上个月的13日拿出了新的ATI Stream SDK v1.4开发包,并将在即将到来的ATI Stream SDK v2.0开发包中实现对OpenCL 1.0标准的支持,而它同样是开放而且免费的。OpenCL API不仅仅适用于图形处理单元,而是适用于所有的并行处理单元,这对同时具备了CPU和GPU设计能力的AMD而言无疑是好的,毕竟其强调的是处理单元间的协同运算而非图形核心本身。 Cyberlink MediaShow Espresso视频转档 Cyberlink MediaShow Espresso视频转档   Cyberlink公司的MediaShow Espresso软件可以把视频源重新编码至iPhone、iTouch以及PSP等个人终端手持娱乐设备所支持的格式,当然你也可以自定义自己所需要的编码格式和解析度。我们使用的这个版本已经提供了对于ATI Stream流计算的支持。 Havok物理计算 “Havok Cloth”和“Havok Destruction” 这个时候的物理运算是由GPU负责的 “Samurai Warrior”Demo甚至同时支持了Havok和DX10.1   透过OpenCL API接口,ATI Stream流计算技术可以让CPU和GPU协同进行物理运算,“Havok Cloth”和“Havok Destruction”这两个Demo便是AMD在这段时间内的工作成果。此外,“Samurai Warrior”Demo甚至同时支持了Havok和DX10.1。 Windows 7:兵马未动,粮草先行 AMD公司已经在ATI Catalyst 9.3驱动程序包上率先实现了对于Windows 7操作系统的完整支持   在本月初的IDF北京站上,Microsoft公司的代表受邀向与会者讲解并演示了新一代操作系统Windows 7的部分功能和特性。回头再来看看网络上几乎是“一日一更新”的诸多版本以及即将与下个月5号推出的首个RC版本,也许Windows 7操作系统真的离我们不远了。事实上AMD公司已经在上个月的ATI Catalyst 9.3驱动程序包上率先实现了对于Windows 7操作系统的完整支持,并同时向下兼容现有的Windows Vista操作系统,支持1.1版本的WDDM(Windows Display Driver Model)显示驱动程序模型。   我们在测试Radeon HD 4770显示时所使用到的8.60版驱动程序和ATI Catalyst 9.4驱动程序包里面的版本是一样的。从ATI Catalyst 9.4驱动程序包开始,AMD已经取消了对于Radeon HD 2000系列以前的,即DirectX 9.0显卡产品的月度更新而转为季度更新。当然,DirectX 10.0以下的整合图形核心也在其中。除此之外,ATI Catalyst 9.4驱动程序包中还内建了最新版本的ATI OverDrive超频工具,它能够自动侦测到显卡的最佳超频频率,不过这一功能还暂时只能被应用于ATI Radeon HD 4000系列显卡上。 关于我们的测试    ATI Radeon HD 4770和Radeon HD 4830以及NVIDIA GeForce 9800 GT这三者是处于同一价格区间上的产品,它们之间的性能比较也应该是最为直接的。除此之外,相信你同样也希望看到ATI Radeon HD 4770和自家Radeon HD 4850相比的结果。 关于我们的测试    我们尽可能多的打开游戏中的画质设定并将其开到最高;我们尽可能的使用游戏里的反锯齿(AA)和各项异性过滤(AF)设置并分别将其设定4倍和16倍,只有当游戏本身没有提供反锯齿(AA)设置时才会在驱动程序中开启,而驱动程序中的垂直同步(Vertical Sync)选项始终是被我们关闭的;除了强制关闭垂直同步(Vertical Sync)的相关命令和参数,我们并不会对游戏的任何配置文件进行修改,因为绝大部分的用户都是不会这样做的;我们的每一组游戏帧数均是通过运行三次之后取平均而值得出的。 Radeon HD 4770 v.s GeForce 9800 GT Radeon HD 4770 v.s Radeon HD 4830 Radeon HD 4770 v.s Radeon HD 4850 HD 4770 v.s 9800 GT With DirectX 10.1 全文总结    Radeon HD 4770和Radeon HD 4830有着一样的640个流处理器、32个纹理单元以及16个光栅单元。虽然它只搭载了128-bit的显存界面,但是GDDR5颗粒还是帮助其获得了接近Radeon HD 4830的带宽,因此你可以看到核心工作频率更快的RadeonHD 4770有着更好的性能表现。而在和比自己贵上25美元的Radeon HD 4850的比较中,Radeon HD 4770也基本上能够达到Radeon HD 4850显卡90%左右的性能,在雷神战争这样对核心工作频率颇为明感的游戏上,Radeon HD 4770还甚至快过了后者。 Radeon HD 4770 v.s GeForce 9800 GT   其实只要是看看Radeon HD 4830之前的表现就知道同样卖100美元左右的NVIDIA GeForce 9800 GT是不可能Radeon HD 4770更快的,而两者之间的性能表现甚至不会在一个水平线上,尤其是在像深入敌后雷神战争和超级房车赛起点这样的游戏上。   也许你应该注意到了,我们在本文里始终将RV740图形芯片的后端渲染单元(Render Back-Ends,RBE),即ROPs的个数描述为16个,因为无论是在AMD官方给出的RV740图形芯片的微架构示意图上,还是在Radeon HD 4770显卡的规格参数上均是这样描述的。不过,我们却发现0.3.3版本的GPU-Z软件则将其识别为8个。另外,每一组后端渲染单元应该是对应一组显存控制器的,但是拥有四组共16个后端渲染单元的RV740图形芯片在微架构示意图上则被描述成了每两组后端渲染单元对应一组显存控制器。   介于Radeon HD 4830和Radeon HD 4850两者之间的性能表现,出色的温度和功耗控制,当然还有极具空间的超频能力,Radeon HD 4770在100美元左右的价位上显示是没有对手的,无论是做为自家Radeon HD 4830的替代者,还是做为与NVIDIA GeForce 9800 GT争夺主流市场的武器,它无疑都是让人满意的产品。面对拥有TSMC 40nm High-K制造工艺和GDDR5显存两大诱人卖点的Radeon HD 4770,NVIDIA若拿出超频版本的GeForce 9800 GT显然也是不够的。那么,他们接下来会怎么做呢? 你更看好下面哪一款显卡? ATI Radeon HD 4770 ATI Radeon HD 4830 ATI Radeon HD 4850 NVIDIA GeForce 9800 GT 更多Radeon HD 4770显卡图赏

史上最快700元级娱乐显卡 镭HD4770首测
提示:

史上最快700元级娱乐显卡 镭HD4770首测

   基于ATI RV740图形芯片打造的Radeon HD 4770显卡也许是史上最强的100美元娱乐型产品…… 史上最快700元级娱乐显卡 镭HD4770首测   【IT168 评测】即将过去的2009年4月份无疑是属于AMD公司的,他们的图形部门和处理器部门分别在这个月的2号和23号拿出了新的旗舰级产品——ATI Radeon HD 4890显卡和Phenom II X4 955 BE处理器,其中前者是业界首款“GHz”频率级别的娱乐型显卡,而后者则是现时工作频率最快的台式机处理器之一。巧合的是,两者的官方报价均为245美元,即1700元人民币,且均比计划的发布时间来的早。就在我们觉得AMD在这个月的表现足够抢眼的时候,他们的图形部门又给我们带来了更大的惊喜…… Radeon HD 4770显卡的原定发布日期应该是在5月4日的那一周   一方面,市场本身的成长空间加之经济环境的低迷让100美元即人民币700元以下的市场需求有增无减;另一方面,AMD已经凭借RV770的成功在100美元至200美元即人民币700元至1500元这一市场上站稳了脚跟,250美元至300美元以上即人民币2000元以上有双芯片产品坐镇,此番又在200美元至250美元即人民币1500元至2000元间导入RV790,其产品布局已经不可谓不完善,AMD接下来显然是想耕耘好100美元即人民币700元以下的市场了,而导入更为先进的制造工艺无疑是最有助于他们做到这一点的。    事实上早在两个月以前,国外知名硬件站点Guru3D.com就曾经放出过一篇显卡测试文章,当时的主角是一张40nm制造工艺、RV740图形核心的ATI Radeon HD 4750显卡。从产品定位上来说,这张显卡应该是更靠近现有的Radeon HD 4600系列的,因为它只搭载了128-bit的显存界面,而从产品规格上来说,其640个流处理器、32个纹理单元以及16个光栅单元的配备已经和主流的Radeon HD 4830显卡无异了。除此之外,它甚至还搭载了GDDR5显存颗粒,在工作频率上向Radeon HD 4870显卡看齐。 Radeon HD 4830显卡在99美元这一价位上的位置接下来将被Radeon HD 4770所取代    在出货量庞大的100美元左右即人民币599元~699元的娱乐型显卡市场上,8个月前你买到的会是Radeon HD 4600系列,而现在你已经可以买到Radeon HD 4830了。根据下面这张产品路线图显示,Radeon HD 4830显卡在99美元这一价位上的位置接下来将被Radeon HD 4770所取代,而后者正是本文的主角。值得一提的是,当时Guru3D.com测试的那张RV740图形核心的显卡有着介乎于HD 4830和HD 4850两者之间的性能表现,而当时那张Radeon HD 4750显然就应该是现在的Radeon HD 4770了。 你更看好下面哪一款显卡? ATI Radeon HD 4770 ATI Radeon HD 4830 ATI Radeon HD 4850 NVIDIA GeForce 9800 GT 创新与更名    就在这个月初AMD发布RV790图形核心的Radeon HD 4890显卡的同一天,NVIDIA公司也同时拿出了新的次顶级单卡——GeForce GTX 275,这可以被看做是ATI RV770和NVIDIA GT200(b)这对第三代DirectX 10 API图形核心较量的延续。而当AMD拿出RV740图形核心的Radeon HD 4770显卡时,你会发现它暂时还没有新的竞争对手,因为在人民币599元~699元这一价格区间上,NVIDIA的产品仍然是9800 GT,而其使用的G92图形核心应该和ATI的RV670图形核心同属于第二代DirectX 10产品。 你不得不肯定其中描述的事实    上面这张截图虽然是出自AMD公司的一份PDF文档,但是你却不得不肯定其中描述的事实。由于第一波G92核心产品8800 GT/GTS的命名方式是延续G80核心的8800 GTX/GTS的,因此NVIDIA在2008年6月份拿出的9800 GT实际上就是8800 GT的55nm更名版本,这也在一定程度上反映出它们的性能表现是不会比G80核心的8800 GTX好的,直到G92核心的补足版本9800 GTX出现。当然,类似的情况还有GTS 250,它虽然使用了向GT200核心看齐的产品命名方式,但实际上却仍然是55nm的G92核心而已。 Radeon HD 4770的对手是NVIDIA 55nm G92核心的GeForce 9800 GT    事实上当AMD在2007年11月份拿出业界首颗55nm RV670图形核心的Radeon HD 3800系列显卡时,它的对手是NVIDIA 65nm G92核心的GeForce 8800 GT。而当AMD在2008年6月拿出业界首款单精度浮点运算能力超过1TFLOPs且搭载GDDR5显存颗粒的RV770核心Radeon HD 4800系列显卡时,它的对手仍然有一半是NVIDIA G92核心的GeForce 9800 GTX。当AMD拿出业界首款40nm RV740图形核心的Radeon HD 4770显卡时,它的对手却暂时还是NVIDIA 55nm G92核心的GeForce 9800 GT。 走进Radeon HD 4770 Radeon HD 4770显卡正面照 Radeon HD 4770显卡背面照 取消散热器的样子 取下显存颗粒散热片和顶部加固条的样子 输出接口为传统的双DVI-I加上S-Video DVI接口带有EMI屏蔽罩 Radeon HD 4770的供电 Radeon HD 4770的显存供电模块 控制芯片为位于PCB背面的ST L6788A Radeon HD 4770的核心供电模块 有源晶振芯片 Radeon HD 4770的散热 Radeon HD 4770的散热器正面照 铝制接触面加铜制热导管 台达风扇 Radeon HD 4770温度及功耗测试 Radeon HD 4770空载    在空载状态下,Radeon HD 4770显卡的风扇转速为32%,即1080转左右,这足以把RV740图形芯片的温度控制在42摄氏度左右。值得一提的是,0.3.3版本的GPU-Z软件对此时核心工作频率的识别是错误的,在PowerPlay技术下它实际只有250MHz。 Radeon HD 4770满载    我们对Radeon HD 4770显卡的满载动作是通过ATITool软件里的Show 3D View达成的,此时显卡的风扇转速提高到了42%,也只是1455转左右,而RV740图形芯片的温度此时仍然不会超过70摄氏度,风扇对于显卡温度和噪音的控制均是让人满意的。    功耗控制方面,Radeon HD 4770显卡在空载状态下并不会比Radeon HD 4830和GeForce 9800 GT低上多少,毕竟它的核心工作频率要更高些。而到了满载状态下就不一样了,Radeon HD 4770分别比HD 4830和 9800 GT省下了25W和15W的电力。 Radeon HD 4770的超频性能测试 这显然是无法满足我们对于Radeon HD 4770显卡的超频需求的    就在这个月初,AMD拿出了业界首颗“GHz”级别的图形芯片——ATI RV790。如果说Intel的4004算是业界第一颗CPU的话,那么其从诞生到达成1GHz时钟频率足足用了近30年时间(Intel 4004于1971年问世),而若将1999年定义为GPU元年的话,那么其从诞生到达成1GHz时钟频率则仅仅用了不到10年时间。要知道,芯片制造工艺的进步带来的不仅仅是更快的速度和更低的功耗,往往还有更好的超频性能,而做为业界首颗40nm制造工艺的台式机GPU,我们没有理由不对RV740超频性能的抱以期望。 RivaTuner工具对其进行初步的识别并通过它进行显卡的工作频率调节    遗憾的是,做为现时唯一正式支持Radeon HD 4770显卡工作频率调节的ATI Catalyst软件,其OverDrive工具仅仅给出了830MHz/850MHz的核心工作频率和显存工作频率调节上限,这显然是无法满足我们对于Radeon HD 4770显卡的超频需求的,因此我们修改了老牌显卡软件RivaTuner的Config文件,你只需要在Rivatuner.cfg文本下找到RV770 = 9440h-9443h,944Ch并在其后面加入表示Radeon HD 4770显卡ID的94B3h,即可让RivaTuner工具对其进行初步的识别并通过它进行显卡的工作频率调节。 由750MHz/800MHz超频至925MHz/1175MHz    我们最终将手上这张Radeon HD 4770显卡的工作频率由750MHz/800MHz超频至925MHz/1175MHz,而能够稳定通过半合成、3D游戏以及负载测试的工作频率也可以在900MHz/1125MHz左右,这对一张100美元级别的显卡而言,已经相当恐怖了。 回过头来说40nm制造工艺    自图形核心制造工艺跨入“nm”级别后,ATI便始终处于领跑者的位置上。最近的一次图形核心制造工艺更迭出现在第二波DirectX 10 API产品——ATI RV670和NVIDIA G92b身上,与TSMC本就良好的合作关系加之AMD在芯片制造方面的经验,让ATI RV670成了业界首颗55nm制造工艺的图形芯片。与处理器芯片面积大部分被缓存所占据不同,图形芯片的面积大部分来自于逻辑电路,因此它在制造工艺上不可能和前者走的一样快,这也就是为什么你会在图形芯片上看到80nm、55nm和40nm这样的数字。 当AMD拿出40nm ATI RV740芯片时,这也就意味着图形芯片的制造工艺超过了通用处理器芯片    事实上早在上个月初的CeBIT大展期间,AMD的图形部门便已经拿出了业界首颗的40nm制造工艺图形芯片——RV740-M97,并率先应用于ATI Mobility Radeon HD 4860/4830两款移动显卡产品上,而Radeon HD 4770显卡的发布则是40nm RV740图形芯片在台式机领域的首次亮相。有趣的是,虽然Intel公司的32nm制造工艺Clarkdale芯片已经浮出水面,但是其上市甚至是发布时间都还未最终敲定,因此当AMD拿出40nm ATI RV740芯片时,这也就意味着图形芯片的制造工艺超过了通用处理器芯片。    AMD选择在RV740图形芯片上植入40nm制造工艺应该是相当稳妥的做法。传统的图形芯片设计思路是先行拿出完整的版本,随后对其相应的单元进行屏蔽以满足各阶层的市场划分。当然,完整版本的图形芯片需要更大的芯片面积和晶体管数量来提高性能,换言之,它对新制造工艺的需求是最为迫切的。不过考虑到新型制造工艺在初期往往良率不高,加之旗舰级产品并不能对图形芯片进行单元屏蔽,因此若先行为其导入新的制造工艺,一旦良率出现问题,也就意味着旗舰级产品不得不面对“难产”的窘境。 RV740图形芯片架构图    ATI RV740图形芯片的Radeon HD 4770显卡虽然只搭载了128-bit的显存界面,不过其640个流处理器、32个纹理单元以及16个光栅单元的配备和主流的Radeon HD 4830显卡是完全一样的。55nm制造工艺的RV770图形芯片有着256平方毫米的芯片面积和9.56亿个的晶体管数量,而40nm制造工艺RV740图形芯片的芯片面积和晶体管数量则分别是137平方毫米和8.26亿个,每平方毫米芯片面积上可容纳的晶体管数量由0.037亿个增至0.06亿个,这是因为新的制造工艺可以让晶体管之间的连接线宽变的更短。 128-bit界面与GDDR5颗粒    虽然Radeon HD 4770显卡640个流处理器、32个纹理单元以及16个光栅单元的配备和Radeon HD 4830是一样的,不过不要忘了它毕竟还是一张100美元级别的产品,因此为了简化显卡在PCB布局走线上的设计进而控制成本,AMD只是给Radeon HD4770显卡搭载了128-bit的显存界面,这和上代Radeon HD 4600系列是一样的。在主流级娱乐型显卡早已普及256-bit的显存界面的今天,你会不会觉得Radeon HD 4770有些另类呢?更另类的是,它把GDDR5颗粒第一次带到了100美元左右的主流市场上。 奇梦达的GDDR5显存颗粒    如果使用GDDR3的显存颗粒,那么128-bit的显存界面显然会成为Radeon HD 4770显卡的瓶颈。那样虽然可以让产品的成本更低,但是AMD现在需要取代的产品是100美元级别的Radeon HD 4830而不是更便宜的Radeon HD 4600系列。虽然GDDR5显存颗粒的单一采购成本是要高于GDDR3的,但是它却能够利用更快的数据传输率把显存界面控制在一个相对更加合理的;例如Radeon HD 4770显卡的显存界面虽然只有128-bit,但GDDR5颗粒仍然能够帮助它获得51.2 GB/s的带宽,4830则是57.6GB/s。 GDDR5显存颗粒的优势    NVIDIA当初就表示将跨过GDDR4而直接使用GDDR5颗粒,不过和40nm制造工艺一样,率先将GDDR5颗粒付诸于现实的还是AMD。当然,在Radeon HD 4770显卡问世之前,你还只能在Radeon HD 4870、Radeon HD 4890以及Radeon HD 4870 X2这样的高阶产品上看到GDDR5颗粒。这样看来,AMD在100美元级别的显卡产品上使用GDDR5颗粒不能不说是个突破了,毕竟对于高带宽和低功耗的渴求,主流级产品一点不会比高端产品来的差,而强调成本控制的前者在这方面的需求甚至会更强烈一些。 更快的运算效能和更低的电力消耗    R600芯片是ATI以AMD图形部门身份亮相后拿出的首款产品,它和NVIDIA的G80芯片同属于第一代DirectX 10图形核心,那个时候的AMD仍然遵循着较为传统的GPU研发思路,即性能至上。而在和NVIDIA G92的第二代DirectX 10图形核心竞争中,ATI RV670已经开始逐步转换了这一传统思路,变性能至上为性价比先行,主攻主流市场,高阶市场则拿出“单卡双芯”概念,加之TSMC 55nm制造工艺以及DirectX 10.1等技术支持,均为日后第三代DirectX 10图形核心RV770的诞生和成功奠定了坚实的基础。    因此在上面这张PDF文档的截图中,你可以看到从R520核心的Radeon X1800到R580核心的Radeon X1900再到R600核心的Radeon HD 2900,虽然在这其间经过了从制造工艺到微架构体系再到DirectX API接口的多重改变,但是你会发现图形芯片的每瓦浮点运算量和每平方毫米浮点运算量是趋于水平的。而从RV670核心的Radeon HD 3800系列到RV770核心的Radeon HD 4800系列,即便是图形核心的制造工艺没有更迭,你还是能够看到上述两项指标出现了几何形的增长,这亦是设计思路转变的体现。    RV740图形芯片的出现又一次让每瓦浮点运算量和每平方毫米浮点运算量有了几何形的增长,这显然和40nm制造工艺是不无关系的。一方面,晶体管之间连接线宽的变短帮助RV740图形芯片在137平方毫米的面积上容纳了8.26亿个的晶体管,因此它能够做到和Radeon HD 4830一样的640个流处理器数量;另一方面,RV740的芯片面积从RV770的256平方毫米大幅缩减至137平方毫米,而每平方毫米芯片面积上可容纳的晶体管数量也从0.037亿个增至0.06亿个,因此出现单位运算效能的几何攀升就很正常了。 Radeon HD 4770配备了一组6-Pin的PCI Express供电接口    值得一提的是,TSMC在40nm图形芯片上同样使用了High-K介质的新型材料,这对控制终端显卡产品的功耗无疑是大有益处的。AMD给出Radeon HD 4770显卡的参考功耗值是80W,这仅比PCI Express插槽所能够提供的75W电力高出了5W而已,而同样具有640个流处理器,且核心工作频率还要比Radeon HD 4770慢上不少的Radeon HD 4830显卡则需要110W左右的电力。不过为了稳妥起见,AMD还是为Radeon HD 4770配备了一组6-Pin的PCI Express供电接口,以保证其在工作中足够的电力供应。 DirectX 10.1:真正的DirectX 10   随着Windows Vista SP2和Windows 7两大操作系统测试版的到来,下一代应用编程接口(API)DirectX 11也浮出了水面,而ATI R7xx亦将随之成为AMD的末代DirectX 10图形核心。既然说到DirectX 10,那么我们就不能提及另外一个概念——“DirectX 10.1”。事实上除了第一代的DirectX 1.0和夭折了的DirectX 4.0两者外,历代DirectX API均至少要经历一次小版本号的变更,只不过在这一次升级上,AMD选择了提供对DirectX 10.1的支持,而身为其最直接竞争对手之一的NVIDIA则并不感冒。 DirectX 10.1特性表一 DirectX 10.1特性表二   无论是按照常理,还是按照微软公司自己的说法,DirectX 10.1才是完整的DirectX 10,不过其中的强制4倍多重采样反锯齿(Minimum 4x MSAA)和FP32纹理过滤(FP32 Filtering)以及Gather4等特性均是DirectX 10硬件已经具备的,而DirectX 10.1真正引入的新特性则主要是立方体地图阵列(Cube Map Array)、可编程反锯齿采样模式(Programmable AA Sample Patterns)、Int 16 Blending以及多重缓冲读写(Multi-Sample Buffer Read and Writes)等,上面便是DirectX 10.1的特性列表。 Radeon HD 4770显卡能够开启DirectX 10.1 NVIDIA GeForce 9800 GT则不可以   事实上早在ATI RV670图形核心上,AMD便率先实现了对于DirectX 10.1的硬件支持,而当ATI RV790问世的时候,DirectX 10.1的应用也早已经不仅仅只有那款AMD自家的“PingPang Demo”了。曾经的“刺客信条门”事件早已经烟消云散,从孤岛惊魂二到潜行者:晴空,从鹰击长空到风暴觉醒,从BattleForge到Continent of the Ninth再到Unigine Tropics Demo,我们已经可以看到从单机到网络,从游戏大作到半合成测试的诸多DirectX 10.1应用了,而我们也将在近期制作关于DirectX 10.1的专题。 ATI Stream:OpenCL是助推器   下面我们再来看看现时正方兴未艾的“ATI Stream”吧。AMD为我们列举了诸多能够从ATI Stream上获益的应用,这其中包括了视频、音频编辑,2D、3D图形图像设计,办公应用和搜索功能,更好的游戏画面、人工智能以及物理效果等等……也许你已经注意到了,我们今天所提及的这些应用距离每一个人都不遥远,甚至是息息相关,因为我们每天都会用我们的电脑进行上述一种或多种工作,而ATI Stream简单说便是一种能够充分释放图形核心并行运算能力的技术,它为图形核心带来了更为广阔的应用空间。 ATI Stream SDK v2.0开发包中实现对OpenCL 1.0标准的支持   现时ATI Stream技术是通过DirectX API接口实现的。当然,接下来它也可以使用OpenCL——首个开放且免费的通用并行计算接口。AMD已经在上个月的13日拿出了新的ATI Stream SDK v1.4开发包,并将在即将到来的ATI Stream SDK v2.0开发包中实现对OpenCL 1.0标准的支持,而它同样是开放而且免费的。OpenCL API不仅仅适用于图形处理单元,而是适用于所有的并行处理单元,这对同时具备了CPU和GPU设计能力的AMD而言无疑是好的,毕竟其强调的是处理单元间的协同运算而非图形核心本身。 Cyberlink MediaShow Espresso视频转档 Cyberlink MediaShow Espresso视频转档   Cyberlink公司的MediaShow Espresso软件可以把视频源重新编码至iPhone、iTouch以及PSP等个人终端手持娱乐设备所支持的格式,当然你也可以自定义自己所需要的编码格式和解析度。我们使用的这个版本已经提供了对于ATI Stream流计算的支持。 Havok物理计算 “Havok Cloth”和“Havok Destruction” 这个时候的物理运算是由GPU负责的 “Samurai Warrior”Demo甚至同时支持了Havok和DX10.1   透过OpenCL API接口,ATI Stream流计算技术可以让CPU和GPU协同进行物理运算,“Havok Cloth”和“Havok Destruction”这两个Demo便是AMD在这段时间内的工作成果。此外,“Samurai Warrior”Demo甚至同时支持了Havok和DX10.1。 Windows 7:兵马未动,粮草先行 AMD公司已经在ATI Catalyst 9.3驱动程序包上率先实现了对于Windows 7操作系统的完整支持   在本月初的IDF北京站上,Microsoft公司的代表受邀向与会者讲解并演示了新一代操作系统Windows 7的部分功能和特性。回头再来看看网络上几乎是“一日一更新”的诸多版本以及即将与下个月5号推出的首个RC版本,也许Windows 7操作系统真的离我们不远了。事实上AMD公司已经在上个月的ATI Catalyst 9.3驱动程序包上率先实现了对于Windows 7操作系统的完整支持,并同时向下兼容现有的Windows Vista操作系统,支持1.1版本的WDDM(Windows Display Driver Model)显示驱动程序模型。   我们在测试Radeon HD 4770显示时所使用到的8.60版驱动程序和ATI Catalyst 9.4驱动程序包里面的版本是一样的。从ATI Catalyst 9.4驱动程序包开始,AMD已经取消了对于Radeon HD 2000系列以前的,即DirectX 9.0显卡产品的月度更新而转为季度更新。当然,DirectX 10.0以下的整合图形核心也在其中。除此之外,ATI Catalyst 9.4驱动程序包中还内建了最新版本的ATI OverDrive超频工具,它能够自动侦测到显卡的最佳超频频率,不过这一功能还暂时只能被应用于ATI Radeon HD 4000系列显卡上。 关于我们的测试    ATI Radeon HD 4770和Radeon HD 4830以及NVIDIA GeForce 9800 GT这三者是处于同一价格区间上的产品,它们之间的性能比较也应该是最为直接的。除此之外,相信你同样也希望看到ATI Radeon HD 4770和自家Radeon HD 4850相比的结果。 关于我们的测试    我们尽可能多的打开游戏中的画质设定并将其开到最高;我们尽可能的使用游戏里的反锯齿(AA)和各项异性过滤(AF)设置并分别将其设定4倍和16倍,只有当游戏本身没有提供反锯齿(AA)设置时才会在驱动程序中开启,而驱动程序中的垂直同步(Vertical Sync)选项始终是被我们关闭的;除了强制关闭垂直同步(Vertical Sync)的相关命令和参数,我们并不会对游戏的任何配置文件进行修改,因为绝大部分的用户都是不会这样做的;我们的每一组游戏帧数均是通过运行三次之后取平均而值得出的。 Radeon HD 4770 v.s GeForce 9800 GT Radeon HD 4770 v.s Radeon HD 4830 Radeon HD 4770 v.s Radeon HD 4850 HD 4770 v.s 9800 GT With DirectX 10.1 全文总结    Radeon HD 4770和Radeon HD 4830有着一样的640个流处理器、32个纹理单元以及16个光栅单元。虽然它只搭载了128-bit的显存界面,但是GDDR5颗粒还是帮助其获得了接近Radeon HD 4830的带宽,因此你可以看到核心工作频率更快的RadeonHD 4770有着更好的性能表现。而在和比自己贵上25美元的Radeon HD 4850的比较中,Radeon HD 4770也基本上能够达到Radeon HD 4850显卡90%左右的性能,在雷神战争这样对核心工作频率颇为明感的游戏上,Radeon HD 4770还甚至快过了后者。 Radeon HD 4770 v.s GeForce 9800 GT   其实只要是看看Radeon HD 4830之前的表现就知道同样卖100美元左右的NVIDIA GeForce 9800 GT是不可能Radeon HD 4770更快的,而两者之间的性能表现甚至不会在一个水平线上,尤其是在像深入敌后雷神战争和超级房车赛起点这样的游戏上。   也许你应该注意到了,我们在本文里始终将RV740图形芯片的后端渲染单元(Render Back-Ends,RBE),即ROPs的个数描述为16个,因为无论是在AMD官方给出的RV740图形芯片的微架构示意图上,还是在Radeon HD 4770显卡的规格参数上均是这样描述的。不过,我们却发现0.3.3版本的GPU-Z软件则将其识别为8个。另外,每一组后端渲染单元应该是对应一组显存控制器的,但是拥有四组共16个后端渲染单元的RV740图形芯片在微架构示意图上则被描述成了每两组后端渲染单元对应一组显存控制器。   介于Radeon HD 4830和Radeon HD 4850两者之间的性能表现,出色的温度和功耗控制,当然还有极具空间的超频能力,Radeon HD 4770在100美元左右的价位上显示是没有对手的,无论是做为自家Radeon HD 4830的替代者,还是做为与NVIDIA GeForce 9800 GT争夺主流市场的武器,它无疑都是让人满意的产品。面对拥有TSMC 40nm High-K制造工艺和GDDR5显存两大诱人卖点的Radeon HD 4770,NVIDIA若拿出超频版本的GeForce 9800 GT显然也是不够的。那么,他们接下来会怎么做呢? 你更看好下面哪一款显卡? ATI Radeon HD 4770 ATI Radeon HD 4830 ATI Radeon HD 4850 NVIDIA GeForce 9800 GT 更多Radeon HD 4770显卡图赏

CPU异构能力那里8万多是什么?
提示:

CPU异构能力那里8万多是什么?

就是指的cpu异构计算分数。 所谓异构计算,是指CPU+ GPU或者CPU+ 其它设备(如FPGA等)协同计算。一般我们的程序,是在CPU上计算。当大量的数据需要计算时,CPU显得力不从心。需要其它的方法来解决计算速度,这就是异构计算。 例如可利用CPU(Central Processing Unit)、GPU(Graphic Processing Unit)、甚至APU(Accelerated Processing Units, CPU与GPU的融合)等计算设备的计算能力从而来提高系统的速度。 异构系统越来越普遍,对于支持这种环境的计算而言,也正受到越来越多的关注。IGPU异构能力分数越高,就说明处理器在计算时就越快。 扩展资料: 异构计算的实现。 目前异构计算使用最多的是利用GPU来加速。主流GPU都采用了统一架构单元,凭借强大的可编程流处理器阵容,GPU在单精度浮点运算方面将CPU远远甩在身后。英特尔Core i7 965处理器,在默认情况下,它的浮点计算能力只有NVIDIA GeForce GTX 280 的1/13,与AMD Radeon HD 4870相比差距就更大。 不同厂商通常仅仅提供对于自己设备编程的实现。对于异构系统一般很难用同种风格的编程语言来实现机构编程,而且将不同的设备作为统一的计算单元来处理的难度也是非常大的。 基于GPU编程的,目前主要两大厂商提供:一个是NVidia,其提供的GPU编程为CUDA,目前使用的CUDA SDK 4.2.另一个是AMD,其提供的GPU编程为AMD APP (其前身是ATI Stream),目前最新版本 AMD APP 2.7。 这两个软件是不兼容的,各自为政。作为软件开发者而言,用CUDA开发的软件只能在NVidia相应的显卡上运行,用AMD APP开发的软件,只能在ATI相应的显卡上运行。 参考资料来源:百度百科-异构计算