权威外媒深扒华为麒麟960 GPU强点就完美了

2017-03-20 20:06:43来源: 快科技 关键字:华为  功耗  带宽测试  运算

对于智能手机来说,SoC的重要性不言而喻,而作为国产唯一自研的海思麒麟处理器,一直以来备受关注,发展至今,逐渐跻身于移动处理器中的领先水平,在麒麟960这款产品上,做到了“留长补短”,被称作麒麟历史上具有突破性的产品,在随后的实际体验上,搭载麒麟960的产品都有着不错的表现。因此,而我们今天就来测试一下麒麟960在深层次上的性能。(注:测试数据编译自ANANDTECH)

  注:ANANDTECH将麒麟960的工艺写成TSMC 16nm FFC,而实际上麒麟960的工艺为TSMC 16nm FF+。

  从麒麟960、麒麟955、麒麟950三款(两代)产品参数表来看,相比于上代产品,麒麟960是全球首款采用ARM最新的A73架构的SoC,相比麒麟950,大核主频由2.3GHz提升至2.36GHz,小核主频从1.81升至1.84GHz,但略低于麒麟955的2.52GHz。可以看到,麒麟处理器对于CPU主频的还是做了一定的限制、以赋予GPU可以做到更高的性能。

  麒麟960采用的A73架构出自于ARM在欧洲的设计团队,而非设计出A15/A57/A72系列的德克萨斯奥斯丁团队,因此尽管A72与A73在编号上只差了1个数,但在CPU的性能设计上则截然不同。A57、A72则是偏重高性能,承担着高端处理器上应付复杂数据的处理。A73则更加着重于对性能与功耗的平衡。

  ▲A73采用双发射L/S

  值得一提的是,A73与A72比较明显的区别在于解码器的宽度,A73采用双发射L/S单元,在发射宽度上小于A72的三发射。虽然从纸面上有所降低,但根据资料显示,A73架构的11级核心流水线深度比A72的15级核心流水线深度更精简,因此发射宽度并没有决定性的影响到A73的性能。另外,A73更短的流水线减少了前端延迟,包括1-2个更少的解码器周期,它可以解码单个周期中的大多数指令,以及1个更少的周期用于读取层面。

  电源管理

  这张图显示了A73相比于A72,在相同的进程和相同的主频下,A73能够比A72减少20-30%的功耗。并且A73号称目前处理器中面积最小的高端核心,每颗核心的面积在0.65mm,相比于A72上1.15mm的面积整整小了43%。

  ▲G71架构图

  一直以来,麒麟处理器的GPU性能相比于骁龙被人诟病,因此在麒麟960上,GPU则最大限度的保持了性能。在麒麟960上,同样配备了ARM最新的G71处理器:Mali-G71 MP8,主频最高为1037MHz。G71采用ARM最新的Bifrost架构。与之前midgrad架构相比,Bifrost最大的创新在于使用指令组着色器(ClausedShader)。在G71上重新设计了执行单元,更好的利用着色器核心,增加吞吐量和性能。另外Bifrost架构还采用Quad based vectorization技术,相比于之前SIMD矢量化技术一次只能执行单一线程,Quad矢量化技术最高支持四线程执行,共享控制逻辑,使用率接近100%。

  通过解读麒麟960的架构,我们了解了麒麟960的设计思路:注重CPU性能与功耗的平衡,以及GPU的极限性能,整个麒麟960没有哪部分成为明显的短板为人诟病。

  CPU跑分测试:

  ▲SPECint2000单项测试

  ▲麒麟960 IPC

  通过SPECint2000可以看到,麒麟960在CPU整数运算性能上相比麒麟950有了比较大的进步,A73的IPC比A72的高出11%、比A57增加29%。值得一提的是,竟然比骁龙821的kryo高出30%,比8890的Mongoose高15%。在这里,我们也只能说一句公版大法好了。

  ▲单线程整数IPC

  GeekBench4的整数运算单线程跑分,可以看到,麒麟960总体来说也是有好有坏。相比麒麟950,在边缘检测(Canny)和直方图均衡(HE)项目中,麒麟960输给了其它三位对手,而在HTML5 Parse和HTML5 DOM的测试中,麒麟960则有上佳的表现。而在IPC的计算中,A73略优与A72 4%,但在SPECint2000的整数运算中,A73的优势则为11%,二者差距比较大,并且在单项测试中的起伏不定,因此比较A73与A72之间的好坏,则 是一个非常困难的事情。

  另外,可以看到,A73的整数运算IPC大概是A53.1.7-2倍,这也是为什么那些只配备A53的中低端SoC性能表现不好的原因之一。

  ▲浮点单项测试

  GeekBench4浮点运算,麒麟960的表现并不能算好。与麒麟950相比也不算优秀,而对比骁龙821则全面落败(当然,骁龙的浮点运算一直都不错)。考虑到A73的NEON执行单元与A72相比并没有改变,而降低了特殊指令的延迟,使得NEON的性能还提升了5%。因此这样的结果还是有些意外,只能猜测为有些测试项目受到A73解码器宽度的变化。但最终的原因,也只能在之后测试其它采用A73的SoC上的表现在下结论。

  ▲浮点测试IPC结果

  在浮点IPC的结论中,麒麟960不出意外的只能排在中游水准,比骁龙821、麒麟950、三星8890都落后。而这也意味着麒麟960会在不同的任务之间有着比较大的性能变化。

  内存性能:

  此次ARM将A73的一级缓存由48kB提升至64kB,二级缓存由A72的最大2MB提升至8MB,并且为一级缓存和二级缓存都配备了独立的预读器,使得A73可以获得接近理论的最大带宽值。并且,与A72一样,A73中配备了两个AGU,能够同时加载和存储操作,而不像A72中只能单个操作,这对提高主系统内存的发射率。

  CPU缓存和内存延迟:

  ▲系统延迟与传输速度

  可以看到,得益于A73 64kb的一级缓存,麒麟960保持了1.27ns的稳定延迟,对比麒麟950的1.74ns,有着27%的提升。

  ▲带宽读取测试

  ▲带宽写入测试

  上面两个图标显示了使用两线程读/写NEON指令,有助于表明麒麟960的内存带宽。读取时,麒麟960的L1缓存优于麒麟950,但从64kb分界线可以明显看出,当到达2级缓存的时候,带宽则有着明显的下降。图2可以看到,写入时,L1、L2下麒麟960都低于麒麟950,而在1024kb分界线过后,写入系统时,则低于麒麟960。缓存带宽的减少,也从侧面解释了GeekBench4浮点测试中麒麟960的劣势。

  在GeekBench4的内存测试中(单线程),尽管麒麟960的L1、L2的缓存性能都是混合的,但在系统内存方面还是比麒麟950有着不错的表现。内存延迟提升了25%、内存带宽提升了69%,但在内存复制上,麒麟960还是被骁龙821甩在了身后。说明kryo对于内存数据的管理还是有着明显的优势。

  当然,上面测试的都是理论性能,而理论性能究竟有多少能转化为真实性能,则体现出厂商的优化能力。当然,不同的厂商对于处理器性能的策略也导致会出现不同的结果,比如发热(后降频)的阈值、CPU的核心调度策略等,也都会使同样的处理器在不同的产品上有着不同的体验。

  ▲PCMark综合测试成绩

  ▲浏览器网络测试

  ▲写入测试

  PCMark通过模拟一些现实的工作场景,调用许多常永的安卓应用API,突出对CPU、GPU、RAM等部分的测试。而在浏览器测试、数据操纵等测试项目的评分中,麒麟960都均为最高(采用Mate9测试)。可以看到,kryo架构对于整数性能的测试一直都比较头疼,因此在整数性能权重比较重的测试项目中,骁龙820/821的手机落后于采用公版A72/A73架构的手机。

  最后的数据操纵测试是对整数运算的测试项目,通过测量多种不同类型文件的数据包解压速度,然后记录动态交叉表的帧率。而在这个测试中,麒麟960比麒麟950快了30%,比骁龙821快了37%。

  ▲Kraken测试

  ▲WebXPRT测试

  ▲JetStream

  注:Kraken在Chrome/Safari/IE中测试javascript性能;WebXPRT测试不同浏览器之间的Web性能(基于HTML5和Javascript)、JetStream测试JavaScript的性能;

  在Javescript测试中,我们选取了不同的应用在不同的浏览器当中测试,综合来看,麒麟960的表现比不错,在旗舰中堪称优秀。

  GPU能耗和发热

  对于CPU理论性能与真实体验之间转换,功耗一直是一个比较矛盾的问题。性能强,CPU的功耗自然比较大,而功耗过大又会限制CPU峰值能力的稳定性,因此控制性能与功耗之间的平衡,则是考验厂家对SoC把握的重要部分。在麒麟950时,海思曾经做到比较不错的功耗比,而ARM宣称A73在同频、同任务下相比A72能减少20-30%的功耗,因此我们对麒麟960的能耗比也有所期待。

  从表格可以看到,麒麟960的四颗大核所消耗的功率远超A72架构的麒麟950,这与ARM所宣传的A73架构更加省电并不太相符。从单纯的数据来看,麒麟960的峰值功率与超频过后的麒麟955比较接近,每颗核心与低频的Exynos 7420相近,只有大约50mW。

  而与骁龙820/821的两个kryo大核相比,麒麟960的功耗更低,两颗大核的功率大致为2.8W,而kryo则能达到3.1-3.3W。但剩余的两颗小核在运行时消耗更低的功率,相比之下,麒麟960之前的优势不再。

  续航测试:

  尽管在峰值功耗上麒麟960明显更高,但华为Mate9在续航测试中的表现结果却非常不错。在PCMark的测试中,接近10小时的续航时间比Mate8甚至都高出27%,与单纯的CPU性能测试的结果并不相符,恐怕也只能说这一代的系统优化更加出色。

  ▲续航测试

  在这张图中,显示了Mate9在运行PCMark 2.0性能测试时的总系统功耗(测试环境:无线电关闭、屏幕亮度仅为10nits),而除了在加载下一个测试场景时的引起的较高功率之外,总功率消耗保持在3W以下,且平时一般都低于2W,远低于麒麟960四颗大核测量的5.3W。

而在这个表中的测试项目:浏览器网络测试、视频测试、文件写入、图片编辑和数据操作,这些项目基本上都是我们平时经常用到的手机功能。可以看到,线程从小核心转移到大核心

[1] [2]

关键字:华为  功耗  带宽测试  运算

编辑:北极风 引用地址:http://www.eeworld.com.cn/xfdz/article_2017032061955.html
本网站转载的所有的文章、图片、音频视频文件等资料的版权归版权所有人所有,本站采用的非本站原创文章及图片等内容无法一一联系确认版权者。如果本网所选内容的文章作者及编辑认为其作品不宜公开自由传播,或不应无偿使用,请及时通过电子邮件或电话通知我们,以迅速采取适当措施,避免给双方造成不必要的经济损失。

上一篇:三星Galaxy S8随机附送AKG音乐耳机谍照曝光
下一篇:OPPO F3 Plus现身GFXBench 配置信息获确认

论坛活动 E手掌握
微信扫一扫加关注
论坛活动 E手掌握
芯片资讯 锐利解读
微信扫一扫加关注
芯片资讯 锐利解读
推荐阅读
全部
华为
功耗
带宽测试
运算

小广播

独家专题更多

迎接创新的黄金时代 无创想,不奇迹
迎接创新的黄金时代 无创想,不奇迹
​TE工程师帮助将不可能变成可能,通过技术突破,使世界更加清洁、安全和美好。
TTI携TE传感器样片与你相见,一起传感未来
TTI携TE传感器样片与你相见,一起传感未来
TTI携TE传感器样片与你相见,一起传感未来
富士通铁电随机存储器FRAM主题展馆
富士通铁电随机存储器FRAM主题展馆
馆内包含了 纵览FRAM、独立FRAM存储器专区、FRAM内置LSI专区三大部分内容。 
电子工程世界版权所有 京ICP证060456号 京ICP备10001474号 电信业务审批[2006]字第258号函 京公海网安备110108001534 Copyright © 2005-2017 EEWORLD.com.cn, Inc. All rights reserved