PowerVR 7架构深度解析:iPhone 7可能搭载

2014-11-12 23:23:56来源: 新浪手机
     作为对ARM Mali-T800系列的直接回应,Imagination今天正式发布了新一代移动GPU PowerVR Series7系列,包括高端7XT、低端7XE两个子系列。

  下边,我们就细细看看它的底层架构设计,并预览一下性能。

  PowerVR 7架构解析

  本质上来说,PowerVR 7的架构还是“Rogue”,已经引入两年。该架构有着先进的着色器流水线体系,没什么明显缺点,短期内还无需彻底翻新,只要局部增强、完善就可以提升效率和性能了,包括强化指令集。 

  当然,它还需要不断加入新的功能特性,尤其是新的API。OpenGL ES 3.1早就支持了,但是苹果的Metal来势汹汹,作为回击的Google Android Extension Pack现在是不能少的,还加入了可选项Direct3D 11.1(通俗地说就是DX11.1)。

  但是注意7XT上这两个都是标配,7XE上的AEP只是可选项,Direct3D则只到10.0。

  这次唯一增加的新模块就是“曲面细分协处理器”(Tessellation Co-Processor),可配合顶点数据管理器(Vertex Data Master)实现完整的曲面细分支持,但注意为了节省功耗,它是个固定功能单元,不可编程

  曲面细分、ATSC纹理压缩、几何着色、纹理着色,这些就是支持AEP的基础。

  其他模块没有大变但都有所增强,比如说顶点数据管理器(几何前端)的几何性能翻了一番,计算数据管理器(Compute Data Master)则提速了最多三倍,尤其适合处理大量的小内核。

  粗纹理调度器(Coarse Grain Scheduler)降低了内部区块关联性,可以更快地向空闲核心(着色器簇/USC)发送指令,而不必等待其他核心完成工作。

  USC核心本身变动很小,FP16/FP32 ALU、浮点单元都没变,但是特殊功能单元(SFU)有了两处明显变化。首先也是最重要的,SFU可以原生处理FP16、FP32操作了(上代会全部推给FP32),因此在处理FP16数据集的时候不必进行无谓的高精度操作,自然能节省功耗,而且因为SFU本身已经很大了,原生FP16带来的功耗节约会很明显。

  另外虽未明说,但极有可能FP16、FP32 SFU单元已经分离成了独立的两个(架构图显示一个),当然即便如此它们也不能同时使用。

  第二个增强是SFU操作可以和ALU操作并发了,也就意味着两个单元可以同时工作。Imagination表示,SFU代码比预期得来得更快,因此并发会大大提高性能,为此指令集也做了相应的扩展。

  此外,PowerVR 7系列还可选支持FP64操作,按照设计每核心有一个FP64 ALU。

  最后是个非图形功能,硬件加密区,使用虚拟化技术创建最多8个区域,彼此完全隔离,可进行不同的安全操作,并与CPU、GPU互联。7XT会标配它,7XE上则是可选。

  CPU上早就有了类似的功能,GPU上则一直是软件模拟,效率低下,而且安全性不足。

  

  7XT/7XE:高低双雄细节探究

  7XT是高端型号,但也有很多技术特性是可选的。FP64操作、OpenCL 1.2 Full Profile是面向高性能计算用途的(默认仅支持FP32、OpenCL 1.2 Embedded Profile),Direct3D 11则适合Windows Phone、Windows RT平台设备(默认是Direct3D 10),但是曲面细分已经是标配。

  通过灵活配置这些特性,SoC厂商可以精确满足自己和客户的需要,同时更好地控制面积和功耗。

  其实相比于性能,能效才是7XT系列提升的重点。Imagination没有给出任何具体数据(提升了百分之多少),只是说7XT可以更低的功耗提供与6XT持平的性能,同时给了一张幻灯片,号称自己有着全球最高的GPU能效。

  证据就是自己的PowerVR长时间运行也几乎不会降频,竞争对手的则会降低40-60%。

  当然了,这能否实现还得看SoC厂商的设计,Imagination只能提供最基本的建议。人家非要把CPU、GPU频率弄得很高,跑着跑着就会过热降频,你也没辙。

 

  7XT系列的核心可选2-16个,比上代最多翻了一番,具体型号分别是:双核心GT7200、四核心GT7400、六核心GT7600、八核心GT7800、十六核心GT7900。

  很有意思的命名吧?Imagination甚至说GT7900的性能已经可以超越入门级笔记本独显GeForce GT730M。GT7400/GT7600则是上代主机Xbox 360、PS3的水平。

  用途方面,2-4个核心的适合手机,6-8个可用于平板机、汽车、超极本,16个的只有笔记本、机顶盒、游戏机、服务器才敢用——512个FP32 ALU单元差不多可以媲美入门级桌面独立显卡了。

  目前的6XT系列里,iPhone 6用到的GX6450是四个核心,iPad Air 2里的GX6650旗舰型号六个核心。

  7XE定位于入门级,规格、成本都很低,并且更强调面积上的效率,而不是功耗。

  7XE其实也有着7XT相同的架构改进,可以支持7XT的几乎所有技术,但绝大部分都是可选项,包括DirectX 11、曲面细分(AEP自然也是可选了)、纹理压缩、HEVC/H.265解码、10-bit YUV色彩输出、虚拟化安全。OpenCL 1.2 FP都直接不可选。

  7XE有两个版本,一个核心的GE7800面向低端手机和电视,半个核心的GE7400则面向最便宜、最简单的设备,以及可穿戴设备

  Imagination声称,7XE的功耗满载也不会超过1W,待机时几乎可以忽略不计。

  

  性能咋样?

  真正使用PowerVR 7系列的处理器、设备要明年底才会出现,而我们都知道,ARM、Imagination他们都只是卖CPU、GPU授权,具体什么样子还得看SoC芯片厂商的选择,包括核心数量、技术特性、制造工艺、运行频率等等,因此现在是无法说清性能的,只能有一个大概的预估。

  Imagination宣称,在同样核心数量、同等频率下,7XT系列的性能可比6XT系列提升35-60%,如果真能实现是很猛的,但这也意味着功耗会增加很多,因此最终在考虑功耗的前提下,性能提升绝对不会这么高,而且这只是理论测试,实际应用中又会打个折扣。

  而在能效方面站出来的是7XE,官方号称相比6XE提升幅度少则40%,多则可以超过100%。

  结语:

  PowerVR 7系列可以配置出各种不同的版本,最高最低相差32倍,因此理论上适合各种各样的设备,从智能手表、手环到笔记本甚至是服务器计算集群。

  PowerVR 6系列是CES 2014大展上宣布的,最近才刚刚投入实用,iPhone 6/Plus、iPad Air 2就是典型代表。PowerVR 7系列的零售产品预计会在一年后面世,正好就是下一代iPhone、iPad发布的窗口,而按照苹果与PowerVR的一贯良好合作关系,iPhone 7(6S)几乎必然会用PowerVR 7,而且说不定会有6个核心。

  ARM Mali-T800、高通Adreno 400、NVIDIA麦克斯韦……明年的移动GPU,注定会精彩异常。

关键字:Imagination  Power  VRGPU

编辑:北极风 引用地址:http://www.eeworld.com.cn/xfdz/2014/1112/article_38290.html
本网站转载的所有的文章、图片、音频视频文件等资料的版权归版权所有人所有,本站采用的非本站原创文章及图片等内容无法一一联系确认版权者。如果本网所选内容的文章作者及编辑认为其作品不宜公开自由传播,或不应无偿使用,请及时通过电子邮件或电话通知我们,以迅速采取适当措施,避免给双方造成不必要的经济损失。
论坛活动 E手掌握
微信扫一扫加关注
论坛活动 E手掌握
芯片资讯 锐利解读
微信扫一扫加关注
芯片资讯 锐利解读
推荐阅读
全部
Imagination
Power
VRGPU

小广播

独家专题更多

富士通铁电随机存储器FRAM主题展馆
富士通铁电随机存储器FRAM主题展馆
馆内包含了 纵览FRAM、独立FRAM存储器专区、FRAM内置LSI专区三大部分内容。 
走,跟Molex一起去看《中国电子消费品趋势》!
走,跟Molex一起去看《中国电子消费品趋势》!
 
带你走进LED王国——Microchip LED应用专题
带你走进LED王国——Microchip LED应用专题
 
电子工程世界版权所有 京ICP证060456号 京ICP备10001474号 电信业务审批[2006]字第258号函 京公海网安备110108001534 Copyright © 2005-2016 EEWORLD.com.cn, Inc. All rights reserved