ARM Cortex-A73详细解读

2016-07-01 18:38:08来源: EEWORLD
日前,ARM 处理器部门市场营销总监Ian Smythe和ARM处理器部门技术总监Peter Greenhalgh介绍了关于Cortex-A73处理器的详情,从市场前景到技术架构,无一巨细。以下是发言详情。

在更小的手机里面得到更多的性能,主要的挑战就是散热,也就是说在有限的散热空间里,需要有更有效的处理器。随着手机的不断地进化,各种各样的应用会出现在手机上,这也就需要了更多的处理性能。需要考虑一个问题,手机设计得越来越薄了,同时也需要更长的手机电池寿命,那么对我们的挑战就是怎么样在散热限制以及电池限制的情况下达到更好的使用效果。

我们最终的目标还是用户体验。目前,各种各样的benchmark只是表现了某一个方面,最终还是要追求用户体验的。所以,我们真正需要的是一个非常高效的处理器,能够给我们提供一个持续的高性能。

首先,我们要考虑的是,如果我们的手机变得非常热了会发生什么样的情况。我们做了一个实验,我们跑Geekbench。我们在这上面一直在跑,我们看到它对散热这方面的约束影响。

这边我们有两个方面要考虑,其中一个是SoC温度,一个是手机温度。我们开始跑Geekbench,性能就急剧提升,SoC的温度也开始上升,达到了69°C。大核这边已经跑到了1,550Mhz,小核跑到了1兆赫兹。当我们持续跑这个benchmark以后,手机就开始变得越来越热了,直到最后变得非常烫。

由于我们达到了散热的上线,所以我们要降低处理器SoC的频率,来降低温度。为了能够实现可持续的使用,并同时降低手机的温度,我们必须把大核的频率能够降下来。

这是手机在比较稳定的状态下跑的benchmark。在这个点的时候大核的频率降到1,200兆赫兹,小核还是在1兆赫兹。所以整体上的影响,在频率上会降低20%,在整体的性质上会降低25%,通过Geekbench可以表现出来。

这是一个特定的benchmark,如果我们跑带有GPU的benchmark,手机的温度会上升得更快。所以说在稳定的执行的时候,可持续的执行,怎么才能达到更好的性能,有一个更好的手机的使用时间。所以说答案就是Cortex-A73,在这方面我们做到了最好的功耗比。

所以Cortex-A73提升了30%的性能,在功耗效率方面也是提升了30%,这样能够保持在一个比较好的手机功耗范围内。所以Cortex-A73是我们在ARMv8-A架构里面积最小的旗舰级的处理器。Cortex-A73能够在700毫瓦的范围内能够提升更好的性能,可持续的使用的峰值性能。



所以,在700毫瓦情况下,我们可以看到Cortex-A57有这样一个可持续的性能以及这样的峰值的,Cortex-A73这边我们进一步地提高了它的可持续性能和峰值。相对于可持续的性能,我们针对Cortex-A57提升了大概2.1倍,对Cortex-A72提升了30%。下面请Peter来进一步讲解Cortex-A73。

Cortex-A73是在我们Cortex-A架构里面最新的处理器。Cortex-A73能够提供峰值的性能,达到最好的能耗效率,所以在架构上做了很多的优化,接下来我们会专门讲讲Cortex-A73是如何在性能、能耗效率方面做到这些优化。



就像前面所提到的,这个是我们现实世界里所面对的主要问题,在移动手机方面。

这边是我们Cortex-A73里面的指令集和流水线的情况。前期我们有一个非常高效的流水线,到后面是基于Slot微架构的结构,所有这些都是面向功耗进行优化的。指令缓存这边我们做了64K的指令cache。相对于以前这是一个比较大的设计,这主要是一些应用对Cache的缓存需求比较大,比如在浏览器应用。

我们集中优化的方向是移除信号,这样能够提升IPC。这方面我们做了一个优化,尽量早地把一些指令分解成一些V指令。针对我们做的这些优化,像刚才提到的信号移除,就需要设计一个更高效的跳转预测机制。

在跳转预测结构上,我们有一个64个入口的Micro-BTAC,另外还有一个两路组相连,每一路是256个分时跳转的预测机制。在返回站以及静态预测这方面,我们还同样有这样一个机制,在预测错误的时候有一个非常低的功耗。在前端,我们跟Cortex-A72也有一个比较大的区别。我们现在是2-wide的超标量流水线。在Cortex-A72里面是一个三路的超标量的结构。为什么从Cortex-A72的三路减到两路?就是为了有一个更好的功耗效率。面向功耗效率,我们来做两路的超标量设计。

我们在发射的阶段以及一些存储器的重命名方面做了一些优化。我们还在发射队列以及读取的平衡方面、算法方面也做了一些提升。

在NEON我们重新设计了它的流水线,和以前的Cortex-A72是有所不同的。除了减少时延以外,在MAC的算法方面,我们引出了一个提前终止的机制,比如我们做的64×64操作的时候。在Cortex-A73里面,我们有一个完全的乱序双发射的存取读取机制。在存储这块我们投入了非常多的时间来进行优化。优化的内存系统使Cortex-A73比Cortex-A72达到了更好的效能。由于优化了内存系统,虽然是从三路超标量降到两路超标量,但是同样在性能上甚至是比Cortex-A72更好。在一级缓存以及二级缓存方面,我们做了一些自动预取的机制,使得效率更高。

在内存这方面,我们有一个非常高的可持续内存带宽,我们优化了主存的TLB,会有一个预取的机制,尤其是在一些非常大数据流动量的时候,它可以同时支持two simultaneious Page Table Walks,来读取页表的机制。

在L2 cache这边也是做了非常多的优化,我们可以可持续地读取更多数据,同时不会有性能的丢失。同时,我们对L2的仲裁也是做了一些优化,尤其是在做交叉访问的时候,整个Cache替换的机制也做一个优化,让它更加重要。

Cortex-A73是为了提供给客户最好的用户体验。Cortex-A73专门针对移动市场做了优化,相较Cortex-A72,Cortex-A73在BBench方面提升了10%,Neon提升了5%,Memory这方面提升了15%。需要指出的是,所有这些比较是在同频的情况下进行比较的。可以看到它对性能是有10%或者是15%的提升,在用户体验的过程中会有这样一个提升,像在网络浏览的时候,更多地是提升它的功耗的效率,提升功耗效率20%。

在相同的工艺下面,我们会相对于Cortex-A72在功耗这方面可以节省20%,同样我们还有在功耗效率方面的提升。这样我们就节省了更多的功耗,在做设计的时候可以有更多的应用。

借助工艺的提升,现在Cortex-A73能够做到最小的ARM的处理器。所以Cortex-A73我们能够实现高性能,低功耗,最小面积。如果在相同的工艺情况下,Cortex-A73比Cortex-A72单核面积降低了25%。如果我们借助到工艺的演进,如果Cortex-73做到10纳米,相比Cortex-A72会有46%的面积的降低,同时比Cortex-A57有70%的降低。



我们ARM引入了大小核的概念。借助Cortex-A73,我们把大小核的概念带入了一个新的阶段。Cortex-A73不仅可以和Cortex-A53做大小核,也可以和Cortex-A35做大小核。除了我们和Cortex-A35这样的大小核能够进一步提升,软件方面我们也一直在做提升,从big.LTTILE MP, Energy Aware Scheduling这些软件上的层次,把大小核的效果更好地发挥出来。

借助这些新的大小核技术,我们可以在2017年看到一些设备上,具备更好的性能,同时降低更多功耗。

除了在旗舰级的手机上,Cortex-A73在中端的手机上也增加了使用机会。我相信大家都非常熟悉八核的Cortex-A53结构。我们如果采用Cortex-A73和Cortex-A53来做一个六核,就是两个Cortex-A73大核,加上四个Cortex-A53小核的设计,在同样面积的情况下,用户体验上可以提升30%,在单线程的性能方面提升90%。

Cortex-A73主要是专门针对移动市场以及消费类市场做了一些优化,它是采用了ARM的ARMv8架构 64-bit,以及我们新的大小核架构的系统,可以为用户带来很好的体验。所以我们看到不仅仅是手机,包括一些大屏的应用,像平板电脑,数字电视、机顶盒,都会有很好的应用。



所以Cortex-A73能够提供旗舰级的用户体验。在这个体验里面,我们能借助它更好的功耗的效率和更高的性能,使我们能够设计出这样一个更轻薄的手机,更长的用户使用时间。

就像我们前面讲的,CortexA73能够提供30%的性能提升,30%可持续使用的提升。Cortex-A73结合我们最新的大小的核架构能够进一步提升性能,同时使得使用时间更长,降低功耗。

最后Cortex-A73目前已经得到了非常广泛的授权,在移动市场和消费类市场,我们也相信我们会很快看到基于Cortex-A73的产品面市。

关键字:ARM  Cortex

编辑:冀凯 引用地址:http://www.eeworld.com.cn/xfdz/article_2016070155346.html
本网站转载的所有的文章、图片、音频视频文件等资料的版权归版权所有人所有,本站采用的非本站原创文章及图片等内容无法一一联系确认版权者。如果本网所选内容的文章作者及编辑认为其作品不宜公开自由传播,或不应无偿使用,请及时通过电子邮件或电话通知我们,以迅速采取适当措施,避免给双方造成不必要的经济损失。
论坛活动 E手掌握
微信扫一扫加关注
论坛活动 E手掌握
芯片资讯 锐利解读
微信扫一扫加关注
芯片资讯 锐利解读
推荐阅读
全部
ARM
Cortex

小广播

独家专题更多

富士通铁电随机存储器FRAM主题展馆
富士通铁电随机存储器FRAM主题展馆
馆内包含了 纵览FRAM、独立FRAM存储器专区、FRAM内置LSI专区三大部分内容。 
走,跟Molex一起去看《中国电子消费品趋势》!
走,跟Molex一起去看《中国电子消费品趋势》!
 
带你走进LED王国——Microchip LED应用专题
带你走进LED王国——Microchip LED应用专题
 
电子工程世界版权所有 京ICP证060456号 京ICP备10001474号 电信业务审批[2006]字第258号函 京公海网安备110108001534 Copyright © 2005-2016 EEWORLD.com.cn, Inc. All rights reserved