datasheet

新技术名词解析——NPU,让手机变得聪明点

2018-09-04来源: 快科技关键字:NPU

今日,美国知名科技媒体Android Authority主笔Gary Sims对麒麟970进行了深度解读,讲述了麒麟970的人工智能NPU的工作原理,对芯片设计的深远影响,以及为用户使用场景带来的跨越式体验。

 

image.png

 

“神经网络(Neural Networks)”和“机器学习(Machine Learning)”是近两年移动处理器领域最流行的两个词。华为麒麟970的NPU(神经网络处理器)、Google Pixel 2内置的IPU(图像处理器),以及苹果A11 Bionic,都是实现上述功能特性的专用硬件解决方案。

 

既然华为、Google和苹果都在都在探索神经引擎处理器,你可能以为机器学习需要特定的硬件。其实不然,神经网络可以在任何形式的处理器上运行,从微处理器到CPU、GPU甚至是DSP。

 

所以,问题的根本不在于处理器是否能利用神经神经网络和机器学习,而在于它到底有多快,能提升多少效率。

 

image.png

 

如果时间倒退回30年前,当年的桌面处理器是没有的FPU(浮点运算单元)芯片的,在486之后,Intel把FPU集成到了CPU内部,浮点运算性能大幅提升。而在很多实例计算中,全都是浮点数运算。这样以来,有FPU和没有FPU,运算效率天差之别。

 

而如今,移动处理器中的NPU也是类似的情况。你可能觉得我们并不需要NPU,就能使用神经网络,但实时情况是,华为正在用事实案例证明,当遇到实时处理运算的情况,NPU是必须的。

 

image.png

 

简单来说,“神经网络”可以理解为“机器学习”中“教”一台机器区别分辨不同“事物”的一系列技术中的一种。上述“事物”可以是一张照片、一个单词甚至是一种动物的声音,诸如此类。

 

“神经网络”由很多“神经元”组成,这些“神经元”可以接收输入信号,然后通过网络再向外传播信号,这取决于输入的强度和自身阈值。

 

举个简单的例子,神经网络正在监测一组灯其中一个的开关,但在网络中,这些灯的状态只能0或者1来表达,但不同的灯可能会出现一样的开关状态。

 

那么问题来了,神经网络怎么知道是该输出0还是该输出1呢?没有规则或者程序能告诉神经网络,输出我们想得到的逻辑答案。

 

image.png

 

唯一的方面就是对神经网络进行训练。大量的“样本”和预期结果一起被注入到神经网络中,各种各样的阈值反复微调,不断产生接近预期的结果。这个阶段可以称为“训练阶段”。

 

这听起来很简单,但实际上相当复杂,尤其是遇到语言、图像这种复杂样本的时候。一旦训练达成,神经网络会自动学会输出预期结果,即便输入的“样本”之前从来没有见过。

 

神经网络训练成功后,本质上就成了一种静态神经网络模型,它就能应用在数以百万计的设备上用于推理,在CPU、GPU甚至是DSP上运行。这个阶段可以称为“推理阶段”。

 

image.png

 

Gary Sims指出,“推理阶段”的难度要低于“训练阶段”,而这正是NPU发挥专长的地方。

 

所以,华为麒麟970最大的不同是,专门设置了NPU硬件芯片,它在处理静态神经网络模型方面有得天独厚的优势,不仅更快,还更有效率。事实上,NPU甚至能以17-33fps实时处理智能手机摄像头拍摄的“直播”视频。

 

image.png

 

从架构来看,麒麟970像是一台“发电站”,内置8颗CPU和12颗GPU,另有移动网络连接以及多媒体处理模块,晶体管规模达到了史无前例的55亿颗。据华为透露,NPU大约内含1.5亿晶体管,不到整个芯片的3%。

 

这对于一款移动处理器来说尤为重要。首先,NPU的加入不会明显增大处理器的尺寸、成本,这就意味着,NPU不仅能放入旗舰手机,一些中端手机也能适用。在未来5年,NPU将对Soc设计产生深远影响。

 

其次是功耗和效率。NPU并非“电老虎”会牺牲手机的续航,相反它能高效的帮CPU承担大量推理运算的任务,反而能节省不少功耗。

 

image.png

 

在最后的总结中,Gary Sims表示,如果华为能吸引更多第三方App开发者使用NPU,其前景不可限量。想象一下,当App在使用图像、声音、语音识别的时候,全部都能本地处理,不再需要网络连接或者云服务,App的使用体验将大大提升和加强。

 

试想,一名游客直接通过相机App就能认出当地地标,App能智能识别你的食物并给出相应的卡路里熟知、提醒食物过敏......

 


关键字:NPU

编辑:muyan 引用地址:http://www.eeworld.com.cn/qrs/2018/ic-news090451179.html
本网站转载的所有的文章、图片、音频视频文件等资料的版权归版权所有人所有,本站采用的非本站原创文章及图片等内容无法一一联系确认版权者。如果本网所选内容的文章作者及编辑认为其作品不宜公开自由传播,或不应无偿使用,请及时通过电子邮件或电话通知我们,以迅速采取适当措施,避免给双方造成不必要的经济损失。

上一篇:手握锐龙的AMD能否和其他两强三分天下?
下一篇:锐成芯微布局RISC-V,壮大DesignShare 生态系统

关注eeworld公众号 快捷获取更多信息
关注eeworld公众号
快捷获取更多信息
关注eeworld服务号 享受更多官方福利
关注eeworld服务号
享受更多官方福利

推荐阅读

STM32上电以后GPIO默认是Floating input

); //根据设定参数初始化PD7检测就是u8 Read_THDET_PIN(){ return GPIO_ReadInputDataBit(GPIOC ,GPIO_Pin_6);}把这个函数放到循环中 周期读一读就知道了 有卡是0  没卡是1 u8 tset =    Read_THDET_PIN(); 上电以后就是高电平!因为它外接的3.3v 结论:上电是浮空的,一般是低电平,除非你外面自己接电了才是高电平。
发表于 2019-04-10
STM32上电以后GPIO默认是Floating input

STM8L库函数修正--GPIO_ReadInputDataBit

使用的库:STM8L15x_StdPeriph_Driver库函数:GPIO_ReadInputDataBit函数原型:BitStatus GPIO_ReadInputDataBit(GPIO_TypeDef* GPIOx, GPIO_Pin_TypeDef GPIO_Pin){   return ((BitStatus)(GPIOx->IDR & (uint8_t)GPIO_Pin));      }作用:读取GPIO脚的电平,被读取的IO口为低电平时返回RESET,高电平返回SET。 SET\RESET的定义:typedef enum
发表于 2019-04-10

瑞芯微CES2019发布AIoT芯片RK1808,内置高能效NPU

集微网消息 CES2019消费电子展,瑞芯微Rockchip向全球发布旗下内置高能效NPU的AIoT芯片解决方案——RK1808。硬件规格上,Rockchip RK1808 AIoT芯片CPU采用双核Cortex-A35架构,NPU峰值算力高达3.0TOPs,VPU支持1080P视频编解码,支持麦克风阵列并具有硬件VAD功能,支持摄像头视频信号输入并具有内置ISP。AI人工智能技术与IoT物联网在实际应用中落地融合的“AIoT”是物联网发展的必然趋势,也是各大传统行业智能化升级的绝佳通道。Rockchip RK1808芯片独特架构所包含的功能模块及各类接口,四大优势特性将高效赋能AIoT生态链及开发者对技术与场景匹配
发表于 2019-01-08
瑞芯微CES2019发布AIoT芯片RK1808,内置高能效NPU

华为麒麟980双核NPU谜底揭开:还是来自寒武纪科技

        华为麒麟970通过集成NPU神经网络单元,开启了手机AI时代,不过这个NPU并非华为自研,而是来自AI独角兽寒武纪科技的A1处理器IP。  今年,寒武纪科技发布了最新的AI 1M处理器IP,华为则带来了麒麟980,首次集成双核NPU,而且二者都是7nm制造工艺,让人不由得联想麒麟980依然采纳了寒武纪科技IP,但双方都从未披露相关信息。  10月10日的全联接2018大会上,华为首次公开AI战略,并推出了全栈全场景AI解决方案和算力强大的两款AI芯片昇腾910、昇腾310,前者更是在某些方面超过了Google、NVIDIA。  难道,麒麟980 NPU是华为自研的?  近日
发表于 2018-11-12
华为麒麟980双核NPU谜底揭开:还是来自寒武纪科技

华为麒麟980双核NPU大揭秘

        华为麒麟970通过集成NPU神经网络单元,开启了手机AI时代,不过这个NPU并非华为自研,而是来自AI独角兽寒武纪科技的A1处理器IP。          今年,寒武纪科技发布了最新的AI 1M处理器IP,华为则带来了麒麟980,首次集成双核NPU,而且二者都是7nm制造工艺,让人不由得联想麒麟980依然采纳了寒武纪科技IP,但双方都从未披露相关信息。          10月10日的全联接2018大会上,华为首次公开AI战略,并推出了全栈全场景AI解决方案和算力强大的两款AI芯片昇腾910、昇
发表于 2018-11-12
华为麒麟980双核NPU大揭秘

S10有望首发 三星7nm Exynos芯片集成双核NPU

       三星的7nm LPP制程已经投入量产,无疑,其新一代移动SoC和高通的5G基带等芯片将率先得以出货。  韩媒ETnews报道称,三星将在新一代7nm Exynos旗舰芯片上集成双核NPU单元,而且是第二代产品,从而大大增强AI场景的负载能力和处理速度。  据悉,三星此前已经研制了第一代NPU,年初的Exynos 7 9610最早集成。  有爆料人补充,双核NPU将为Galaxy S10的ISP(图像处理器)增光添彩,进一步提升拍照、视频录制、声控等功能的体验。  目前,竞争对手华为、苹果等,都在NPU上开疆拓土。以A12芯片为例,NPU升级为8核,每秒可处理5万亿次,使
发表于 2018-11-06
S10有望首发 三星7nm Exynos芯片集成双核NPU

小广播

何立民专栏

单片机及嵌入式宝典

北京航空航天大学教授,20余年来致力于单片机与嵌入式系统推广工作。

电子工程世界版权所有 京ICP证060456号 京ICP备10001474号 电信业务审批[2006]字第258号函 京公海网安备110108001534 Copyright © 2005-2019 EEWORLD.com.cn, Inc. All rights reserved