华为麒麟970到底是不是真正的AI芯片?

2017-09-05 10:25:55来源: 智东西 关键字:麒麟

智东西文 | Lina漠影


华为这周末搞了件不大不小的事——发布了“世界首款手机AI芯片”麒麟970——各位科技媒体小编都辛苦了,大周六晚上的不是飞去德国跑会就是在电脑前蹲直播,连约会都要改期,好气哦。


咳,言归正传。


(华为官方推特介绍,“世界上第一款搭载NPU的AI芯片”)

华为为了抢这个“世界第一”着实花了不少心思,作为一个以“自研”为骄傲的企业,本次麒麟970上不仅使用的是别家的(寒武纪的)神经网络处理单元(NPU),智东西还独家获悉到,麒麟970在物体识别方面的一整套嵌入式AI解决方案(从算法+Camera Tuning)都来自中科创达。

此外,据业内人士透露,寒武纪的AI架构在麒麟970上实现的梳理也并非全部是华为海思自研的技术。

这款芯片打造了多少个月?仅是加了一个NPU模块就能叫“AI芯片”吗?为什么华为要这么紧赶慢赶抢“第一”?联发科、深鉴科技等业内人士又是怎么看待麒麟970?……以上种种疑问,智东西将为你一一揭晓。

一、参数轰炸


麒麟970的参数想必大家已经被刷屏了一遍又一遍,但为了文章完整性这里还是不能免俗地需要列一列数据,看过的读者可以直接跳过这段:

众所周知,目前九成的手机芯片采用的是ARM的架构,麒麟970也不例外。麒麟970采用ARM Cortex-A73四核+Cortex-A53四核的架构,采用了台积电10nm制造工艺,搭载12核高效GPU、8核高性能CPU,4.5G高速LTE Modem,支持LTE CAT.18,最高下载速度可以达到1.2Gbps,与高通目前发布的最强的X20 LTE基带实力相当。

特别值得一提的是,麒麟970的GPU用上了ARM最新推出的Mali-G72 MP12架构——这是Mali-G72 MP12 GPU的首次商用。这个架构很厉害,比上一代的Mali-G71性能提高了40%,能效提高了25%。

但如果抛去数据,一个小细节能让你更直观地理解它:在智东西跟某移动端大咖聊天的过程中,他对NPU、10nm统统只是点头微笑,唯有在看到MP12 GPU小小地惊讶了一下。

与此同时,麒麟970拥有两个用于处理图像信息的ISP,能够更快速地响应处理图片,并且能在低光照度环境下对降噪进行优化。

由中科创达提供的智能拍照技术则将自动识别镜头内的物体(比如一朵静止小花又或是一个奔跑的人类),系统根据该物体的属性调整相机参数或是进行主动去糊。

麒麟970会搭载在将于10月16日于慕尼黑发布的华为Mate 10手机上。

二、寒武纪?何方神圣?

既然一直在说“寒武纪”的NPU,那么这个寒武纪究竟是何方神圣呢?

寒武纪科技(Cambricon)是中科院计算所孵化出来的AI芯片创业公司,中科院计算所不仅对寒武纪进行了天使轮融资,同时还给与了长期的支持与投入。8月底,寒武纪宣布完成了1亿美元的A轮融资,投资方为国投创业、阿里巴巴、联想等,一跃成为国内AI芯片届当之无愧的独角兽。

不仅如此,寒武纪的两位创始人也非常神奇——一对出身中科院的兄弟。哥哥陈云霁目前仍在中科院计算所担任研究员,从事基础科技研发,弟弟陈天石则当起了公司的CEO。

(弟弟陈天石与哥哥陈云霁)

不过,很长一段时间,寒武纪这家公司一直以“研究性”企业被业内所知,说白了就是没有产品出来。直到去年4月份的世界互联网大会期间,宣告自己的第一款AI芯片产品寒武纪1A流片了,这一点不断拿来背书,新闻联播、人民日报都说了这事;不过之后其产品到底有没有商用,有没有量产,并没有官方说法,按照2016年底寒武纪CEO 陈天石的说法,“芯片从研发、量产到商用,是一个以年为单位的周期,所以在明年,大家将可以在市面上看到使用寒武纪技术的芯片产品,比如在手机、安防监控等智能终端和云端服务器上。”


不过根据中国科学院计算技术研究所发布的贺信显示,麒麟970芯片上的NPU正是集成寒武纪1A处理器作为其核心人工智能处理单元,实现了手机上本地、实时、高效的智能处理。这也是寒武纪1A真正意义上的一次产品化应用。

不过话说回来,恐怕也只有华为这个量级的土壕,才有能力让寒武纪1A真正产品化,从这一点看寒武纪是抱上了一个不错的大腿。

三、到底什么是“AI芯片”?


上文提到,麒麟970之所以敢叫自己“AI芯片”,最主要的就是集成了寒武纪的NPU(Neural-Network Processing Unit,神经网络处理器。

现在所谓的手机处理器,比如高通的835、苹果的A11、麒麟970等,实际上所指的是一个“处理器包”封装在一起,这个计算包专业一点说叫Soc(System-on-a-Chip),高大上的说法是“计算平台”;根据分工不同,很多专用功能的处理单元加进来,比如我们最熟悉的是GPU,现在这个包里的独立单元数量已经越来越大,比如ISP(图像处理)、Modem(通信模块)、DSP(数字信号处理)等,不同的数据进来,交给不同特长的计算模块来处理,这个NPU就是手机处理器平台新加入的一个擅长神经网络计算的单元,那么到底哪些应用会用到神经网络计算?也就是现在最能代表人工智能计算的一些应用,比如模式识别里的语音、图像(人脸)识别,比如其他会用到深度学习的一些AI应用。

为了让这个深度神经元网络连接更快,“寒武纪1A”还设计了专门的存储结构,以及完全不同于通用处理器的指令集。“它每秒可以处理160亿个神经元和超过2万亿个突触,功能非常强大,功耗却只有原来的1/10。

有时候,有些计算单元会独立出来,不封装在SoC里,比如观察苹果iPhone的主板结构,其Modem模块就一直独立在其A系列处理器模块之外;寒武纪的这个NPU单元之前也是一个独立的处理器单元,只是这次整合封装到了麒麟970的Soc里面。


虽然芯片里的CPU、GPU、DSP都可以用来做运算,但是NPU是专门用于神经网络架构计算的,号称比CPU快25倍的同时效率将提高了50倍。有点类似于你想要剪东西,我给你一把剪刀。

至于为什么用的是寒武纪的NPU呢?主要原因是目前国内能做AI芯片级别的公司只有那几家,而寒武纪是中科院出身,和华为的合作自然也是顺理成章。中科院计算自己也表示,计算所自2011年以来就和华为展开合作,组建了“中科院计算所-华为联合实验室”。

不过,也没有说现在其他芯片的CPU+GPU+DSP架构在人工智能应用方面效果差到哪里去了,恰恰相反,现在的众多手机厂商都在这个架构上对AI功能进行优化。从高通骁龙到联发科Helio,无不在人工智能的芯片应用上进行了大力优化。比如高通在骁龙800和600系列芯片上做了一个软件的神经处理引擎,高通也承诺未来也会出专门用来做神经网络运算的核——比如NPU。

所以说,这个NPU,重要,但也没那么重要。以深度学习为例,深度学习分为训练(Training)和推理/应用(Inference)两部分,训练阶段的确需要非常高的计算能力,但在应用层面其实并不需要巨大的计算量——相信没有哪个纯真的用户拿手机去做Training的。

另一方面,AI不AI,最终还是得看应用嘛……需要整个移动AI应用的生态起来了,才能体现出硬件的优势。

同为手机芯片制造商,联发科的一位产品技术负责人也认为,在芯片上集成硬件相对容易,关键还是上层的应用,用户不会在意这个是不是AI,只会在意体验。

虽然华为展示出了三个常见应用方向(AR、计算机视觉、自然语言处理),还动用了开发者网页、开发者工具包、应用商店来招揽开发者,华为消费者业务CEO余承东也在发布会现场承诺,华为将打造一个开放的AI环境,开发者可以直接接入华为NPU功能,也可以通过第三方AI框架接入(目前支持TensorFlow和Caffe)。

不过,就目前来看,移动AI应用开发还很少,华为现场展示的AI功能也集中在降噪、拍照美化等方面,快则快矣,没有什么鸡蛋。在应用缺失的情况下,麒麟970、骁龙835、甚至性能再弱些的芯片使用起来也会让用户感觉相差不大。

四、为了这个“世界第一”煞费苦心


不知道大家还记不记得,去年12月16日,华为旗下手机品牌荣耀推出了2016年最后一款旗舰手机——荣耀Magic。

荣耀总裁赵明在讲述这款荣耀3周年的特殊新产品的过程中,全程未提硬件配置,只谈了这款手机的八曲面外形设计和搭载由华为2012实验室研发4年的人工智能引擎Magic Live。

除了2012实验室外,华为旗下还有诺亚方舟实验室、高斯实验室、香农实验室,华为没有透露本次麒麟970使用的人工智能技术是否来自这些实验室,但从目前看来主要是这几个部门在研发。

不过,仅从深度学习来说,华为的技术并不算领先。这也是为什么虽然华为海思方面非常想要自研“AI芯片”,但为了来得及抢上这个“世界第一”的名头,最终选择了和寒武纪、中科创达合作。

一位业内人士对此的评价是——“从急促的拍板签下IP核合同,到和Mate 10分开,赶在苹果之前发布这款芯片,时间上感觉有点赶鸭子上架。”

那么华为这个“世界第一”真的要抢得这么急吗?

真的要。

据传言,这次麒麟970的项目做了大概4-5个月,其中包括了寒武纪、中科创达方面的技术整合、以及流片。从速度

[1] [2]

关键字:麒麟

编辑:冀凯 引用地址:http://www.eeworld.com.cn/xfdz/article_2017090571792.html
本网站转载的所有的文章、图片、音频视频文件等资料的版权归版权所有人所有,本站采用的非本站原创文章及图片等内容无法一一联系确认版权者。如果本网所选内容的文章作者及编辑认为其作品不宜公开自由传播,或不应无偿使用,请及时通过电子邮件或电话通知我们,以迅速采取适当措施,避免给双方造成不必要的经济损失。

上一篇:诺基亚打包出售6000多项专利:涵盖4G、5G、SDN及VR
下一篇:iPhoneX采用A11处理器 性能提升25%

关注eeworld公众号 快捷获取更多信息
关注eeworld公众号
快捷获取更多信息
关注eeworld服务号 享受更多官方福利
关注eeworld服务号
享受更多官方福利

小广播

独家专题更多

东芝在线展会——芯科技智社会创未来
东芝在线展会——芯科技智社会创未来
2017东芝PCIM在线展会
2017东芝PCIM在线展会
TI车载信息娱乐系统的音视频解决方案
TI车载信息娱乐系统的音视频解决方案
汇总了TI汽车信息娱乐系统方案、优质音频解决方案、汽车娱乐系统和仪表盘参考设计相关的文档、视频等资源
电子工程世界版权所有 京ICP证060456号 京ICP备10001474号 电信业务审批[2006]字第258号函 京公海网安备110108001534 Copyright © 2005-2017 EEWORLD.com.cn, Inc. All rights reserved