datasheet

Thinker 1可重构混合神经网络计算芯片的诞生

2018-02-14来源: 互联网关键字:合神经网络计算芯片  AI芯片

在机器学习算法不断变化、人工智能应用不断增多的当下,神经网络计算芯片(AI芯片)的设计者们所思考的一个关键问题开始浮出水面——如何在保证AI芯片性能/功耗表现优秀的同时,尽可能的在更多人工智能算法上通用。

目前市面上陆续涌现的AI芯片中,有不少都采用了重新设计芯片底层架构的方式,来平衡AI芯片的性能与AI算法通用性之间“鱼与熊掌不可兼得”的矛盾,突出玩家有寒武纪、谷歌TPU项目等等。

AI-F1-20180213

产业界如此热火产天的发展,离不开学术界此前的长久积累。在过去的十几年里,清华微电子所的可重构计算团队一直在研究一项核心技术——“软件定义芯片”,前年,他们推出了一款代号为Thinker 1的AI芯片,这款芯片不仅能够支持人脸识别、语音识别的AI算法,而且芯片的功耗非常小——只需要7号AA电池就够让它运行一整年。

在2018年的春节前夕,智东西专门来到清华大学校园里,与GTIC 2018重磅嘉宾之一,清华大学微电子研究所所长、中国半导体行业协会IC设计分会理事长、我国半导体行业“男神”级人物魏少军教授围绕着AI芯片的话题展开了独家对话。魏少军教授有着数十年半导体行业经验,对我国半导体产业有着深刻的认识,看法往往一针见血。

他认为,目前芯片架构创新已经引起了全球各个学院/企业的广泛关注,尤其是“软件定义芯片”相关研究,更是提升AI芯片的应用范畴、适应AI算法不断变化的重要研究方向。在今明两年之内AI芯片将持续火热,但是到了2020年前后则会行业洗牌,出现第一批出局者。

一、性能 vs 灵活:鱼与熊掌不可兼得

芯片的性能跟通用性常常是一个“鱼和熊掌不可兼得”的选项,传统架构下,一个芯片在某些特定领域的性能越强、功耗越低,它往往就越不灵活、越不通用。举个例子,华为Mate 10里的麒麟970芯片用于手机的性能非常强大,但是它并不适用于安防摄像头、可穿戴手环等场景;同理,一个CPU能够灵活地处理众多不同任务,但是它在某些特定任务上往往性能不够强大,比如在深度神经网络训练上的性能不如GPU。

而ASIC这类专用芯片的位置,则介乎于手机SoC这类标准芯片、与CPU这类通用芯片之间——这是一个非常尴尬的地位,标准芯片虽然单个开发成本高,但是单一品类出货量非常大,很大程度上降低了芯片的单个价格;而通用芯片则相反,虽然总体出货量不高,但是单一品类的价格很高,也能够分摊研发成本。

随着芯片制造工艺的日益先进(目前已经逼近7nm),芯片制造成本也水涨船高,如今设计制造一颗10nm芯片的成本要几千万美元,综合成本高达上亿美元。

因此,如果不能保证某款单一应用场景下能够大量出货,专用芯片需要保持一定的通用性与灵活度。 最近两年间,产业界开始陆续涌现出神经网络计算专用芯片(AI芯片),寒武纪、深鉴科技、中星微电子等玩家的AI芯片产品采用的都是28nm的芯片工艺,前期从投入到流片的成本超过400万美元,单一品类出货量没有百万的级别将很难收回成本。

而除了成本之外,AI算法的演进也需要纳入考虑。由于目前人工智能算法还在不断变化、不断演进的过程中,人工智能经历了六十多年的发展才迎来了深度学习的大规模爆发,然而现在深度学习算法还有众多有待优化的方面,比如稀疏化、低功耗、小数据训练等,算法尚未定型。

此外,目前语音/文字/图像/视频等不同应用无法使用统一算法,然而许多实际生活中的AI应用程序(识别图像中的对象或理解人类语言)需要不同类型的具有不同层数的神经网络的组合。

因此,在确保AI应用性能的前提下,AI芯片需要尽可能地保持芯片通用性。

目前AI芯片企业们采用的技术方案各不相同,如果将芯片通用性作为评测坐标轴,最左边、最激进的企业会采用算法固化方案,这一做法成本低、芯片落地时间短、单一算法的性能与功耗比能够做到极致,但是极大减少了芯片的通用型和灵活性;最右边的团队(比如寒武纪、谷歌TPU等)则会设计一款全新的芯片架构,这一做法成本高昂、芯片研发周期长,但是能够在性能与芯片通用性上达到极好的平衡。

AI-F3-20180213

清华微电子所所长魏少军教授

清华微电子所的可重构计算团队就属于坐标轴右边的一类,从2006年开始,清华微电子所所长魏少军教授就带领着团队在持续深入研究这项重要技术——“软件定义芯片”,又称“可重构计算技术”。

“软件定义芯片”顾名思义就是让芯片根据软件进行适应与调整,这是一项专用芯片架构设计上的创新,与传统的冯诺依曼架构有着很大的区别。简单来说就是将软件通过不同的管道输送到硬件中来执行功能,使得芯片能够实时地根据软件/产品的需求改变功能,实现更加灵活的芯片设计。

也就是说,沿用这种架构设计出来的专用芯片,可以让芯片的计算能力按照软件的需求来调整适应,而不是沿用传统芯片设计的刚性架构,让应用适应架构。对于现在尚未定型/统一的各类AI算法而言,可重构计算成了AI芯片设计的一个重要研究方向。

二、Thinker AI芯片:语音图像双识别、一节电池用一年

前年(2016年),依照可重构计算芯片的框架,魏少军教授团队中的尹首一副教授带队设计研发了一款代号为Thinker 1的可重构混合神经网络计算芯片。

这款芯片不仅可以动态地调整计算和内存需求,使得芯片能够支持人脸识别和语音识别的神经网络应用,而且芯片的功耗非常小——只需要八节7号AA电池就够让它运行一整年。

AI-F4-20180213

Thinker 1不仅在AI性能与算法通用性上取得了突破性的进展,还获得了学术界的重要认可,在2017 ACM/IEEE ISLPED国际低功耗电子学与设计会议上,Thinker1获得了设计竞赛奖,这是中国大陆单位首次以第一完成单位获得此奖项。

魏少军教授告诉智东西,Thinker 1是一块实验性质的验证芯片,为了证明“软件定义芯片”这一架构在AI芯片设计中的可行性——效果出奇的好。随后,可重构计算团队又打造了两款Thinker系列芯片,分别为Thinker 2人脸识别芯片,能够做到6ms人脸识别(iPhone X为10ms)、准确率超过98%;以及Thinker S语音识别芯片,不仅功耗只有200多微瓦,只需要一节7号AA电池就运行一整年,而且可以进行声纹识别。

AI-F5-20180213

清华大学微电子所提供的Thinker芯片的显微照片

Thinker可以嵌入到很多小型设备中,包括智能手机、手表、家用机器人、或远程控制的仪器设备等。目前,研究团队与厂商沟通Thinker芯片的产业化方案,此前也有报道称最快今年三月我们就能看到第一款搭载Thinker芯片的端智能产品。不过清华微电子所将会将这一技术授权予企业使用,高校本身不会进行产业化。

魏少军教授说,清华微电子所在可重构计算上已经投入了十多年的研发,此前一直将重心放在在其他芯片的研究上,将这一架构用于AI芯片的设计并且能取得如此好的效果,完全是“意外之喜”。下一步,可重构计算团队将会加大基础研究(尤其是编译器等相关软件)的研发投入,并且进一步推动产业应用与企业合作的进程。

除了人工智能(AI)外,这项技术在信息安全芯片、可编程逻辑器件、可穿戴计算芯片等领域都获得了批量应用。魏少军教授带领的可重构计算团队也获得了国家863计划两期支持、2015年国家技术发明二等奖、2014年教育部技术发明一等奖等国家荣誉。

去年12月,清华微电子所、澜起科技、英特尔还联合推出了基于此项技术研发的津逮服务器CPU,不仅能够大幅提升云端服务器的计算能效,还能实时监测、甄别和管控,极大增强CPU芯片的硬件安全性。

三、AI芯片广泛用于安防监控?“可能走错路了”

目前AI应用仍处于早期阶段,主要还是集中在互联网应用,需要在云端处理,端智能方面并没有较多普及。

在这一轮兴起的人工智能(AI)浪潮中,最为火热、最频繁地被人提起的落地行业莫过于安防了——或者更准确来说,是基于安防监控摄像头的人脸识别应用。这不仅是众多AI芯片、AI平台应用厂商都在瞄准的行业,各家传统安防巨头也都跃跃欲试瞄准了AI+安防。

然而在交谈中,魏少军教授向智东西提到,现在的AI芯片应用在视频监控上,很有可能是走错路了。 由于目前的安防监控智能化还是以人脸识别为主,然而在广场、车站等远距离、广泛监控的场景下,根本没可能看清人脸,这些场景的人脸识别项目虽然是个看似纯技术角度可行的项目,然而一旦设计光照、遮挡、摄像头清晰度、以及可承载的芯片算力、网络带宽等工程化问题,情况就会变得非常复杂。

AI-F6-20180213

2008年北京奥运会人脸票证

一位有着传统芯片厂商与安防厂商双背景,曾参与过2008年奥运会“刷脸门票”、天安门广场安防布控等项目的AI芯片初创CEO也曾经告诉我类似的结果,中远距离内大型广场内的人脸识别项目——比如天安门广场人脸识别项目——根据去年天安门分局的调研结果显示,这项目仍旧有着巨大的实现难度,是个美好的“理论幻想”。

如果我们按照智能摄像头车牌识别的技术类推,经过了十几年的技术演进、形态变迁后,目前北京市共有65万路交通摄像头,其中能够进行智能车牌识别的只有公安的3000路、停车场的3万路,而且是只有在光照、画面对其等问题都解决了,才能在特定路口、特定场景下实现——而人脸识别远比车牌识别要复杂得多。

因此,AI安防虽然可以在局部场景(比如中短距离、室内监控、门禁刷脸、车辆识别等)落地,但是离真正的安防广泛应用还差得很远。魏少军教授说,AI只是方法、AI芯片只是手段,但是最重要的还是AI的应用落地。

结语:AI芯片2020年或将进入洗牌期

魏少军教授认为,我国的芯片工艺技术与发达国家相比,还存在两三代工艺的差距;我们原来希望在2020年以前,与国际最先进制造工艺水平的差距,不要大于两代,现在看来实现较为困难。此外,在芯片行业的人才、产能、研发、设计等几大重要因素上,我们的产业缺口仍就比较明显。

我国的芯片产业目前在高端芯片的发展上遇到了很多挑战,如果我们依旧遵循传统的架构以跟随的脚步进行发展,将会始终落后于人——因此,从芯片设计底层架构上的创新尤为重要。目前我们在软件定义芯片、AI芯片等这类传统芯片业的“破冰者”方面已经取得了不错的研究成绩,值得加大投入力度。

魏少军教授认为,从产业发展规律来看,在今明两年之内AI芯片将持续火热,大家扎堆进入;但是到了2020年前后,则将会出现一批出局者,行业洗牌开始。由于目前AI算法还在不断演进汇总的过程中,最终的成功与否则将取决于各家技术路径的选择和产品落地的速度。


关键字:合神经网络计算芯片  AI芯片

编辑:鲁迪 引用地址:http://www.eeworld.com.cn/afdz/article_2018021411579.html
本网站转载的所有的文章、图片、音频视频文件等资料的版权归版权所有人所有,本站采用的非本站原创文章及图片等内容无法一一联系确认版权者。如果本网所选内容的文章作者及编辑认为其作品不宜公开自由传播,或不应无偿使用,请及时通过电子邮件或电话通知我们,以迅速采取适当措施,避免给双方造成不必要的经济损失。

上一篇:解析目前六款类脑芯片,如何颠覆传统架构
下一篇:中国半导体量子芯片研究首次实现三量子比特逻辑门

关注eeworld公众号 快捷获取更多信息
关注eeworld公众号
快捷获取更多信息
关注eeworld服务号 享受更多官方福利
关注eeworld服务号
享受更多官方福利

推荐阅读

AI芯片“碰撞”安防:巨头何以痴迷自研?

在国内安防行业实现落地的救命稻草。芯片的成本问题是智能安防产品能否迅速普及的关键。在此背景下,将芯片与场景结合起来进行产品化部署成为了安防企业的核心竞争力之一。研发自己的芯片成为了各安防企业为以后发展铺路的重要一环。华为海思、君正、富瀚微、国科微等老牌安防芯片提供商正在加紧自我研发制造。好消息是,今天的AI芯片还远远不能满足市场的需求。目前安防云端AI芯片的市场已经较为成熟,全球各大科技巨头扎根已深。终端AI芯片市场还有待拓展,是众多AI芯片初创企业的机会所在。在面临结构性创新的市场面前,一切都值得期待和想象。结语:安防行业作为AI落地首站,具有万亿市场规模,用户需求大且呈现碎片化,具备芯片落地的天然优势,巨头纷纷造“芯”,行业自然
发表于 2019-04-15

“AI芯片”这个概念已经火了两年,接下来呢

转眼间,“AI芯片”这个概念已经火了两年。随着2018年的结束,AI芯片发展也将进入新阶段,第一季玩家亮相已经结束,享受到短暂胜利的愉悦的同时也感受到发展的不易。第二季AI芯片大战已经拉开序幕,2019年是AI芯片的重要节点,对芯片存在很大刚需的安防行业更是如此。 AI安防芯片百家争鸣AI应用不再是锦衣夜行,特别是在安防行业落地生根获得真金白银后,更是百家争鸣。Nvidia 作为第三次人工智能浪潮受惠者之一,理所当然地成为安防行业的理想选择,无论是视频结构化服务器,还是安防智能终端,大部分算法训练和推理跑在 Nvidia 的 GPU 上。Intel 花费巨资收购的 ASIC 芯片设计厂商 Movidius 来势汹汹布局
发表于 2019-03-28

Nvidia用CUDA生态来应对AI芯片厂的挑战

和底层软件接口架构(CUDA-X),通过编程可以为不同的领域做定制化的高效率加速”。在这里,PRADA有明显的回应AI芯片初创公司的意味,首先AI芯片往往宣称GPU无法做domain-specific acceleration,因此效率差;而Nvidia则用PRADA回应说GPU通过编程也可以做高效domain-specific acceleration。更进一步,由于AI芯片往往只针对特定应用,因此不同的应用需要不同的芯片,不同的软件API以及系统框架,因此会造成碎片化的问题;而使用GPU配合其强大的CUDA生态则可以完美解决这个问题,使用同一类硬件,同一种框架就可以解决不同领域的问题。今年的GTC的开场中,Nvidia列举了众多
发表于 2019-03-19
Nvidia用CUDA生态来应对AI芯片厂的挑战

舍弃冯诺依曼架构突破内存墙瓶颈的AI芯片,即将轰动市场?

近几年再次兴起的AI热潮,不仅引发了芯片巨头们的AI芯片战,更让科技巨头们纷纷开始了AI芯片的研发。在AI芯片的争夺中,算力首先成为了焦点。不过,算力提升之后,算力与内存的不匹配又成为了阻碍AI向前发展的关键。此时,一家成立于2017年的初创公司提出的存储优先架构(SFA)表示很好地解决了内存墙的问题,事实是否如此?【 图片来源:supernovainvest 】AI芯片的真正问题是内存墙算力、算法、数据被认为是AI向前发展的三个关键因素,更高的算力自然必不可少,这也直接驱动了AI芯片公司们推出更高算力的AI芯片。不过,目前对于AI芯片的定义并没有一个严格和公认的标准,一个非常宽泛的看法是,面向人工智能应用的芯片都可以称为AI芯片
发表于 2019-03-18
舍弃冯诺依曼架构突破内存墙瓶颈的AI芯片,即将轰动市场?

AI芯片遍地开花,谁会是新的王者?

AI芯片遍地开花,谁会是新的王者?第一财经“每一次计算构架的大变革都会创造一个新的王者。从原来主机时代的IBM、PC时代的英特尔、移动时代的高通,现在进入智能物联网的时代,新的王者会是谁?有很大的几率不是前面这几家,而是新的玩家或者几个。”北极光创投董事总经理杨磊在GTIC 2019全球AI芯片创新峰会上这样阐述他对AI芯片市场格局的看法。从2017年下半年开始,包括云知声、出门问问、Rokid等国内不少AI初创企业纷纷推出了自己的芯片或模组。今年年初,云之声发布第二代物联网语音AI芯片雨燕Lite,面向智慧城市的支持图像与语音计算的多模态AI芯片海豚(Dolphin),以及面向智慧出行的车规级多模态AI芯片雪豹(Leopard
发表于 2019-03-18

AI 芯片2.0:自我学习与自我演进的智慧芯片

GTIC 2019全球AI芯片创新峰会在上海隆重开幕。会上,中国半导体行业协会IC设计分会理事长、清华大学微电子所所长魏少军首先回顾了GTIC2108上提出的问题:架构创新是AI芯片面临的一个不可回避的课题。但同时也面临一个重要问题,是否会出现像通用CPU那样独立存在的通用A处理器?如果存在的话,它的架构是怎样的?如果不存在,那么目前以满足特定应用为主要目标的AI芯片就一定只能以IP核的方式存在,最终被各种各样的SoC所集成。如果真是这样,那么今天从事AI芯片研发的设计公司将何去何从?对于这些问题,他认为,AI无疑十分重要,但其作用也没有一些人说的那么邪乎。相反AI芯片的发展很可能会在未来2-3年遭遇一个挫折期。今天的部分
发表于 2019-03-15
AI 芯片2.0:自我学习与自我演进的智慧芯片

小广播

About Us 关于我们 客户服务 联系方式 器件索引 网站地图 最新更新 手机版

站点相关: 视频监控 智能卡 防盗报警 智能管理 处理器 传感器 其他技术 综合资讯 安防论坛

北京市海淀区知春路23号集成电路设计园量子银座1305 电话:(010)82350740 邮编:100191

电子工程世界版权所有 京ICP证060456号 京ICP备10001474号 电信业务审批[2006]字第258号函 京公海网安备110108001534 Copyright © 2005-2019 EEWORLD.com.cn, Inc. All rights reserved