datasheet

产业专家对AI芯片未来发展的预测

2018-09-30来源: 半导体行业观察 关键字:AI

在加州山景城举办了 AI Hardware Summit 会议,这是目前唯一专门致力于开发用于神经网络和计算机视觉硬件加速器生态系统的活动。

 

会上,来自 AI 芯片初创企业、半导体公司、系统供应商/ OEM、数据中心、企业、金融服务、投资者和基金经理等 250 多位先进技术领导者们,为新兴的 AI 芯片市场构建了一幅全面的架构路线图。

 

本文作者 Brett Simpson 等人是市场研究机构 Arete Research 的高级分析师。在参加完本次会议后,他们将一些新的观察和所感写下来,形成了这份简短的小报告「AI Silicon: New Dawn for Compute」。从题目可以看出,作者非常看好 AI 芯片的前景。

 

以下是报告的中文译文:

 

人工智能硬件峰会的五大要点:

 

  • 几乎所有使 AI 计算加速的都是 7nm 芯片,由台积电制造。另外,我们还看到了一系列新的高速接口芯片 (Serdes 56 / 112gbs)。


  • 英伟达依旧是训练领域之王,我们将会看到其新款计算卡 Tesla T4(使用了全新的 12nm 制程工艺 图灵架构)的广泛使用。我们认为,它将在 2019 年继续占据主导地位。长远来看,我们对 AI 较少依赖于 CUDA 和 GPU 的状况感到担忧。


  • 我们认为 Intel 的 7nm AI 芯片(由台积电代工)支持 112GBs Serdes 和高速 DRAM。明年,在 Cascade Lake 服务器中,DL Boost INT8 会协助提高深度学习推理性能。


  • 所有的云计算服务商都在开发内部的芯片,加速计划是不公开的。这种垂直推进是对芯片制造商的一个主要威胁。


  •  在五年的时间中,我们看到:新的模拟计算机(神经形态)的进步,纳米线对数字计算的部分挑战,硅光子代替了 SerDes(112GBs 以上),以及更高速的存储器对 AI 性能提升的助益。


未来十年,AI 芯片将不仅是半导体领域最有前途的增长领域之一,还可能扰乱传统的计算机市场。

 

专门针对 AI 开发的软件还有 99%没写出来。如今,只有不足1% 的云服务器为AI加速服务(今年的服务器总数为 5 百万台),企业服务器则是几乎零举动。训练和推理的工作量正以较低的基数倍增,但市场似乎一致认为,今天的加速硬件(GPUs,CPUs, FPGAs)已经远远满足不了市场的需求——在我们看来,我们需要实现吞吐量的巨大飞跃(100 倍),以扩大 AI 的规模,并让 AI 变得无处无在。

 

好消息是,即将迎来结构性的创新,但是其作用需要一段时间才能显现出来。

 

2019 年以后,我们将看到:新的流程技术(7nm),新的计算机功能结构(芯片上的神经网络),新的芯片连接(56/112GBs SerDes),新的内存方法(HBM3,SRAM on-chip 等)和新的包装技术,所有这些都能大规模提升性能。

 

芯片行业正在进行创新反思,因为芯片的发展不能过多依赖制造业的萎缩来取得进展。机会来了。我们会继续看到,对长期投资 AI 芯片的投资者而言,投资台积电和主要的 DRAM 制造商仍是最佳选择。

 

我们上周参加了人工智能硬件峰会,了解了很多 AI 芯片替代品的现状。

 

有一件事是清楚的:我们从未见过如此多的公司(无论大小)像今天这样、进军新的芯片市场,毫无疑问,未来几年将会是一个令人着迷的时期,我们一定能见证这个市场的整合过程。

 

继谷歌的 TPU 领先之后,每个云计算服务商都在做内部的 AI 芯片。问题在于,要想影响市场的情绪,这一切需要的时间有多长。

 

毕竟,谷歌的 TPU 芯片已经到了第三代(2016 年中期推出第一代 TPU),但仍然承载不了 Tensorflow(或其他框架)所有工作量。我们认为,其他云计算服务商将在 2020 年验证并量产他们的第一款 AI 芯片。

 

造新的 AI 芯片,有两种通用方法。

 

第一种方法是,在系统上进行创新,以更快的 I/O 和外部内存接口(英伟达、英特尔等)为重点来扩展性能。

 

第二种方法是,把所有的数据集中保留在芯片上(芯片上的神经网络)——包括大量的小核和芯片内存,以减少对外部 DRAM 的需求。第二种方法将在未来 6 个月内实现第一批 AI 芯片的商业化,但我们认为,7nm 工艺才是促使市场为其买单的优势(也就是 2020 年的增长)。

 

围绕人工智能的软件栈在快速发展,云计算服务商也推出了开源适配器,以支持在其框架中运行的各种芯片(例如 Tensorflow XLA、Facebook Glow)。随着新神经网络的成熟,每个人都会认同可编程性和灵活性的重要性。

 

这意味着,7nm 芯片潜在的目标是,16 位浮点运算的运算能力至少要达到 10TOPS。人们真正关注的是如何通过提高效率来提高性能,如通过支持稀疏数据结构、降低精度、使用 mini-batching、加快芯片互联速度(112GB Serdes)、使用更快的内存接口(远超 HBM2),以及新的多芯片先进封装。

 

英特尔:AI 领域的玩家

 


 

当人们普遍不再依赖通用 CPU 时,也不再十分信任英特尔计划在未来几年内为 AI 引入一些新的优化措施这件事。

 

英特尔去年 (2017 年) 的 AI 收入约为 10 亿美元,Xeon CPUs 也将继续在 AI 推理和 AI 训练方面发挥重要作用。

 

例如,英特尔在 Cascade Lake 的服务器架构中添加了大量新的指令,以提高其推理性能(声称在精度为 INT8 的情况下、性能提升了 11 倍)。我们预计,这些扩展将与 AMD EPYC2 规格区别开来。

 

我们还相信,英特尔的下一个 ASIC 芯片(将于 2019 年采样)将由台积电代工(7nm),将具有一些关键的专有接口,这将显著提高它的性能。虽然当下 GPU 以低速(PCIE-3)与 CPU 相连,但是我们预计,新的服务器将 PCIE-4(16GB),仍会是数据输入 GPU 的关键瓶颈。

 

相比之下,我们认为,英特尔将在其 Xeon CPU 和 7nm Nervana 芯片之间构建专有接口,速度可达 112GB。英特尔正计划推出一种新的高带宽内存接口(这对云服务提供商来说,是一个关键的关注点),并积极参与新的多芯片包装。AI 的加速会导致更多的 CPU 被停用,英特尔正寻求通过围绕 Xeon 构建外围解决方案来获取价值。

 

时间会证明这是否有效,但为了在 2020 年对抗英伟达,这个目标十分明确。

 

英伟达:标准制定者

 


 

英伟达的 GPU 目前仍然是 AI 计算领域的王者,他们有实际的收益(支持所有的框架,所有的云计算服务商,所有的 OEM),他们的新品将有显著的性能提升——我们认为,其 T4 将被广泛采用,其新的 DGX2 服务器将在今年售罄。目前没有什么引人注目的替代品可供选择,我们认为,英伟达将继续占据主导地位(至少到 2019 年),但有两个主要问题让我们怀疑,英伟达是否能长期维持其领导地位:

 

首先,我们认为,很明显的一点是,随着谷歌和 ONNX 等公司的努力,英伟达的软件护城河 (CUDA) 将变得不那么重要。

 

云计算服务商正积极提供开源插件,用于替代芯片解决方案,以支持 Tensorflow、Pytorch、CNTK、coff2 等框架,从而降低进入新的 AI 处理器的软件门槛。

 

其次,是英伟达训练和推理芯片的经济性——虽然它们可以为许多 AI 工作节省 CPU,但是销售卡的超高利润率与昂贵的内存捆绑在一起(V100 是每张卡 1 万美元,P4 可能是每张卡 2000 美元),这只会让云端玩家拥抱其他架构。

 

图 1: 微软关于计算选择强调了我们的观点,即需要快速发展 GPU。

 

 

来源:微软在人工智能硬件峰会上的 PPT

 

尽管如此,英伟达有巨大的资源来超越竞争对手 (尤其是初创企业),它致力于每年为 AI 推出一种新的架构,可能在 2019 年首次推出 7nm 解决方案。

 

V100 和 T4 在很大程度上都被视为英伟达在 AI 领域的第一颗转换芯片(不再只是通用 GPU),因为它们是第一个支持张量核心和较低推理精度的芯片(INT8)。

 

随着英伟达 7nm 芯片的推出,我们期待,其性能在 2019 年会有另一个大的飞跃——有很多大幅提升吞吐量和延迟以提升效率的方法,我们预期,其下一代芯片更像以 AI 为中心的 ASIC,而不是 GPU。

 

云端的消费者告诉我们,他们使用 V100 GPU 来进行训练的频率很低(低至 15%),因为他们用 GPU 只是为了训练单一的神经网络。他们希望英伟达能将 GPU 虚拟化——尽管对 AI 计算的需求永无止境的,但这可能会给英伟达的 GPU 增长带来压力。

 

此外,英伟达如今拥有芯片对芯片的快速接口(NVlink2),运行速度为 25Gbs(远远超过仅 8GB 的 PCIE-3 或 16GB 的 PCIE-4)。我们预计,到 2019 年底,英伟达将支持 56Gbs 甚至 112 GB 的服务器,因为有些替代方案可以提升这些规格。

 

我们认为,英伟达的下一代架构将在 2019 年的 7nm 芯片上出现(超过 Volta / Turing),这将大大决定它能够在多大程度上拉开市场差距。

 

AI 芯片的替代品——即将到来

 


 

随着谷歌 TPU 的推出,每个云计算服务商内部都有了做 AI 芯片的项目,我们认为,这将在未来 18 个月内得到验证。

 

有些人公开表达了自己的意图。微软甚至在峰会上设立了招聘平台,这就是它渴望建立团队的表现。但有关这些项目的状况,我们无从得知:云计算服务商没有公开他们造芯计划的任何细节,所以

[1] [2]

关键字:AI

编辑:muyan 引用地址:http://www.eeworld.com.cn/IoT/2018/ic-news09304403.html
本网站转载的所有的文章、图片、音频视频文件等资料的版权归版权所有人所有,本站采用的非本站原创文章及图片等内容无法一一联系确认版权者。如果本网所选内容的文章作者及编辑认为其作品不宜公开自由传播,或不应无偿使用,请及时通过电子邮件或电话通知我们,以迅速采取适当措施,避免给双方造成不必要的经济损失。

上一篇:研华发布首款基于“中国芯”ARM高性能处理器工业运算平台
下一篇:推动物联网商业化,Semtech发布设计合作伙伴计划

关注eeworld公众号 快捷获取更多信息
关注eeworld公众号
快捷获取更多信息
关注eeworld服务号 享受更多官方福利
关注eeworld服务号
享受更多官方福利

推荐阅读

依图医疗亿元绘制“AI防癌地图” 以AI应用提升医疗机构服务供给能力

”对于创业公司,第一要务是活下去,做这件事情有些忐忑。但是这是一个很重要的事情,量力而为,努力做好。”依图医疗总裁倪浩说。11月9日,医疗人工智能企业依图医疗在北京宣布启动“AI防癌地图”项目,计划在未来5年内投入1亿元项目资金,联合数百家医疗机构,覆盖19个省市自治区,以AI应用提升医疗机构服务供给能力。倪浩表示:“随着医疗AI在医疗机构的广泛应用, AI正在成为医生的助手及第二大脑。依图医疗希望通过持续、高效的投入,覆盖高致死率肿瘤的高发地区,通过提升医疗供给侧的服务能力,让更多癌症患者能够早期发现,早期治疗,提升生存年限及生存质量,不断扩大中国人的健康版图。”依图科技成立于2012年,主要从事人工智能创新性研究,是一家偏技术
发表于 2018-11-12
依图医疗亿元绘制“AI防癌地图” 以AI应用提升医疗机构服务供给能力

再出手!大基金、武岳峰等入股瑞芯微,后者在“IoT与AI”赛

,进军平板电脑市场。即便在高通、英特尔的夹击下,中国平板芯片市场瑞芯微依然做到了三分天下有其一的成绩。继承平板优势,瑞芯微在很多细分领域都逐渐突破。例如,2017年瑞芯微芯片成功打进三星笔记本供应链,成为国产芯片第一个嵌入到笔记本电脑的厂商。在完成一定的积累后,近两年瑞芯微开始将战略方向瞄准“IoT与AI”领域。目前公司在IoT领域已经覆盖消费电子、家居、汽车、零售等方方面面,并已经取得了一些成绩。例如,目前市面上电梯口、机场等户外大屏广告机,有80%用的都是瑞芯微的芯片。在AI领域,目前瑞芯微AI芯片级的解决方案已经实现产品的商用化落地。根据市场研究公司Compass Intelligence的统计,在全球前20名的AI芯片企业
发表于 2018-11-12
再出手!大基金、武岳峰等入股瑞芯微,后者在“IoT与AI”赛

河源国际手机创新创业大赛华东赛区圆满结束,5G、AI应用表

来近期最强的换机动力,面对5G和物联网市场,公司将以更加巨大的研发和市场投入,来迎接射频前端的爆发增长黄金时代。在回答评委所提出的,如何能从如狼似虎的竞争对手中“跑出来”时,倪胜谈到了两个点,其一是扼杀成本,前期可能会采取不盈利的方式打入市场,另一个点是5G射频前端有一定的门槛,大公司会认为射频前端的市场并不能满足自身需要的市场规模,而小公司又没有足够强劲的实力。除了5G之外,AI相关的项目也表现亮眼,其中一个项目是智能化手机研发测试系统,由于厂商研发测试部门经常有一些困扰,例如手工和重复测试工程多、测试规模小、强度低、软硬件综合测试少等,新的智能化测试系统将会帮助测试部门缩减约三分之二的人力并大大减少人员工作量,提高测试效率
发表于 2018-11-10
河源国际手机创新创业大赛华东赛区圆满结束,5G、AI应用表

AI等技术能为治疗老年痴呆做些什么?

11月7日,广州市黑格智造信息科技有限公司(以下简称“黑格科技”)发布了桌面级别的3D打印机Ultracraft D-OS(以下简称“D-OS”),与D-OS同时亮相的还有Ultracraft A2-OS(以下简称“A2-OS”)。A2-OS可以看做是黑格科技在2016年发布的第一款DLP(DLP,全称是Digital Light Processing,译作“数字光处理”)工业级3D打印机Ultracraft A2(以下简称“A2”)的升级版。A2、A2-OS、D-OS这三款3D打印机均可用于打印牙科产品。黑格科技创始人兼CEO桂培炎介绍,目前黑格科技已经向外投放了100多台A2,预计D-OS和A2-OS均可以在明年第一季度开始试用
发表于 2018-11-09

对AI芯片创业公司来说,哪些市场更容易规模化?

本文是创投观察系列的第131篇分享人:耐能CEO Albert一颗芯片需要百万级以上规模出货量才能收回成本,像英特尔、英伟达、高通等芯片巨头都是提供标准化产品给各行业客户来实现规模化。虽然AI芯片的趋势是软硬结合,但现在很多 AI芯片创业公司却成为系统集成商。芯片产生不了足够营收,通过系统集成项目来撑。对AI芯片创业公司来说,哪些市场容易规模商用AI芯片?AI芯片需要“软”到何种程度?首先,安防和自动驾驶领域对AI芯片创业公司是非常有挑战的。除手机外,安防是最清晰的AI芯片应用场景,多数创业公司扎堆投入,宣称各种参数碾压传统芯片巨头,然而最终落地商用的多是摄像机硬件以及安防平台、新零售等软件解决方案。创业公司如果
发表于 2018-11-09

中星微AI闪耀乌镇

  今日,第五届世界互联网大会在乌镇正式拉开帷幕。  中星微人工智能的最新产品AI视频处理器芯片“星光智能二号”摘得“世界互联网领先科技成果”,这不仅印证了中国互联网产业的腾飞动能是如何从研发前沿领域展开,也是中星微人工智能从“芯”开始,谱写中国芯人工智能发展篇章的又一重大里程碑事件。  世界互联网脉动看中国,中国互联网脉动看乌镇。转眼之间,这场互联网产业的盛会已经花落江南水乡第5个年头,见证了中国从科技行业的追赶者逐渐成长为驱动者。AI火,芯片难。AI从来都是科技大玩家的战场,而芯片研发则是要啃硬骨头的持久战役。中国的人工智能领域和芯片行业,从不缺乏期待与质疑之声的冰火两重天。但缺乏的是厚积薄发,初心向前的意志。  在这艰难漫长
发表于 2018-11-09
中星微AI闪耀乌镇

小广播

电子工程世界版权所有 京ICP证060456号 京ICP备10001474号 电信业务审批[2006]字第258号函 京公海网安备110108001534 Copyright © 2005-2018 EEWORLD.com.cn, Inc. All rights reserved