datasheet

英特尔发布全新AI架构Nervana,是啥东西?

2018-09-13来源: EEFOCUS关键字:英特尔  Nervana

英特尔在深度学习领域的推进催生了各种新型架构,还包括tile、先进封装和更加定制化的解决方案。

近日,英特尔人工智能产品事业部副总裁Gadi Singer接受了媒体访谈,谈论了英特尔在深度学习领域的长期愿景,以及为什么公司看好x86之外的架构和单芯片解决方案。

记者:处理器方面有什么变化?

Singer:最大的变化是增加了深度学习和神经网络。过去几年,人工智能带来了快速且深刻的变化,我们也正在试图评估它们的潜力,以及能用它做些什么。但是,与此同时,您还需要退后一步,思考如何与其它互补性的功能相适应。处理器的变化是英特尔整体转型大略的一部分。

 

英特尔人工智能产品事业部副总裁Gadi Singer


记者:真正人工智能的标志是可以用机器开发算法而不是人工开发对吧?

Singer:人工智能起步于20世纪60年代,直到计算机科学家Hinton和其他人在21世纪初找到一种更好的方法有效处理多层数据之前,它一直处于沉寂状态。几年前,ImageNet的工作表明可以通过机器进行图像识别且达到接近于人的识别精度,人们才意识到深度学习是一种重要的计算力量,人工智能至此取得了重大突破。之后,我们在语音识别方面也取得了很好的成果。2015年到2016年左右,深度学习的一系列成果表明,人工智能成为推动人类科技进步的重大因素。当时能够处理的图像都是相对简单的二维图像,可以识别的语音也简单直接。之后,业界的一系列努力证明了可以通过深度学习达到一定的精度,取得一系列成果。当时创建和验证模型的主要架构是CPU和GPU,主要开发语言是C++,开发环境是CUDA等专有环境。构建并部署计算架构需要大量的专业知识并投入大量精力。你看看现在这个领域的主要技术,就可以看出哪些公司是早期的参与者。

记者:从那以后发生了什么变化?

Singer:在过去的几年中,深度学习时代迎面而来。数据本身变得更加复杂了,我们也从识别2D图像成功转变为识别3D图像。我们正在和诺华公司合作,它们正在研究细胞的3D显微图像,以试图找出潜在的恶性细胞。在数据方面,图像的复杂程度提升了25倍,但是现在识别的是更加精确的模型。

记者:英特尔在这些架构的哪些方面发力?人工智能和深度学习的一大问题在于它们还在快速变化之中,因此您需要一个非常灵活的架构,英特尔在这方面有什么计划?

Singer:过去面对的问题很清楚。你知道两三年后的图形芯片或者CPU芯片需要实现什么功能,公司之间的竞争体现在为已知问题提供最佳解决方案上。在深度学习领域的竞争则体现在谁能够在发展变化过程中最深刻地理解问题。你需要的是一个能够理解并预见变化趋势的架构,并在全面生产上市和部署时为即将面临的问题做好准备,而不是在设计和测试时就固定好了能够解决的问题。

记者:架构会因市场而改变,还是架构仍然相同?

Singer:这影响到方方面面。我们认为,一种架构不可能满足所有需求,成功的解决方案是提供一系列各具特色的产品。所以架构肯定不止一个,但是也不会太多。我们可以按照功率从1瓦以下到300瓦,从推理、训练到机器学习,从关注吞吐能力到关注延迟,按照各种要求实施不同的架构。架构对每瓦性能也有不同的敏感度。解决方案的能效值是多少?你愿意在其它方面妥协吗?这不仅仅是在一个实例上进行小程度的修改,而是面对一系列需求,必须有一系列互补性的架构。

记者:这一系列架构是什么?

Singer:主要有三个要素。第一,因为我们客户要求不同,我们需要提供一个产品组合。你需要提供从终端设备(安全摄像头、无人机或汽车等)到网关(数据汇聚点)再到云端或本地服务器的解决方案,每个层面都需要有非常有效的解决方案。第二,我们的硬件战略是提供具有互补架构和解决方案的组合。第三,进一步使Xeon成为AI的坚实基础。

记者:针对训练还是针对推理?

Singer:我们是从推理开始的。Xeon是一个很好的推理解决方案。和其它任何产品相比,Xeon的推理解决方案都毫不逊色,而且在总体拥有成本和灵活性方面具有其它优势。你看看Facebook,他们会展示怎么对其Top 7服务进行培训和推理的。

记者:但是Facebook这样的公司对推理的要求和手机或汽车摄像头一样吗?

Singer:不一样,这就是你需要不同架构的原因。你希望在大型数据中心中进行推理,你可以利用同样的计算进行推理或者执行其它任何任务。在低端市场中,我们有Movidius架构,它的功耗在1瓦到几瓦之间(英特尔于2016年9月购买了开发计算机视觉应用低功耗处理器的公司movidius),你可以使用它实时创作音乐,或者将Movidius计算棒连接到手机上,检测早期皮肤癌,然后进行非常重要的分析。

记者:所以你们在数据中心和边缘节点上都有方案了,你们战略的第三部分是什么?

Singer:系统集成。当您考虑系统集成时,拥有正确解决方案的大量价值都体现在数据移动上。一个好的解决方案应该尽量减少数据移动,因为数据移动的成本要比对数据进行乘除/累加贵10倍。针对如何在正确的位置、正确的时间取得数据进行系统和软件栈的优化,是任何解决方案成功的关键。

记者:听起来英特尔像是要发生从头到脚的变化

Singer:当然,你看一下我们对基本版本Xeon的改进,我们现在通过VNNI(矢量神经网络指令集)和BFloat 16提升DL(深度学习)能力。过去,英特尔分别解决了浮点、SIMD和矢量运算。现在,AI需要一系列能力,我们在x86架构下实现了许多重要的新功能。我们希望为这两种架构提供优化的解决方案。这就是我们和Movidius合作要解决的问题,我们将要发布Nervana,这个架构引入了FPGA,它集成了最出色的x86,并用最好的架构增强它,对它加速。现在从系统的层面来看,不仅仅是主机和加速器的改进,还涉及到存储器和网络,它是一种系统集成。你在硅片上、封装内放什么东西?你在同一个机架中集成了什么?

记者:所以你们现在实施的是包含先进封装在内的平台策略。这是英特尔之前没有认真做过的事情,你觉得这种策略是怎么个玩法?

Singer:封装内集成可以将不同种类的事情结合在一起,并将之紧密集成,我们正在这方面努力,我们认为这样做非常有价值。

记者:新型硬件架构正在发生的一个重大变化是增加数据密度,每个周期可以处理更多数据,对吧?

Singer:这方面讲的是数据压缩和增加计算的并行性。你看我们从头开始构建的Nervana NNP(神经网络处理器)架构,它具有张量神经网络,你管理的是各种数据结构。这是架构创新的基础,使用VNNI,你可以提供在数据结构上执行的指令,从而能够在阵列上进行计算。

记者:除了缩小功能单元外,还有更多优势,对吧?

Singer:我们需要从这个流程中得到需要的东西。我们一直将设计和架构向矢量处理的方向推进。我们将利用这种流程。不过,我们的目的是提高设计和架构的效率,使得每个周期可以处理更多指令,始终都是为了让向量尽可能快地运行。

记者:但是现在你必须把这些东西融合在一起,数据在内存中存储和读取的方式也可能不同。

Singer:是的。你必须能够从内存中提取这些数据结构,我们需要看到的另外一件事是如何融合纯神经网络操作和常规的潜在循环代码。如果你注意到现在已经在开展的一些工作就会发现,它会假设很多新的计算必须是深度学习。实际上,这些是具有神经网络和深度学习的更加通用的任务。你需要一个非常有效的神经网络架构。但是,如果一个方程的某些部分的次序性更强或者需要依赖更多条件,它同样需要非常有效地完成。你需要能够在常规运算和神经网络运算之间切换。我们目前正在研究的一个课题就是,如何在具有其它元素的真实背景中以最佳方式执行神经网络运算。如果你看一下NNP机器翻译或者其它类似的工作,就会发现它们内部就有一些不是神经网络计算的内容,它们也是解决方案的一部分。


关键字:英特尔  Nervana

编辑:muyan 引用地址:http://www.eeworld.com.cn/IoT/2018/ic-news09134359.html
本网站转载的所有的文章、图片、音频视频文件等资料的版权归版权所有人所有,本站采用的非本站原创文章及图片等内容无法一一联系确认版权者。如果本网所选内容的文章作者及编辑认为其作品不宜公开自由传播,或不应无偿使用,请及时通过电子邮件或电话通知我们,以迅速采取适当措施,避免给双方造成不必要的经济损失。

上一篇:stratasys在大中华区推出优惠活动,推动智能制造发展
下一篇:Akamai在WAF的强势表现

关注eeworld公众号 快捷获取更多信息
关注eeworld公众号
快捷获取更多信息
关注eeworld服务号 享受更多官方福利
关注eeworld服务号
享受更多官方福利

推荐阅读

西门子医疗携手英特尔展示应用AI技术进行实时心脏MRI诊断

英特尔与西门子医疗(Siemens Healthineers)* 正在合作开发一种突破性的基于人工智能的的心脏MRI(磁共振成像)分割和分析模型,有望提供实时的心血管疾病诊断。英特尔和西门子医疗使用了第二代英特尔®至强®可扩展处理器进行人工智能推理,为技术专家、心脏病专家和放射科医生提供实时磁共振成像(MRI)推理结果。英特尔公司物联网事业部生命科学与健康部门总经理David Ryan表示:“西门子医疗和英特尔有一个共同目标——利用人工智能技术,进一步改善医疗水平。通过在边缘部署集成了英特尔®深度学习加速技术和英特尔®Distribution of OpenVINO™工具包的第二代英特尔至强可扩展处理器,数据在采集后将被即刻用于
发表于 2019-04-15

英特尔在M.2规格的固态盘上整合革命性的内存和存储技术

英特尔今日公布了英特尔®傲腾™混合式固态盘的详细信息,这款创新的设备采用M.2规格,体积小巧,将英特尔傲腾技术的卓越响应速度与英特尔® Quad Level Cell (QLC) 3D NAND技术的强大存储容量融为一体。  “英特尔®傲腾™混合式固态盘独创性地将英特尔傲腾技术和英特尔QLC 3D NAND技术相结合,我们颠覆性地整合内存与存储,以业界无法比拟的方式释放英特尔平台化全部能量的绝佳例证。” –英特尔高级副总裁兼非易失性存储器解决方案事业部总经理罗布·克鲁克(Rob Crooke) 重要性: 将英特尔傲腾技术与英特尔QLC 3D NAND技术结合到M.2规格的模块上,可扩大英特尔
发表于 2019-04-11
英特尔在M.2规格的固态盘上整合革命性的内存和存储技术

英特尔推出以数据为中心的创新产品组合

去年,英特尔领导层宣布了支撑所有产品的六大技术支柱:制程和封装、架构、内存和存储、互连、安全、软件。上周,英特尔推出了一个令人惊叹的以数据为中心的创新产品组合,包括全新处理器、内存、网络控制器、SSD、FPGA等。这两大举措都围绕这个新时代人们对数据的愿景——更快传输数据、存储更多数据、处理一切数据。本周,我与英特尔的技术领导团队一起,分享了关于“更快传输数据”的最新消息,并详细介绍了互连技术在英特尔整个布局中所扮演的重要角色。连接数据在互连技术领域,英特尔是业内投资部署最广泛的公司之一。英特尔的互连技术可实现片上、封装内、以及处理器节点间的通信。通过有线网,或者无线网络,数据将在数据中心、边缘设备、以及芯片之间传输。英特尔在所
发表于 2019-04-10
英特尔推出以数据为中心的创新产品组合

英特尔新款企业级SSD外形略显奇葩

英特尔创新产品发布会上,Intel发布了首款E1.L规格的SSD D5-P4326,基于企业级的QLC NAND闪存颗粒,可用容量高达15.36TB、30.72TB。  当然,容量啥的这年头企业级SSD都挺大的咱也就不一惊一乍了,重点是这个形状,简直就是一个加长版的M.2,活脱脱的像一把长尺!略显奇葩!  它归属于“RULER”(统治者)家族,规格为E1.L,标准厚度9.5毫米,加装散热片允许到18毫米,E1.L SSD接口支持PCIe 3.1 x4/x8通道,单向理论最大带宽为3.94GB/s、7.68GB/s,后续还会支持x16;且随时可以升级到PCIe 4.0
发表于 2019-04-10
英特尔新款企业级SSD外形略显奇葩

英特尔、三星、台积电,三巨头竞争先进工艺

摩尔定律推动半导体业进步,之前主要依靠两大法宝,一个是工艺尺寸缩小,另一个是硅片直径增大,显然以工艺尺寸缩小为主。因为硅片尺寸从2000年进入12英寸之后,没有再往18英寸迈进。尺寸缩小的步伐一路走来相当顺利,基本上是每两年前进一个工艺台阶,如2007年的采用HKMG工艺的45纳米,2009年的32纳米,2011年釆用FinFET 3D工艺 的22纳米,及2013年的14纳米。显然之后的10纳米,7纳米及5纳米进程,业内在工艺制程尺寸定义等方面存有争议,其中英特尔认为要依晶体管密度来计,及定律开始变缓,可能要24-36月才前进一个工艺台阶。但是不用争议,英特尔在HKMG及FinFET 3D工艺等方面作出了巨大贡献。业内关于先进工艺
发表于 2019-04-10
英特尔、三星、台积电,三巨头竞争先进工艺

英特尔用1300万美元投资Untether AI

英特尔投资在其全球峰会上宣布,拿出1.17亿美元(约合人民币7.85亿)投资14家创业公司。今(3) 日有消息传出,英特尔正在向Untether AI 投资 1300万美元,这家创业公司正致力于开发一种用于人工智能的新型芯片,该芯片有望以超高的速度进行神经网络计算。据介绍,Untether AI(加拿大安大略省多伦多市)从事超高效、高性能 AI 芯片的开发。这些芯片将成为下一轮 AI 创新浪潮的基础。Untether AI 发明了一种前所未有的新型芯片架构,打破了数据移动瓶颈,专门用于神经网络推理。这种独特的架构能以千倍于传统架构的速度传输数据,因此性能和效率都极高。该公司由一群科学家、工程师以及经验丰富的企业家共同
发表于 2019-04-09

小广播

电子工程世界版权所有 京ICP证060456号 京ICP备10001474号 电信业务审批[2006]字第258号函 京公海网安备110108001534 Copyright © 2005-2019 EEWORLD.com.cn, Inc. All rights reserved