机器学习如何改变未来十年软硬件

2017-08-29 10:44:10编辑:冀凯 关键字:机器学习

  最近,Google Brain员工,TensorFlow产品经理Zak Stone在硅谷创业者社群South Park Commons上做了个讲座,谈到了TensorFlow、XLA、Cloud TPU、TFX、TensorFlow Lite等各种新工具、新潮流如何塑造着机器学习的未来。同时,他还暗示了一些还未向公众披露的exciting的事儿。


  讲座的题目叫“Tensor Flow, Cloud TPUs, and ML progress”,以下是整个讲座的概要,量子位编译整理自South Park Commons官方博客。

  作为一个平台来说,TensorFlow算是一场豪赌:它兼顾了快速,灵活,还可用于生产。实验和执行之间的转换要足够快,才能保证工程生产力,静态图像计算通过Python等高级灵活的语言来表示,同时图编译允许对特定目标进行准确度优化。


  作为一个开源项目,TensorFlow极为成功,它从2015年11月发布至今在Github上已经获得了超过20,000个commit。Github版的TensorFlow每周与Google内部镜像文件之间至少会进行一次双向同步,同时TensorFlow也收获了来自Intel,Microsoft,IBM,Rstudio,Minds.ai以及其他公司研发团队的大大小小的贡献。

  


  为了更好地触及用户,能够在移动端上提高运行TensorFlow模型效率的TensorFlow Lite将会在今年晚些时候内嵌到设备中,而像是XLA这样的项目更具野心:XLA使用深度学习来支持线性代数元的先时和实时编译,从而为任意的目标后端系统生成加速过的代码。XLA的目标是在递阶优化上实现重大突破,不仅是在GPU架构上,而是要在任意能够平行放置线性代数元的架构上实现突破。

  


  谷歌内部,在CEO Sundar Pichai要成为“AI-first”公司的号召下,TensorFlow被应用到非常多的项目当中。


  而加速研发基于机器学习软件的趋势不仅在Google身上发生,亚马逊,苹果,百度,Facebook,微软,Salesforce,Uber,Lyft等几乎所有的主流科技企业,都雇佣了专业的研发团队来推动机器学习的工业化。而在这些公司中,深度学习的开发平台也是五花八门,其中包括来自Facebook的PyTorch和Caffe2,来自Microsoft的CNTK,来自Apple的Core ML以及来自Amazon的MXNet等。


  机器学习的崛起,意味着原来的clean abstraction和模块化设计正在被高维浮点张量和高效矩阵乘法所取代。


  按这种趋势发展下去,软件工程行业将彻底改变。


  Google软件工程师D. Sculley曾写过一篇题为“Machine Learning: The High-Interest Credit Card of Technical Debt”的文章,他在其中列举出了机器学习系统促进低劣软件设计的种种可能,甚至会使这些低劣的设计成为必须。他提到,“这些系统的基本代码跟正常代码拥有相同的复杂度,但在系统层面上拥有更大的复杂度,从而可能引发潜在的风险。”


  阅读D. Sculley的文章:https://research.google.com/pubs/pub43146.html

  机器学习系统通过将所有系统输入紧密耦合,模糊了模型边界和抽象:理想的行为不变性不是来自软件逻辑,而是来自于驱动它们的特定外部数据。尽管存在通过静态分析和图连接来辨别代码可靠性的工具,但总体上,这些工具并没有办法用来分析数据的相关性。


  D Sculley等人在文章中讨论了几种系统设计中的劣势,很能与相关从业者产生共鸣:


  1. Glue Code(粘滞的代码)系统设计样式,“在这其中需要写大量的支持代码负责把数据传入、传出各种用途的安装包”;

  2. Pipeline jungles(乱七八糟的流水线),它会随时间有机地演变,数据准备系统“可能会变成由scape,join和sampling步骤组成的一团乱麻,通常还伴随着中间文件的输出”;

  3. Configuration debt(庞大的编译代价),将会随着系统和生产线的研发而逐渐累积,集合了“各种编译选项,包括使用的特征有哪些,怎样筛选数据,特定学习算法的设置(范围很宽),潜在的预处理或者后处理,验证方法等等。”


  即使在更小、更轻量化的项目中,工程师还会被以下这些问题困扰:


  1. 在实验中模型架构和权重的版本——尤其是当模型从不同体系借来了部分与训练模型,或者从其他模型借来了权重的时候。 

  2. 数据来源和特征的版本;

  3. 在实验环境和实际生产环境之间的迁移(domain shift);

  4. 监测生产中推断的质量。


  解决这些问题的一个可能方案是TFX,它是一个Google内部研发的平台,用来在生产中分布和供应机器学习模型:


  创造和管理一个可用于可靠地生产和部署机器学习模型的平台,需要在很多部件之间进行细致编排——这些部件包括基于训练数据生成模型的学习器、用于分析和验证数据和模型的模块、以及最终在生产工程中用于部署模型的基础架构。当数据随着时间变化且模型在连续更新时,平台的管理就变得非常难。


  不幸的是,这些编排通常是在通过glue code和特定的脚本文件来有针对性的一一处理,导致了复制成本大、系统脆弱同时伴随着大量的技术隐患。


  TFX标准化了这些过程和部件,并把它们整合到单个平台上,从而简化了平台编译的过程,在确保平台可靠性、减少服务崩溃的基础上,将制作的时间从数月减少到了数周。

  


  摩尔定律放缓,使得我们得以重新进入“架构的黄金年代”,见证各式各样芯片和指令集的飞速发展。


  诸如英特尔旗下的Nervana、英伟达、Cerebras和Google等公司全都开始研发能够加速机器学习中线性代数运算的下一代硬件架构。且在默认情况下,每种架构都需要独特的、像cuDNN那样的底层、手动优化基元库。(cuDNN全称是CUDA Deep Neural Network library,是NVIDIA专门针对深度神经网络设计的一套GPU计算加速库。)


  想打破这个趋势,需要同行们在XLA等更普适的编译器框架上下更多功夫。


  Google的TPU(Tensor Processing Units)目前最有可能打破GPU的统治。每个Cloud TPU能提供高达每秒180万亿次的浮点运算,64GB的超高带宽存储空间以及可串联的特性。跟之前超级计算机的架构不同,TPU是从零开始设计,专门针对机器学习中常见的线性代数运算。



  TPU是与TensorFlow集成的,Google提供收费云端服务(Cloud TPU),同时通过TensorFlow Research Cloud(TFRC)项目,对想要提前使用TPU的机器学习专家进行补贴,提供1000个Cloud TPU,希望他们能通过论文和开源软件来跟世界分享其研究成果。

  


  小结


  像TensorFlow这样的图计算和深度学习库是未来计算行业发展背后的主要驱动力,这推动我们去重新审视系统架构,从硬件到编译器再到更高级的程序语言和设计规范。


  于是,繁重的工作摆在了软件架构师,工程师、研究人员等从业者面前,但同时这过程也很令人兴奋。就像Zak在演讲中所总结的一样:


  我读研究生的时候,这些惊艳的应用大都还不可能实现——当人们对机器学习技术习以为常,然后开始做一些我们现在预见不到的事情,会是什么样呢?第一批TensorFlow原生的产品会是什么样?”

关键字:机器学习

来源: 量子位 引用地址:http://www.eeworld.com.cn/qrs/article_2017082937643.html
本网站转载的所有的文章、图片、音频视频文件等资料的版权归版权所有人所有,本站采用的非本站原创文章及图片等内容无法一一联系确认版权者。如果本网所选内容的文章作者及编辑认为其作品不宜公开自由传播,或不应无偿使用,请及时通过电子邮件或电话通知我们,以迅速采取适当措施,避免给双方造成不必要的经济损失。

上一篇:兆芯:广电+TVOS +人工智能 更新体验更多可能
下一篇:英特尔推出专注于人工智能的Movidius视觉处理芯片

关注eeworld公众号 快捷获取更多信息
关注eeworld公众号
快捷获取更多信息
关注eeworld服务号 享受更多官方福利
关注eeworld服务号
享受更多官方福利

推荐阅读

人工智能会替代多少人力劳动?

大量的数据训练,这也是为什么在互联网大数据的时代,AI可以崛起。而在数据训练之前,又必须先对大量的数据进行标注,作为机器学习的先导经验。 因此,催生了大量数据标注员的产生。 简单的说,数据标注员类似于AI的老师,举个形象的例子,我们要教机器认识一个苹果,你直接给它一张苹果的图片,它是完全不理解的。我们得先有苹果的图片,然后在上面标注着“苹果”两个字,机器通过学习了大量的图片中的特征,这时候再给它任意一张苹果的图片,它就能认出来了。 据了解,目前标注员的工作内容常见的有拉框标点、打标签、分割、批注等等。其中分类就是最常见的打标签,比如标注画面上动物毛发颜色、动物耳朵等等;框选是将画面中相对应的对象标框标注
发表于 2018-07-20 19:27:04

蹭着电影的热度,看看AI医疗是怎么回事?

价格高昂的正版药,让患者们退无可退。不容否认,一种新药,尤其是“特效药“的研发,需要过亿的研发成本和研发周期,其能够面市,已经是诸多患者的“福音”。然而,面对高昂的售价,如何给“特效药”及疾病治疗“降降温”,AI也许能够一步步成为你的“药神”。第一步:AI预测白血病,让白血病不再成为“突然之灾”近期,《自然》上发表了一项研究成果——由全国多家科研机构白血病科学家组成的研究小组使用血液检测和机器学习,以达到预测健康个体是否有患急性骨髓性白血病(AML)的风险。这意味着我们今后对AML的出现有预警,并能够提早发现AML的高风险人群并进行监测,同时可以进行研发,寻找降低该疾病患病几率的方案。AML名为“急性骨髓性白血病”,以骨髓与外周血
发表于 2018-07-18 17:03:05
蹭着电影的热度,看看AI医疗是怎么回事?

人工智能会替代多少人力劳动?

大量的数据训练,这也是为什么在互联网大数据的时代,AI可以崛起。而在数据训练之前,又必须先对大量的数据进行标注,作为机器学习的先导经验。 因此,催生了大量数据标注员的产生。 简单的说,数据标注员类似于AI的老师,举个形象的例子,我们要教机器认识一个苹果,你直接给它一张苹果的图片,它是完全不理解的。我们得先有苹果的图片,然后在上面标注着“苹果”两个字,机器通过学习了大量的图片中的特征,这时候再给它任意一张苹果的图片,它就能认出来了。 据了解,目前标注员的工作内容常见的有拉框标点、打标签、分割、批注等等。其中分类就是最常见的打标签,比如标注画面上动物毛发颜色、动物耳朵等等;框选是将画面中相对应的对象标框标注
发表于 2018-07-16 19:01:26

2018年安防技术发展趋势

作伙伴增加价值。  3、深度学习与机器学习  目前我们已开始实现深度学习和机器学习架构的所有优势:拥有海量的数据可供分析;拥有强大的处理能力,能够在合理的时间范围内完成分析;拥有先进的算法以及大量案例可供借鉴。当某些非凡的深度学习应用与图像解读、语音识别和决策支持互相关联时,安防领域的分析潜力便不言而喻。  在相对较基础的层面上,深度学习应用将可改善视频运动检测、人脸识别、个体追踪和误报控制,能有助于系统的设计、配置、优化和设备管理。此外,预测分析也将迎来前所未有的机遇,最终能够预防各种事件的发生,包括恐怖攻击、滑倒与坠落事故、交通问题和入店行窃等。  4、个性化与隐私  提供高度个性化的服务是深度学习的潜在应用之一。设想在某个零售
发表于 2018-07-05 20:34:37

Arm机器学习处理器IP参数公布,将首先用在移动市场中

近日,在Arm Tech Day 2019上,Arm杰出工程师及机器学习事业部技术总监Ian Bratt介绍了Arm在机器学习及人工智能领域目前所做的工作和进展,Arm针对人工智能领域的Project Trillium项目,这是一套包括新的高度可扩展处理器的Arm IP组合,包括全新的ML处理器IP以及OD视觉处理器,以及一系列配套的软件体系。Ian给出第一代机器学习处理器指标,在7nm下效率为3 TOP/W,吞吐量为4.6 TOP/s,有针对激活和权重的硬件压缩,利用Cortex-M技术支持安卓NN和Arm NN,预计2018年中期交付客户。Ian表示,“机器学习和人工智能是颠覆性的技术,应用场景多种多样,因此对Arm
发表于 2018-06-29 15:58:41
Arm机器学习处理器IP参数公布,将首先用在移动市场中

Mali-G76处理器提升机器学习性能,适合高清手游和VR应用

近日,在Arm Tech Day 2019上,Arm资深产品经理Espen φybφ详细讲述了Mali的发展路径,以及最新Mali-G76处理器的强劲性能。Espen表示,目前推动GPU发展的趋势主要有三大类,包括高清手游、AR/VR以及对象识别/机器学习。如图所示,目前Bifrost架构是Arm的第三代GPU架构,在此架构上,Arm推出了多款中高端显卡。而针对各细分领域的客户需求,Arm有着丰富的处理器组合Mali-G76性能提升根据Arm给出的数据,Mali-G76性能比相同工艺,相同优化程度下的Mali-G72提升了30%,能效也提升了30%,同时机器学习性能有了较大飞跃,相当于G72的2.7倍。G76的架构和G72看上
发表于 2018-06-29 15:48:58
Mali-G76处理器提升机器学习性能,适合高清手游和VR应用

小广播

何立民专栏

单片机及嵌入式宝典

北京航空航天大学教授,20余年来致力于单片机与嵌入式系统推广工作。

电子工程世界版权所有 京ICP证060456号 京ICP备10001474号 电信业务审批[2006]字第258号函 京公海网安备110108001534 Copyright © 2005-2018 EEWORLD.com.cn, Inc. All rights reserved