“深度学习”:人工神经回路大显威力

2013-05-06 14:21:31来源: 日经商务周刊
      人称“深度学习”的人工智能技术如今备受关注。为了大幅提升图像、语音的识别精度,美国谷歌等公司正在进行研究。这项技术还有望在经济动向预测、新药开发等领域发挥威力。 

       最近1~2年,有一项技术受到了全世界人工智能研究人员的密切关注。这种新方法名叫“深度学习”,是一种让计算机像人类一样根据经验采取行动的机器学习方式。 

       支撑互联网社会的图像识别和语音识别、有助于新药开发的化合物活性预测——在此类技术角逐精度的大赛上,深度学习大幅改写过去的纪录,一次又一次赢得了胜利。 

       “真不相信精度能得到如此飞跃”,“结果太震撼了”。专家的惊叹之声不绝于耳。 

       深度学习是由在计算机上模拟人类神经回路的“神经元网络”技术发展而来。 



       人脑在根据图像判断图上物品的种类、根据手头信息预测未来上面拥有优秀的能力。

      神经元网络是在计算机上把虚拟的神经元排列成层状,模拟真正的神经细胞之间的电信号。借此实现大脑从各式各样的数据中提取本质概念的功能。 

       深度学习的目的是把神经元“深化”到4层、5层,实现接近于大脑的性能。 

       神经元网络研究的历史悠久,可以追溯到1950年代。但是,由于增加神经元的层数后,会出现性能降低等问题,因此,研究一直处于兴盛与衰退的反复交替过程。 

       然而,到了2000年代中期,美国的研究人员开发出了攻克这一课题的计算技术。再加上能够处理大数据的计算机的进步,深度学习的研究拉开了序幕。 

       2012年6月,美国谷歌与美国斯坦福大学合作发表的成果成为了让世界了解深度学习威力的开端。 

       谷歌把取自视频网站“YouTube”的大量图像输入到了神经元网络之中。结果,在没有教授任何知识的情况下,计算机自然产生了“猫”的概念。 

识别精度提高7成 

       谷歌的研究员杰夫·迪恩(Jeff Dean)解释说:“我们的研究就像是给刚出生的婴儿看大量的YouTube图像。”下面,笔者就以该公司的研究为例,解释一下深度学习的原理。 

       谷歌在计算机上制作了深达9层的神经元。第1层是“输入层”,第2~8层是“隐藏层”,第9层是“输出层”。 

       输入层的神经元从输入图像上读取各像素的值,把信号传导至第2层的各个神经元。第2层的神经元根据某种规则,对第1层传导来的信号进行转换,然后输出到第3层。在第3层到输出层之间,输出信号按照同样的步骤,逐层向下传递。 

       重点是在输入每一幅图像时,各神经元的连接方式都会发生细微的改变。向神经元网络输入图像后,各神经元在接收信号,进行转换之时,相关的参数将得到调整,使整体的信号传导方式发生改变。也就是网络慢慢得到“训练”。 

       在谷歌的研究之中,参数约为10亿个,数量相当庞大。该公司向如此巨大的网络输入了从1000万个YouTube视频中截取的图像。通过1.6万个CPU(中央运算处理装置)并用的大规模计算,耗费1周时间实施了训练。 

       训练结束后,神经元网络的内部形成了不可思议的构造。各神经元会分别对不同的特定种类输入信号做出特别强烈的反应(放电)。 

       这与人脑内的神经细胞对人的相貌、物体等特定物体和概念做出反应并放电的原理相同。也就是说,人通过学习和经验形成的神经回路构造在计算机中得到了重现。 

       各神经元识别的对象因层的深度而异。靠近输入层的第2层的神经元对图像中的边缘、弯曲等单纯的形状和概念做出反应。随着向第3层、第4层的不断深入,神经元捕捉的概念将愈发高深、抽象。在输入动物面部的图像时,这些层负责识别眼睛、耳朵等构造,以及面部整体。 

       根据谷歌的研究,位于最后的输出层的1个神经元已经可以自然地识别出猫脸。在看到包含猫脸的图像后,这个神经元的反应最为强烈。 

在美国谷歌的研究中,让识别猫的神经元做出了最强反应的猫的头像

       当然,可以识别的并不只是猫。人、汽车、长颈鹿等各种事物都可以进行识别。包括人类难以区分的鳐和蝠鲼在内,在对大约2万个种类进行识别精度调查后,结果显示,识别率达到了16%,比过去的最高纪录高出了约7成。 

       谷歌已经把深度学习的技术运用到了该公司的语音识别服务之中。今后还考虑在图像识别和视频搜索等用途投入实用。谷歌的迪恩充满期待地表示,“计算机与人类的新式人机对话将成为可能”。

超越人类的未来预测 

       人脑包含着数以千亿计的神经细胞。今后,随着深度学习的规模和精度的提升,计算机将能够达到人脑的什么程度呢? 


       东京大学研究生院工学系研究科副教授松尾丰指出,“人脑最大的优势在于擅长预测和推测。通过使用深度学习,对于未来的高精度预测或许将成为现实”。 

       人类拥有优秀的预测能力,能够根据物体的外观,判断其能否食用,或是根据与某人相关的知识,预测此人的年收入。如果把这些特征与计算机的处理性能相结合,超越人类的高精度未来预测将开辟一条崭新的道路。 

       松尾副教授等人目前正在研究根据微博客“Twitter”上的发言内容,来提高推测发言者性格的精度。今后还打算使用超级计算机等设备,把深度学习运用于未来经济的预测。 

       深度学习不同于传统技术,输入的数据无需事先进行人工筛选。因此,只需输入报纸刊登的企业财务数据、各种各样的市场数据、互联网的经济信息等杂乱的信息,就有望实现准确的经济预测。 

       真实的大脑中存在着功能各异的多个部位,在这些部位之间,电信号的交换非常复杂。深度学习目前还不能完全重现。 

       但日本产业技术综合研究所智能系统研究部门的高级主任研究员麻生英树说:“开发像人脑一样提取数据内在本质概念的技术非常重要。”而且,这种技术的应用领域也十分广泛,所以深度学习的研究热度估计还会持续下去。

关键字:深度  深度学习  度学  学习

编辑:鲁迪 引用地址:http://www.eeworld.com.cn/afdz/2013/0506/article_5741.html
本网站转载的所有的文章、图片、音频视频文件等资料的版权归版权所有人所有,本站采用的非本站原创文章及图片等内容无法一一联系确认版权者。如果本网所选内容的文章作者及编辑认为其作品不宜公开自由传播,或不应无偿使用,请及时通过电子邮件或电话通知我们,以迅速采取适当措施,避免给双方造成不必要的经济损失。
论坛活动 E手掌握
微信扫一扫加关注
论坛活动 E手掌握
芯片资讯 锐利解读
微信扫一扫加关注
芯片资讯 锐利解读
推荐阅读
全部
深度
深度学习
度学
学习

小广播

独家专题更多

富士通铁电随机存储器FRAM主题展馆
富士通铁电随机存储器FRAM主题展馆
馆内包含了 纵览FRAM、独立FRAM存储器专区、FRAM内置LSI专区三大部分内容。 
走,跟Molex一起去看《中国电子消费品趋势》!
走,跟Molex一起去看《中国电子消费品趋势》!
 
带你走进LED王国——Microchip LED应用专题
带你走进LED王国——Microchip LED应用专题
 

About Us 关于我们 客户服务 联系方式 器件索引 网站地图 最新更新 手机版

站点相关: 视频监控 智能卡 防盗报警 智能管理 处理器 传感器 其他技术 综合资讯 安防论坛

北京市海淀区知春路23号集成电路设计园量子银座1305 电话:(010)82350740 邮编:100191

电子工程世界版权所有 京ICP证060456号 京ICP备10001474号 电信业务审批[2006]字第258号函 京公海网安备110108001534 Copyright © 2005-2016 EEWORLD.com.cn, Inc. All rights reserved