datasheet

xsy-ai机器人文明

文章数:108 被阅读:58836

账号入驻

激荡80年,这些大牛将AI拥向“神坛” | 产业图谱系列二

2018-10-24
    阅读数:

关注我们,思考像钟摆,永不停歇


阅读关键词:人工智能发展史、图灵、两落三起

在第一篇“AI产业图谱系列”(AI身世揭秘:爸图灵,妈是谁?)中,系统介绍了孕育人工智能的哲学土壤。从希腊三杰对意识和理性的认知、逻辑三段论,到拉蒙·鲁尔认为“有用推理可以用机器人造物来实现”、计算器制造,再到机械唯物主义和二元论。二十世纪之前,人类社会的头两次产业革命主要关注点在于机械化和分工协作,人工智能的哲学启蒙还是少数研究者的“脑洞大开”。

 

但到了二十世纪,这些“脑洞”终于被认识到价值。


本文字数:6400,阅读需15分钟,耐心哦~


发现期:不像机器输出的图灵成为人工智能之父

 

人工智能的作用原理,并不比人脑复杂。打个比方,今天晚餐你想吃点好的,备选有牛排、寿司,以及水煮鱼。你希望这餐饭不要花超100块钱,在这些预设前提下,你的脑种出现了以下几种情况:

 

1、牛排要128元一份,超出预算;

 

2、虽然100块刚购买五份寿司,但可能吃不饱;

 

3、水煮鱼68元一份,还可以同时吃青菜和主食,管饱。

 

最后,你做出决策:晚饭吃水煮鱼。

 

在这一系列的思考过程中,你首先输出了一个指令“晚饭吃好的,不超过100块钱”,紧接着在自己的食物知识库中找出了“牛排、寿司、水煮鱼”三个想要的数据,然后通过以上三步计算,最终得出吃水煮鱼的答案。

 

事实上,模拟人类思维的人工智能也是这么思考的。它的作用原理是“算法(告诉计算机晚饭吃不超100块的美食)+数据(牛排、寿司、水煮鱼)+计算(得出吃水煮鱼的过程)”

 

这个逻辑不难理解,但问题是,人通过大脑思考的学习方式,是怎么被机器学会的?

 

这个问题的解决便是阿兰·图灵被称为“人工智能之父”的由来。

 

1936年,时年24岁的图灵发表了名为《论数学计算在决断难题中的应用》论文,文中,图灵首次描述了“图灵机”——一台将纯数学符号逻辑和实体世界建立联系的概念机,它可以模拟人类进行数学计算过程:首先,通过一个类似于人眼和手的读写头读取和输出信息;然后,用一条长纸带输入和输出信息;最后,通过类似于大脑分析原理的控制器,根据设定的不同问题,对获得的信息进行不同的处理。

 

现代版图灵机示意装置

 

图灵机之所以重要,是因为它不同于算盘之类的简单机械,理论上说,任何能够用数学解决的问题都能交由图灵机来处理。通过图灵机,图灵完成了早他一代的数学天才巴贝奇想要“完全由机器来分析和处理问题”的遗憾。

 

图灵机(左发明)和巴贝奇分析机(右发明)的理论中有不少异曲同工之处

 

除了发明图灵机,图灵还被认为是“计算机之父”,这个贡献源自其参加盟军的秘密软件计划。二战时,对于有备而来的德意轴心,英法联军在硬件上力不从心,便想设法从软件入手。1939年,27岁的图灵应征至英国外交部通信处从事软件研究工作,紧要关头,图灵和他的团队最终研制出可以破解德军复杂密码的“计算机”,从而让盟军抢占了先机。战后,图灵因为这项发明获得了英国政府最高奖章——OBE勋章,以表彰其发明挽救了至少几百万人的贡献。

 

然而,图灵用他的天才挽救了百万人的生命,却无法挽救人类的蒙昧。当被发现同性取向后,图灵被逮捕,并被定罪为“严重猥亵”。为了能够继续进行科学研究,他没有选择牢狱服刑,而是进行了化学阉割”,这被认为是他非正常死亡的可能原因。

 

《科学美国人》曾这样评价图灵:个人生活隐秘又喜欢大众读物和公共广播,自信满怀又异常谦卑。一个核心的悖论是,他认为计算机能够跟人脑并驾齐驱,但是他本人的个性却是率性而为、我行我素、无法预见,一点也不像机器输出来的。

 

孕育期:“神经网络”和第一台基于它的计算机

 

除了图灵,早期人工智能的研究者还有沃伦·麦卡洛克和沃尔特·皮兹。

 

 

美国著名神经生理学家和控制论学者沃伦·麦卡洛克生长在一个盛产知识分子的家族,他的家人全部是律师、医生、神学家,或者工程师。或许因为家庭氛围使然,麦卡洛克对很多知识领域都充满兴趣,他先后进修了数学、实验美学、心理学,以及神经生理学,但从内心来说,他其实是个哲学家,对所有知识的剖根究底最终只为了解一个问题——知识的意义是什么。在这个问题上,弗洛伊德用“自我”、“本我”和“超我”的精神分析试图解释,但麦卡洛克确不同意,他认为所谓精神源自于大脑中纯机械的神经元激发。

 

 

与麦卡洛克抱持相同看法的还有小他25岁的沃尔特·皮茨。与麦卡洛克优渥的成长环境不同,皮茨出生于底层的困难家庭。但尽管没有接受过系统的知识教育,他还是在图书馆里自学了希腊文、拉丁文、逻辑学和数学。12岁时,皮茨在学习过程中发现罗素和怀特海德合著的《数学原理》有几处错误,便给罗素写信指正。成年之后,混迹于芝加哥大学旁听的皮茨在罗素和卡尔纳普的帮助下谋到一份研究员的职位。与此同时,皮茨认识了麦卡洛克。听过后者向他解释正在试图用莱布尼茨的逻辑演算建立一个大脑模型后,皮茨马上提出可以用数学工具对此研究,基于深厚的数学功底,皮茨和麦卡洛克开始了用神经元建立一个计算的大脑的尝试。

直到1943年,他们合著的论文《神经活动中内在思想的逻辑演算》发表,这篇论文对后来的“神经网络”,以及当下流行的深度学习影响巨大。它主要讨论了理想化、简化的人工神经元网络,以及它们如何形成简单的逻辑功能,受此学说启发,“模拟大脑”的想法开始出现。

 

通过对大脑的分析,人们发现神经元具有多输入单输出、突触(传递神经冲动的地方)兼有兴奋和抑制两种性能、能时间加权和空间加权、可产生脉冲、脉冲可以进行传递,以及非线性等特点。

 

在麦卡洛克-皮茨模型提出之后,唐纳德·赫布展示了一条简单的用于修改神经元之间的连接强度规则的更新规则,这一规则在目前被称为赫布型学习规则;之后,马文·明斯基和迪恩·埃德蒙兹在1950年建造了第一台神经网络计算机。

 

命名期:哲学家麦卡锡和人工智能的“心-身”问题

 

人工智能在经历了图灵机和计算机的发明,以及早期的神经网络研究之后。虽然已经有了相关理论和实验的创建,但最初的研究者并没有将其定义为“人工智能”,虽然明斯基所提出的神经网络一般计算被他所在的哲学博士委员会怀疑是否应该被看做是数学,但当时大部分人还是将这类学科的研究定性为数学科学的一种。

 

直至1956年,“人工智能”术语终于在学界正式诞生。

 

 

人工智能的作用原理更接近数学,但真正将其命名的却是一位哲学家——约翰·麦卡锡。从普林斯顿大学哲学博士学位毕业后,麦卡锡先是留校任教,后来去了达特茅斯大学。在达特茅斯,他说服了明斯基、克劳德·香农(数学家,信息论创始人,据传是爱迪生的远房亲戚)和内森尼尔·罗切斯特,他们把对神经网络和智能研究感兴趣的研究者召集在一起。

 

麦卡锡给这次“召集活动”的主题命名为“Summer Research Project on Artificial Intellengence”,Artificial Intellengence 即现在AI的全拼,翻译为中文即“人工智能”。

 

除了组织者麦卡锡,这场研讨会还聚集了来自普林斯顿大学的特伦查德·摩尔、来自IBM的阿瑟·萨缪尔、来自MIT的雷·索洛莫洛夫和奥利弗·赛尔弗里纪,还有本次研讨会最引人注目的,来自卡内基技术学院(现卡耐基梅隆大学)的组合,艾伦·纽厄尔和赫伯特·西蒙等人参会。

 

当时在业界已有研究者可以设计出类似西洋跳棋类的特定程序,但纽厄尔和西蒙却创造性的发明了“逻辑理论家”推理程序。西蒙对此声称:“我们发明了一个能非数值地思考的计算机程序,因此解决了古老的‘心-身’问题”。在这次研讨会不久,他们的程序便可以证明罗素和怀特海德的《数学原理》中的定理。

虽然这次研讨会在学术方面并没有新突破,但却对人工智能命名,并从研讨会的提案中说明了为什么人工智能成为一门独立于数学、控制论、运筹学之外的学科是必要的。其一,人工智能从诞生起就采纳了复制人的才能的能力,比如创造性,这种性质是其它任何领域都不具备的;其二,方法论不同,人工智能从所需硬件来说属于计算机科学的分支,而且是唯一试图建造能在复杂、变化的环境中自主运行的机器的领域。

 

发展期(一):过于乐观却因只能解决“玩具问题”进入寒冬

 

基于早期研究,人工智能在发展的最初阶段被寄予了极大期望,达特茅斯会议之后的十几年则被认为是人工智能的“黄金时代”。

 

这一时期,继“逻辑理论家”之后,纽厄尔和西蒙又进一步研发了“通用问题求解器”,用来模仿人类问题的求解方式,GPS成为第一个“像人一样思考”的程序。在IBM,罗切斯特和他的同事制作了一些最初的人工智能程序,赫伯特·格林特则发明了“几何定理证明机”。

 

1958年,从达特茅斯搬到MIT的麦卡锡做出了人工智能发展史上的重要三贡献:1、定义高级语言Lisp,该语言在后来的30年中成为占统治地位的人工智能编程语言;2、和MIT的同仁发明分时技术;3、发表题为《有常识的程序》的论文,文中描述了假想程序“意见接受者”,被认为是第一个完整的人工智能系统。

明斯基也在1958年搬到了MIT,但和麦卡锡不同,他对“程序的有效工作”更感兴趣,并将研究方向定位在“求解时可能需要智能”的有限问题上。因为这些问题只能应用于特定的场景,因而他和学生所研究的领域被称为“微观世界”,其中最著名的便是“积木世界”。

 

除了第一个像人一样思考的工具和第一个假象的完整人工智能系统,这个时期,“推理”和“搜索”成为人工智能的思维研究方向,“暴力计算”则成为这一方向下的主要计算方法,又称为“搜索树”。

 

通过搜索树的方式,计算机可以通过在解决问题的途径上设置节点,并对各个节点进行前后逻辑的持续分析,在不厌其烦的试错下,最后根据指示找到正确的目标。

 

虽然取得不少成绩,但后来发生的事情说明了早期研究者对人工智能的预判还是过于乐观。

 

进入到上世纪60年代后半期,人工智能迎来它诞生以来的第一次“寒冬”。

 

当人类发现“智能”这个东西可以超出自身,在机器上得以实现,这个从“无”到“有”的过程自然让人兴奋。但和语言的产生一样,学会用不同声音指代到语言成为稳定的交流工具,经历了成百上千年的沉淀。事实上,直到今日,语言的逻辑依然没有被完全认知,人与人的交流还是难免产生误会。

 

对于人工智能这个新生事物,误会更加容易产生。

 

通过大量试验发现,无论是逻辑理论家、通用问题求解器,还是几何定理证明机,这些发明都只适用于简单问题的求解,一旦涉及到更难的问题选择时,结果证明都非常失败。

 

以机器翻译为例,准确的翻译需要背景知识来消除歧义,并建立句子内容。人类之所以了解背景知识是在建立在持续学习基础上,但当时的人工智能并不具备主动的自我学习能力。到1966年,机器翻译被最终定性为“尚不存在通用科学文本的机器翻译,近期也不会有。”

 

过于乐观还让当时的研究者得出这样的结论:更大问题的复杂计算只是需要更快的硬件和更大的存储器。这个指导思想是非常错的,事实证明,当需要将证明包含超过数十条事实的推理时,原先的程序原则就失效了。

 

认知和计算两个方面的受挫,导致早期的人工智能难以产业化,除了保留有一些基础研究外,进入到六十年代末,各类研究资助开始大幅缩减,人工智能在科技界几近销声匿迹。

 

发展期(二):成也商业化,败也商业化

 

是什么又让已经“僵死”的人工智能重新焕发生机?

 

要知道,对于人工智能这个烧钱、耗能,且极大消耗人类智慧的新生技术,仅仅能够解决诸如迷宫、积木世界这些“玩具问题”,投入产出比实在不划算。商业化的社会是功利的,再美好的理想,再强大的技术,如果不能落地为产出,就是无用。

 

让人工智能在80年代重获一线生机的是——AI开始形成产业。这一时期,专家系统、视觉系统,以及机器人产业从1980年的几百万美元暴涨至1988年数十亿美元。

 

以专家系统为例,相比早期需要人设定程序模型,它的出现可谓平地起惊雷,打破了人工智能界的一潭死水。简单来说,专家系统可以根据某个领域已有的知识和经验进行推理和判断,最终做出模拟人类专家的决策,从而解决需要人工判断的问题。相比搜索,专家系统的出现让人工智能开始具备决策能力。

 

爱德华·费根鲍姆开发出业界第一个专家系统——DENDRAL

 

第一台成功商用的专家系统R1最开始在数据设备公司(DEC)运转,该程序可以帮助为新计算机系统配置订单,此后四年,该系统为公司节省了4000万美元。

 

但即使开始商用,说人工智能的春天来了还为时尚早,事实上,因为很多公司无法兑现可以达到的承诺,短暂的生机只维持了不到十年便又迅速垮掉了。

 

爆发期:大数据、机器学习和深度学习的未来

 

专家系统为人工智能的发展定下了通过知识进行决策的基调,但这一路径的最大障碍是——知识从哪里获取?这也是为什么八十年代后期专家系统难以升级,最终沦为智能解决某些特殊情景问题的处理机的重要原因。

 

1989年,伯纳斯·李提出万维网的设想,并于第二年开发出世界上第一个网页浏览器。这之后,伴随着年轻一代人成长的互联网骤然兴起,大量的数据搜索和运用终于间接的解决了人工智能所面临的一大难题——知识,或者说数据的积累。

 

得益于互联网,人工智能再一次从寒冬中走了出来。

 

尽管不能从根本上改变自然语言处理所遇到的背景知识瓶颈,但基于互联网带来的海量数据,计算机可以自动从网络中检索出被翻译概率最高的词汇,从而增加了翻译准确率。

 

但仅解决知识储备量还远远不够,九十年代中后期开始盛行的这波人工智能浪潮还通过三次技术突破不断提升着段位。

 

第一次,是从搜索树、知识获取进化到机器学习。事实上,机器学习早在1952年就被IBM的亚瑟·塞缪尔提出,通过研发“会下跳棋的程序”,他给machine learning定义为:一个通过不明确编程使计算机拥有某种能力的研究领域。直到1996年,兰勒将机器学习进一步定义为“在经验学习中改进具体算法的性能”。

 

第二次,为解决机器学习所面临的“特征工程”弱点,杰弗里·希尔顿等人在2006年提出了“深度学习”概念,作为无监督学习的一种,深度学习通过教授计算机进行深度学习,可以解决深层机构优化问题。

 

第三次,2012年的ILSVRC上,多伦多大学开发的Super Vison系统历史性的将图像识别错误率从26%降低到15%,尽管15%的错误率仍然不断低,但在当时,将众多研究者聚在一起,花一年的时间也可能只降低1%错误率。因为该系统采用了深度学习技术,让它成为了深度学习深入到实际应用的重要事件。同年,吴恩达参与领导的Google Brain运用16000个超级计算机训练深度神经网络,最终让计算机成功识别出猫,也成为深度学习与产业结合的轰动事件。

 

在大数据、机器学习和深度学习取得决定性进展后,人工智能终于迎来产业化的春天,如今,人工智能在上、中、下各个产业链上全面开花,不仅在软硬件的算法层不断提升,在应用技术上,视觉、语音也是独角兽的盛产之地,终端应用上,智能驾驶、智能语音、智慧医疗、智慧金融、智能机器人……都成为了人们畅想未来的明日之光。

 

后记

 

本期内容比较多,最后做一个简单的梳理。

 

发现期:图灵被称为“人工智能之父”源自在1936年发明图灵机;

 

孕育期:沃伦·麦卡洛克和沃尔特·皮兹通过对“神经网络”的早期奠基引领了人工智能的黎明浪潮;

 

命名期:给“人工智能”起名字的不是科学家,而是哲学家麦卡锡;

 

发展期:人工智能的发展并不顺利,经历了两落三起;

 

爆发期:未来人工智能将沿着大数据,机器学习和深度学习路径实现产业落地。

 

下期预告:上游核心技术 | 产业图谱系列三


欢迎加入“AI大爆炸”群组,一起探秘AI!


也可以撩撩群主~

长此以往,我们就是朋友了!




我是广告:芯师爷重金约稿,等你来撩!

好文请投:tougao@gsi24.com

往 期 精 选 


— 完 —

About Us 关于我们 客户服务 联系方式 器件索引 网站地图 最新更新 手机版

站点相关: TI培训

北京市海淀区知春路23号集成电路设计园量子银座1305 电话:(010)82350740 邮编:100191

电子工程世界版权所有 京ICP证060456号 京ICP备10001474号 电信业务审批[2006]字第258号函 京公海网安备110108001534 Copyright © 2005-2018 EEWORLD.com.cn, Inc. All rights reserved