历史上的今天

今天是:2025年03月26日(星期三)

正在发生

2018年03月26日 | 对抗性神经网络凭啥入选MIT2018十大突破性技术

发布者:火星 来源: 智造大视野作者: Lemontree 手机看文章 扫描二维码
随时随地手机看文章

日前,《麻省理工科技评论》刊文评出了2018年十大突破性技术,“对抗性神经网络”(GAN)赫然在列。

什么是对抗性神经网络?为什么它能入选MIT十大突破性技术?它的发展脉络如何?与我们此前耳熟能详的神经网络有什么区别?能够应用在人工智能的哪些场景?还有哪些关键问题有待攻克?

中国自动化学会混合智能专委会副主任、中国人工智能学会机器学习专委会常委、复旦大学博士生导师张军平教授在接受科技日报记者采访时做了深入浅出的解释。

故事中的GAN幻影

张军平告诉记者,虽然GAN是科技领域的“新贵”,但其实在很久以前的中外小说中就能看到这个想法的影子。

这个想法最早可以追溯到奥地利小说家斯蒂芬·茨威格写于1941年的小说《象棋的故事》。

在该小说中,主人公B博士被长期囚禁在纳粹集中营中。在想尽了各种摆脱空虚和孤独的办法却徒劳无功后,B博士意外得到了一本国际象棋棋谱。

他背完书里的上千棋谱后,用送来的面包做了副国际象棋,开始自己跟自己下棋,最终演变成一盘接一盘的相互疯狂挑战,这令他棋力大涨。出狱后,在一艘游艇上,他居然轻松地在首盘就击败当时的世界冠军。

在中文小说里也有类似的影子,它出现在金庸写于1957年的武侠小说《射雕英雄传》中。

王重阳的师弟周伯通被东邪“黄药师”困在桃花岛的地洞里。为了打发时间,周伯通就用左手与右手打架,自娱自乐。其武功决窍在于要先“左手画圆、右手画方”,分心二用,保证可以同时使出两种武功,从而使得武力倍增。

这两部小说主人公功力大增的关键都是“自己跟自己决斗,试图倾尽全力击败对方”,而结果都是练成后,去跟高手过招时能轻松秒杀对手。用一句俗话来解释,叫“双拳难敌四手”。

让机器学会“左右互搏”

GAN网络的原理本质上就是这两篇小说中主人公练功的人工智能或机器学习版本。

一个网络中有两个角色,修炼的过程中左手扮演攻方,即生成器(generator),试图生成和自然世界中拟完成任务足够相似的目标;右手扮演守方,即判别器(discriminator),试图把这个假的、生成的目标和真实目标区分开来。经过反复多次双手互搏,左手右手的功力都会倍增,从而达到“舍我其谁”的目标。

明白这个道理,就不难明白为什么GAN网络一出,就有独孤求败的感觉了。

正是因为GAN网络的机理是“双手互搏、一心两用”,所以,虽然最初的应用场景是针对图像相关任务,但其机理是普适性的。只要能用这个“诀窍”的地方,都能把自己的功力提升一个档次。不过,需要注意的是,GAN只把双手互搏用来训练自己“双手”的功力。在多数实际应用中,它只用了自己千锤百炼出来的生成器,就得到了非常好的结果。

于是,自2014年GAN网络被Ian J. Goodfellow等人提出,至今其演绎出的各种版本就像攻城掠地般在各个领域蔓延。

在今年的人工智能顶级会议IJCAI、机器学习顶级会议ICML和NIPS、深度学习著名会议ICLR上,光读参会论文的标题,就能发现大量GAN网络的工作痕迹。图像处理计算机视觉、自然语言处理、语音识别、智能驾驶、安全监控……似乎GAN已经无所不能了。

张军平用几个比较火的人工智能应用场景举例——

在年龄估计中,GAN能通过攻守互搏,基于给定的人脸图像实现对其人衰老或年轻时的样貌生成。

在多视角人脸识别、跨视角步态识别领域,采用类似的机理,实现对人脸角度和步态角度的自动旋转,从而有效提高了多视角、跨视角人脸和步态识别的精度。

在自动驾驶领域,需要对智能汽车进行复杂环境下的虚拟训练。此时,就可以利用GAN来实现与实际交通场景分布一致的图像生成。具体来说,可以先给GAN输入一张随机噪声图像,通过其生成器来最小化与真实场景接近的图像,同时判别器最大化生成场景与真实场景间的差异。经过反复迭代的攻守博弈,从而获得与真实环境一致的交通场景。

“不光在应用领域上有了突破,互搏的方式也有了不少变化。既然可以双手互搏,那当然可以三手甚至更多手的互搏,也可以组团逐对互搏、成串互搏,诸如此类。还可以把圆和方换成其他东西或者所谓的函数或结构来互搏。但万变不离其宗,内在的机理是不变的。”张军平补充道。

GAN有什么“软肋”

“毫无疑问,这种可倍增‘功力’的技术入选MIT年度十大突破性技术是当之无愧的。但值得注意的是,这一技术仍然有较大需要改善的空间。”作为《IEEE Intelligent System》(智能系统)和《IEEE Transactions on Intelligent Transportation Systems 》(智能交通系统)等著名期刊的编委,张军平对GAN的“软肋”了如指掌——

首先,对抗不好是容易出问题的。比如那位B博士。国棋象棋的世界冠军在觉察到他的强烈焦躁与急切情绪后,就有意识地放慢下棋速度。结果诱发了B博士的精神分裂,使得他再次陷入狂乱的自我对弈之中,最终才幡然醒悟而告别了棋局。对抗网也是如此,稳定性一直是其存在的问题之一。尽管理论上Wasserstein GAN (WGAN)可以部分解决其收敛性问题,但实际的效果还没有达到尽人意的地步。

其次,枪打出头鸟,既然这项技术这么牛了,过来挑战的也不少。据不完全报告,似乎已经有十五波“武林高手”对GAN网络的抗击打能力进行了挑战。极端情况,在图像中加一个像素就可能使GAN网络产生误判。

第三,GAN网络也是深度网络的一种,在可解释性这条路上,仍然没有找到非常明确的方向。

最后,双手互搏的基础还是手。而这一基础的结构并没有从近几十年来人工智能发展的框架中脱离出来。

因此,张军平提醒,期望以GAN之奇技,从弱人工智能冲击“能真正推理和解决问题,且有知觉、有自主意识的”的强人工智能还遥遥无期。

来源:科技日报 作者:房琳琳

引用地址:对抗性神经网络凭啥入选MIT2018十大突破性技术

上一篇:专家:人工智能将开启“智慧教育”新模式
下一篇:我国成功研发智能辅助驾驶系统

推荐阅读

外媒日前撰文指出,美国政客可能连“华为”(Huawei)怎么读都不会,但他们却非常确信这家中国最大的科技公司实实在在的威胁到了其国家安全。事实上,美国政客们真正担心的是美国在5G大战中会输给中国。以下为腾讯科技(微信号ID:qqtech)编译的文章内容摘要:继发推文声称“贸易战是好的,且很容易赢得胜利”之后,美国总统特朗普在3月12日颁布行政命令...
当全国大学生电子设计竞赛面向的学科和专业越来越广泛,命题方向更多关注业界新应用和新技术,参赛同学越来越多特别是低年级学生的参与更加积极,这也给产业界和学校提出了更多需求,包括参赛学生培训、最新的仪器、新技术开放平台等等。泰克作为2019电赛的协办方,为参赛者提供数百台先进仪器设备,为学生设计测试提供强有力的支持,协助学生队伍设计出优...
据英国广播公司(BBC)24日报道,位于英国什罗普郡的哈珀?亚当斯大学 (Harper Adams University) 正在与科学家共同合作,制定无人机技术抗击新冠肺炎病毒的解决方案。该大学多年来致力于无人机农业应用的前沿研究,探索如何使用无人机高效安全地喷洒农作物。正值英国应对新冠肺炎疫情的关键时期,哈珀?亚当斯大学希望将无人机精准喷洒技术应用于消杀...
对于曾经操作过示波器的人而言,几乎每个人都使用过一两次示波器探头。有些人的使用体验很好,而有些人的感受却不尽如人意,而这可能是他们自身操作的结果。本文将试图澄清有关示波器探头的一些误解和半真半假之言,让用户获得更良好的结果。相关阅读:误解1. 100 MHz 的“信号”,使用 100 MHz 的示波器探头。示波器探头带宽与配合它们使用的示波器...

史海拾趣

问答坊 | AI 解惑

基于DSP控制的全数字UPS逆变器设计

1 引言     随着信息处理技术的不断发展,尤其是计算机的广泛应用和Internet的迅猛发展,供电系统的可靠性要求越来越高,因此对不间断电源(UPS)技术指标的要求也越来越高。UPS的核心部分是一个恒频恒压逆变器,由于传统模拟控制需要使 ...…

查看全部问答∨

《求助》dsPIC33FJ128 串口设置问题

各位好,最近想用dsPIC33FJ128GP802或MC802 SDIP28封装的,做一个交流电压测量的东西,初学,想请教一个比较低级的问题: 我查看了数据手册,看到这两款芯片都有UART和SPI,但是怎么在管脚图上没找到是哪个脚呢?是需要配置RPx管脚来复用吗? 请 ...…

查看全部问答∨

如何查看一块板子的地址映射

如题,我现在需要查看两块开发板(其CPU相同)的地址映射,请问如何查看?谢谢!…

查看全部问答∨

双向出发二级管

双向出发二级管如型号为:2CTS或PDA30~PDA60,可用现在的哪种双向出发二级管代替呀?…

查看全部问答∨

LM3开发笔记_4.串口和printf实现

LM3S8962有2个UART 模块。每个 UART 都具有以下特性:           独立的发送 FIFO和接收 FIFO(First-In First-Out,先进先出);         FIFO长度 ...…

查看全部问答∨

单片机秒表和数字钟的实现

非常好的资料_秒表时钟程序_c语言_51单片机_ 基于单片机的数字钟设计与实现…

查看全部问答∨

51单片机及其C语言程序开发实例 --51入门进阶佳品

看了几本介绍51c语言的书, 《51单片机及其C语言程序开发实例 戴仙金主编》这本算是里面比较好的,其中外围电路介绍的比较多也比较详细,很适合51入门,程序模块化易于移植,根据实际电路适当修改即可使用,适合项目开发,唯一不足的就是电路是pdf ...…

查看全部问答∨

基于cortex-A8的3D动感游戏机

看了很多人的项目,发现大家都是用这块板子做控制功能,其实只是做控制操作外围设备的话用9B96或cortex-M4足够了。这块开发板最大的优势就在于主频高,可以支持OPENGL,所以就有了做本项目的想法。如果时间允许的话,还可以把项目扩展成为联网的。 ...…

查看全部问答∨

求MBUS集中器设计方案

求MBUS集中器设计方案?  面议QQ455371934…

查看全部问答∨

LaunchPad 之pwm波形的输出

之前也做过一些LaunchPad的程序,现在是重新开始玩LaunchPad。 void pwm1(void) {     P1SEL |= BIT2;     P1DIR |= BIT2;     CCTL1 = OUTMOD_3;              ...…

查看全部问答∨
小广播
最新机器人文章
厂商技术中心

 
EEWorld订阅号

 
EEWorld服务号

 
汽车开发圈

 
机器人开发圈

About Us 关于我们 客户服务 联系方式 器件索引 网站地图 最新更新 手机版

站点相关:

词云: 1 2 3 4 5 6 7 8 9 10

北京市海淀区中关村大街18号B座15层1530室 电话:(010)82350740 邮编:100190

电子工程世界版权所有 京ICP证060456号 京ICP备10001474号-1 电信业务审批[2006]字第258号函 京公网安备 11010802033920号 Copyright © 2005-2026 EEWORLD.com.cn, Inc. All rights reserved