百度提出交互式学习方法:让机器在对话中学会自然语言

2017-06-11 13:34:06编辑:王磊 关键字:机器学习  百度

自然语言处理一直是人工智能发展道路上面临的巨大挑战。此前,大多数研究都是让机器学习模型在大量已标记数据集上进行训练的。最近,百度研究院人员提出了一种全新的方法,研究人员让人工智能系统通过与「教师」的口语对话来学习自然语言和知识。这种类似婴儿学习语言过程的方法展现出了很大的潜力。机器之心对该文及其研究论文摘要进行了编译,原文链接见文末。


四月上旬,百度研究团队通过由虚拟教师(a virtual teacher)发出自然语言指令,成功地教会了人工智能代理(agent)在迷宫中导航(参阅:用自然语言教育人工智能:百度新算法发展出 zero-shot 学习能力)。今天,百度研究团队又很高兴地宣布,通过与虚拟老师之间的交互,其人工智能代理成功地学会了说话。


说话,以及其他人类基本能力,在创建通用人工智能的道路上不可或缺。尽管今天与机器进行简单的交谈很常见,但是百度研究团队教机器说话的方法与传统方法大不相同。


百度的人工智能代理以一种类似于婴儿互动的方式学习说话。相反,传统方法依赖于有监督训练,使用包含大量预搜集训练集的静态语料库,难以捕捉到语言学习过程中的动态交互属性。结果,通过传统方法训练的系统主要反映了数据集中的行为,适应性和泛化能力有限。百度的人工智能代理通过交互学习说话,旨在获取语言学习与理解能力而不仅仅是捕捉到数据之中的统计模式。


当一个婴儿学习说话时,他与人产生交互,并通过模仿和反馈进行学习。婴儿最初通过模仿其会话者来产生言语行为,掌握字句生成的技巧。婴儿也会向其父母发出声音,并根据父母的纠正和鼓励调节其言语行为。


研究概述


百度研究人员提出了一种基于自然语言学习的交互式方法,其中人工智能代理通过与虚拟教师(教授者)交互、获得反馈来学习自然语言,从而学习和提高自然语言技能以达到参与对话的程度。在这里,没有带标签数据形式的监督学习来引导学习者;取而代之的是,系统必须通过不断尝试说来学习说话,而教授者会提供口头反馈(如是/否)和非口头反馈(如点头/微笑)。


下图显示了训练中几种不同形式的对话。在一开始,代理只能生成无意义的句子,它只能在纯粹对话中提升自己的技能。而到了最后,代理可以正确运用自然语言回答教授者提出的问题。


另一方面的实验进一步证明了新方法具备学习自然语言的能力。研究人员证明训练后的人工智能代理可以回答由已知知识或问题中的概念组成,但经过重组后形成的全新问题。例如,在训练中,「avocado,east」组合从未出现在问答中;而 orange 仅被描述过,从未被教授者问到过。而在测试中,代理可以回答有关在「east」的「avocado」的问题,或有关「orange」的问题。


百度的研究人员表示,他们会在未来进一步增加语言学习环境的复杂性,以训练出更为复杂的语言行为。另外,他们还计划探索机器学习系统的知识建模与快速学习,让人工智能代理能够与人类进行自然交互,并让它可以从物理世界中进行有效的学习。


论文:Listen, Interact and Talk: Learning to Speak via InteracTIon


摘要:人工智能的一个长期目标是构建一种可与人类进行自然语言交互的代理。然而,目前的大部分自然语言学习的研究都依赖大量带注释标签的数据集以进行训练,这导致人工智能代理的任务变成了外部数据集的统计学抓取。由于训练数据本质上是由标注者对知识进行的静态表述,人工智能代理经过学习后的适应性和拓展性受到了限制。此外,这种训练方法与人类学习自然语言的过程非常不同,后者是一个交流的过程,通过说话和获得反馈来进行。


在本论文中,我们提出了一种交互形式的自然语言学习方法。其中,人工智能代理通过与教授者(teacher)用自然语言互相交流,从而在谈话中学习和提高语言技能。为了达成这个目标,我们构建了一个包含模仿和强化学习方法的模型,用以比较句子和教授者的反馈。我们进行了实验,证明了这种方法的有效性。

关键字:机器学习  百度

来源: EEWORLD 引用地址:http://www.eeworld.com.cn/afdz/article_2017061110746.html
本网站转载的所有的文章、图片、音频视频文件等资料的版权归版权所有人所有,本站采用的非本站原创文章及图片等内容无法一一联系确认版权者。如果本网所选内容的文章作者及编辑认为其作品不宜公开自由传播,或不应无偿使用,请及时通过电子邮件或电话通知我们,以迅速采取适当措施,避免给双方造成不必要的经济损失。

上一篇:高考AI智能机器人比拼:10分钟完成数学答卷
下一篇:CES Asia汽车黑科技齐亮相,自动驾驶离我们还有多远

关注eeworld公众号 快捷获取更多信息
关注eeworld公众号
快捷获取更多信息
关注eeworld服务号 享受更多官方福利
关注eeworld服务号
享受更多官方福利

推荐阅读

蹭着电影的热度,看看AI医疗是怎么回事?

价格高昂的正版药,让患者们退无可退。不容否认,一种新药,尤其是“特效药“的研发,需要过亿的研发成本和研发周期,其能够面市,已经是诸多患者的“福音”。然而,面对高昂的售价,如何给“特效药”及疾病治疗“降降温”,AI也许能够一步步成为你的“药神”。第一步:AI预测白血病,让白血病不再成为“突然之灾”近期,《自然》上发表了一项研究成果——由全国多家科研机构白血病科学家组成的研究小组使用血液检测和机器学习,以达到预测健康个体是否有患急性骨髓性白血病(AML)的风险。这意味着我们今后对AML的出现有预警,并能够提早发现AML的高风险人群并进行监测,同时可以进行研发,寻找降低该疾病患病几率的方案。AML名为“急性骨髓性白血病”,以骨髓与外周血
发表于 2018-07-18 17:03:05
蹭着电影的热度,看看AI医疗是怎么回事?

人工智能会替代多少人力劳动?

大量的数据训练,这也是为什么在互联网大数据的时代,AI可以崛起。而在数据训练之前,又必须先对大量的数据进行标注,作为机器学习的先导经验。 因此,催生了大量数据标注员的产生。 简单的说,数据标注员类似于AI的老师,举个形象的例子,我们要教机器认识一个苹果,你直接给它一张苹果的图片,它是完全不理解的。我们得先有苹果的图片,然后在上面标注着“苹果”两个字,机器通过学习了大量的图片中的特征,这时候再给它任意一张苹果的图片,它就能认出来了。 据了解,目前标注员的工作内容常见的有拉框标点、打标签、分割、批注等等。其中分类就是最常见的打标签,比如标注画面上动物毛发颜色、动物耳朵等等;框选是将画面中相对应的对象标框标注
发表于 2018-07-16 19:01:26

2018年安防技术发展趋势

作伙伴增加价值。  3、深度学习与机器学习  目前我们已开始实现深度学习和机器学习架构的所有优势:拥有海量的数据可供分析;拥有强大的处理能力,能够在合理的时间范围内完成分析;拥有先进的算法以及大量案例可供借鉴。当某些非凡的深度学习应用与图像解读、语音识别和决策支持互相关联时,安防领域的分析潜力便不言而喻。  在相对较基础的层面上,深度学习应用将可改善视频运动检测、人脸识别、个体追踪和误报控制,能有助于系统的设计、配置、优化和设备管理。此外,预测分析也将迎来前所未有的机遇,最终能够预防各种事件的发生,包括恐怖攻击、滑倒与坠落事故、交通问题和入店行窃等。  4、个性化与隐私  提供高度个性化的服务是深度学习的潜在应用之一。设想在某个零售
发表于 2018-07-05 20:34:37

Arm机器学习处理器IP参数公布,将首先用在移动市场中

近日,在Arm Tech Day 2019上,Arm杰出工程师及机器学习事业部技术总监Ian Bratt介绍了Arm在机器学习及人工智能领域目前所做的工作和进展,Arm针对人工智能领域的Project Trillium项目,这是一套包括新的高度可扩展处理器的Arm IP组合,包括全新的ML处理器IP以及OD视觉处理器,以及一系列配套的软件体系。Ian给出第一代机器学习处理器指标,在7nm下效率为3 TOP/W,吞吐量为4.6 TOP/s,有针对激活和权重的硬件压缩,利用Cortex-M技术支持安卓NN和Arm NN,预计2018年中期交付客户。Ian表示,“机器学习和人工智能是颠覆性的技术,应用场景多种多样,因此对Arm
发表于 2018-06-29 15:58:41
Arm机器学习处理器IP参数公布,将首先用在移动市场中

Mali-G76处理器提升机器学习性能,适合高清手游和VR应用

近日,在Arm Tech Day 2019上,Arm资深产品经理Espen φybφ详细讲述了Mali的发展路径,以及最新Mali-G76处理器的强劲性能。Espen表示,目前推动GPU发展的趋势主要有三大类,包括高清手游、AR/VR以及对象识别/机器学习。如图所示,目前Bifrost架构是Arm的第三代GPU架构,在此架构上,Arm推出了多款中高端显卡。而针对各细分领域的客户需求,Arm有着丰富的处理器组合Mali-G76性能提升根据Arm给出的数据,Mali-G76性能比相同工艺,相同优化程度下的Mali-G72提升了30%,能效也提升了30%,同时机器学习性能有了较大飞跃,相当于G72的2.7倍。G76的架构和G72看上
发表于 2018-06-29 15:48:58
Mali-G76处理器提升机器学习性能,适合高清手游和VR应用

人工智能正在进入制造领域

人工智能技术正在进入制造领域,其核心机器学习技术和模式识别软件可能成为不久将来工厂改造的关键。 尽管人工智能有望从根本上改变很多行业,但该技术非常适合制造业,深度学习Google Brain项目的创始人兼斯坦福大学计算机科学兼职教授Andrew Ng说。 “AI将执行制造、质量控制、缩短设计时间、减少材料浪费、提高生产再利用率,执行预测性维护等等,”Ng说。  他说,人工智能这个术语今天被用作软件的一部分,它可以训练自己执行某些任务并随着时间的推移逐渐完成这些任务。 例如,AI是在照片中识别朋友脸部软件的后面。这些系统最终会在面部识别方面变得更好,因为您可以通过继续标记和识别
发表于 2018-06-07 19:43:38
人工智能正在进入制造领域

小广播

About Us 关于我们 客户服务 联系方式 器件索引 网站地图 最新更新 手机版

站点相关: 视频监控 智能卡 防盗报警 智能管理 处理器 传感器 其他技术 综合资讯 安防论坛

北京市海淀区知春路23号集成电路设计园量子银座1305 电话:(010)82350740 邮编:100191

电子工程世界版权所有 京ICP证060456号 京ICP备10001474号 电信业务审批[2006]字第258号函 京公海网安备110108001534 Copyright © 2005-2018 EEWORLD.com.cn, Inc. All rights reserved