datasheet

只闻其声也能“看透”你,来自“声音画像师”的秘密

2019-04-22来源: 机器之心关键字:AI  NUANCE

你感到抑郁吗?会在开车时打瞌睡吗?有被骗保经历吗?有心脏病隐患吗?AI 或许能够过倾听你的声音来解决这些问题。

人类的声音中蕴藏着比我们想象中还要丰富的信息,你的年龄、身高、体重、精神、情绪、甚至情感、气质、进取心、创造力……与此同时,声音似乎比图像更加安全可控。

基于 AI 算法与声音分析学的融合,「声音画像师」正在帮助医院可以提早发现神疾病及身体疾病,让呼叫中心进行个性化营销,为公司筛选出更为合适的求职者……

日益强大的机器学习方法,使一切变得皆有可能。

AI 系统可以测量音调、节奏及其他语音特征,并将其与存储的语音模式,包括快乐、悲伤、疯狂及其他情绪进行比较。

虽然声音分析学已经发展了几十年,但成本更低廉的计算力与新一代的 AI 工具,如谷歌的 TensorFlow,才使那些雄心勃勃的项目成为可能。

在情感 AI 或情感计算领域,该技术与计算机视觉结合后,功能将变得愈加强大。例如,车载语音系统可判断驾驶员是否哈欠不断,视觉系统则能判断驾驶员是否在打瞌睡。

咨询公司 Gartner 认为,情感 AI 甚至可能进入消费品市场,Gartner 预测,到 2022 年,10% 的个人设备(目前这一比例少于 1%)将具备情感 AI 功能,如监测个人精神状态的可穿戴设备,和基于玩家情绪自动调整的视频游戏。

但在情感 AI 成为主流之前,必须先克服一个巨大的阻碍:人们的不适应情绪。Gartner 在去年发布的一份调查报告指出,来自美国和英国的 4000 多名受访者中,有 52% 的人表示不希望 AI 分析自己的面部表情,63% 的人表示不希望 AI 为了解她/他们而经常「入侵」其工作与生活。

此外,消费者还特别关心自身隐私,约有 65% 的人坚信,AI 会侵犯其隐私。

Gartner 分析师 Annette Zimmermann 撰写了关于情感 AI 的报告,她表示:「人们普遍不相信 AI。至于大家对 AI 的感受,我认为这是仁者见仁、智者见智的问题,但的确有许多理由令人生疑。」

Zimmermann 表示,系统都不完美,最佳系统的精确率也不超过 85%。

CMU(Carnegie Mellon University,美国卡耐基梅隆大学)语音学家 Rita Singh 说,「这不完全正确。而且我们也不知道系统何时才能变得精确。但是,快了。」

带着上述防止误解的说明,我们来了解下 AI 语音分析技术已经影响以及即将颠覆的领域。

01 医学领域:疾病监控师

2017 年,根据美国国家精神卫生研究所的数据,2017 年,全美有五分之一的人(约 4660 万)饱受精神疾病的困扰。据估计,接受治疗的人仅占需要接受治疗的人数的一半,而新兴的语音技术可能使该问题更容易被发现。

2018 年底,从行为分析公司 Cogito 衍生出的 CompanionMx 公司发布了一款名为 Companion 的移动心理健康监测系统。该系统由美国国防高级研究计划局、美国退伍军人事务部及美国国家精神卫生研究所资助研发。

正接受抑郁症、双相情感障碍和其他疾病治疗的患者,可通过 Companion 下载一个 APP,在智能手机上创建音频日志。系统要求患者定期描述个人感受,并将信息自动传输到 AI 模块进行分析。

运用 Cogito 研发的情感 AI 技术,CompanionMX 可以分析患者的音频及某些行为数据,以了解其情感、情绪或行为的变化。譬如,CompanionMX 通过监测智能手机活动,看患者是否减少与外界的联系。如果护理人员看到有问题的迹象,他们会主动联系患者。

美国国家精神卫生研究所资助了一项关于该 APP 的研究项目,自 2015 年 5 月至 2017 年 8 月。

「研究结果十分令人鼓舞。」项目联合首席研究员、布莱根妇女医院 (Brigham and Women's Hospital) 与哈佛医学院数字行为健康与信息学研究项目负责人 David Ahern 说。

Ahern 表示,这款 APP 可以作为护理人员的早期监测系统。因为多数需要治疗的患者直到病情严重才会寻求治疗,所以,此款 APP 是一个非常必要的工具。

根据疾病控制和预防中心 (Centers for disease Control and Prevention) 的数据,全美每年有 60 多万人死于心脏病。研究人员正尝试使用语音 AI 发现警告信号,帮助人们快速获得治疗。

梅奥诊所进行了一项为期两年的研究项目(2017 年 2 月结束),旨在验证语音分析是否能够检测出冠心病。梅奥医学中心心血管研究中心主任 Amir Lerman 解释说,每个人的声音频率不尽相同,它们可以被分析。

梅奥与语音 AI 公司 Beyond Verbal 合作,采用机器学习识别冠心病的语音生物特征判定标识,而后,在计划进行血管造影的患者人群中展开测试。

所有研究参与者都在手机 APP 上录制了自己的声音,而后,Beyond Verbal 对这些声音进行了分析。研究发现:在血管造影上有冠心病病症的患者也有该疾病的语音生物特征判定标识。

Lerman 博士表示,梅奥希望在不久的将来部署这项技术。「我认为这是一个令人惊叹的新领域,为我们如何治疗患者打开了新的大门。」他说。

02 智能驾驶:评估驾驶员精神状态

根据国家公路交通安全管理局 2017 年 10 月的统计数据,在 2015 年,有 800 多名美国人因为疲劳驾驶而丧生,超过 3 万人在司机疲劳驾驶导致的撞车事故中受伤。

现如今,许多大型汽车公司与 AI 公司正在设计一种 AI,运用语音分析与面部识别技术评估驾驶员的警觉性及情绪状态。

你能看出我生气了吗?

声谱图可用于分析说话人的声音特征。谐波(深色平行线)表示说话人音调和语调的变化。

高情绪活动

线条的剧烈运动反应了语调的快速变化。在较高频率下,线条颜色越深,其代表语音质量越高。

低情绪活动

声音更柔和、平静,谐波的强度要小的多,特别是在高频率下。

请输入图片描述

去年的消费电子展(CES)上,丰田发布了一款概念车 Concept-i,它可以识别面部表情及语音声调。该车在转向柱上安装了一个红外摄像头,在仪表盘上安装了一对 3D 传感器,还搭载了语音识别与对话系统。

系统协同工作,以评估驾驶员的状态。例如,头部下垂、弯腰驼背的姿势、困倦或低沉的声音(或者打呵欠的声音)都表示驾驶人员处于疲惫状态。如果系统注意到驾驶人的疲惫状态,会迅速做出反应。

例如,车载语音助手可以与驾驶员进行对话,提高其警觉级别。并且,随着时间点的推移,对话系统会知道哪些话题最可能吸引驾驶员的注意。

去年 9 月,两家 AI 公司──Affectiva 与 Nuance Communications 表示,他们将携手合作,把情感智能融入 Nuance 的对话型汽车助手中,理解并回应驾驶员需求。

Nuance 声称,目前在奥迪、宝马、戴姆勒、菲亚特、福特、通用、现代和丰田等 2 亿多辆汽车上都可以找到这款名为 Dragon Drive 的对话型汽车助手。

该项由 lovetiva 和 Nuance 公司研发的新技术将使用摄像头来检测面部表情(如微笑),采用麦克风识别声音情绪(如愤怒)。他们的算法采用深度学习、计算机视觉与语音技术,来识别情绪和疲惫的特征指标。

如果驾驶人员已显露疲态,语音助手可通过一些简单的话语提示驾驶员,如「你看起来很疲倦,你想停车休息一下吗?」

目前,上述技术仍处于研发阶段,但是据 Nuance CEO Joe Petro 透露,这些技术或将于几年内正式投入使用。

03 智能营销:个性化的呼叫中心

房地产咨询服务商 Site Selection Group 的数据显示,尽管许多公司将客服业务转移到了海外,但全美仍有 7400 座呼叫中心雇佣了 300 多万名员工。

包括哈门那(Humana,美国大的医疗保险公司)、美国大都会人寿保险公司(MetLife)在内的许多公司,已经部署 Cogito 的 AI 软件,以此来保持保险经纪人的敏锐度及客户满意度。

该系统分析保险经纪人与客户之间的对话,实时跟踪其交互方式。

当呼叫中心接到电话后,会将其流处理至 Cogito 的系统,该系统可评估成百上千个数据点,包括语速、音调等。如果保险经纪人在回答问题前停顿,那可能表明其分心了。如果顾客提高嗓门,这可能是一种沮丧的迹象。

当 Cogito 的系统检测到呼叫过程中可能出现问题时,它将以图标或短信息的形式推送通知到员工的屏幕上,帮助保险经纪人识别、了解客户的情绪。

Cogito CEO Joshua Feast 表示,该系统的主要目标是训练保险经纪人,让她/他们更自信、更投入,更有同情心,「学会与各式各样的客户交谈是一项真正的技能,并非与生俱来,必须后天习得。」

Cogito 表示,其呼叫中心产品的准确性因各类使用场景(如客户服务中心、销售部或理赔管理部)和在各领域中的监控行为而异。

总体上,Cogito 称,该产品的平均准确率为 82%。该公司表示,他们通过人工评审呼叫效果、客户反馈及机器学习分析来验证结果。

大都会保险全球客户解决方案负责人 Kristine Poznanski 表示,大约 15 个月前,大都会在其客户服务中心部署了 Cogito 的系统。

该系统除了为客户服务代表提供呼叫即时反馈及实时指导,还能向经理展示呼叫实时状态。呼叫中心经理可通过数据监控正在进行的呼叫,或者在呼叫结束后与保险经纪人一起复盘呼叫过程。

Poznanski 说道,自从部署该系

[1] [2]

关键字:AI  NUANCE

编辑:鲁迪 引用地址:http://www.eeworld.com.cn/szds/ic459349.html
本网站转载的所有的文章、图片、音频视频文件等资料的版权归版权所有人所有,本站采用的非本站原创文章及图片等内容无法一一联系确认版权者。如果本网所选内容的文章作者及编辑认为其作品不宜公开自由传播,或不应无偿使用,请及时通过电子邮件或电话通知我们,以迅速采取适当措施,避免给双方造成不必要的经济损失。

上一篇:韩国用设计AR/VR超薄显示器,投影动态、多色3D全息图像
下一篇:Facebook研发新AI模型,动态人物视频也能造假

关注eeworld公众号 快捷获取更多信息
关注eeworld公众号
快捷获取更多信息
关注eeworld服务号 享受更多官方福利
关注eeworld服务号
享受更多官方福利

推荐阅读

一文看懂ADI在汽车电子领域的布局

随着物联网、5G、人工智能等技术的发展,传统的汽车产业正快速的转向智能化、网联化、电动化。因此也涌现出了一大批的新能源汽车、智能汽车初创企业,比如蔚来汽车、小鹏汽车、威马等等企业。与此同时,大众、宝马、通用等众多的传统车企也开始快速跟进。汽车市场对于半导体的需求也是越来越大,半导体在整车成本当中的占比也是越来越高。数据显示,2017年全球汽车电子市场规模达到了1435.4亿美元,同比增长9.5%,预计未来5年将保持8.2%的年平均复合增长率。随着汽车电子市场的增长,2017年全球汽车半导体市场的规模也已超过了360亿美元。近年来都保持在9%左右的增长速度。到2025年每辆智能汽车当中的电子元器件成本占比将达到整车成本的40%,到20
发表于 2019-05-20
一文看懂ADI在汽车电子领域的布局

Xnor发布AI平台的AI2Go

Xnor.ai今天发布了AI2Go,这是一个为开发人员和制造商提供的平台,可以为设备上的人工智能优化预先构建的AI模型。AI2Go是为相机、无人机和传感器等设备中最先进的边缘计算而设计的。该平台提供了数百款专门为智能家居、安全、汽车、娱乐和监控设备设计的机型。该服务的构建是为了消除在尝试为边缘用例(如延迟、功耗或有限的可用内存)制作人工智能时可能出现的问题。只需几次单击和几行代码就可以创建模型,并调整设置来管理内存使用等问题。模型还为各种用例定制,并注入了推理引擎。Xnor首席执行官Ali Farhadi在接受VentureBeat电话采访时表示:“有了zero版本,人们可以指定这些约束条件,然后获得一个模型并下载下来。所有这些
发表于 2019-05-17

广达林百里:AI路很广 也很崎岖

广达董事长林百里表示,现在全球AI战争打得非常大,包括美国、法国、英国、德国等,每个国家都有他的AI产业计划,但关键是AI的应用,这是很大的题目,换言之,AI的路很宽广,但是也很崎岖。       林百里16日应邀出席台湾计算云启动年会,并以「AI产业革命的新竞赛:赛局、冲击、转型」为题,进行专题演讲。       林百里说,广达是做硬件的,所以AI这场仗不是广达来打的,不过广达对这场AI仗要怎么打,也是有点观察心得。       林百里指出,其实AI已经有数十年的历史了,这中间也历经了2次衰退,有人说,这是AI
发表于 2019-05-17

NVIDIA和伦敦国王学院携手打造AI 平台

英伟达(NVIDIA) 与伦敦国王学院携手为英国 NHS 医院打造首个 AI 平台为增进效率与资料隐私,NVIDIA DGX-2 AI系统为当地医院 AI 医疗影像的创建、导入与部署提供联合学习基础设施。        英伟达(NVIDIA)人工智能(AI)平台布局医疗领域又有新进展,15日宣布与伦敦国王学院 (King’s College London) 携手打造AI 平台,用以简化与加速复杂放射科医疗流程,此应用计划使英国 NHS (National Health Service)体系专科医师,能通过训练计算机自动执行放射科影像作业中最耗时的判读程序。   
发表于 2019-05-16

IBM合作大众等公司 混合云计算和AI技术完成数字化转型

据外媒报道,当地时间5月14日,IBM公司宣布与欧洲汽车行业三大公司 – 德国大众(Volkswagen)公司、德国Moovster公司以及荷兰Vinturas公司合作,混合云计算和人工智能(AI)技术重新定义汽车行业的未来。2017年9月,IBM对全球汽车行业高管进行了一项调查,结果显示,73%的受访者认为,数字技术将重新定义人与车的关系,因此未来的移动出行服务将需要与消费者合作创造。IBM正致力于向汽车公司推出混合云计算和AI技术的解决方案,其中包括物联网(IoT)和区块链技术,以帮助完成数字化转型。IBM将与德国大众萨克森公司(Volkswagen Sachsen)合作,实施SAP的S/4HANA资源规划软件,以简化大众汽车
发表于 2019-05-15

AI、物联网时代,RISC-V挑战巨头ARM和英特尔

和ARM架构占据了主流市场。其中,X86主宰了PC、服务器等高性能高功耗领域,而ARM专注于手机、物联网等低功耗低成本领域,其他架构要挑战前两者几乎不可能。“对于CPU芯片这类产业而言,不光是技术问题,很多是商业问题”。方之熙告诉记者,一旦当某种应用的需求有一定市场规模以后,会形成一种运转平台。当这一平台上面的软件形成了一定的生态系统以后,其他玩家很难进入。即使是PC时代的霸主英特尔,在手机市场也是屡战屡败。“ARM当时做了手机以后,除了苹果公司之外,一般都是用谷歌的安卓。安卓和ARM结合在一起之后,英特尔再要打进去就很难了。其实英特尔当时手机芯片不比高通差,但是就是晚了就很难进去了。”在AI、物联网新时代,近年备受关注的开源指令集
发表于 2019-05-15
AI、物联网时代,RISC-V挑战巨头ARM和英特尔

小广播

About Us 关于我们 客户服务 联系方式 器件索引 网站地图 最新更新 手机版

站点相关: 电视相关 白色家电 数字家庭 PC互联网 数码影像 维修拆解 综合资讯 其他技术 技术产品 应用设计 论坛

北京市海淀区知春路23号集成电路设计园量子银座1305 电话:(010)82350740 邮编:100191

电子工程世界版权所有 京ICP证060456号 京ICP备10001474号 电信业务审批[2006]字第258号函 京公海网安备110108001534 Copyright © 2005-2019 EEWORLD.com.cn, Inc. All rights reserved