datasheet

浅析语音界面带来隐私问题

2019-07-11来源: 爱集微关键字:语音界面

Alexa,你能保守秘密吗?

我们都习惯了便捷的智能扬声器,比如在家中使用的亚马逊Echo和手机上的Siri等语音助手,然而,除了方便,我们是否应该更关注它们对隐私的影响?当我们将数据交给亚马逊、谷歌或其他一些大公司后,我们的数据和对话是否会被泄露?




(来源:CEVA)

语音识别成为主流

对语音识别最早的尝试出现在20世纪60年代,但直到20世纪90年代,这项技术才在电脑上实现并变得普及。Siri在iPhone 4S上的首次亮相为市场带来了真正的巨变,而这竟然已经是2011年的事情了。

今天,许多产品和设备上都设有语音控制的“虚拟助手”,例如苹果的Siri和谷歌访问助手。事实上,现在有六分之一的美国人拥有智能扬声器。目前,虽然亚马逊凭借在其Echo扬声器和其他设备上运行的Alexa引领市场,但它依然面临着强劲的竞争对手,比如谷歌、苹果和其他公司。

当然,采用语音界面的不只是智能扬声器和移动设备,还有智能显示器,他们通常包含与智能扬声器相同的语音助手界面和AI功能,例如亚马逊的Echo Show。语音控制也被添加到智能电视和汽车,以及家用恒温器等普通电器中,而微软已将Cortana作为Windows系统的核心部分。

语音识别热潮背后的技术是在高性能云服务器上运行的人工智能(AI)和人工神经网络(ANN)。在本地设备中还需要一些复杂的信号处理,例如远场拾音,它可以从背景噪声中提取语音。

隐私问题

我们都知道技术有用,但一旦这些设备能收听、处理和响应我们的语音,那么会发生什么?微软最近的一项调查显示,41%的语音助手用户存有隐私方面的担忧。

通常,大多数智能扬声器会接收您的问题或指令音频,并将其上传到自己的服务器进行处理。这意味着您询问或告知扬声器的任何内容至少暂时由服务提供商存储。

虽然智能扬声器总是在“听”,但只有在听到“唤醒词”时才会上传音频,例如“Alexa”。但有些建议说,在实际使用中,扬声器可能会将你说的其它话误认为唤醒词,在违背你意愿的情况下开始录音和上传。

另一个值得关注的领域是服务提供商的员工对录音和数据的访问权限。最近的新闻报道称亚马逊有专门的人员听取录音以提高质量,这似乎合乎逻辑,但也带来了一些理论上的风险。另一方面,我们已经习惯了大公司存储我们的网络浏览历史和聊天消息,添加语音真的有什么不同吗?

有人担心这些员工会将语音数据链接到我们的其他个人详细信息,包括位置。了解你居住的地方对于提供本地化推荐很有用,例如您所在城市的最佳餐厅,但这确实会引发对于隐私的担忧。

本地处理

解决这些隐私问题的一种方法是将云处理与更多的本地AI处理相结合。这可以通过使用能够理解指令并做出相应响应的专用处理器来实现。

对于控制智能家居的许多交互,是可以无需与云进行任何通信的。而在需要交换信息的情况下——例如,当用户提出问题或者请求控制诸如Spotify或互联网广播电台之类的网络应用程序时,智能扬声器可以只将元信息(而不是实际对话)发送到云。

随着语音激活和控制被添加到更多的消费产品中,已经足够成熟的神经网络处理器可以部署到嵌入式应用程序中,并且可以用于本地计算,而无需将数据发送到云,这将有助于减轻许多人的隐私担忧。

虽然云公司更喜欢收集原始对话以建立数据库,但如果家用设备能发挥安全网关的作用,限制哪些信息可以与云共享,用户将更有可能信任语音服务。

这里的透明度至关重要:设备制造商需要向消费者表明哪些数据将在本地进行处理,哪些会发送到云。当然,关于这一问题的争论亦存在一个积极的角度:不难想象,设备供应商会使用其本地处理能力作为一个差异化因素,说服消费者购买具有更多“仅限本地”功能的智能扬声器。

OEM可以做什么?

提高公众信心的另一个方法是提供“从设计着手保护隐私”的功能,以便用户可以看到设备在提供信息保密。例如,亚马逊的Echo Show 5智能显示器带有覆盖摄像头的物理快门。所有智能扬声器设备都设有一个静音按钮,用于禁用麦克风。

无论硬件功能如何,无论我们的技术能力或经验水平如何,软件都必须提供让我们信任的用户体验。一个重要的步骤是为用户提供明确的路径,让用户能够设置隐私偏好,以及随时删除所有录音和历史记录。

保护隐私的另一个步骤是确保“唤醒词”提取(在本地执行)尽可能准确,以便消费者确信他们可以在不回避语音界面的情况下谈论私密话题。随着更强大的处理器和更复杂的算法在语音控制设备中趋于普遍,智能扬声器也能够可靠地确定用户是否在请求它们的帮助。

结论

未来的语音界面只会更加普及,那些能够提供优质产品和隐私保护的供应商拥有广阔商机。消费者想要便捷,有关其他技术产品的证据表明,如果供应商能够证明隐私可以得到保护,消费者会很乐意与语音控制设备进行交谈,就像在智能手机上打字一样。

最后,我刚刚问我Echo扬声器中的Alexa:“你能保守秘密吗?”它回答:“你可以放心地告诉我你想让我知道的秘密。”听上去有些含糊,但这是一个很好的起点。


关键字:语音界面

编辑:北极风 引用地址:http://www.eeworld.com.cn/xfdz/ic467369.html
本网站转载的所有的文章、图片、音频视频文件等资料的版权归版权所有人所有,本站采用的非本站原创文章及图片等内容无法一一联系确认版权者。如果本网所选内容的文章作者及编辑认为其作品不宜公开自由传播,或不应无偿使用,请及时通过电子邮件或电话通知我们,以迅速采取适当措施,避免给双方造成不必要的经济损失。

上一篇:普京:美国制裁华为让人吃惊,让竞争者“没有出路”
下一篇:继刘海屏之后?郭明錤:明年iPhone或采用超小前置镜头

关注eeworld公众号 快捷获取更多信息
关注eeworld公众号
快捷获取更多信息
关注eeworld服务号 享受更多官方福利
关注eeworld服务号
享受更多官方福利

推荐阅读

谷歌Android Auto提供新媒体界面及改进语音搜索功能

Play Books、Google Play Music、iHeartRadio和Pocket Casts。语音搜索及群聊设定据谷歌透露,本次升级后,语音搜索功能也得到了改进,当用户要求wizard显示某一类型的曲目时,将显示歌手及专辑的搜索结果。据Android Police透露,值得注意的是,该功能并非最优化状态,因为有些时候,Android Auto无法识别或理解不常见的曲目或专辑名称。Android Auto还支持彩信(MMS)及RCS,驾驶员们可查看这类信息、启用视频聊天(hangouts)功能及WhatsApp应用并进行群聊。据谷歌预计,在未来数周内,新的更新文件将在Play Store发布。然而,用户也可以从其他链接中下
发表于 2018-12-06

马化腾:车载微信正在研发中 没有界面纯语音

的威胁。但是我们的团队在思考,能不能提供一套纯语音交互的接口,没有界面的,要保证人的眼睛始终是盯着路面情况,而不要去分心看屏幕,连看一秒都不要看。“如果能做得到,那我们就正式地在车联网解决方案中提供给大家,我们希望未来这种车载模式可以非常智能。”马化腾说。他表示,这对人的语意语音的理解是非常重要的,我们尽量希望能够只有紧急重要的事情才处理等方案,而不是喧宾夺主,把驾驶的过程变成一个危险的事情,这个是我们绝对不想做的。
发表于 2018-05-24

Nuance的DragonDrive为上汽集团互联汽车荣威RX5语音界面提供技术

中国上海2016年7月7日——Nuance通讯公司(NASDAQ: NUAN)今日宣布,Dragon Drive(声龙驾驶)互联汽车语音和内容平台为荣威RX5互联信息娱乐系统提供技术支持。荣威RX5互联信息娱乐系统由中国领先汽车制造商上汽集团和中国电商巨头阿里巴巴集团控股有限公司的合资公司开发。     全新荣威RX5支持普通话的对话型语音界面集成了基于深层神经网络的Dragon Drive(声龙驾驶)本地嵌入-云端混合式语音识别和自然语言理解(NLU)技术,提供非凡的快速准确语音体验。此外,Dragon Drive(声龙驾驶)还具有语音信号增强和语音合成功能,让系统能够
发表于 2016-07-08
Nuance的DragonDrive为上汽集团互联汽车荣威RX5语音界面提供技术

蓝色系/可改名 微软语音Cortana界面曝光

     关于微软Windows Phone8.1即将增加的新语音助手Cortana已经有过不少消息,不过此前一直没有曝光其正式界面。不过目前外媒首次曝光了Cortana的界面图。   从截图上看,该语音助手确实采用的是“Cortana”命名,不过允许点击下面的选项修改名称,这点是目前苹果Siri和谷歌的Google Now都不具有的。Cortana主界面采用的是微软特色的蓝色,以正圆中加个椭圆的形式体现,很像一个张口说话的嘴。另外,想象一下,改成自己或喜欢的明星或朋友的名字进行交流还是非常有意思的。 微软语音Cortana界面曝光(图片引自The Verge) 微软语音Cortana界面曝光(图片引自The Verge
发表于 2014-03-07

Rovi与Nuance共同开发电视用语音输入用户界面

    美国大型电子节目表提供商Rovi与美国大型语音识别系统开发商Nuance Communications,开始采用语音输入技术共同着手开发电视用户界面(UI)。目标是在Rovi的电子节目表中,嵌入将电视、机顶盒(STB)与智能手机和平板终端等相结合的语音输入UI。Rovi在从2012年5月21日(当地时间)开始于美国波士顿举行的有线电视(CATV)展会“Cable Show 2012”上,现场演示了试制版UI。   试制版UI将Rovi的电子节目表及电视节目和电影等的元数据,与Nuance向电视提供的云计算语音识别服务“Dragon TV”相结合,用于向用户推荐影像内容。目前正处在收集用户在操作电子节目表时,多使用何种语言
发表于 2012-05-25

小广播

电子工程世界版权所有 京ICP证060456号 京ICP备10001474号 电信业务审批[2006]字第258号函 京公海网安备110108001534 Copyright © 2005-2019 EEWORLD.com.cn, Inc. All rights reserved