了解优势与挑战 打好“声纹识别”这张牌

2017-07-10 19:38:22编辑:鲁迪 关键字:声纹识别

随着科技的发展,尤其是生物科技的不断发展并逐渐广泛应用,包括人脸、指纹、掌纹、声纹等生物特征类证据已成为公安和司法机关破案侦查的重要证据之一,在热播的《人民的名义》中,声音就成了调查原汉东省检察院反贪局局长陈海车祸案件的重要线索。

在众多生物识别技术中,除了早已使用多年的指纹识别、虹膜识别,近期兴起的人脸识别技术被用于公司打卡、软件系统登录、家庭或公共场所的安防等多个场景,而语音识别技术的用途更是广泛,机器人、智能家居产品、无人车等等。

随着相关算法的精进,以上生物识别技术的准确率已经可以与人类相媲美。而在这些识别技术愈加成熟之时,越来越多的人将目光放在另外一种生物识别技术上——声纹识别

什么是声纹识别技术?

声纹识别,也称作说话人识别,是一种通过声音判别说话人身份的技术。人在讲话时使用的发声器官舌、牙齿、喉头、肺、鼻腔在尺寸和形态方面每个人的差异很大,所以任何两个人的声纹图谱都有差异,因而声纹具有唯一性。

根据不同的应用场景,声纹识别可分为说话人辨识(SpeakerIdentification,SI)和说话人确认(SpeakerVerification,SV)。SI指的是我们有了一段待测的语音,需要将这段语音与我们已知的一个集合内的一干说话人进行比对,选取最匹配的那个说话人,是一个1对多的判别问题;SV指的是我们有了一段未知的语音,紧接着判断这段语音是否来源于这个目标用户即可,是一个1对1的二分类问题。

声纹识别的应用及成果

在应用上,声纹识别更大的应用前景在于安防领域,比如刑侦破案、门禁、银行交易等等。此外,在智能家居等领域,为了安全,也为了更好的智能体验,比如在人声鼎沸情境中准确识别哪句话是主人下达的命令等,声纹识别技术也就渐渐受到了重视。

当前,在声纹识别需求渐增的情况下,专注于声纹识别的企业也有不少,并已取得了不错的成果。比如国外的Nuance、VoiceVault、Voice Biometrics、PhoneFactor,或是国内的科大讯飞、中科信利、厦门天聪、上海电虹等公司。

以科大讯飞为例,此前,在锤子手机的发布会上,罗永浩成功的为科大讯飞做了一次PR,一时间,科大讯飞的语音识别技术受到了人们更多的关注。作为同属于语音技术的“兄弟”,声纹技术也是科大讯飞的关注领域,并已研究多年。在2015年,依托于声纹识别、人脸识别技术,科大讯飞构建了业界首个统一生物认证系统,用人脸识别补充声纹识别的不稳定性,进一步的提高了安全性,并在金融、保险等领域启动了大规模的应用推广。

声纹识别的优势与挑战

声纹识别的主要任务包括:语音信号处理、声纹特征提取、声纹建模、声纹比对、判别决策等。

相对于其他生物识别技术,在安全性上,声纹识别的唯一性不说排第一,但也是名列前茅的,纵然模仿声音类似,但也是能够分辨的出来的。除了更高的安全指数,与其他生物识别技术相比,声纹识别还有着其他的优势 :

1、蕴含声纹特征的语音获取方便、自然;2、获取语音的成本低廉,使用简单,像麦克风、通讯设备等皆可;3、适合远程身份确认;4、声纹辨认和确认的算法复杂度低;5、配合一些其他措施,如通过语音识别进行内容鉴别等,可以提高准确率;

不过,纵然有着这么多的优势,但在实际操作中,声纹识别却面临着重大的挑战:

1、如何建立声纹库和特征 :从理论上讲,声纹的获取是极其容易的,但这仅仅是针对国家相关机构,如目前声纹库最全的公安。对企业而言,所有的声纹数据都需要他们自行采集,这是一件相当具有难度的任务。另外,在数据不全面的情形之下,声纹特征的提取和建立也就受到了阻碍,从而就难以训练声纹识别的机器学习算法,以提高识别的准确率。

2、如何降低内外环境对于声纹的影响 :目前,人们对声纹识别的要求已经不仅仅满足于静态检测,更多的是动态检测。在外部环境中,首先,声音是通过录音设备进行采集的,不同的型号的录音设备对语音都会造成一定程度上的畸变,同时由于背景环境和传输信道等的差异,对语音信息也会造成不同程度的损伤。这些情况的出现为声纹识别增添了不少的问题。比如外部环境的影响,哪怕是如今发展较为完善、已经实现落地的语音识别技术,降噪以及去混响方面也依然是其运行中的一大难题。

此外,在内部环境中,对于同一个用户,即便采集到的两段语音内容都是相同的,但由于情绪、语速、疲劳程度等原因,语音都会有一些差异性。在这方面,小伙伴就曾做过实验,以不同的嗓音、速度唤醒iPhone 7中的Siri,结果显示,只有与提前录制的语音同样的嗓音、速度才能成功唤醒。


关键字:声纹识别

来源: 新智元 引用地址:http://www.eeworld.com.cn/afdz/article_2017071010873.html
本网站转载的所有的文章、图片、音频视频文件等资料的版权归版权所有人所有,本站采用的非本站原创文章及图片等内容无法一一联系确认版权者。如果本网所选内容的文章作者及编辑认为其作品不宜公开自由传播,或不应无偿使用,请及时通过电子邮件或电话通知我们,以迅速采取适当措施,避免给双方造成不必要的经济损失。

上一篇:Precise Biometrics推出突破性的防假指纹和活体检测解决方案
下一篇:科幻片中的安防系统竟然在家也能轻松实现

关注eeworld公众号 快捷获取更多信息
关注eeworld公众号
快捷获取更多信息
关注eeworld服务号 享受更多官方福利
关注eeworld服务号
享受更多官方福利

推荐阅读

请给我一个安全的语音助手!

人基于此开玩笑的说,说以后犯罪不用带面具了,因为他一进门就可以说:XXX,请帮我关闭所有的摄像头。  其实,用过小米音箱的人可能都知道:小米音箱在语音分析上已经做的很不错,但是在声纹识别上,目前还是空白的。换句话讲:现在很多语音助手、智能音箱以及各种语音产品,已经能听的到和理解说什么了,但是他不知道谁是他的主人,所以任何人都可以对他发号施令。  当然,这里其实涉及到了2种技术:一个是语音识别,一个是声纹识别。  语音识别就比较好理解,而且我们应用的也更多。机器通过识别和理解过程把语音信号转变为相应的文本或命令。最常见的就是,微信发个语音可以直接转成文字。除了我们常见的社交软件上的应用外,人机交互、导航、检索、还有前几天翻车的腾讯
发表于 2018-05-08 22:31:01
请给我一个安全的语音助手!

“人工智能”再成两会热门话题,声纹黑科技引领未来发展潮流

领域,声纹验证和鉴定为人民的财产和生命安全提供保障。  显然,人工智能服务于人们的生活已成为大势所趋,这也是两会将“人工智能”纳入政府工作报告的根本原因。  传统上,我们对人工智能有一个很大的误区,认为人工智能就是机器人;但其实,人工智能并不能简单等同于机器人,机器人只不过是人工智能诸多应用当中的一小部分。人工智能还包括了语音识别、图像识别、声纹识别、自然语言处理等内容。  而声纹识别作为人工智能领域极具代表性的技术之一,近年来,在人们的智能生活当中发挥了重要的作用。这种智能黑科技能够提高生活质量,为我们的生活提供有效的智能辅助,让生活更加便利。  在智能家居当中,声纹识别应用的范围非常广泛,包括声控灯、声控家具、声控多媒体、车载声纹
发表于 2018-05-08 22:27:12

Alexa 笑了,声纹识别该醒醒了!

。  其次,是通过这样一个试验性产品进行数据的采集,从而对智能家居的深度化场景的挖掘,这些制作智能音响的企业, 都拥有自己的云计算业务。未来,物联网行业一定是基于大数据和云计算的,而没有大量的数据支撑,很多场景以及计算都无法实现。  2.为什么是声纹识别?  这里为什么谈到声纹识别。  这里就涉及到一个词义的区别:语音识别和声纹识别。语音识别更多的偏向其能否识别你说的话;而声纹识别,是指一个机器能否认出他的主人。  举个例子:假设我有一个天猫精灵它带有声纹识别功能(事实上,天猫精灵已经有此项功能),每当我叫他天猫精灵,他能知道,是我在叫他,这个叫做语音识别。目前市面上可能有上千家公司在做类似的工作。但是更难的在这里,如果天
发表于 2018-04-09 20:56:17
Alexa 笑了,声纹识别该醒醒了!

探秘美国国安局,如何将声纹识别技术用到极致

的时候,经常会使用到这种被称为声纹识别的技术。但是早在“Hello Siri”和“OK Google”这样的语言指令走入寻常百姓家之前十年,NSA 就用这种声纹识别技术来监控恐怖分子、政治家、毒枭、间谍甚至是一些普通政府机构的雇员。这种技术的原理在于分析个人声音中独特的物理和行为特征来区分不同人的声音,例如发声的音高、嘴型、咽部长度等。算法随后会创建个人声音特征的动态计算机模型,也就是通常所说的“声纹”模型。整个过程——捕捉所说的单词、将单词转化为声纹、并将这种表示与数据库中其他的“声纹”进行对比——都可以在瞬间完成。尽管我们已经知道 NSA 依靠指纹和面部图像来识别目标,但是根据 2008 年的一份机构文件,声纹才是“NSA 的统治地位所在
发表于 2018-01-24 19:53:26
探秘美国国安局,如何将声纹识别技术用到极致

从指纹到人脸,你身上还有多少密码能识别?

。因此,人脸识别系统会在及短的时间内对人的骨骼框架进行识别、重组、分析,再结合精准对应人脸近三万个点位,准确率也是杠杠的。虹膜识别人的眼睛结构由巩膜、虹膜、瞳孔晶状体、视网膜等部分组成。虹膜是位于黑色瞳孔和白色巩膜之间的圆环状部分,其中包含了无数细微特征。虹膜在胎儿发育阶段形成后,就不会再改变了,这也决定了虹膜特征的唯一性。并且当人死亡后,瞳孔会自然放大,虹膜从而消失,因此只有活体才能够使用虹膜识别。根据虹膜识别的唯一性、稳定性、不可复制性、活体检测等特点,在综合安全性能上具有绝对优势。是目前安全系数最高的生物识别技术。而三星手机今年已经已经用上了这项技术,可能在不久的将来,会有更多厂商前赴后继投入到虹膜识别的大潮中来。声纹识别众所周知
发表于 2017-11-12 18:01:20
从指纹到人脸,你身上还有多少密码能识别?

首推人工智能电视技术系统 长虹声纹识别电视构建“强交互

传统电视已死,如果放在20年前,这个口号绝对是惊人耸听。最近10年来,随着互联网的不断渗透,电视研发、生产技术的持续提升,以及电视内容运营商的转型和整合,智能电视已经全面取代了传统电视。智能电视与传统电视相比,具有一系列显著优点,比如从前人们只能被动观看电视台播放的节目,现在我们可以任意点播、转播某一场比赛、某一部电影;再如以前除了看电视外,最多就是接入游戏机、录像机、VCD等进行家庭娱乐,现在通过互联网支持,用户可以通过电视进行购物、教育、音乐、医疗、健康等一系列生活应用。首个人工智能电视技术系统人工智能技术的应用,使电视智能化标准再次提升。日前,人工智能电视的领跑者——长虹再次强势升级,并推出了搭载着远场语音、声纹识别、模糊
发表于 2017-10-22 19:41:16

小广播

About Us 关于我们 客户服务 联系方式 器件索引 网站地图 最新更新 手机版

站点相关: 视频监控 智能卡 防盗报警 智能管理 处理器 传感器 其他技术 综合资讯 安防论坛

北京市海淀区知春路23号集成电路设计园量子银座1305 电话:(010)82350740 邮编:100191

电子工程世界版权所有 京ICP证060456号 京ICP备10001474号 电信业务审批[2006]字第258号函 京公海网安备110108001534 Copyright © 2005-2018 EEWORLD.com.cn, Inc. All rights reserved