即使吐字不清 Google Now也能"懂"我

2015-09-30 13:00:36来源: 新浪手机
    相信有不少文章详细介绍过 Siri、Cortana 和 Google Now 之间的区别,总体说来,Google Now 算是目前市场上最为成熟的语音助手。现在,为了精益求精,Google 官方搜索部门又推出了它的更新版本。

  现有的声音模型主要依赖于 LSTM(Long-Short Term Memory),作为一种长短期记忆人工神经网络,它可以视为 RNN (recurrent neural networks)的一种特殊延伸。和其他的 RNN 相比,LSTM 在记忆单元和门控机制上有着独特的优势,能够记住更多的信息。

(RNN 结构)

  在这之前,Google Now 采用的是 DNN 技术,这也是目前市场上最为流行的技术,再之前则是称霸了整个行业 30 年之久的 GMM(the Gaussian Mixture Model)技术。

  前浪死在沙滩上,一代更比一代强。

  现在,依靠更加成熟的 LSTM 技术,Google Now 的语音识别功能更快也更精准,哪怕是在噪音环境下,也有着不俗的表现。

  另外,针对音素预测(phoneme prediction)会有 30 毫秒延迟这点,Google 搜索部门特意对其进行了训练,使其更接近实际速度;而 feedback loop 功能则可以在瞬间吸纳你说的所有单词及声音,即使有些发音你并没有完全发出来,它都可以将这个单词变得“一气呵成”。

(feedback loop)

  ——也就是说,可能你话还没有说完,它就已经知道你要说什么了。

  目前 Google app 上已经增添了这一服务,Android 或 iOS 用户均可使用。

关键字:Google  Now  声音

编辑:北极风 引用地址:http://www.eeworld.com.cn/xfdz/2015/0930/article_44889.html
本网站转载的所有的文章、图片、音频视频文件等资料的版权归版权所有人所有,本站采用的非本站原创文章及图片等内容无法一一联系确认版权者。如果本网所选内容的文章作者及编辑认为其作品不宜公开自由传播,或不应无偿使用,请及时通过电子邮件或电话通知我们,以迅速采取适当措施,避免给双方造成不必要的经济损失。
论坛活动 E手掌握
微信扫一扫加关注
论坛活动 E手掌握
芯片资讯 锐利解读
微信扫一扫加关注
芯片资讯 锐利解读
推荐阅读
全部
Google
Now
声音

小广播

独家专题更多

富士通铁电随机存储器FRAM主题展馆
富士通铁电随机存储器FRAM主题展馆
馆内包含了 纵览FRAM、独立FRAM存储器专区、FRAM内置LSI专区三大部分内容。 
走,跟Molex一起去看《中国电子消费品趋势》!
走,跟Molex一起去看《中国电子消费品趋势》!
 
带你走进LED王国——Microchip LED应用专题
带你走进LED王国——Microchip LED应用专题
 
电子工程世界版权所有 京ICP证060456号 京ICP备10001474号 电信业务审批[2006]字第258号函 京公海网安备110108001534 Copyright © 2005-2016 EEWORLD.com.cn, Inc. All rights reserved