datasheet

语音识别领域芯片公司该如何定位

2017-06-21来源: EEWORLD 关键字:语音识别  intel  高通

报道苹果公司时记者总是这样类比:世界银行追踪研究的199个国家中,有183个国家的2015年国内生产总值(GDP)低于苹果市值。苹果市值几乎是伊朗和奥地利GDP的总和。从这个角度看,苹果、谷歌、亚马逊这样的巨无霸之间的竞争很像一场国战。国战的根本特征是不管你喜欢不喜欢最终都会被卷入,那怕你与此看似毫不相关,恰如互联网与传统零售行业。


终极生态与即将白热化的竞争


到现在为止我们在IT行业看到了三类性质迥异的成功:


一类是硬科技型公司,比如Intel和高通,这类硬科技项目虽然其上也有生态,但技术壁垒仍然在商业模式中占据较大权重;


一类是工具平台型公司,在这点上集大成的是操作系统,典型公司则是微软。对于操作系统而言技术、工程等很关键,但更关键的则是其上的应用生态系。所以虽然Linux免费,但也没可能在PC这种终端上撼动微软的地位。


一类是互联网生态公司,这点大家会比较熟悉,比如我们常说的BAT。和上一类的核心差异在于Windows根本不是数据驱动,而互联网生态公司大多时候其生态依赖于其里面的数据和内容。社交时关系链是其核心内容,搜索时爬到的东西是其内容,电商时商品是其内容。


这种行业分工内置了足够的技术合理性,不太会发生实质性变化。但可能会变化的是公司在其中扮演的角色,比如Google最终同时控制操作系统和搜索引擎,这会影响最终竞争的走势。在最终格局中实际扮演那种角色影响控制权,而控制权影响商业模式和利润空间。


以控制力大小而论,中间层非数据驱动的OS影响力最大,其次才是互联网生态公司,最弱是硬科技型公司。这在近来苹果PK腾讯一事中体现的特别清楚。因此我们也可以说直到Android,Google的商业模式其实并不稳固,所以它才那么有动力在OS层突围。


这样一来国战的焦点就在于谁能控制远场语音交互下的OS。这点上结局很可能和过去不同,因为这些公司都实在太大了。


苹果不用说一定还会是自己的封闭生态系,Google,亚马逊和微软则一定会在各自的势力版图上排斥对方。短期看,Google和亚马逊不太可能分出胜负,也不太可能使用对方的系统。这是非常有意思的一种局面,过去在行业早期巨头就同时关注某一行业的先例不是没有但并不能形成相对势均力敌的竞争,比如Windows+Nokia 与Android阵营的竞争。但这次在行业早期所有的巨头都关注这个点,每家背后都近乎拥有无尽的资源。所以战况一定会比想的还要激烈。


作为结果我们可能会在较长的时间内面临多OS并存的局面。


高通这样的芯片公司位置在哪里


每次人机交互的变革必会引起OS的变革,这至少在过去两次产品大升级中得到了验证。从命令行到图形用户界面促成了Windows这样的操作系统,而从键盘鼠标到触屏则促成了iOS和Android。所以我们有理由相信这次远场语音交互一样会引起OS层面的变更。在这背景下看高通这类芯片公司的角色和行为就特别有意思。


高通最近推出了一款SoC,让IPQ40x8/9支持阵列算法,从各方报道来看应该是通过DSP来实现的。高级副总裁Rahul Patel则说:有可能Echo的语音功能都会被整合进AP,这是新的趋势。这样一来有些传统厂商比如科胜讯确实会难过,因为过去一般是它们搭着高通等来实现一组功能,这下高通把事情全干了,相当于它们不太好找到自己的位置了。


但高通干的事其实并不对路,放在整个人机交互变革的背景下看就相当于需要回答:OS适合放到芯片里面吗?


OS显然不能放芯片里,算法是可以放芯片里的,但算法是远场语音交互的一个部分,并且不太适合切割出来。


这可以拿唤醒做例子进行说明,实现唤醒的时候通常需要与最终产品的亮灯相关联。这样一来首先要有降噪算法提高唤醒率,然后训练过的唤醒模型监测周围的声音,一旦检测到唤醒词时,要反馈出特定的角度,这个角度信息再传递给系统,系统才知道Echo上面那一圈灯究竟应该亮那个。显然的在这个场景下,算法、消息、硬件控制彼此交织在一起,这是OS的范畴,但并不是芯片的范畴。


一般来讲这类彼此间的消息越多,OS对外呈现出的功能也就越强大。这样的一种系统显然不可能放芯片里。唯有部分算法是可以放芯片里的,但在行业早期这样其实并没太大价值,一是算法并未稳定仍然需要持续提高,一是这种芯片集成算法的方式反倒会降低整个系统的灵活程度。假设A公司想做一款叫X的产品,其未来衍生产品为Y,那当然它希望用统一架构实现这两者,而A公司显然也不希望这种实现只能用高通的某几款芯片,而希望在更宽的范围内进行灵活选择。


微信上很多人看到高通干这事会很震惊等等,觉得会对行业产生如何如何的影响,但实际上并没有意识到高通其实选了条歪路。高通在语音交互这事上应该是一直没太想清楚,它并不是第一次干与语音交互相关的事(JAN 6, 2016就做过类似的发布),但似乎每次最终都会无疾而终。


这样一来芯片公司的角色就非常清楚:芯片公司在远场语音交互这场PK中会是受益者,但显然不能发挥主导作用。这与PC或手机刚启动的时候状态非常不一样。那个时候如果没有Intel、高通一代代赋能,PC或手机这样的产品是没办法一代代升级的。也就是说芯片公司是在关键路径上。但眼下已有各种芯片其计算能力是足够的,而交互方式本身与操作系统融合更紧。


高通与苹果会给远场语音交互带来什么


虽然苹果的产品不一定立刻就大卖,高通的SoC估计也掀不起什么浪花,但他们确实会为这个赛道注入更多的信心。


就像触屏影响了所有的设备一样,远场语音交互也一定会影响所有设备。这就为市场提供了足够多的新机会。


在巨头的带动下,已有产品品类会普遍进行升级,汽车、手机、PAD、笔记本、电视、玩具、摄像头、耳机等。而新的产品品类也会持续出现,比如讯飞经常展示的翻译机、电话会议系统等。


产品大升级的同时也会催生方案提供商上的需求。声音的冷僻程度要远比当年做手机时的系统定制为甚,复杂程度也会远超此前的手机。在有的场景它可能对功耗提出极高的要求,在有的场景,它可能更多的是挑战性价比。这点通过了解声智科技推出的各种方案可以获得更为直观的体验。不再一线的人很难理解这种复杂度是如何导入的,因为理论上似乎像高通那样把算法与芯片相结合,所有的问题就应该解决了。但实际上这样是不行的,因为从算法和芯片到具体能落地的产品中间还有着很大的距离:麦克风数产生距离、阵型产生距离、计算结构也产生距离、新需求的持续发生等也会导入类似的问题。


但这个层次确实具有高度不确定性,是会出现MTK那种提供Turnkey方案的公司,还是会出现新的OS,或者OS会有什么新的变种,亦或者会长期多OS并存?


小结


短期来看高通、苹果的入局实质影响不大,更多的是在信心层面。两个显然的后果里:一个是高度确定的,那就是远场语音交互必成;一个则具有高度不确定性,传统的OS一层上到底会发生什么?

关键字:语音识别  intel  高通

编辑:王磊 引用地址:http://www.eeworld.com.cn/afdz/article_2017062110795.html
本网站转载的所有的文章、图片、音频视频文件等资料的版权归版权所有人所有,本站采用的非本站原创文章及图片等内容无法一一联系确认版权者。如果本网所选内容的文章作者及编辑认为其作品不宜公开自由传播,或不应无偿使用,请及时通过电子邮件或电话通知我们,以迅速采取适当措施,避免给双方造成不必要的经济损失。

上一篇:AI发展出了自己的语言 人类无法理解
下一篇:新增三家AI初创,英特尔投资持续加码人工智能

关注eeworld公众号 快捷获取更多信息
关注eeworld公众号
快捷获取更多信息
关注eeworld服务号 享受更多官方福利
关注eeworld服务号
享受更多官方福利

推荐阅读

谷歌医疗顾问Toby Cosgrove预测:医疗领域的下一个重要技术应用将是语音识别

通过外媒资讯获悉,在美国“新闻&世界报道医疗保健会议” (News & World Report Healthcare)上,谷歌顾问、前克利夫兰诊所首席执行官Toby Cosgrove预测,除了已经在医疗领域站稳脚跟的人工智能等新技术外,医疗领域的下一个重要技术将是“语音识别”。Cosgrove在会议期间提出了他对当前医疗保健服务领域创新的看法。他表示:“语音识别将是医疗保健领域的下一个‘杀手级’应用。”当然,谷歌、亚马逊和苹果这些硅谷的大腕们已经开发和改进了语音识别工具,包括Google Home、Alexa和Siri等。Cosgrove表示,语音识别只是技术不断发展的一个例子和表现,它可以建立在繁琐的EHR
发表于 2018-11-22

麻省理工新型AI技术 融合了语音和物体识别技术

麻省理工学院的研究人员已经创建了一个新的人工智能程序,它不仅能够同时识别图像和语音中的物体,而且还能积极地将两者结合起来,从而更有效地理解和利用两者。这个人工智能程序可以分析带有音频标题的图像,然后把这两个资源放在一起,然后找出哪个对象对应于标题的哪些部分。它在测试中通过突出显示图像区域和对象来演示这一点,而它们是由标题描述的。根据该项目的研究人员的说法,这比传统的语音识别或图像识别训练更自然、更有机。从本质上讲,人工智能正在像人类一样学习,这将使它更加灵活,从而在未来更有能力。这个人工智能程序实际上是一个以前的模型的扩展,它能够将单词和短语与图像的主题集合相匹配,比如颜色和原型。该模型使用两个卷积神经网络,分别处理语音输入和图像
发表于 2018-10-12

语音识别将推动科技发展

9月25日消息,谷歌搜索业务负责人本·戈麦斯(Ben Gomes)在接受记者采访时做出了一次惊人的预言,他表示科技的下一个转折点将是语音识别技术。戈麦斯认为如何让机器更好的对普通语言进行认知将决定着互联网时代未来的发展。   戈麦斯说:“语音识别和语言理解是未来搜索和信息的核心。然而还存在很多困难的问题,包括理解参照对象是什么,例如句子里的‘他’、‘她’和‘它’指代的是什么。这不是一个在语言中来解决的问题,而这只是需要解决的成千上万个问题之一。” 9月24日,谷歌迎来了成立20周年纪念日。7年多前,谷歌推出了首个语音服务,即简单的语音转换文本搜索服务。目前,谷歌的搜索服务和人工智能语音
发表于 2018-09-26
语音识别将推动科技发展

谷歌、Alexa、Siri语的实验室音语音识别测试谁家表现最出色

人工智能创业公司Vocalize.ai的实验室进行了一项语音识别测试,研究人员对虚拟助手Alexa、谷歌助手和Siri进行了测试对比。这项竞赛的目的是为了查明这三种数字助手中谁能够更好的理解那些带有口音的人们所说的英语。研究人员分别使用美国本土口音、印度口音和中国口音的英语对三种语音助手进行了测试。 所有三种语音助手对于独立的单词识别都完成的很好,而且在美国口音和印度口音识别中表现的更好。但是谷歌助手在理解中国口音的英语方面完全超过了其它两种语音助手。事实上,谷歌助手在所有三轮测试中都得到了完美的平分。  当进行噪音环境下的测试时,谷歌在美国口音、印度口音和中国口音的识别错误率分别为
发表于 2018-09-20
谷歌、Alexa、Siri语的实验室音语音识别测试谁家表现最出色

国内智能音箱市场日渐火爆,出现了什么问题?

箱出货量为410万台。HomePod今年七月市场占有率在4%,预计将在2020年涨到10%。 尽管市场份额持续下滑,但得益于其先发优势,亚马逊Echo仍然是美国家庭中最为常见的智能音箱。 Voicebot和Google今年5月份对1200多名美国成年人进行的一项调查显示,亚马逊Echo在美国家庭中的占有率仍然高达61.9%,而谷歌Home的占有率则为26.9%。  根据市场研究公司Canalys的预测,未来将会有越来越多的人定期使用语音识别系统,到2019年全球将销售将近1亿台智能扬声器,到2022年大约55%的美国家庭将会拥有一台智能扬声器。预计2018年全球智能扬声器市场将达到约30亿美元
发表于 2018-09-12
国内智能音箱市场日渐火爆,出现了什么问题?

提高语音识别准确性,Alexa语音助手新系列问市

人机界面解决方案开发商新突思电子科技日前宣布, TCL集团生产的Alexa语音助手电视已经采用旗下AudioSmart®远场语音(FFV)技术。搭载AudioSmart FFV数字信号处理器(DSP)的TCL全新系列电视可为消费者带来优质的用户体验,并能够通过亚马逊Alexa语音助手实现语音控制。搭载Alexa和AudioSmart技术的TCL全新电视已于目前举行的2018 IFA 德国柏林国际消费电子展上亮相。 TCL集团产品项目部总监黄定海表示:“搭载亚马逊Alexa和Synaptics AudioSmart技术的全新TCL电视致力于通过创新来提升消费者对我们产品的体验。将远场语音识别功能嵌入我们的电视产品,将为
发表于 2018-09-03

小广播

About Us 关于我们 客户服务 联系方式 器件索引 网站地图 最新更新 手机版

站点相关: 视频监控 智能卡 防盗报警 智能管理 处理器 传感器 其他技术 综合资讯 安防论坛

北京市海淀区知春路23号集成电路设计园量子银座1305 电话:(010)82350740 邮编:100191

电子工程世界版权所有 京ICP证060456号 京ICP备10001474号 电信业务审批[2006]字第258号函 京公海网安备110108001534 Copyright © 2005-2018 EEWORLD.com.cn, Inc. All rights reserved
pt type="text/javascript" src="//v3.jiathis.com/code/jia.js?uid=2113614" charset="utf-8">