语音识别领域芯片公司该如何定位

2017-06-21 16:29:46编辑:王磊 关键字:语音识别  intel  高通

报道苹果公司时记者总是这样类比:世界银行追踪研究的199个国家中,有183个国家的2015年国内生产总值(GDP)低于苹果市值。苹果市值几乎是伊朗和奥地利GDP的总和。从这个角度看,苹果、谷歌、亚马逊这样的巨无霸之间的竞争很像一场国战。国战的根本特征是不管你喜欢不喜欢最终都会被卷入,那怕你与此看似毫不相关,恰如互联网与传统零售行业。


终极生态与即将白热化的竞争


到现在为止我们在IT行业看到了三类性质迥异的成功:


一类是硬科技型公司,比如Intel和高通,这类硬科技项目虽然其上也有生态,但技术壁垒仍然在商业模式中占据较大权重;


一类是工具平台型公司,在这点上集大成的是操作系统,典型公司则是微软。对于操作系统而言技术、工程等很关键,但更关键的则是其上的应用生态系。所以虽然Linux免费,但也没可能在PC这种终端上撼动微软的地位。


一类是互联网生态公司,这点大家会比较熟悉,比如我们常说的BAT。和上一类的核心差异在于Windows根本不是数据驱动,而互联网生态公司大多时候其生态依赖于其里面的数据和内容。社交时关系链是其核心内容,搜索时爬到的东西是其内容,电商时商品是其内容。


这种行业分工内置了足够的技术合理性,不太会发生实质性变化。但可能会变化的是公司在其中扮演的角色,比如Google最终同时控制操作系统和搜索引擎,这会影响最终竞争的走势。在最终格局中实际扮演那种角色影响控制权,而控制权影响商业模式和利润空间。


以控制力大小而论,中间层非数据驱动的OS影响力最大,其次才是互联网生态公司,最弱是硬科技型公司。这在近来苹果PK腾讯一事中体现的特别清楚。因此我们也可以说直到Android,Google的商业模式其实并不稳固,所以它才那么有动力在OS层突围。


这样一来国战的焦点就在于谁能控制远场语音交互下的OS。这点上结局很可能和过去不同,因为这些公司都实在太大了。


苹果不用说一定还会是自己的封闭生态系,Google,亚马逊和微软则一定会在各自的势力版图上排斥对方。短期看,Google和亚马逊不太可能分出胜负,也不太可能使用对方的系统。这是非常有意思的一种局面,过去在行业早期巨头就同时关注某一行业的先例不是没有但并不能形成相对势均力敌的竞争,比如Windows+Nokia 与Android阵营的竞争。但这次在行业早期所有的巨头都关注这个点,每家背后都近乎拥有无尽的资源。所以战况一定会比想的还要激烈。


作为结果我们可能会在较长的时间内面临多OS并存的局面。


高通这样的芯片公司位置在哪里


每次人机交互的变革必会引起OS的变革,这至少在过去两次产品大升级中得到了验证。从命令行到图形用户界面促成了Windows这样的操作系统,而从键盘鼠标到触屏则促成了iOS和Android。所以我们有理由相信这次远场语音交互一样会引起OS层面的变更。在这背景下看高通这类芯片公司的角色和行为就特别有意思。


高通最近推出了一款SoC,让IPQ40x8/9支持阵列算法,从各方报道来看应该是通过DSP来实现的。高级副总裁Rahul Patel则说:有可能Echo的语音功能都会被整合进AP,这是新的趋势。这样一来有些传统厂商比如科胜讯确实会难过,因为过去一般是它们搭着高通等来实现一组功能,这下高通把事情全干了,相当于它们不太好找到自己的位置了。


但高通干的事其实并不对路,放在整个人机交互变革的背景下看就相当于需要回答:OS适合放到芯片里面吗?


OS显然不能放芯片里,算法是可以放芯片里的,但算法是远场语音交互的一个部分,并且不太适合切割出来。


这可以拿唤醒做例子进行说明,实现唤醒的时候通常需要与最终产品的亮灯相关联。这样一来首先要有降噪算法提高唤醒率,然后训练过的唤醒模型监测周围的声音,一旦检测到唤醒词时,要反馈出特定的角度,这个角度信息再传递给系统,系统才知道Echo上面那一圈灯究竟应该亮那个。显然的在这个场景下,算法、消息、硬件控制彼此交织在一起,这是OS的范畴,但并不是芯片的范畴。


一般来讲这类彼此间的消息越多,OS对外呈现出的功能也就越强大。这样的一种系统显然不可能放芯片里。唯有部分算法是可以放芯片里的,但在行业早期这样其实并没太大价值,一是算法并未稳定仍然需要持续提高,一是这种芯片集成算法的方式反倒会降低整个系统的灵活程度。假设A公司想做一款叫X的产品,其未来衍生产品为Y,那当然它希望用统一架构实现这两者,而A公司显然也不希望这种实现只能用高通的某几款芯片,而希望在更宽的范围内进行灵活选择。


微信上很多人看到高通干这事会很震惊等等,觉得会对行业产生如何如何的影响,但实际上并没有意识到高通其实选了条歪路。高通在语音交互这事上应该是一直没太想清楚,它并不是第一次干与语音交互相关的事(JAN 6, 2016就做过类似的发布),但似乎每次最终都会无疾而终。


这样一来芯片公司的角色就非常清楚:芯片公司在远场语音交互这场PK中会是受益者,但显然不能发挥主导作用。这与PC或手机刚启动的时候状态非常不一样。那个时候如果没有Intel、高通一代代赋能,PC或手机这样的产品是没办法一代代升级的。也就是说芯片公司是在关键路径上。但眼下已有各种芯片其计算能力是足够的,而交互方式本身与操作系统融合更紧。


高通与苹果会给远场语音交互带来什么


虽然苹果的产品不一定立刻就大卖,高通的SoC估计也掀不起什么浪花,但他们确实会为这个赛道注入更多的信心。


就像触屏影响了所有的设备一样,远场语音交互也一定会影响所有设备。这就为市场提供了足够多的新机会。


在巨头的带动下,已有产品品类会普遍进行升级,汽车、手机、PAD、笔记本、电视、玩具、摄像头、耳机等。而新的产品品类也会持续出现,比如讯飞经常展示的翻译机、电话会议系统等。


产品大升级的同时也会催生方案提供商上的需求。声音的冷僻程度要远比当年做手机时的系统定制为甚,复杂程度也会远超此前的手机。在有的场景它可能对功耗提出极高的要求,在有的场景,它可能更多的是挑战性价比。这点通过了解声智科技推出的各种方案可以获得更为直观的体验。不再一线的人很难理解这种复杂度是如何导入的,因为理论上似乎像高通那样把算法与芯片相结合,所有的问题就应该解决了。但实际上这样是不行的,因为从算法和芯片到具体能落地的产品中间还有着很大的距离:麦克风数产生距离、阵型产生距离、计算结构也产生距离、新需求的持续发生等也会导入类似的问题。


但这个层次确实具有高度不确定性,是会出现MTK那种提供Turnkey方案的公司,还是会出现新的OS,或者OS会有什么新的变种,亦或者会长期多OS并存?


小结


短期来看高通、苹果的入局实质影响不大,更多的是在信心层面。两个显然的后果里:一个是高度确定的,那就是远场语音交互必成;一个则具有高度不确定性,传统的OS一层上到底会发生什么?

关键字:语音识别  intel  高通

来源: EEWORLD 引用地址:http://www.eeworld.com.cn/afdz/article_2017062110795.html
本网站转载的所有的文章、图片、音频视频文件等资料的版权归版权所有人所有,本站采用的非本站原创文章及图片等内容无法一一联系确认版权者。如果本网所选内容的文章作者及编辑认为其作品不宜公开自由传播,或不应无偿使用,请及时通过电子邮件或电话通知我们,以迅速采取适当措施,避免给双方造成不必要的经济损失。

上一篇:AI发展出了自己的语言 人类无法理解
下一篇:新增三家AI初创,英特尔投资持续加码人工智能

关注eeworld公众号 快捷获取更多信息
关注eeworld公众号
快捷获取更多信息
关注eeworld服务号 享受更多官方福利
关注eeworld服务号
享受更多官方福利

推荐阅读

从思必驰、云知声互掐事件看AI算法公司的出路

诸多AI算法公司在语音识别、图像处理等领域大举进攻,迎来了资本的热捧。但如今风向已变,AI算法公司在寻求应用落地的过程中,发现算法无法成为持续的“抓手”,开始寻求转型之道。这不,最近国内数家语音创业公司已然陆续“硬”着陆,推出了AI语音专用芯片,包括思必驰、出门问问、Rokid、云知声等等。抛开他们之间的“明争暗斗”及互怼不谈,以AI算法单打独斗的时代显然已然翻篇,下一战AI语音专用芯片的战斗已然打响。算法的末路对于这些公司“不约而同”的选择,或许是时势使然。安创空间联合创始人杨宇欣实话实说,他在最近的第五期安创成长营路演会上表示,创业公司纯做算法是难以长久的,因为算法是有瓶颈和天花板的,可能根本就卖不了大钱,所以一定要与硬件结合
发表于 2018-06-29 19:31:12

用声音/手势操作汽车,苹果还有这个实力?

手势控制操作指定前方停车区域内的某个停车位,然后再利用语音识别技术,说出“我要停靠到那里”。车载系统可结合手势及语音识别技术完成这一系列的停车操作。 『测试中的苹果自动驾驶车辆』根据此前消息,苹果正在不断扩充无人驾驶路测项目的车队规模,已经将测试车辆的数量从27辆扩充到55辆。此专利只是苹果自动驾驶技术开发中的一部分,其还希望车辆能够识别驾驶员的手势或语音操作来对驾驶进行控制,未来该理念或将在自动驾驶车辆中实现。
发表于 2018-06-20 21:07:05
用声音/手势操作汽车,苹果还有这个实力?

智能家居市场 语音识别这一密钥何时才能被激活?

语音交互的核心环节也取得重大突破,语音识别环节突破了单点能力,从远场识别,到语音分析和语义理解有了重大突破,呈现一种整体的交互方案。自动语音识别(ASR)和前端语音处理的最新发展已使得语音控制相当成熟和有效。ASR引擎可以理解多种语言和口音,而语音生物辨识可用于辨识系统中预先登录的特定用户,以在智能家居环境中提供不同的权限。不过,虽然大多数家居可以用语音开启导航,进行信息查询,实现一些诸如空调、开灯等功能控制,但距离“以语音为入口连接各种服务,构建智家生态”的理想仍然较远。目前的技术仍然限制在5公尺的范围内,并且难以在多人同时交谈或吵杂的环境中操作。影响语音控制技术进入到智能家居或其他应用领域的原因很多,包括使用者的习惯是否被建立、是否
发表于 2018-06-07 21:29:44
智能家居市场 语音识别这一密钥何时才能被激活?

浅谈智能语音交互,看一个Windows语音识别程序

我们经常能在科幻影片里能看到各种机器人与人类同台出演,与人类自由的沟通交流,甚至比人类更加聪明。大家肯定想知道这样的人造机器是如何做到的,我们现在真的能造出这样的机器人吗?开玩笑,我在这绝不可能解释好这个问题,但是从另一个角度简单来讲,与机器人交流其实这是通过语音来实现与机器交互,互动的一种操作,人与机器人的沟通其核心的一个方面便是语音的识别,就是说机器人得先听懂人说话。那此文就来浅聊下关于通过语音来实现人机交互的一些问题。我们先看一个较简单的例子 —— Windows语音识别程序:Windows语音识别功能主要是使用声音命令指挥你的电脑,实现离开键盘鼠标来实现人机交互。通过声音控制窗口、启动程序、在窗口之间切换,使用菜单和单击
发表于 2018-05-30 17:34:48
浅谈智能语音交互,看一个Windows语音识别程序

高通宣称其语音识别系统准确率高达95%

据外媒报道,在美国波士顿举行的Re-Work深度学习峰会上,高通的人工智能研究人员克里斯-洛特(Chris Lott)展示了其团队在语音识别计划方面的新进展。这种语音识别系统在智能手机或其他便携式设备上运行,包含两个神经网络:循环神经网络(RNN)和卷积神经网络(CNN)。循环神经网络利用其内存来处理输入信息,而卷积神经网络则模仿人类大脑中神经元之间的联系方式。洛特称,这种语音识别系统识别单词和短语的准确率达到了95%。“它可以学习你使用设备的习惯。”他说,“它能够根据你的习惯来进行个性化设置。”洛特称,现在大多数语音识别系统在云端进行运算过程。手机中的麦克风和芯片,智能音箱如谷歌Home和亚马逊Echo,以及配置
发表于 2018-05-29 09:13:06
高通宣称其语音识别系统准确率高达95%

受手机严重冲击:中国电视必须向智能化转型

不少彩电厂商认为,电视市场的前景依旧光明,现在是“黎明前的黑暗”,而要迎来黎明,电视厂商们需要打一场突围之战,行业专家认定:内容化、智能化、物联化这“三化”,被认为是突围的方向。  一个行业的共识是,对电视行业带来最大冲击的仍是手机。数据显示,用户影音娱乐使用时间最长的设备是手机,占比达46.3%,远远超过占比30.9%,屈居第二的电视。  中国的电视企业非常重视智能化的深入研究,语音识别功能明显丰富于其他外资品牌,虽然很多用户对于目前的智能系统并不买账,不仅响应时间长,而且语音识别的准确率也不能得到很好的保障。那是因为目前国内的智能电视市场乱象问题比较严重,互联网品牌层出不穷,甚至几百块钱就可以购买一台附带智能系统的电视。这些
发表于 2018-05-17 19:57:46
受手机严重冲击:中国电视必须向智能化转型

小广播

About Us 关于我们 客户服务 联系方式 器件索引 网站地图 最新更新 手机版

站点相关: 视频监控 智能卡 防盗报警 智能管理 处理器 传感器 其他技术 综合资讯 安防论坛

北京市海淀区知春路23号集成电路设计园量子银座1305 电话:(010)82350740 邮编:100191

电子工程世界版权所有 京ICP证060456号 京ICP备10001474号 电信业务审批[2006]字第258号函 京公海网安备110108001534 Copyright © 2005-2018 EEWORLD.com.cn, Inc. All rights reserved