datasheet

智能家居又一突破性技术诞生了

2015-12-09来源: OFweek智能家居网 关键字:灵云语音唤醒  语音技术  智能终端
    捷通华声宣布推出灵云语音唤醒技术,可唤醒在休眠的手机、智能家居、智能车载、机器人、智能可穿戴设备等各种智能终端,唤醒率高达96%,从根本上解决了当前智能硬件只能用手打开后再用语音控制的方式。这是继灵云远场识别、灵云内容平台发布以来,捷通华声为智能车载、智能家居、家电等智能终端领域贡献的又一突破性技术。

    灵云语音唤醒的推出,进一步打破了智能语音控制在智能终端领域应用的产业瓶颈,让智能终端设备实现语音启动,一句话打开手机、电脑、电视、车载终端、机器人等智能硬件,使设备脱离了手动控制,实现“语音交互从‘头’开始”。

    灵云语音唤醒真正解放双手

    众所周知,由于功耗等方面的限制,智能电视等终端设备很难24小时都保持在激活状态。因此,要想自由地控制智能终端设备,我们还需要能即时“唤醒”功能,也就是给智能终端设备加入“语音唤醒”技术。

    语音唤醒,是指通过含有特定唤醒词的语音输入来“触发”语音识别系统以实现后续的语音交互。通过该技术,任何人在任何环境、任何时间,无论是近场还是远场,面向设备直接说出预设的唤醒词,就能激活产品的识别引擎,从而真正实现全程无触控的语音交互。

    除了说单个唤醒词实现唤醒外,更自然便捷、在技术上更具有挑战性的交互方式是在连续语流中带上唤醒词,以实现唤醒产品并同时实现操控的效果。

    目前,灵云语音唤醒方案在家居、电视、机器人等智能终端中具有非常广泛的用途,比如室内电灯关闭时喊一声:“小灵,开灯。”此时电灯会自动亮起,当离开时喊一声:“小灵,关灯。”电灯就自动关闭;当你找不到手机时,可以直接通过语音喊出“你好,小灵,你在哪儿”将其唤醒并响铃,这是其相对基础、也是比较主要的功能。

    灵云语音唤醒具备当前领先的技术水平,也可用于智能车载设备上。在此之前,智能车载必须手动开机,开机后才能再进行语音交互,而灵云语音唤醒则将省略开机过程,在通电状态下直接喊出“小灵,打开车载”车载设备将自动打开并等候下一步指令;在智能家居中,灵云语音唤醒更是必不可少,电视、冰箱、洗衣机、空调等智能家居设备都需要首先唤醒才能实现语音交互功能;而机器人的即问即答则更是少不了唤醒的功能。

    灵云智能语音一站式语音交互解决方案

    随着国内外巨头们对语音交互领域投入的增加,语音核心技术正逐步成熟。智能终端作为IT产业和制造工业向个人用户领域渗透发展的必然结果,语音技术正不断进入智能终端领域渗透,市场前景广阔。语音交互对于智能终端最直接的意义在于将“智能终端”变得真正的智能起来。无论是再技术先进的品牌,再友善的人机交互界面,都没有语音交互控制来的简便直接。所有品牌、所有产品以一个智能控制的概念进驻到人们息息相关的日常生活中的时候,少不了需要一个学习和适应的过程,而语音则不需要,我们所有的日常交流、行为习惯,语言和声音已经成了人们思维中的一部分。所以,如果智能终端能与语音交互融于一体,那么智能终端产业也许会迎来一次划时代的突破。

    但很长一段时间以来,科大讯飞、NUANCE等语音技术公司都在努力开拓智能硬件市场,但智能硬件产品在很多场景下因语音交互体验不如人意而不能满足市场的需求,究其原因主要是受限于手动开启、背景噪音、回声、混响、交互内容空洞等多重复杂因素,进而导致的识别距离近、识别率低等明显痛点,在这些问题没有解决之前,智能硬件语音交互方面将一直是一个短板。鉴于此,捷通华声推出了包括灵云语音唤醒、灵云远场语音识别、灵云智能语音、灵云智能语义、灵云内容平台在内的灵云智能终端解决方案,该套解决方案为国内最全、最完整的智能语音交互解决方案,必将极大促进智能语音交互技术在真实生活场景中智能终端的应用。

    智能终端首先需要由灵云语音唤醒来“叫醒”,才能进一步交互,没有被“叫醒”功能的终端将无法继续使用语音交互来控制。当设备被叫醒后,灵云远场语音识别能力将显示它巨大的威力,可以想象,基于灵云远场语音识别的远距离、高识别率支撑,现在用户在以家庭为单位的活动范围内,几乎可以通过语音轻松操控家里的一切智能硬件设备,推而广之,搭载远场识别的智能硬件产品将无限扩大适用范围和应用场景。而灵云内容平台的及时出现,为智能终端增添了天气咨询、日历查询、列车查询、航班查询、餐馆位置查询、电话拨打、电话号码寻找、短信收发、音乐及视频播放控制、导航、车载指令等30余种内容的支持,从根本上改变了智能终端语音交互仅能“发号施令”的弊端。

    2014年,为方便国内智能车载、智能家居等智能终端厂商与集成商、开发商更好地使用灵云平台(hcicloud.com)全方位人工智能能力,捷通华声特别推出了企业级开发者专用的智能终端交互方案:灵云种子。灵云种子强化了灵云全方位人工智能平台各项人工智能技术的融合,包括灵云语音识别、语音合成、语义理解、声纹识别、人脸识别、指纹识别等全方位人工智能交互能力,并提供简单易用的开发接口,供智能家居、车载等各类智能终端进行集成调用,实现人与终端设备多种方式的自由沟通和控制。企业级开发商通过应用灵云种子,可以轻松实现智能语音交互、智能语音导航、智能语音控制、声纹解锁、手写输入、智能图像识别、安全身份认证等多种人机交互功能,满足智能家居、智能车载、智能家电、机器人及可穿戴式设备等各个行业对人工智能技术应用大量且多方位的需求。

    据悉,灵云语音唤醒技术即将应用在灵云种子中,灵云平台还将陆续推出语音降噪,回声消除、声源定向等多种能力,为各行各业智能终端不断提供新的技术,推动中国智能终端产业将进入一个全新的、真智能的时代!

    灵云平台服务智能终端合作共赢

    灵云平台是捷通华声于2011年推出的首个全方位人工智能开放平台。为推动人工智能产业的广泛应用,灵云平台自推出以来一直面向产业全面开放,包括个人开发者在内的合作伙伴,都可以通过灵云平台获取智能语音、智能图像、智能语义、生物特征等技术能力。

    捷通华声为更好服务智能终端各领域合作伙伴,在全国各地建立分公司与办事处,尤其在中国华南的广州、深圳地区经济发达、创新力强,在智能车载、智能家居、机器人、穿戴式设备研发与创新上拥有独特优势。为了向华南地区广大合作伙伴提供更加直接的支持与帮助,捷通华声2015年在深圳、厦门等地成立了分公司,旨在依托灵云平台,利用灵云平台智能语音、智能图像、语义理解等全方位人工智能技术能力和丰富完善的智能终端交互解决方案,与华南地区智能车载、智能家居等智能终端厂商加强合作关系,发挥华南地区智能终端设备研发和生产的优势,期望通过与各领域合作伙伴的精诚合作,互惠共赢,共同推动中国智能终端产业的发展进步!

    未来发展,捷通华声将继续以清华大学人工智能研究力量为依托,更加专注智能语音等人工智能技术研究与产业化的推广与应用,与合作伙伴精诚合作,共同创建良好的人工智能产业生态,共同推动中国人工智能产业的发展进步,为中国人工智能产业的发展做出应有的贡献!

关键字:灵云语音唤醒  语音技术  智能终端

编辑:鲁迪 引用地址:http://www.eeworld.com.cn/afdz/2015/1209/article_9115.html
本网站转载的所有的文章、图片、音频视频文件等资料的版权归版权所有人所有,本站采用的非本站原创文章及图片等内容无法一一联系确认版权者。如果本网所选内容的文章作者及编辑认为其作品不宜公开自由传播,或不应无偿使用,请及时通过电子邮件或电话通知我们,以迅速采取适当措施,避免给双方造成不必要的经济损失。

上一篇:主要看气质 智能蓝牙挂锁让生活变简单
下一篇:视频智能分析技术在各个领域扮演的各种角色

关注eeworld公众号 快捷获取更多信息
关注eeworld公众号
快捷获取更多信息
关注eeworld服务号 享受更多官方福利
关注eeworld服务号
享受更多官方福利

推荐阅读

谷歌医疗顾问Toby Cosgrove预测:医疗领域的下一个重要技术应用将是语音识别

通过外媒资讯获悉,在美国“新闻&世界报道医疗保健会议” (News & World Report Healthcare)上,谷歌顾问、前克利夫兰诊所首席执行官Toby Cosgrove预测,除了已经在医疗领域站稳脚跟的人工智能等新技术外,医疗领域的下一个重要技术将是“语音识别”。Cosgrove在会议期间提出了他对当前医疗保健服务领域创新的看法。他表示:“语音识别将是医疗保健领域的下一个‘杀手级’应用。”当然,谷歌、亚马逊和苹果这些硅谷的大腕们已经开发和改进了语音识别工具,包括Google Home、Alexa和Siri等。Cosgrove表示,语音识别只是技术不断发展的一个例子和表现,它可以建立在繁琐的EHR
发表于 2018-11-22

智能语音技术在医疗领域的成熟应用

近年来,智能语音技术在医疗领域的应用越来越广泛,借助互联网大数据的不断发展,语音技术也从最初的语音识别逐步转向智能化的语音辅助。智能语音技术作为医生诊疗过程中的辅助助手,以其快速、准确、出错率少的特点,帮助医生处理了大量冗杂,繁琐的重复性劳动,大大减轻了医护工作者们的负担。随着技术的不断完善和创新,我们有理由相信,以语音为媒介的人机交互很可能会成为下一代医疗行业最有意义的交互方式。语音设备作为助手辅助治疗语音技术在医疗领域的应用,最先是用来解决医疗过程中存在的各种问题。比如,美国的一家公司就利用语音识别技术发明了一种入耳式语音设备,通过这种设备,外科医生可以直接和设备内的病人的电子病历进行对话,并能够得到比询问患者本人更加精
发表于 2018-10-14
智能语音技术在医疗领域的成熟应用

麻省理工新型AI技术 融合了语音和物体识别技术

麻省理工学院的研究人员已经创建了一个新的人工智能程序,它不仅能够同时识别图像和语音中的物体,而且还能积极地将两者结合起来,从而更有效地理解和利用两者。这个人工智能程序可以分析带有音频标题的图像,然后把这两个资源放在一起,然后找出哪个对象对应于标题的哪些部分。它在测试中通过突出显示图像区域和对象来演示这一点,而它们是由标题描述的。根据该项目的研究人员的说法,这比传统的语音识别或图像识别训练更自然、更有机。从本质上讲,人工智能正在像人类一样学习,这将使它更加灵活,从而在未来更有能力。这个人工智能程序实际上是一个以前的模型的扩展,它能够将单词和短语与图像的主题集合相匹配,比如颜色和原型。该模型使用两个卷积神经网络,分别处理语音输入和图像
发表于 2018-10-12

你要的技术干货来了 | 用于蓝牙低功耗遥控器的语音命令

研究了使用Dialog基于DA14585的高级语音遥控参考设计,通过蓝牙低功耗(BLE)实现语音命令。 图1. 较大的 QWERTY遥控器用语音作为命令界面语音是一个非常强大和直观的界面。一个简单的短语可以包含足够的信息来描述非常复杂的命令。然而,在嘈杂的环境中捕捉短语并提取有实际意义的信息(通常以字符串的形式),这在技术上是一个挑战。幸运的是,产生这个需求的源头,即智能设备与互联网的连接,也为这一复杂问题提供了解决方案。设备现在可以访问云计算,并且可以受益于最先进的语音到文本识别引擎,如Nuance Communications、微软、谷歌、亚马逊等公司提供的技术。如今,基于云的语音识别服务足以提供非常好的用户体验。我们为什么还需要
发表于 2018-07-18
你要的技术干货来了 | 用于蓝牙低功耗遥控器的语音命令

Google造人计划,人工智能还能这么玩?

字是图灵老人家在 1950 年那篇论文里面对 2020 年的技术。但事实上尽管影视作品里面的人工智能助手深入人心,但用户能用到的人工智能,可以说基本上都是人工智障了。 直到昨晚 Google 用两个动作,让 Google Assistant 距离像真正的人又近了一步。 我们都知道,要想让一个智能语音助手像人,其实只要实现三个维度的事情就行了: 1. 能听懂你说的话 2. 说的话能让你听懂 3. 如果是语音助手,那么它说话的像人 目前市面上的智能音箱不少,各家互联网巨头也都在做所谓的“智能语音助手”,但智能音箱鸡肋的原因也挺简单的,归根结底还是不够聪明。 早上
发表于 2018-05-11
Google造人计划,人工智能还能这么玩?

第一家在中国语音生物识别技术的银行

  在当今信息化和科技化的时代,由于传统密码存在易丢失、易遗忘且不与用户唯一绑定等缺点,生物识别技术逐渐兴起,并成为替代传统密码识别作为身份验证的重要手段。下面就随网络通信小编一起来了解一下相关内容吧。  生物识别是指通过计算机与光学、声学、生物传感器和生物统计学原理等高科技手段密切结合,利用人体固有的生理特征来进行个人身份鉴定的技术。生物识别技术主要有指纹识别、语音识别、人脸识别、虹膜识别等。  预计到2021年,中国生物识别行业的市场规模将突破340亿元。现在,中国第一家广泛采用自由语音声纹认证技术的银行诞生了,它就是花旗银行。  根据百科资料,花旗银行是美国最大的银行之一,也是一家在全球近一百五十个国家及地区设有分支机构
发表于 2018-05-08
第一家在中国语音生物识别技术的银行

小广播

About Us 关于我们 客户服务 联系方式 器件索引 网站地图 最新更新 手机版

站点相关: 视频监控 智能卡 防盗报警 智能管理 处理器 传感器 其他技术 综合资讯 安防论坛

北京市海淀区知春路23号集成电路设计园量子银座1305 电话:(010)82350740 邮编:100191

电子工程世界版权所有 京ICP证060456号 京ICP备10001474号 电信业务审批[2006]字第258号函 京公海网安备110108001534 Copyright © 2005-2018 EEWORLD.com.cn, Inc. All rights reserved
pt type="text/javascript" src="//v3.jiathis.com/code/jia.js?uid=2113614" charset="utf-8">