datasheet

如何保证语音引擎设计的质量和性能

2008-06-24来源: 电子工程专辑 关键字:引擎  语音通信  语音编码器  语音处理  语音质量  语音不清  性能  缓存  音频  编解

  目前无绳电话或IP电话使用的通用SoC集成了接入器件和统一的无线通信器件,并且在系统软件中集成软件语音引擎,可以完全支持VoIP要求的软件数字信号处理。语音引擎采用了软DSP(soft-DSP)实现技术,能够满足嵌入式处理器的系统性能要求。为了确保VoIP具有电话质量的语音性能,系统软件必须满足语音引擎的实时要求。

  下一代软DSP产品采用了实时处理和宽带(高清晰度)语音通信技术,可以比当前技术取得更大的最终用户满意度和市场潜力。这些产品为语音通信建立了新的高清晰度标准。根据本文建议开发的产品可以取得超过电话质量通信的效果。相反,不满足这些实时要求将造成许多语音质量劣化的症状,包括掉话、显著的时延、爆破音或卡嗒声、传真/调制解调器呼叫失败或传真页错乱,以及由于丢包或超额延时造成的语音不清等等。不满足实时要求还将导致错过时限,这将是严重的系统故障,需要整个系统复位才能解决,除非系统支持硬件和软件的恢复。

  电话呼叫中的语音通信是双向的:音频的发送和接收同时进行。因此尽量减小语音系统中的延时以确保音频质量很关键;然而,减小时延的优化工作与满足语音处理要求相冲突。在传统的回放音频系统中,如音频(MP3)回放或多媒体流,缓存可以做得很大以补偿系统处理能力的低下,此时延时与质量无关。语音引擎却不能这样做,因为音频缓存必须能在固定时间得到全部处理。这种架构通常采用中断优先级划分和软件调度,利用甚至在某些时候增强操作系统的实时性能来保证语音处理的完成。

  在语音引擎系统中,软件中断服务程序将与语音硬件编解码器交换语音采样。语音硬件编解码器以8kHz的采样速率完成模拟信号与音频采样之间的来回转换。在电话应用中,硬件编解码器被连接到作为电话物理接口的用户线接口电路(SLIC)或无绳电话的DECT射频电路。而在IP电话或移动手机场合,硬件编解码器被连接到放大器,放大器再与麦克风和扬声器相连。

  SoC硬件接口在保证语音引擎的实时性能和准确调度方面扮演着关键的角色。如果SoC带TDM或AC97外设,电话语音编解码器可以直接连到处理器。如果嵌入式处理器不带这些外设,最低成本的解决方案是经过一个CPLD再与处理器相连。CPLD可以从硬件编解码器逐个收发采样,这种方案对时间最敏感,并且代表了最坏情况下的时序要求。

  不管是通过TDM、AC97还是CPLD,语音硬件服务必须优先处理以确保中断得到响应;其他系统软件必须不影响这个中断的关键时序。在8kHz的采样速率下,中断将每125μs发生一次。对于运行在200MHz的SoC来说,针对速度优化过的CPLD中断服务程序处理时间在25μs以内。这就允许最大中断延时的计算值为90μs(125μs–(25μs+中断服务建立时间10μs))。系统要想满足实时时限,操作系统必须在收到编解码器中断后的90μs内调用中断服务程序,并且操作系统必须允许服务运行并立即完成。

  操作系统还必须保证中断服务程序可以调度语音引擎,以便立即对在音频缓存进行处理。中断服务程序使用缓存准备好信号激活这种调度,如图所示。在该图中可以看到,DMA外设用来将音频采样采集到缓存中供语音引擎的处理,这种方法的效率要比CPLD实现高。

  对语音引擎的要求是要在下一个语音缓存准备好之前完成语音采样的处理。语音引擎中处理语音所需的时间取决于多个因素,包括处理器、缓存大小、RAM速度、物理语音接口数量(音频通道)、缓存要求的软件DSP处理以及所用的语音编码器类型。

  要想全面地分析语音引擎时序要求,请参考附表。tidle参数代表的是所有其他系统进程或系统应用程序留给可用处理的剩余时间。从语音引擎设计角度看,就是指空闲时间。所有较低优先级系统的处理都是发生在语音引擎完成实时语音处理后的空闲时间内。在最坏情况下,tidle可能为0ms,此时语音引擎处理会有多次反复。

  D2科技公司的vPort软件包含了针对所支持配置的性能基准。例如,vPort版本可能规定三方G.729AB语音会议呼叫的语音处理,作为最坏情况和缓存连续清空的条件下,要求语音引擎提供每10ms最大100MHz的处理能力。如果运行在400MHz RISC处理器上,tvoice在最坏情况处理时要求100MHz(CPU处理能力的25%),对应每隔10ms处理间隔中的2.5ms处理时间。如果tswitch超过7.5ms(tswitch=tbuffer–(tvoice+tidle)),实时时限就无法满足,这个时间还不包括在语音引擎处理期间由于其他外设中断、下半部处理或“tasklet”软中断引起的额外开销。

  以下是设计师在集成用于软DSP处理的语音引擎时需要考虑的最重要的一些设计准则:

  1. 为了使质量最优,语音通信要求最小化系统时延;

  2. 语音通信是连续的,丢失采样或失去实时性将是最严重的错误;

  3. 语音硬件有严格的时序要求,在丢失时序时需要一种差错恢复机制;

  4. 语音引擎实时处理必须在10ms的软件时限内完成对语音缓存的处理。语音引擎中断服务程序在CPU外设硬件基础上有严格的时序限制。

  

  图1:语音引擎时序图。

关键字:引擎  语音通信  语音编码器  语音处理  语音质量  语音不清  性能  缓存  音频  编解

编辑:孙树宾 引用地址:http://www.eeworld.com.cn/afdz/2008/0624/article_776.html
本网站转载的所有的文章、图片、音频视频文件等资料的版权归版权所有人所有,本站采用的非本站原创文章及图片等内容无法一一联系确认版权者。如果本网所选内容的文章作者及编辑认为其作品不宜公开自由传播,或不应无偿使用,请及时通过电子邮件或电话通知我们,以迅速采取适当措施,避免给双方造成不必要的经济损失。

上一篇:基于射频识别技术的联机型门禁系统设计
下一篇:TI针对金属应用推出两款低频RFID产品

关注eeworld公众号 快捷获取更多信息
关注eeworld公众号
快捷获取更多信息
关注eeworld服务号 享受更多官方福利
关注eeworld服务号
享受更多官方福利

推荐阅读

iSee研发深度学习及常识引擎 提升导航服务品质

据外媒报道,iSee公司正在打造新的自动驾驶汽车类型,该类车辆可利用“常识(common sense)”引擎,在非受控区域内为车辆提供导航服务。尽管大多数公司都将自动驾驶技术的研发方向定在提升传感器、感知及控制的性能上,但iSee的首席执行官Yibiao Zhao表示,他的公司率先致力于创建一款可真正了解交通状况的自动驾驶车辆。Zhao表示:“看见并不等同于理解。当前的车辆确实拥有了‘视觉’能力,但该类车辆并不了解接下来会发生什么状况,也不清楚其他人的想法,更遑论了解其他人的意图。”iSee在研发一款汽车编程系统,可利用特殊算法,实现开放环境下自动驾驶车辆与人员的协作,该系统分为两个部件:深度学习及常识引擎。Waymo及优步等公司
发表于 2018-11-08
iSee研发深度学习及常识引擎 提升导航服务品质

未来五年VCSEL市场年复合增长率达16.9%,增长引擎有哪些?

集微网消息,据市场研究公司Markets and Markets的2018年VCSEL市场报告显示,垂直腔面发射激光器(VCSEL)市场的年复合增长率(CAGR)将从2018年的17.8亿美元增加到2023年的38.9亿美元,年复合增长率(CAGR)为16.9%。增长主要归功于VCSEL在接近传感和医疗、数据通信、红外照明等应用中的使用日益增加,以及随着汽车电子技术的进步对VCSEL的需求激增。然而,有限的数据传输范围限制了VCSEL市场的增长。Markets and Markets数据显示,按材料类型划分,VCSEL市场分为砷化镓(GaAs),氮化镓(GaN),磷化铟(InP)等,包括镓铟氮化镓(GaInNAs),砷化铟镓(InG
发表于 2018-10-27
未来五年VCSEL市场年复合增长率达16.9%,增长引擎有哪些?

强型AI引擎,联发科技推出曦力P70(Helio P70)系统单芯片

联发科技今日宣布推出曦力P70(Helio P70)系统单芯片(SoC),其增强型AI引擎结合CPU与GPU的升级,实现了更强大的AI处理能力。超高功效的芯片组曦力P70除了升级对成像与拍摄功能的支持外,同时还提升游戏性能和先进的连接功能,以满足最严苛的用户需求。 基于今年上半年曦力P60的全球成功发布及其非凡的标志性功能,曦力P70为全功能智能手机“新高端(New Premium)”市场增添动力。 曦力P70 采用台积电12nm FinFET 制程工艺,应用多核 APU,工作频率高达 525 MHz,可实现快速、高效的终端人工智能(Edge-AI)处理能力。为了最大限度提升严苛的AI应用性能,芯片组采用八核
发表于 2018-10-25
强型AI引擎,联发科技推出曦力P70(Helio P70)系统单芯片

OPPO的Hyper Boost引擎如何对系统和应用实现加速?

  摘要  Hyper Boost 加速引擎包含了系统、游戏、应用三个层面,通过更智能地分配手机资源,提高手机流畅度。  提到 OPPO,可能不少人的第一反应是大街小巷上无数绿色招牌的店铺或者是两只手才能数过来的明星代言人,不过从产品上看,OPPO 其实是一家在手机技术上有很强积淀的手机公司。  其中大家最熟知的可能是 VOOC 闪充,这项以‘充电五分钟,通话两小时’被所有国人所知、放在 2018 年依然出于行业领先地位的充电技术是 OPPO 在 4 年前的 Find 7 上推出的。  到了 2018 年,特别是下半年,OPPO 在保持原有的时尚、流行定位的同时,加快了在技术方面的布局,50W SuperVOOC 超级闪充
发表于 2018-10-18
OPPO的Hyper Boost引擎如何对系统和应用实现加速?

谷歌重返中国市场不是搞个搜索引擎那么简单

美媒称,互联网搜索引擎谷歌(Google)8年前退出了中国市场。对谷歌的母公司“字母表”(Alphabet)来说,这个世界上最大的互联网市场的机会太过诱人,令它难以抗拒。如今,这家公司在中国的兴趣范围似乎不限于搜索引擎。 想在中国无人驾驶汽车行业分一杯羹? 据美国网站8月27日报道,最新的暗示来自于Waymo,这是一家2016年从谷歌剥离出来的无人驾驶汽车公司。中国媒体本周注意到,这家企业5月悄然在上海注册了一家子公司,表明它想在中国这一行业中分一杯羹。 在美国加利福尼亚州芒廷维尤,谷歌公司展示其研发的新型无人驾驶汽车的原型车(2015年5月13日摄) 谷歌近期在中国迈出的其他步伐包括开设
发表于 2018-08-31
谷歌重返中国市场不是搞个搜索引擎那么简单

OPPO宣布R17 Pro相机新特性:AI超清引擎

   8月16日消息,OPPO官方微博惯例预热R17系列新机,今天放出了关于R17 Pro夜拍能力的视频。  据官方介绍,OPPO R17 Pro拥有AI超清引擎,能多重提升夜拍画质,主要拥有三种功能,一是AI影像处理,能够智能分析场景;二是像素级色彩重构,可以智能提升色彩;三是超清纯净处理,能够让照片更清晰。  换句话说,就是通过AI算法提升夜间拍摄能力,而拍出的照片再通过算法处理,从而让夜间照片更加清晰。  就目前来看,OPPO一直在着重强调R17 Pro的夜间拍照能力,所以该机在这个方面应该会有所提升。  综合手头的消息,OPPO R17 Pro的相机目前拥有F1.5/F2.4灵动光圈、OIS光学防抖
发表于 2018-08-16
OPPO宣布R17 Pro相机新特性:AI超清引擎

小广播

About Us 关于我们 客户服务 联系方式 器件索引 网站地图 最新更新 手机版

站点相关: 视频监控 智能卡 防盗报警 智能管理 处理器 传感器 其他技术 综合资讯 安防论坛

北京市海淀区知春路23号集成电路设计园量子银座1305 电话:(010)82350740 邮编:100191

电子工程世界版权所有 京ICP证060456号 京ICP备10001474号 电信业务审批[2006]字第258号函 京公海网安备110108001534 Copyright © 2005-2018 EEWORLD.com.cn, Inc. All rights reserved
pt type="text/javascript" src="//v3.jiathis.com/code/jia.js?uid=2113614" charset="utf-8">