如何保证语音引擎设计的质量和性能

2008-06-24 13:27:25编辑:孙树宾 关键字:引擎  语音通信  语音编码器  语音处理  语音质量  语音不清  性能  缓存  音频  编解

  目前无绳电话或IP电话使用的通用SoC集成了接入器件和统一的无线通信器件,并且在系统软件中集成软件语音引擎,可以完全支持VoIP要求的软件数字信号处理。语音引擎采用了软DSP(soft-DSP)实现技术,能够满足嵌入式处理器的系统性能要求。为了确保VoIP具有电话质量的语音性能,系统软件必须满足语音引擎的实时要求。

  下一代软DSP产品采用了实时处理和宽带(高清晰度)语音通信技术,可以比当前技术取得更大的最终用户满意度和市场潜力。这些产品为语音通信建立了新的高清晰度标准。根据本文建议开发的产品可以取得超过电话质量通信的效果。相反,不满足这些实时要求将造成许多语音质量劣化的症状,包括掉话、显著的时延、爆破音或卡嗒声、传真/调制解调器呼叫失败或传真页错乱,以及由于丢包或超额延时造成的语音不清等等。不满足实时要求还将导致错过时限,这将是严重的系统故障,需要整个系统复位才能解决,除非系统支持硬件和软件的恢复。

  电话呼叫中的语音通信是双向的:音频的发送和接收同时进行。因此尽量减小语音系统中的延时以确保音频质量很关键;然而,减小时延的优化工作与满足语音处理要求相冲突。在传统的回放音频系统中,如音频(MP3)回放或多媒体流,缓存可以做得很大以补偿系统处理能力的低下,此时延时与质量无关。语音引擎却不能这样做,因为音频缓存必须能在固定时间得到全部处理。这种架构通常采用中断优先级划分和软件调度,利用甚至在某些时候增强操作系统的实时性能来保证语音处理的完成。

  在语音引擎系统中,软件中断服务程序将与语音硬件编解码器交换语音采样。语音硬件编解码器以8kHz的采样速率完成模拟信号与音频采样之间的来回转换。在电话应用中,硬件编解码器被连接到作为电话物理接口的用户线接口电路(SLIC)或无绳电话的DECT射频电路。而在IP电话或移动手机场合,硬件编解码器被连接到放大器,放大器再与麦克风和扬声器相连。

  SoC硬件接口在保证语音引擎的实时性能和准确调度方面扮演着关键的角色。如果SoC带TDM或AC97外设,电话语音编解码器可以直接连到处理器。如果嵌入式处理器不带这些外设,最低成本的解决方案是经过一个CPLD再与处理器相连。CPLD可以从硬件编解码器逐个收发采样,这种方案对时间最敏感,并且代表了最坏情况下的时序要求。

  不管是通过TDM、AC97还是CPLD,语音硬件服务必须优先处理以确保中断得到响应;其他系统软件必须不影响这个中断的关键时序。在8kHz的采样速率下,中断将每125μs发生一次。对于运行在200MHz的SoC来说,针对速度优化过的CPLD中断服务程序处理时间在25μs以内。这就允许最大中断延时的计算值为90μs(125μs–(25μs+中断服务建立时间10μs))。系统要想满足实时时限,操作系统必须在收到编解码器中断后的90μs内调用中断服务程序,并且操作系统必须允许服务运行并立即完成。

  操作系统还必须保证中断服务程序可以调度语音引擎,以便立即对在音频缓存进行处理。中断服务程序使用缓存准备好信号激活这种调度,如图所示。在该图中可以看到,DMA外设用来将音频采样采集到缓存中供语音引擎的处理,这种方法的效率要比CPLD实现高。

  对语音引擎的要求是要在下一个语音缓存准备好之前完成语音采样的处理。语音引擎中处理语音所需的时间取决于多个因素,包括处理器、缓存大小、RAM速度、物理语音接口数量(音频通道)、缓存要求的软件DSP处理以及所用的语音编码器类型。

  要想全面地分析语音引擎时序要求,请参考附表。tidle参数代表的是所有其他系统进程或系统应用程序留给可用处理的剩余时间。从语音引擎设计角度看,就是指空闲时间。所有较低优先级系统的处理都是发生在语音引擎完成实时语音处理后的空闲时间内。在最坏情况下,tidle可能为0ms,此时语音引擎处理会有多次反复。

  D2科技公司的vPort软件包含了针对所支持配置的性能基准。例如,vPort版本可能规定三方G.729AB语音会议呼叫的语音处理,作为最坏情况和缓存连续清空的条件下,要求语音引擎提供每10ms最大100MHz的处理能力。如果运行在400MHz RISC处理器上,tvoice在最坏情况处理时要求100MHz(CPU处理能力的25%),对应每隔10ms处理间隔中的2.5ms处理时间。如果tswitch超过7.5ms(tswitch=tbuffer–(tvoice+tidle)),实时时限就无法满足,这个时间还不包括在语音引擎处理期间由于其他外设中断、下半部处理或“tasklet”软中断引起的额外开销。

  以下是设计师在集成用于软DSP处理的语音引擎时需要考虑的最重要的一些设计准则:

  1. 为了使质量最优,语音通信要求最小化系统时延;

  2. 语音通信是连续的,丢失采样或失去实时性将是最严重的错误;

  3. 语音硬件有严格的时序要求,在丢失时序时需要一种差错恢复机制;

  4. 语音引擎实时处理必须在10ms的软件时限内完成对语音缓存的处理。语音引擎中断服务程序在CPU外设硬件基础上有严格的时序限制。

  

  图1:语音引擎时序图。

关键字:引擎  语音通信  语音编码器  语音处理  语音质量  语音不清  性能  缓存  音频  编解

来源: 电子工程专辑 引用地址:http://www.eeworld.com.cn/afdz/2008/0624/article_776.html
本网站转载的所有的文章、图片、音频视频文件等资料的版权归版权所有人所有,本站采用的非本站原创文章及图片等内容无法一一联系确认版权者。如果本网所选内容的文章作者及编辑认为其作品不宜公开自由传播,或不应无偿使用,请及时通过电子邮件或电话通知我们,以迅速采取适当措施,避免给双方造成不必要的经济损失。

上一篇:基于射频识别技术的联机型门禁系统设计
下一篇:TI针对金属应用推出两款低频RFID产品

关注eeworld公众号 快捷获取更多信息
关注eeworld公众号
快捷获取更多信息
关注eeworld服务号 享受更多官方福利
关注eeworld服务号
享受更多官方福利

推荐阅读

飞机引擎检修只需五分钟?全靠智能机器虫协助

罗尔斯·罗伊斯在本周的范堡罗国际航展上展示了其对未来发动机维修的新愿景。这种设想可能会让人们感到不可思议。在今年年初的新加坡航展上,罗尔斯·罗伊斯提出了“智能引擎”(IntelligentEngine)的概念。作为其智能引擎愿景的一部分,该公司研发出了一种蛇型机器人和微型蟑螂机器人,并展示了它们的计划。理论上,这些机器人将协同工作,在不影响整个引擎状态的情况下检查飞机引擎的内部并进行维修。目前来说,这两项技术都还不够成熟,尚未达到可以付诸实践的程度,但这里需要解释一下它们的工作原理:罗尔斯·罗伊斯正与美国哈佛大学和英国诺丁汉大学合作,致力于制造一种名为“SWARM”的10毫米微型协同机器人。这种机器人将能够通过小型摄像机为操作员
发表于 2018-07-23 19:03:12

看好思必驰或成为第二家汇顶?联发科畅谈未来三大成长引擎

到端集成方案,包括智能门锁、可穿戴健康手环和儿童安全腕表等。事实上,联发科与中国移动在NB-IoT领域已经展开过多次合作。游人杰说道,继去年合作推出业界最小的NB-IoT通用模组、一站式解决方案、完成R14速率增强测试之后,今年双方将在原有合作基础上基于一站式解决方案继续推进NB-IoT技术在消费类电子行业的合作。在他看来,作为5G商用的前奏和基础,NB-IoT技术将为物联网领域带来诸多创新突破,有助于促进5G的真正实现。然而,他也无奈地表示,目前NB-IoT技术仍在发展中,如果大家一直通过猛砍价的方式恶意竞争,将导致这个产业不能健康发展。三大成长引擎当然,除了布局NB-IoT技术,联发科也十分关注AI的发展趋势。据游人杰介绍
发表于 2018-07-02 19:07:33
看好思必驰或成为第二家汇顶?联发科畅谈未来三大成长引擎

曙光先进计算“新引擎”亮相ISC2018 专注HPC价值

液冷技术发展前沿。  曙光Torus液冷硅元交换机曙光TC4600E-LP冷板刀片液冷服务器 大会期间,曙光公司还重磅推出新版本人工智能管理平台——“SothisAI2.0”和EasyOP升级服务——先进计算服务平台,为先进计算装上“新引擎”。这意味着,曙光在硬件“引擎”的基础上,不断完善服务支持“新引擎”,开启先进计算领域软硬件两翼齐展的新格局。Summit启示:计算技术趋于融合6月8日,美国橡树岭国家实验室宣布新的超级计算机Summit落成,其峰值计算性能可突破200 PFlops(20亿亿次每秒),一跃成为全球最快的超级计算机。Summit对AI计算的强大支持,揭示HPC与AI的融合发展趋势正不断
发表于 2018-07-01 10:56:27
曙光先进计算“新引擎”亮相ISC2018 专注HPC价值

眼擎科技“成像引擎” 让摄像头无惧复杂光

实验室的“理论”效果。“大脑要强,但如果感知端无法传输有效的信息,那么大脑再强也没有用。”针对当前AI成像的问题,朱继志于2014年创立了眼擎科技,研发超越人眼视觉能力的成像引擎技术及芯片,解决数码成像在弱光、逆光、反光等复杂光环境下成像的痛点。AI视觉新问题:大脑够强了,眼睛却跟不上在安防领域,每年摄像头出货量超过1亿台,人脸识别、车辆识别等算法的成熟持续带动着安防市场扩大,但在实际应用中,“识别”受到了诸多环境因素的限制,其中最重要一个挑战就是复杂光线。“如果将整个识别的系统比作一个人,我们现在已经有很强的大脑了,但眼睛却跟不上。”朱继志告诉亿欧,要对人脸、车辆进行识别的前提条件,是前端摄像头能够传回清晰的画面。但现在的问题是
发表于 2018-06-07 21:21:51
眼擎科技“成像引擎” 让摄像头无惧复杂光

联想亟待发展后个人电脑时代的新成长引擎

联想集团曾是大陆最成功的高科技公司与全球个人电脑(PC)出货量龙头,虽然PC与智能设备业务成长动能依然强劲,但寄予重望的智能手机业务因高度竞争几乎毫无进展,且数据中心(data center)解决方案业务尚处亏损,亟待发展后PC时代第二个成长引擎,并寻回客户与第一线优先的初心。 根据Nikkei Asian Review报导,联想2016年财报净利达5.35亿美元,而2017年财报净损失达1.89亿美元,主因包括移动设备业务失利,营收72亿美元,衰退6%、亏损4.63亿美元;数据中心解决方案业务税前损失达3.05亿美元;为美国税改方案产生的递延所得税提列4亿美元一次性支出。 联想市值较5年前腰斩过半,2018年
发表于 2018-05-30 20:04:00

苹果“深度扫描引擎”专利曝光,iPhone将具备深度感应

深度感应(depth-sensing)是虚拟现实等技术的下一个重要研究方向,而苹果似乎也对此非常感兴趣。最近,这家公司一个所谓的“深度扫描引擎”专利就遭到了曝光,当中介绍了一种使用光线发射器和扫描仪来判断深度的方式。 从2012年开始,苹果已经接连注册了多个相关的技术专利,这显然表明他们对这项技术很感兴趣。从专利图片上看,这项技术似乎是为Mac所准备的,但我们也能想象出它在iPhone上的应用方式,并且后者可能会更加实用。 深度图在许多情况下都非常有用。它们不仅可以在手机上生成更具沉浸感的图像,还能帮助捕捉虚拟现实内容,或是增强游戏的沉浸感。除了发射器和扫描仪之外,苹果的这套系统当中还包含一个处理器,可使
发表于 2018-05-08 20:51:50
苹果“深度扫描引擎”专利曝光,iPhone将具备深度感应

小广播

About Us 关于我们 客户服务 联系方式 器件索引 网站地图 最新更新 手机版

站点相关: 视频监控 智能卡 防盗报警 智能管理 处理器 传感器 其他技术 综合资讯 安防论坛

北京市海淀区知春路23号集成电路设计园量子银座1305 电话:(010)82350740 邮编:100191

电子工程世界版权所有 京ICP证060456号 京ICP备10001474号 电信业务审批[2006]字第258号函 京公海网安备110108001534 Copyright © 2005-2018 EEWORLD.com.cn, Inc. All rights reserved