数字音频标准:改写产业被动格局

2008-04-07 15:24:51来源: 中国电子报

  长期以来,数字音频的核心技术基本掌握在美、日、欧等国家和地区的跨国巨头手中,应用比较广泛的有杜比、DTS、索尼等,包括中国在内的音频终端厂家需要向专利权人缴纳专利费,才得以采用上述主流的音频技术。这笔专利费并非小数,据统计,目前杜比、DTS以及MPEG等国外企业或组织,每年从我国收取的数字音频技术许可费用高达数亿美元。

  数字音频核心技术与标准的缺失,意味着国内企业只能充当“制造商”的角色,数字音频产业的大部分利润将被国外专利组织攫取,更重要的是,我国企业因此而丢掉音频产业未来发展的主动权。

  改写我国音频产业被动格局的时间点,指到2007年1月20日,信息产业部正式发布了中国数字音频电子行业标准——《多声道数字音频编解码技术规范》。该标准具有中国自主的知识产权,它的出台被业内评价为“中国数字音频产业打了一个翻身仗”。

  标准研发前的专利困局

  “《多声道数字音频编解码技术规范》的原型是DRA数字音频编码技术,其研发始于2001年6月。”全国音视频标准化技术委员会秘书长赵新华在接受记者采访时表示。

  站在《多声道数字音频编解码技术规范》研发历史原点的关键人物是游余立博士。在游余立供职美国DTS公司时,曾到中国推介DTS技术标准。相关领导的邀请使他在中国与DRA数字音频技术迅速结缘。

  数字音频编解码技术是数字音视频领域的一项核心基础技术。MP3、VCD、DVD等的视频和音频都是经过压缩编码的,只是所采用的编解码技术标准不同。

  从全球整个市场看,流行的是六大音频标准:一是美国杜比公司的AC-3标准。从某种程度上说,杜比AC-3技术标准是目前应用最为普及的音频技术标准。它具备单声道、立体声和5.1环绕声功能,在数字电视、DVD、影院系统等多方面得到广泛的应用。目前美国ATSC、欧洲DVB、澳大利亚等国家数字电视纷纷采用杜比AC-3作为数字电视的伴音标准,使其应用更为广泛。

  二是MPEG-1音频技术标准。它是上世纪80年代中期随着MPEG技术标准的不断成熟而推出的音频编码技术标准,其目的是为数字视频节目伴音,其伴音具备8声道(用于多语言重放)。由于其设计的目标适合于多种语言环境的伴音,特别适用于语言环境复杂的地区。目前,欧洲DVB标准中将MPEG作为音频伴音标准。

  三是MPEG-2。它是在MPEG-1的基础上开发的一种视频编码,质量远远好于MPEG-1,是从立体声转换成了环绕声,所以被运用在了DVD-Video上面。MPEG-2是DVD-Video唯一指定的视频编码。MPEG-2不光运用于DVD-Video,现在大部分HDTV(高清电视)也采用MPEG-2编码,分辨率达到了1920×1080。

  四是MPEG2 AAC标准。AAC是MPEG2音频编码技术标准之一,在MPEG2技术标准中的第七部分进行了标准化(ISO/IEC 13818-7)。杜比公司从1998年开始管理AAC的知识产权池,目前VIA LICENSING公司负责管理其知识产权池的工作,代理AT&T、杜比、Fraunhofer IIS和索尼等公司收取相关的知识产权费。

  五是DTS标准。DTS是数字影院系统的缩写,其系统设计的目的是给电影院系统提供环绕立体声的音频编码技术方案。目前在美国有超过数万座DTS影院,一般认为其环绕声效果比AC-3好。

  六是WMA标准。它是微软公司开发的基于互联网流媒体应用的数字音频压缩算法,广泛应用于互联网中音频的压缩。由于其具有更低的码率,目前已经成为网络音频资源的重要标准之一,继微软提出VC-1技术标准后,WMA成为微软推荐的事实标准之一。

  由以上可以看出,全球市场上可提供音频编码技术完整方案的公司并不多,核心技术基本掌握在美、日、欧等国家和地区的跨国巨头手中,包括美国的杜比、DTS、Lucent、微软,欧洲的飞利浦、Fraunhofer和日本的索尼。不过,这些跨国巨头近年来明显加快了对中国市场的掠夺和瓜分,比如杜比AC-3和DTS在DVD、数字影院行业,MPEG在广电行业,MP3在个人多媒体播放器领域几乎达到了垄断的程度。

  包括中国在内的音频终端厂家需要向上述跨国巨头缴纳专利费,才能采用主流的音频技术。这笔专利费并非小数,据统计,目前杜比、DTS以及MPEG等国外企业或组织,每年从我国收取的数字音频技术许可费用高达数亿美元!

  在跨国巨头公司通过控制标准的制定或造成事实标准,获取高额而稳定的收益的同时,中国市场上,相关自主音频编解码技术标准的研发,一直没有实质性成果。

  面对数字音频领域严峻的形势,我国政府前期投入了大量的资金,扶持民族数字音频技术研究。国家重点扶持的清华大学和中国电子科技集团第三研究所等机构对此做了很多深入工作,但主要集中于学术性研究,还没有计划开发一套完整的能产业化的技术标准体系;以中科院计算所为主体的AVS工作组,在2006年3月公布了视频标准之后,其音频部分至今尚未取得实质性突破;由北京阜国数字技术有限公司开发,曾被EVD标准采用的ExAC音频技术由于受到专利归属纠纷的影响,至今前景不明。

  数字音频核心技术与标准的缺失,意味着国内企业只能充当“制造商”的角色,数字音视频产业的大部分利润将被国外专利组织攫取,更重要的是,我国企业因此而丢掉音视频产业未来发展的主动权。

  游余立说:“这些专利费的流出,就像一根大水管将中国的资金和创新能力源源不断地抽走,却不能带来就业、消费。”

  基于要做出中国自主知识产权的音频标准的考虑,游余立2001年从美国回国后,在广东中山小榄镇组建了一家合资知识产权公司——中山正音数字技术有限公司,在不到一年的时间里,开发出“中山正音”数字音频编码技术,申请了12项国内专利。

  2003年3月,游余立采取比以往更先进的技术路线,开发出一套全新的数字音频编解码算法——DRA多声道数字音频编解码算法。直到同年11月,他用C++开发完DRA编码和解码软件,DRA算法由此正式定型。2004年1月,他又在Motorola DSP 56367芯片上开发出实时DRA解码软件。

  “这个标准的诞生过程并非如外界想像得那样波澜起伏,它是一个很平滑的过程。我们在其间做的只是一点一滴的技术积累,一步一步的技术完善,厚积薄发,由此标准研发成功。”内敛而低调的游余立和很多技术狂人一样,全部心思只在于捕捉最先进的技术,而对自己在其中的是非功过及诸多细节,不做过多的评述。

  2002年,广东省发改委副主任张军获知游余立的“中山正音”技术后,意识到自主知识产权的音频标准对信息产业的巨大价值,于是开始给予大力支持,并当起了游余立和一家企业之间的“月老”,一个由企业提出、省部联动的标准故事由此开篇。

  企业提出“省部联动”

  2007年1月20日,这家企业因起草以DRA数字音频技术为基础的《多声道数字音频编解码技术规范》,从幕后走向了前台。这家企业就是广东企业广晟数码技术有限公司(以下简称“广晟数码”),此前业界对这家企业知之甚少。

  2004年6月,在广东省发改委副主任张军的牵线之下,由广东省广晟资产经营有限公司出资、游余立博士以其自主研发的DRA多声道数字音频编码技术入股,成立广晟数码。

  “国外的标准大部分是企业自己做的,而中国的企业很多是在要交专利费时就叫苦,而又不愿意投钱自己研发自主知识产权的标准。广晟的领导班子对自主知识产权音频技术的大力支持是非常难得的,因为在很多人看来,在结果不明朗前,这是一个很冒险的烧钱行为。”游余立向记者坦陈。

  如此重大的技术开发项目由一个地方企业承担,在全国是很罕见的,毕竟投资知识产权公司风险太大。知识产权公司的运营模式是很长时间看不到收入,只有技术被广泛使用后,依据知识产权保护法,公司才开始获益。比如,MP3技术的开发工作20年前就开始了,而大量收取专利费却是近几年的事。

  广晟数码甫一成立,就开始了将DRA技术推向行业标准的征途。

  记者在采访中了解到,DRA数字音频技术在短短的2年多时间里就成为国家行业标准,得益于广东省和信息产业部的“省部联动”。

  2005年年底,广东省数字音频项目推进工作领导小组启动了将广晟数码起草的《多声道数字音频编解码技术规范》申报国家有关标准的工作。2006年1月19日,广东省信息产业厅以“粤信厅[2006]13号”文向信息产业部提交《关于申报广晟数码(DRA)数字音频编解码技术国家标准(草案)的请示》。

  自此,省部联动推动我国数字音频行业标准出台这一创新举措,拉开了序幕。

  2006年2月22日,广东省信息产业厅以“粤信厅[2006]33号”文向信息产业部科技司提交了《关于广东省推进国家数字音频标准工作的情况汇报》。

  2006年3月31日,广东省信息产业厅以“粤信厅[2006]59号”文向信息产业部科技司提交了《关于加快数字音频标准(草案)审查的请示》。

  2006年4月6日,信息产业部科技司会同广东省信息产业厅在广州召开了音频编解码标准协调会。

  2006年6月13日,信息产业部科技司副司长韩俊及相关人员前往国家发改委,沟通和商议DRA音频标准事宜。国家发改委高技术产业司司长许勤表态,支持广东省将技术、标准和产业化在地区开展试点,由信息产业部确定形成行业标准,6月14日,国家广电总局科技司副司长王联明确表示在DRA技术具备产业化的条件下,国家广电总局支持DRA技术成为国家标准。

  2006年7月3日,信息产业部科技司主持召开的部内相关司局参加的第二季度标准协调会议上,与会人员认真审议了DRA音频标准草案制定和广东省推进其产业化的情况,同意DRA音频标准作为电子行业推荐性标准立项。根据标准草案的制定进展情况,会议认为可以进入标准报批稿公示阶段。

  2006年8月7日,信息产业部科技司以“信科简函字[2006]243号”向广东省信息产业厅发出《关于加快妥善处置广晟数字音频编解码技术标准中知识产权问题的函》,要求广东省信息产业厅督促广晟集团尽快提供第三方代理机构建立的进展情况。

  2006年8月21日,《多声道数字音频编解码技术规范》(报批稿)在中国电子工业标准化技术协会网进行开始公示。

  2006年11月23日,广东省信息产业厅彭平副厅长北上信息产业部,就标准的知识产权处置以及产业化进展情况向信息产业部科技司做了汇报。

  2007年1月21日,《多声道数字音频编解码技术规范》行业标准颁布。

  由此,在国际音频产业界,我们听到了中国发出了自己的声音。同时,《多声道数字音频编解码技术规范》对民族产业的最直接贡献就是每年向国外音频标准组织少交六七十亿元人民币的专利费。

  信息产业部副部长娄勤俭在《多声道数字音频编解码技术规范》正式发布的会上指出,该音频标准拥有数字音频核心技术的自主知识产权,标准的颁布将为数字音视频产业提供有力的技术支撑,对于我国数字音视频产业的整体突破和快速发展将起到十分重要的带动作用。

  六次“小考”打消技术疑虑

  《多声道数字音频编解码技术规范》成为中国音频行业标准之前,业界对杜比、DTS和MPEG的认可度以及使用率较高,对于一个新生的事物,人们难免对其的技术指标抱有怀疑的心态。

  实际上,DRA获得业界的广泛认可也颇费一番周折,大大小小经历了六次考验,才让业界对这个中国人自己研发的音频编解码标准打消了疑虑。

  第一次小考是在2004年8月10日,DRA技术顺利通过信息产业部国家广播电视产品质量监督检测中心的技术测试。当时的测试结论为:该技术“在立体声和5.1声道工作方式下,音质损伤较小,听音人员感觉其音质与未经编解码的原始节目信号无明显差别。”时隔10多天之后,2004年8月23日,广东省发改委、信息产业厅和广电局联合在广州召开了“广晟数码数字音频编解码算法专家鉴定会”。会议由中国工程院吴佑寿院士主持,包括4位院士在内的15位业界专家、学者组成了本次鉴定会的专家委员会。专家委员会对DRA技术给予了充分的肯定,鉴定结论为“该项目的主要技术性能指标相当或优于国际主流数字音频编解码算法的技术水平,位居国际先进行列。”

  DRA技术获得了业界的初步肯定。

  2005年4月,国家广电总局广播电视规划院对DRA技术的效果进行了第三轮主观和客观评测。对广晟数字音频编码软件和解码硬件得出的测试结论为:达到了EBU(欧洲广播联盟)定义的“不能识别损伤的”音频质量。

  2005年9月30日,由信息产业部科技司、国家广电总局科技司联合主持在北京召开了广晟数码数字音频编解码技术成果汇报会。包括科技部高技术产业司、国家标准化委员会,中国工程院等单位的领导专家共40多人参加。由中国工程院副院长邬贺铨院士主持的专家评审委员会认为:“DRA技术在自适应时频分块方法、技术实现、灵活的码书选择等关键技术方面具有创新性,其主要技术性能指标达到了国际先进水平。”

  2005年12月,广晟数码研发的“高品质数字音频编解码器”通过了广州市科技局的科技成果鉴定,鉴定委员会一致认为“该项目拥有自主知识产权,是一项自主创新的音频核心关键技术。其总体技术达到国内领先,主要技术指标达到了国际先进水平。”

  DRA技术最后一次的小考是在2006年8月,这一次被游余立称为“一锤定音”,打消了业界所有对这一技术的疑虑。当时受中央电视台委托,国家广电总局广播电视规划院组织对DRA硬件编解码器系统进行了针对我国“直播星”项目的听音测试,测试结论令人兴奋:5.1声道环绕声在384kbps及320kbps码率下均达到了ITU-R BS.1548建议书的要求,其中384kbps码率下总体音质为4.90分,达到了EBU定义的“不能识别损伤的”音频质量。

  业界由此认定DRA拥有压缩效率高,音质好,解码复杂度低和容错能力强的优点,在技术指标上达到了国际先进水平。

  再好的技术,如果没有专利保护,也无法实现技术的应有价值。为此广晟数码选择先到专利保护最好的美国申请专利,并将美国专利转抄中国专利局,在两国同时申请专利。2004年9月到2007年1月间,广晟数码已在美国申请了4项发明专利。到目前为止,广晟数码已经对DRA技术各个技术点申请了13项国内专利和一项美国专利,形成了严密的知识产权保护。

  DRA技术目前共申请了两项核心专利,一是《Apparatus and methods for multichannel digital audio coding》,美国专利申请号为US20060074642,申请日期为2004年9月17日;中国专利申请号为200510095898.6,申请日期为2005年9月7日,权利要求为87项。二是《Variable-Resolution Processing of Frame-Based Data》,美国专利申请号为US11558917,申请日期为2006年8月18日,权利要求为20项。

  上述两个专利分别于2004年11月18日和2006年10月6在美国通过了专利检索。另外,专利US20060074642还通过了PCT国际检索单位的专利检索。这三个独立的国际专利检索提供的意见具备独立、客观、完整,对《多声道数字音频编解码技术规范》用到的技术专利问题进行了完整的分析,结论表明广晟数码拥有独立的知识产权。

  开始产业化长征

  应用是科技成果商品化、产业化的保证,也是一项技术标准具有生命力的重要所在,否则标准仅是一本书。目前来看,《多声道数字音频编解码技术规范》出台,只是万里长征刚走完了第一步。

  国家广电总局科技司副司长王联表示:“DRA的音频编码只是音频领域的基础标准,能否取得市场上的成功,还有大量的工作要做,特别是作为广电这样的应用部门,我们希望以更大的努力完成这项工作:一是完善这项技术对应用环境的适配,比如与广播电视节目制作环节上的适配和融合;二是对广播电视数字传输、音视频存储介质等体系的适配和融合;三是要和各种接收、播放终端的适配和融合;四是为了达到产业化的目的,与普遍应用的终端芯片的融合与配合。”

  全国音视频标准化技术委员会秘书长赵新华在接受记者采访时表示,推进产业化应用,加快数字音频产业链的形成,是下一步工作应该关注的重点。而在推进产业化应用方面,当前关键的是解决芯片问题。

  华录集团公司董事长陈润生在接受记者采访时也表达了相同的观点,他表示,此标准的发布标志着技术层面的问题已经解决。下一个层面要关注的是这个标准在产业上如何取得成功。

  《多声道数字音频编解码技术规范》应用的领域目前主要有两个:一是消费类电子产品,二是广播电视领域。在产业化应用方面,该标准具备了一定的产业化基础,已在芯片设计、应用开发等方面形成了较为完整的产业链。

  早在2004年11月19日,广晟数码公司就与“高清晰度视频光盘产业联盟”(HVD产业联盟)合作推进广晟数字音频编解码技术在高清视盘机领域的应用。2005年12月,DRA数字音频技术就被确定为广东省“数字家庭行动计划”技术体系的基础标准之一,并在广东省媒资库、数字电视整体转换试点等项目中应用。中国华录集团也成功地研发出了一款音频采用DRA技术的5.1声道环绕声个人多媒体播放器。

  而《多声道数字音频编解码技术规范》最新的产业化成果是:已成为国家广电总局的手持移动电视CMMB的首选音频标准。在这个项目中,国家广电总局将发射两颗卫星,通过卫星发射电视信号,在未来用手机和PMP等手持终端可随时随地看电视。此外,国家广电总局的数字直播星项目、信息产业部的IPTV也在申请之中。

  事实上,一个企业是很难构成一个完整的产业链的,需要相关部门和企业的扶持和配合。《多声道数字音频编解码技术规范》的产业化,需要的是团队作战。在这一标准产业化艰巨而漫长的道路上,新的考验已经开始。

  相关链接

  DRA技术简介

  广晟数码数字音频编解码算法(简称广晟数码音频技术,DRA)是一种同时支持立体声和多声道环绕声的数字音频编解码技术,是《多声道数字音频编解码技术规范》的原型。该算法的特点是采用自适应时频分块(ATFT)方法实现对音频信号的最优分解,进行自适应量化和熵编码。其主要技术性能指标如表所示。

    《多声道数字音频编解码技术规范》
    技术发展里程碑
    2003年3月 游余立博士开始研发DRA多声道数字音频编解码算法。
    2003年11月 用C++开发完DRA编码和解码软件,DRA算法定型。
    2004年1月 在Motorola DSP 56367芯片上开发出实时DRA解码软件。
    2004年2月 在广东省发改委张军副主任的协调下,游余立博士与广东省广晟资产经营有限公司开始合作洽谈。
    2004年6月 由广东省广晟资产经营有限公司出资、游余立博士以其自主研发的DRA多声道数字音频编码技术入股共同成立广州广晟数码技术有限公司。
    2004年8月 国家广播电视产品质量监督检测中心听音测试。结论为:“听音试验结果表明广州广晟数码技术有限公司送样的数字音频编/解码算法在立体声和5.1声道工作方式下,音质损伤较小,听音人员感觉其音质与未经编解码的原始节目信号无明显差别”。
    2005年6月 广东省政府为了组织和推动广晟数码的标准申报和产业化工作,成立了由主管副省长为组长、省政府唐豪副秘书长和省发改委张军副主任为副组长的广东省数字音频项目推进工作领导小组。
2005年9月 承担了由广东省信息产业厅下达的《多声道数字音频编解码技术规范》的编制任务,由游余立博士负责起草工作。
    2005年10月 开发完成基于DRA算法的文化娱乐维权系统。
    2005年11月 《多声道数字音频编解码技术规范》通过了有关审查。
    2005年12月 广东省数字音频项目推进工作领导小组启动了将广晟数码起草的《多声道数字音频编解码技术规范》申报国家有关标准的工作。
    2006年1月 广东省信息产业厅将修改后的标准文本呈送信息产业部科技司。
    2006年2月 开发完成了DRA卫星电视广播系统。
    2006年6月 中央电视台组织国家广电总局广播电视规划院对DRA算法和国外音频编解码算法进行了对比测试。唯有DRA算法的5.1环绕声在384kbps时即达到了“透明”音质。
    2006年8月 中国电子技术标准化研究所对《多声道数字音频编解码技术规范》做了最终修改,形成报批稿。
    2006年8月 在美国申请了临时专利“Variable-Resolution Filtering”(申请号:US60/822,760)。
    2006年8月 《多声道数字音频编解码技术规范》公示。
    2006年8月 中国华录集团根据《多声道数字音频编解码技术规范》开发出了一款支持5.1环绕声的个人媒体播放器(PMP)。
    2006年9月 《多声道数字音频编解码技术规范》完成公示。
    2006年9月 正式加入CMMB(中国移动多媒体广播)技术研究工作组。
    2006年10月 在美国完成了临时专利申请“Variable-Resolution Filtering”(申请号:US60/822,760)的检索和侵权分析。
    2006年11月 在美国申请了专利“Variable-Resolution Filtering”(申请号:US11/558,917)。
    2006年12月 在深圳实现了与中兴通信研发的CMMB音视频码流系统复用协议的联调。
    2006年12月 在国家广电总局完善了与中兴通信研发的CMMB音视频码流系统复用协议的联调。
    2007年1月 信息产业部正式批准《多声道数字音频编解码技术规范》成为电子行业标准(标准号:SJ/T11368-2006),于2007年1月1日开始实施。
    2007年1月 在美国申请了专利“Audio Encoding System”(申请号:US11/669,346)。

关键字:多声道  编解码  音频  侵权  多媒体  移动  广播

编辑:汤宏琳 引用地址:http://www.eeworld.com.cn/szds/2008/0407/article_170.html
本网站转载的所有的文章、图片、音频视频文件等资料的版权归版权所有人所有,本站采用的非本站原创文章及图片等内容无法一一联系确认版权者。如果本网所选内容的文章作者及编辑认为其作品不宜公开自由传播,或不应无偿使用,请及时通过电子邮件或电话通知我们,以迅速采取适当措施,避免给双方造成不必要的经济损失。
论坛活动 E手掌握
微信扫一扫加关注
论坛活动 E手掌握
芯片资讯 锐利解读
微信扫一扫加关注
芯片资讯 锐利解读
推荐阅读
全部
多声道
编解码
音频
侵权
多媒体
移动
广播

小广播

独家专题更多

富士通铁电随机存储器FRAM主题展馆
富士通铁电随机存储器FRAM主题展馆
馆内包含了 纵览FRAM、独立FRAM存储器专区、FRAM内置LSI专区三大部分内容。 
走,跟Molex一起去看《中国电子消费品趋势》!
走,跟Molex一起去看《中国电子消费品趋势》!
 
带你走进LED王国——Microchip LED应用专题
带你走进LED王国——Microchip LED应用专题
 

About Us 关于我们 客户服务 联系方式 器件索引 网站地图 最新更新 手机版

站点相关: 电视相关 白色家电 数字家庭 PC互联网 数码影像 维修拆解 综合资讯 其他技术 技术产品 应用设计 论坛

北京市海淀区知春路23号集成电路设计园量子银座1305 电话:(010)82350740 邮编:100191

电子工程世界版权所有 京ICP证060456号 京ICP备10001474号 电信业务审批[2006]字第258号函 京公海网安备110108001534 Copyright © 2005-2016 EEWORLD.com.cn, Inc. All rights reserved