展望未来 多核DSP技术不仅仅是小把戏

2008-11-11 19:02:40来源: 电子工程世界 汤宏琳

  “多核DSP”也许对大多数人而言并不是个陌生的概念,早在几年前,为了提升性能、降低功耗,在处理器中增加内核已经成为计算和嵌入式处理器产业的标准作法。

  然而,正当多内核技术在处理器领域发展得红红火火之时,多核DSP似乎显得不瘟不火,还仅仅停留在无线基础设施应用上。

  多核DSP之困

  正如多核技术被计算应用广泛采纳一样:以更低的功率提供更高的性能驱使DSP技术必须“一次又一次打破性能藩篱”。“要么是单板面积受限,要么是处理能力受限,越来越多的客户需要更高的处理平台,”德州仪器中国区DSP业务开发经理郝晓鹏对电子工程世界如是说。

  用户的需求是多种多样的。在通信基础设施的信号处理中,无论是语音用户、数据用户还是多媒体用户,所需的是单位通道成本低、功耗小;而对于视频检测、医疗影像等应用,越来越复杂的二维、三维甚至四维的图像处理,需要并行化的系统并能够运行复杂的算法;另外,在高性能、高强度终端设备中,包括医疗中的核磁共振,实时的现场通信,这些设备需要在极短的时间完成信号处理分析,这时对性能的要求是非常高的。

  而目前几百到1GHz的单核处理器远远不能满足这种需求。

  与此同时,单核通过提升硅工艺而大幅提升性能的理论,伴随着漏电流的发现,已经不再奏效。同时,主频从最初的几百兆赫兹到1.2G赫兹甚至更高,功耗也随之提升,单板功耗已不可控。功耗的提升,为整个系统设计带来前所未有的复杂度。此时多核的诞生似乎是理所当然。

  然而,核越多面临的挑战也越大:首先,功耗,这是多核环境下在系统硬件设计上要考虑的一个重要问题,过高的功耗会造成散热困难进而影响系统的稳定性。同时,把更多的处理核心集成到一起需要更精细的制造工艺,例如45纳米甚至更窄的线宽,成本必然会提升。程序优化会更加越困难,而这些优化工作往往不是开发系统和编译器能完成的,而是需要大量的高素质人才来完成。

  随之而来的,是开发人员必须学会如何划分设计以便高效地使用多核DSP。“许多人希望编译器能完成分割任务。但这不是一蹴而就的事。为了用好这些器件,我们需要学会多角度的思考。” TI公司多核解决方案部经理Ray Simar表示。

  性能与功耗的决斗

  然而,以上的种种挑战丝毫不会影响DSP厂商的脚步,也正是看到了种种需求与挑战,德州仪器 (TI)日前推出了一款在单一裸片上集成了三个 1 GHz 的 TMS320C64x+™ 内核的DSP处理器——TMS320C6474。大多数人心中不免有些疑问:双核、四核、八核,似乎这些产品已经见怪不怪,甚至TI本身也已经推出过6 DSP内核的TNETV3020。这个时候推出这样一款产品,是不是略显过时?

  “这主要是看用户的需求,”郝晓鹏解释道。多核DSP的应用是极具特点的,如无线基站、医疗影像、现场通信等等,这些领域的客户对多核DSP的需求是芯片厂商推出产品的首要考虑因素。他们所需的单芯片功耗是多少?从而决定使用多少内核;他们所需单芯片的处理能力是多少?这是靠具体应用决定的;多核DSP的可编程性和升级维护以及如何在多核的情况下有效提升并行度?种种诸多因素的折衷,最终导致了这款三核芯片的诞生。

  TMS320C6474 在单一裸片上集成了三个 1 GHz 的 TMS320C64x+™ 内核,可实现 3 GHz 的原始 DSP 性能,而功耗和DSP成本则分别比离散处理解决方案降低了 1/3和 2/3。

  “一方面要降低功耗,但另一方面又要为新的多媒体和娱乐应用增强系统性能,”相信这是大多数无线移动终端和其他节能型平台制造商的都要面对的进退两难的局面。基于 C6474 的解决方案有着更为明显的优势。例如,为了满足 25 瓦的功率预算要求,设计人员不能采用超过 8 个 1 GHz TMS320C6455 单核 DSP,且每个 DSP 的功耗必须为 3W左右,这一系统的总体性能为 8 GHz。与之对应的是基于 C6474 的系统仅包含四颗芯片,每颗芯片的功耗约为 6W。但由于每个处理器包含了三个 1 GHz 内核,系统总性能将达到 12 GHz,从而使单位功率下的性能提高了50%。功耗的提升更多得益于TI 的 SmartReflex 技术,通过 TI 的深亚微米工艺技术显著降低了芯片级漏电。该技术由一系列智能和自适应硬件与软件技术组成的,这些技术可根据设备活动、操作模式和温度来动态控制电压、频率和功率。

  同时,多核DSP天生的使命就是提升性能。C6474 在同一裸片上集成了三个 1 GHz 的 C64x+™ 内核,可实现 3 GHz 的 DSP 性能,即处理能力为 24,000 MMACS(16 位)或 48,000 MMACS(8 位)。同时,考虑到很好的延续性,该产品与诸如 TMS320C6452 与 TMS320C6455 等基于 C64x+ 内核的单核 DSP的代码完全兼容,而且与 TMS320C641x等基于前代 TMS320C64x™ 内核的产品也完全兼容。

[1] [2]

关键字:多核DSP  处理器  通信  功耗

编辑:汤宏琳 引用地址:http://www.eeworld.com.cn/DSP/2008/1111/article_809.html
本网站转载的所有的文章、图片、音频视频文件等资料的版权归版权所有人所有,本站采用的非本站原创文章及图片等内容无法一一联系确认版权者。如果本网所选内容的文章作者及编辑认为其作品不宜公开自由传播,或不应无偿使用,请及时通过电子邮件或电话通知我们,以迅速采取适当措施,避免给双方造成不必要的经济损失。
论坛活动 E手掌握
微信扫一扫加关注
论坛活动 E手掌握
芯片资讯 锐利解读
微信扫一扫加关注
芯片资讯 锐利解读
推荐阅读
全部
多核DSP
处理器
通信
功耗

小广播

独家专题更多

富士通铁电随机存储器FRAM主题展馆
富士通铁电随机存储器FRAM主题展馆
馆内包含了 纵览FRAM、独立FRAM存储器专区、FRAM内置LSI专区三大部分内容。 
走,跟Molex一起去看《中国电子消费品趋势》!
走,跟Molex一起去看《中国电子消费品趋势》!
 
带你走进LED王国——Microchip LED应用专题
带你走进LED王国——Microchip LED应用专题
 
电子工程世界版权所有 京ICP证060456号 京ICP备10001474号 电信业务审批[2006]字第258号函 京公海网安备110108001534 Copyright © 2005-2016 EEWORLD.com.cn, Inc. All rights reserved