TigerSHARC结构的ADSP-TSl01及其应用

2006-05-30 15:16:43来源: 单片机及嵌入式系统应用

引 言
  ADSP-TSl01是AD公司新一代TigerSHARC结构的数字信号处理器,具有多指令流多数据流(MIMD)结构;有两个计算单元,每个单元包括算术逻辑单元(ALU)、移位寄存器(shift)、乘法器(mult)、寄存器组(register files)。ADSP-TSl01性能比ADSP21160有显著提高,且与之兼容,使得以ADSP21160开发的产品升级快速、简捷。ADSP-TSl01是64位处理器,工作在250 MHz时钟下,可进行32位定点和32位或40位浮点运算,提供最高1500 MFLOPS(Millions of floating-pointoperations per second,每秒执行百万次浮点操作)的运算能力;内部具有6 M位双口 SRAM,同时集成了I/O处理器,加上内部总线,消除了I/O瓶颈。此外,ADSP-TSl01适宜多处理器结构,内部集成总线仲裁,通过链路(1ink)12I和外部(external)口可支持并行处理器,而不需任何附加逻辑电路,每一个处理器可直接读写任何一个并行处理器的内存。本文简要介绍其性能、应用特点及芯片内部的系统结构和功能框图,给出ADSP-TSl01的一种典型应用,并说明DSP的电源供电和功耗的计算方法。

1 ADSP-TSl01的主要性能
  ADSP-TSl01的主要性能如下:
  ◆采用TigerSHARC结构,具有3条独立总线用于取指令、取数据、不间断I/O;
  ◆指令周期4 ns,工作时钟250 MHz;
  ◆单指令流多数据流(SIMD)提供两个运算单元,每个有一个算术逻辑单元、乘法器、移位器、寄存器组,可同时在两个运算单元上进行同一指令下对不同数据的32位操作;
  ◆提供最大1 500 MFLOPS运算能力;
  ◆片内6 M位双口SRAM,允许CPU、Host和DMA的独立存取;
  ◆有14个DMA通道,可进行内存和外存、外设、主处理器、串(serial)口、链路(1ink)口之间的数据传输;
  ◆有2个数据地址发生器(IALU),允许取模和按位取反操作;
  ◆片内集成I/0处理器、6 M位双口 SRAM,具有串行、连接、外部总线和JTAG测试口,支持多处理器结构;
  ◆并行总线和多运算单元,使单周期可执行1次算术逻辑运算、1次乘法、1次双口SRAM的读或写,以及1次取指操作,CPU与内存之间可进行每周期4个32位浮点字的传输;
  ◆簇式多处理器最高可支持8个TigerSHARC ADSP-TSl01。
  ADSP-TSl01性能测试如表1、2所列。


2 ADSP-TSl01的系统结构框图和功能简介

  图1为ADSP一TSl01的系统结构框图。由图可见,ADSP-TSl01包括PEX、PEY两个运算单元,每一个浮点运算有一个算术逻辑单元、乘法器、移位器、32字寄存器组。另外,算术逻辑单元、乘法器、移位器为并行排列,可进行单周期多功能操作,如在同一机器周期中算术逻辑单元和乘法器可同时进行操作。


  ◆当数据在存储器和寄存器之间传递时,IALU提供存储器的地址。每个IALU有一个算术逻辑单元、32字寄存器组。
  ◆程序控制器包括指令队列缓冲器(IAB)和分支目标缓冲器(BTB)。ADSP-TSl01既有4个外部中断IRQ3~O,也有内部中断。
  ◆3条128位总线提供高的宽带连接。每个总线允许每个周期4条指令或4队列数据进行传输。外部口和其他链路口的片上单元也用这些总线访问存储器。在每个周期仅能访问一个存储器块,故DMA或外部口传输与处理器核在访问同一块时必须进行竞争。
  ◆片内6 M位SRAM,分为3个(M0、M1、M2)128位宽的2 M位的块,可组合构成数据、程序存储器,每个SRAM与两个总线相连,允许单周期内完成和CPU之间4个数的传输。
  ◆外部口支持与片外存储器、主机(host)及8片ADSP-TSl01的多处理器接口。外部口支持同步、异步及突发式存取。
  ◆ADSP-TSl01提供了4个链路口,每个链路口是8位双向口,与SHARC DSP口不兼容。
  ◆DMA控制器支持独立于处理器的后台零等待数据传输。14个DMA通道分别与外部口(4)、链路(1ink)口(8),autoDMA
寄存器(2)相连,外部总线可采用8/16/32/64位字长进行DMA操作。此外还有JTAG测试口及片内仿真。
  ◆串口支持250 Mb/s的收发独立的同步传输。
  ◆具有IEEE JTAG标准1149.1测试口和片内仿真。
  ◆27 mm×27 mm或19 mm×19 mm PBGA封装
  ◆内部ADD1.2 V,外部ADD3.3 V。


3 ADSP-TSl01的典型应用
  根据ADSP-TSl01的系统结构特点,给出ADSP-TSl01在雷达信号处理方面的典型应用,如图2所示。信号处理机主要由以下几部分组成。
  ① 运放及A/D。DPMCW接收机视频输出信号幅度为O~+4 V,经运放接收后,输出到A/D的模拟输入端。运放及A/D分为I、Q两路输入,以32位定点数同时采集到DSP1,在DSP1内分为I、Q两部分进行处理。
  ② CPLD。CPLD内部主要完成对数据的锁存,产生A/D采样时钟、各个DSP的中断请求信号和数据发送的同步信号。
  ③ DSP1。DSP1主要完成:A/D数据输入变换,并输出到DSP2;系统自举。系统采用EPROM自举方式,4个DSP的加载任务由DSP1完成。初始化时,DSP1通过链路口1发出一个控制字,将工作参数传给DSP2、DSP3、DSP4。链路口3和链路口4用于系统自举。
  ④ DSP2。DSP2完成2048点FFT运算。输入数据用链路口0和链路口2,输出数据用链路口1和链路口3。链路口4用于系统自举。
  ⑤ DSP3。DSP3完成门限判断与固定目标对消和动目标运动速度的校正。
  ⑥ DSP4和DPRAM。DSP4完成数据积累,然后对数据进行整理并输出。
  这个例子充分体现了ADSP-TSl01适宜多处理器结构,通过链路(1ink)口支持串行处理器,而不需要任何附加逻辑电路的优势。


4 电源供电及功耗估计
(1) 电源供电

  ADSP-TSl01有三个电源,其中数字3.3 V为l/0供电;数字1.2 V为DSP内核供电;模拟1.2 V为内部锁相环和倍频电路供电。ADSP-TSl01要求数字3.3 V和数字1.2 V同时上电。如果无法严格同步,则应保证核电源1.2 V先上电,l/0电源3.3 v后上电。本系统在数字3.3 V输入端并联了一个大电容,而在数字1.2 v输入端并联了一个小电容。其目的就是为了保证3.3 v充电时间大于1.2 v充电时间,以便很好地解决电源供电先后的问题。
(2)外部口功耗估计
  外部口的功耗主要是输出引脚(例如数据线的某个位由高到低,或由低到高)转换的功率消耗,而且该功耗与系统无关。由于这种转换的外部平均电流为0.137 A,因此,功耗为PDD=VD×lDD=3.3 V×0.137 A=0.45 W
(3)内核功耗估计
  内核最大电流为1.277 A。该电流是DSP进行单指令流多数据流(SIMD)方式下,4个16位定点字乘加与2个四字读取并行操作以及进行由外部口到内部存储器DMA操作所需的电流。实际上,DSP内核电流大小还和内核工作频率有关,图3所示是其内核电流与频率的关系曲线。因此,供给DSP内核电流可根据不同的并行处理任务和内核工作频率来确定。若并行处理较少,工作频率低,所需电流就小。这样,最大内核功耗为PDD=VDD×IDD=1.2 V×1.277 A=1.534 W。


结 语
  本文介绍了ADSP-TSl01芯片及其在雷达信号处理方面的应用。该应用系统充分利用了ADSP-TSl01高速的运算能力、数据吞吐量大以及易于多片连接,可对数据进行串行处理的特点。文中还讨论了DSP应用过程中的电源设计和功耗问题,因而具有一定的工程指导意义。目前该系统已成功用于某雷达系统。

关键字:功耗  总线  处理器

编辑: 引用地址:http://www.eeworld.com.cn/designarticles/dsp/200605/4175.html
本网站转载的所有的文章、图片、音频视频文件等资料的版权归版权所有人所有,本站采用的非本站原创文章及图片等内容无法一一联系确认版权者。如果本网所选内容的文章作者及编辑认为其作品不宜公开自由传播,或不应无偿使用,请及时通过电子邮件或电话通知我们,以迅速采取适当措施,避免给双方造成不必要的经济损失。
论坛活动 E手掌握
微信扫一扫加关注
论坛活动 E手掌握
芯片资讯 锐利解读
微信扫一扫加关注
芯片资讯 锐利解读
推荐阅读
全部
功耗
总线
处理器

小广播

About Us 关于我们 客户服务 联系方式 器件索引 网站地图 最新更新 手机版

站点相关: 安防电子 医疗电子 工业控制

北京市海淀区知春路23号集成电路设计园量子银座1305 电话:(010)82350740 邮编:100191

电子工程世界版权所有 京ICP证060456号 京ICP备10001474号 电信业务审批[2006]字第258号函 京公海网安备110108001534 Copyright © 2005-2016 EEWORLD.com.cn, Inc. All rights reserved