用蛀洞路由器ST_C104构造全互连多机并行系统

2006-05-07 15:50:05来源: 电子技术应用

    摘 要: 采用蛀洞路由机制是新型多计算机并行系统的重要特征,介绍用蛀洞路由器ST_C104构造全互连多机并行系统的方法并给出构造实例,证明它具有并行效率高、通信速度快、拓扑结构可变、扩展性强等特点。

    关键词: 多计算机 并行 蛀洞路由 ST_C104    

    近年来,在高性能并行计算机系统中,分布存储型的多计算机系统的研究与应用得到快速发展。MPP(Massively Parallel Processors)系统属于一种松散耦合的计算机系统,它一般由数十台至百台以上计算机结点和高速互连网络组成,由于没有共享内存,各结点之间通过互连网以消息传递的方式相互通信,各结点间既相互独立又可相互交流、共享信息,它非常适合目前各行各业方兴未艾的网络发展的需要。新型的由硬件支持的路由技术特别是蛀洞路由器的出现,使多计算机系统的网络互连变得更加灵活方便,更为重要的是大大减小了通信时延,使远程通信时延和本地通信时延一样,即通信时延与两个结点之间的距离无关,从而大大提高了多计算机并行系统的通信效率。

    本文介绍采用蛀洞路由器ST_C104构造全互连多机并行系统的方法,我们将该技术应用于“长缨-III分布式并行仿真计算机系统” 的研制中,取得了良好的效果。

    t1.gif (7949 字节)1 ST_C104的结构与特点

    ST_C104是SGS_THOMSON公司于1996年推出的32×32高速异步网络开关,是专门为多CPU间互连而设计的系列产品之一,其结构如图1所示。

    ST_C104具有如下主要特点:

    ·支持蛀洞路由方式,且可传递任意长度的信息包(Packet);

    ·时延小,不大于1μs;

    ·通信速率为32×100Mb/s,通信带宽达300MB/s;

    ·支持虚拟通道和自适应寻径;

    ·具有硬件出错处理机制(Fault Tolerant Network);

    ·提供2对控制链Clink,用于初始化及出错处理;

   t2.gif (7337 字节) ·提供32对数据链Dlink,用于数据传递及校验。一个C104最多可直接连接32个满足Link协议的CPU(如T9000等),也可通过与高速链路适配器ST_C101相配合,实现与任意型号CPU的连接;

    ·在线编程,可动态改变网络拓扑结构;

    ·可无限级连。

    2 基于ST_C104的多计算机系统

    对于一般的CPU,因为外部数据线多为并行总线,且时序、协议各不相同,因此与C104连接时需要利用C101进行链路适配,如图2中小框所示,而对于具有Link协议的CPU,可直接与C104相连,不需加C101。一个C104最多可连接32个CPU,如果不需要那么多的CPU,或希望提高链路通信带宽,则可减少CPU数量,而将C104的多个链路分配给同一个CPU,如图2中#30节点,它占用了3根lINK,双向带宽达600Mb/s。

    图2中各个CPU的地位是完全相同的,每个CPU既可做为主控结点,也可做为从结点。将一个或多个任务按一定策略划分后分配到各个结点,所有结点可同时进行工作,各结点之间通过C104为媒介进行实时通信,因此该多机系统是全互连的、并行的。

    一般将由一个C104相互连接的结点合称为一个机群,如图2中的全部1~30个CPU结点机即构成了一个机群。

    t3.gif (9738 字节)3 ST_C104的级连与扩展

    C104采用蛀洞路由方式寻径,通信时延小,且与结点间距离无关,因此理论上C104可无限级连构成一个任意大的MPP系统。但实际上任何系统级连的数量与其性能都不可能永远线性地增加,而是有一个平台,在此之后,系统性能增长缓慢。事实上,在现实应用中对系统规模一般也是有限的,图3是用6个(可继续扩展)C104构成的平面拓扑结构的多机系统。

    图中将C104相连的实线表示数据链,虚线表示控制链,控制链的连接顺序是任意的,不同的连接顺序即可得到不同的网络拓扑结构。可见C104间所需连接的线很少,它们的互连是非常简单的。图中每个C104用于与其它C104互连占用了4根数据链,因此还可以连接28个其它CPU结点,即构成了一个由6个机群组成,而每个机群可各带28个CPU结点的并行机系统。

   t4.gif (11819 字节) 可扩展性是多机并行系统的重要性能之一,C104的互连简单,其扩展功能非常强大,例如可轻易扩展成环形结构、二维网络结构、立方体结构、三维超立方体结构等多种拓扑结构,这里不再重述。

    4 ST_C104应用实例

    我们以C104为核心构造了“长缨-III分布式并行仿真计算机系统”,它主要是针对部队对仿真计算机小型化(机动性强)、高速高精度、伸缩性好、环境适应性强等要求而设计制造的。该系统由6个C104构成的6个机群及1个I/O子系统组成,每个机群包含9个结点,其中8个计算结点(即CPU结点),1个I/O通信结点,总共为48个计算结点,6个I/O通信结点。为了增加机群间的通信带宽,机群之间的互连用了5根数据链,通信带宽达1000MB/s,如图4所示,图中小方块表示1个计算结点,小圆圈表示I/O结点。

    每个计算结点中,CPU采用Intel公司高性能RISC微处理器1860,其主频为40MHz,单精度峰值运算速度为80Mflops,双精度峰值运算速度为60M flops,DRAM采用单体结构,页方式(Page Mode)工作,字长64位,每页4K字节。其它辅助电路包括8MB~116MB的动态存储器DRAM、64KB的只读存储器EPROM(用于存放初始引导程序)、定时电路TIMETR、中断控制电路INTER、2个高速并行Link适配器C101(用2个C101并在一起,是为了得到64位的通讯带宽)组成,如图5所t5.gif (5479 字节)示。

    I/O通信结点形式有多种,可根据用户任务的需要进行选择,目前应用的有2种:(1)多总线通信板。用于与普通PC机或工作站间的通信,适用于AT、ISA、PCI、VME协议的插槽,并行机在运行过程中可与任何具有上述协议的计算机进行实时通信;(2)A/D、D/A通信板。用于并行机与外界实物数据采集或输出系统间的通信,可并行或串行通信,分别适用于高速、近距离与中速、远距离通信的场合。长缨-III并行计算机具有非常强大的I/O接口能力,且扩展性强,目前已配备了16路16位A/D与16路16位D/A,在并行通信方式下,相距100m时一组A/D、D/A数据与并行机通信时间小于45μs,完全突破了目前业界通信时间在ms级的瓶颈。

    总之,ST_C104是网络互连专用产品,我们在应用中发现它确实具有优秀的互连能力,用它设计的“长缨-III分布式并行仿真计算机系统”采用的CPU性能并不高,但构成MPP系统后表现出了很高的并行效率,系统性能稳定,使用简便,其主要性能指标如下:

    ·单精度浮点运算速度:38.4亿次/s;

    ·双精度浮点运算速度:21.6亿次/s;

    ·系统总存储容量:6×64Mbyte;

    ·机群间通信带宽:1000Mbits/s;

    ·结点间通信带宽:200Mbits/s;

    ·I/O接口配置:16路16位A/D,16路16位D/A;

    ·多总线通信板:可直接与外部计算机的AT、ISA、PCI、VME总线通信;

    ·软件配置:并行C,并行FORTRAN,并行程序开发环境。

    “长缨-III分布式并行仿真计算机系统”在战略战术导弹的闭环动态测试、导弹射前仿真与修偏、大型武器系统性能评估与决策、气象数据处理等领域均获得良好运用。

 

编辑: 引用地址:http://www.eeworld.com.cn/designarticles/network/200605/2935.html
本网站转载的所有的文章、图片、音频视频文件等资料的版权归版权所有人所有,本站采用的非本站原创文章及图片等内容无法一一联系确认版权者。如果本网所选内容的文章作者及编辑认为其作品不宜公开自由传播,或不应无偿使用,请及时通过电子邮件或电话通知我们,以迅速采取适当措施,避免给双方造成不必要的经济损失。
论坛活动 E手掌握
微信扫一扫加关注
论坛活动 E手掌握
芯片资讯 锐利解读
微信扫一扫加关注
芯片资讯 锐利解读
推荐阅读
全部

小广播

About Us 关于我们 客户服务 联系方式 器件索引 网站地图 最新更新 手机版

站点相关: 安防电子 医疗电子 工业控制

北京市海淀区知春路23号集成电路设计园量子银座1305 电话:(010)82350740 邮编:100191

电子工程世界版权所有 京ICP证060456号 京ICP备10001474号 电信业务审批[2006]字第258号函 京公海网安备110108001534 Copyright © 2005-2016 EEWORLD.com.cn, Inc. All rights reserved