瞄准五大方向持续攻关,构建AI网络底座

发布者:正在搬砖的河马71最新更新时间:2024-08-26 作者: 是德科技产品营销经理 Linas Dauksa关键字:AI  网络  底座  是德科技 手机看文章 扫描二维码
随时随地手机看文章

image.png?imageView2/2/w/1000

作者:是德科技产品营销经理 Linas Dauksa


如果企业拥有数据中心,需要关注的是人工智能(AI)技术可能很快就会部署到数据中心。无论AI系统是一个聊天机器人,还是横跨多个系统的自动化流程,亦或是对大型数据集的有效分析,这项新技术都有望加速和改善许多企业的业务模式。然而,AI的概念也可能会令人产生困惑和误解。是德科技的这篇文章旨在探讨有关AI网络如何工作以及该技术面临的独特挑战等五个方面的基本问题。  


GPU相当于AI计算机的“大脑”


简单来说,AI计算机的大脑就是图形处理器(GPU)。过去,人们可能听说过中央处理器(CPU)是计算机的大脑。GPU 的优势在于,它是一个擅长进行数学计算的 CPU。当创建AI计算机或深度学习模型时,需要对其进行 “训练”,这就要求对可能包含数十亿个参数的数学矩阵方程进行求解。进行此种数学运算的最快方法是让多组 GPU 在相同的工作负载上运行,即便如此,训练AI模型也可能需要数周甚至数月的时间。AI模型创建后,会被迁移到前端计算机系统,用户可以向模型提问,这就是所谓的推理。


AI计算机集众多GPU于一身


用于处理AI工作负载的最佳架构是在一个机架中集成一组GPU, 并将其连接到机架顶部的交换机中。还可以有更多的 GPU 集成机架,按照网络层次结构连接所有 GPU。随着所要解决的问题的复杂性增加,对 GPU 的需求也就越大,有些将要部署的解决方案可能会包含数千个 GPU 集群。这不难让人联想到数据中心里一排又一排密密麻麻的服务器机架,这种场景非常常见。


AI集群是一个小型网络


在构建AI集群时,有必要将更多GPU连接起来,这样它们才能协同工作。而GPU之间的连接可以通过创建微型计算机网络的方式来实现,让GPU与GPU之间能够互相发送和接收数据。


image.png?imageView2/2/w/1000

图1:AI集群


图1展示了一个AI集群,其中最下方的圆圈代表了GPU在执行任务时的工作流程。将许多GPU连接到了机架顶部(ToR)的交换机。ToR 交换机还连接到了上图顶部的骨干网络中使用的交换机,这张图充分描绘了需要集成众多GPU时所采用的清晰网络层次结构。


AI部署的瓶颈在于网络


去年秋天,在OCP(开放计算项目)全球峰会上,与会者重点讨论了新一代AI基础设施。其中,来自迈威尔科技的Loi Nguyen充分阐述了由此出现的一个关键问题:网络已经成为新的瓶颈。


GPU在解决数学问题或者处理工作负载方面非常有效。这些系统完成任务的最快方法是让所有 GPU并行计算、协同工作来处理相同的工作负载。要做到这一点,GPU需要获取它们即将处理的信息,并且它们彼此之间可以互相进行通信。如果其中一个GPU没有得到它所需的信息,或者需要更长的时间来输出结果,那么所有其他GPU都必须等待,直到能够一致协作来完成任务。


从技术角度来讲,拥堵的网络造成的数据包延迟或者数据包丢失可能会导致系统需要反复重新传输数据包,并显著延长完成任务所需的时间。这意味着,可能会有价值数百万或数千万美元的 GPU闲置,从而影响最终的结果,当然也可能会影响希望通过利用AI技术获得商机的企业的上市时间。


测试是成功运行AI网络的关键


为了高效运行AI集群,用户需要确保GPU得到充分利用,这样才能较早地完成学习模型的训练,并将其投入使用,实现投资回报最大化。这就需要对AI集群(图2)的性能进行测试和基准测试。然而,这并不是一件轻而易举的事儿,因为GPU和网络架构之间有着千丝万缕的联系和诸多设置,它们需要在架构上实现互补,以满足处理工作负载的需要。


image.png?imageView2/2/w/1000

图2:AI数据中心测试平台及如何测试AI数据中心集群


这给AI网络带来了诸多挑战:


  • 考虑到成本、设备的可用性、熟练的网络 AI 工程师的时间、空间、功率和热量等因素的限制,很难在实验室中复刻完整的工作网络。

  • 在工作系统上执行测试会降低工作系统可用的处理能力。

  • 由于工作负载的类型以及数据集的规模大小和范围可能大不相同,因此所要研究的问题也会难以重现。

  • 深入洞察GPU之间的集体通信也颇具挑战性。


应对上述挑战的方法之一是,首先在实验室环境中对所提出的设置的一个子集执行测试,以便对JCT、整个AI集群所能达到的带宽等关键参数进行基准测试,同时将这些参数与Fabric容量利用率以及内存缓冲区消耗情况进行比较。这种基准测试有助于找到GPU/工作负载的分布与网络设计/设置之间的平衡点。当计算架构和网络工程师对结果比较满意时,他们就能够将这些设置应用到执行任务的工作系统中并且衡量新的结果是否理想。


小结


为了充分释放AI的潜能,需要优化AI网络的设备和基础架构。企业的研究实验室和学术机构致力于对构建和运行高效AI网络所涉及的各个层面进行分析,以解决在大型网络上执行任务所面临的挑战。尤其是在当前行业最佳实践正不断发生变化的情况下,形势更是如此。只有采用这种可以反复验证、高度协作的方法,业界才能实现可重复的测试,并灵活地尝试各种“假设 ”场景,这是优化AI网络的基础。


关键字:AI  网络  底座  是德科技 引用地址:瞄准五大方向持续攻关,构建AI网络底座

上一篇:是德科技在 FR3 频段实现首个互操作性和数据连接
下一篇:是德科技加入 AI-RAN 联盟,助力推进移动网络 AI 创新

推荐阅读最新更新时间:2026-03-19 14:58

是德科技推出安全 AI 辅助工具,助力电子设计效率跃升
AI 聊天助手与 Copilot 虚拟助手赋能是德科技先进设计系统(ADS)软件,为用户带来更快捷的使用体验 美国加利福尼亚州圣罗莎,2025 年 12 月 16 日 —— 是德科技公司(Keysight Technologies, Inc.,纽约证券交易所代码:KEYS)今日宣布,为其先进设计系统(Advanced Design System, ADS)推出搭载人工智能技术的聊天助手(Chat)与 Copilot 辅助工具。该工具具备突破性的自然语言交互功能,可在加速设计流程的同时,保障企业级安全标准。 电子设计团队正面临日益严峻的挑战:多领域工作流程复杂、数据管理分散,且产品上市周期缩短的压力持续增大。人工操作流程拖累
[半导体设计/制造]
是德科技推出软件解决方案,保障安全关键环境下的可信AI部署
该集成解决方案可支持AI的开发和维护、实际推理应用,以及数据漂移与性能监控工作 是德科技近日推出是德科技AI软件完整性构建器,这款全新软件解决方案旨在革新AI系统的验证与维护方式,确保系统的可信度。随着监管审查日益严格,加之AI开发复杂度持续增加,该解决方案为汽车等安全关键环境,提供透明、可适应、数据驱动的AI保障。 是德科技AI软件完整性构建器革新了AI系统的验证与维护方式,确保在安全关键环境中的系统可信度 AI系统作为复杂的动态实体运行,但其内部决策过程却往往并不透明。这种透明度的缺失,给汽车等必须证明安全性、可靠性与合规性的行业带来了重大挑战。开发者难以诊断数据集或模型的局限性,而新兴标准(如汽车领域的ISO/P
[测试测量]
<font color='red'>是德科技</font>推出软件解决方案,保障安全关键环境下的可信<font color='red'>AI</font>部署
是德科技与三星携手NVIDIA展示端到端AI-RAN验证工作流程
该联合演示会在2026年世界移动通信大会上展示,为AI驱动的无线接入网模块验证简化了数据采集、AI/ML训练及基准测试流程 是德科技与三星电子宣布,会在巴塞罗那举行的2026年世界移动通信大会(MWC 2026)上,与NVIDIA联合演示端到端人工智能无线接入网络(AI-RAN)测试与验证工作流程。该演示展示了是德科技的AI-RAN解决方案如何以物理上行共享信道(PUSCH)信道估计用例,简化AI驱动RAN模块的验证流程,将数据生成、AI/ML训练和性能基准测试整合到单一的自动化工作流程中,以加速创新并降低运营商和设备厂商的部署风险。 随着AI技术在RAN中不断深入应用,工程师必须在多样化的真实网络条件下对算法进行验证。然
[网络通信]
是德科技将在ECOC 2025展示支持AI基础设施的新型解决方案和光学创新
活动内容: 是德科技将在ECOC 2025上展示面向人工智能/机器学习(AI/ML)应用的数据中心基础设施解决方案和光学测试创新。 时间: 2025年9月29日至10月1日 地点: 丹麦哥本哈根贝拉中心(Bella Center),是德科技展位#C2120 是德科技专家将现场展示以下面向 AI数据中心的解决方案和光学测试创新 : AI数据中心能效:展示如何测量和分析AI数据中心能效,包括功耗、电源完整性仿真、时域电源纹波、串扰分析以及频域分析。是德科技还将展示液冷测试技术、测试方法以及用于下一代基础设施的电源/负载仿真。 1.6T AI互连测试:展示是德科技INPT-1600G台式测试系统及新型互连测试软件,可验证
[测试测量]
是德科技推出全新KAI系列解决方案,增强AI数据中心的可扩展性
Keysight AI(KAI)系列解决方案,旨在帮助客户通过仿真真实世界的AI工作负载来验证AI集群组件,从而扩展数据中心的AI处理能力,洞察系统的性能和效率。 AI数据中心构建器通过模拟真实工作负载验证AI基础设施的性能,通过评估新算法、组件或协议提高AI训练的性能。 互连与网络性能测试仪1600GE(INPT-1600GE)硬件流量仿真器可运行先进的软件解决方案,可验证200GE到1600GE的AI基础设施、网络组件和数据中心互连。 全新采样示波器可优化1.6T光学收发器测试效率,用于研发和制造下一代数据中心AI集群光互连。 是德科技(NYSE: KEYS )发布Keysight AI(KAI),这是一系列端到
[测试测量]
<font color='red'>是德科技</font>推出全新KAI系列解决方案,增强<font color='red'>AI</font>数据中心的可扩展性
是德科技成为联合国汽车网络安全和软件法规指定技术服务提供商
是德科技的设备安全研究实验室现在可以根据 UN R155 / R156 法规进行车辆类型批准评估 自2024年7月起,联合国欧洲经济委员会国家生产的所有新车均须遵守汽车安全法规 是德科技宣布设备安全研究实验室Riscure Security Solutions已获得荷兰车辆管理局(RDW)正式批准,成为联合国欧洲经济委员会(UNECE)R155、R156法规审批指定技术服务商。 是德科技成为联合国汽车网络安全和软件法规指定技术服务提供商 UNECE R155 和 R156 法规由世界车辆法规协调论坛 (WP.29) 创建,制定了网络安全和软件更新要求,以加强汽车系统的安全性。UN R155 概述了汽车制造商的网
[汽车电子]
<font color='red'>是德科技</font>成为联合国汽车<font color='red'>网络</font>安全和软件法规指定技术服务提供商
是德科技Nemo解决方案助力德国全国移动网络基准测试
是德科技宣布,德国最大的消费者测试杂志IMTEST,与德国宽带网络测试技术和市场的领导者zafaco GmbH合作,采用是德科技的测试解决方案 ,再次发布了一项重要的德国全境路测项目的结果。 是德科技Nemo解决方案助力德国全国移动网络基准测试 测试目的是通过对德国三大移动运营商——德国电信、Vodafone和Telefónica进行比较测试,以评选出德国最佳移动网络。 今年的测试主要结果显示,所有被测试运营商的总体表现良好,德国的网络覆盖率正在不断改善,几乎没有移动连接不良的地区。根据测试结果,德国电信以1.4的“非常好”得分位列第一,Telefónica以1.8的“良好”得分位列第二,Vodafone以2.1的总体评分
[测试测量]
<font color='red'>是德科技</font>Nemo解决方案助力德国全国移动<font color='red'>网络</font>基准测试
是德科技携手温莎大学进行车载网络安全培训
是德科技为汽车工程学生提供高级培训,帮助他们应对软件定义汽车的网络安全挑战 自动化的开源平台采用预编程,支持标准测试场景,并且完全可定制 是德科技(Keysight Technologies, Inc.)日前宣布, 公司将与温莎大学 SHIELD 车载网络安全卓越中心合作,利用 Keysight SA8710A 车载网络安全渗透测试平台为汽车工程学生提供高级网络安全培训。 SHIELD 项目致力于培养工程和计算机科学学生,进而推进和开发车载网络安全解决方案,从而确保未来车辆的安全性和可靠性。 是德科技携手温莎大学进行车载网络安全培训 随着驾驶员期望他们的汽车完全融入自己的数字生活,汽车在本质上正变得更加以
[测试测量]
<font color='red'>是德科技</font>携手温莎大学进行车载<font color='red'>网络</font>安全培训
小广播
最新测试测量文章
厂商技术中心

 
EEWorld订阅号

 
EEWorld服务号

 
汽车开发圈

 
机器人开发圈

About Us 关于我们 客户服务 联系方式 器件索引 网站地图 最新更新 手机版

站点相关: 信号源与示波器 分析仪 通信与网络 视频测试 虚拟仪器 高速串行测试 嵌入式系统 视频教程 其他技术 综合资讯

索引文件: 4 

词云: 1 2 3 4 5 6 7 8 9 10

北京市海淀区中关村大街18号B座15层1530室 电话:(010)82350740 邮编:100190

电子工程世界版权所有 京ICP证060456号 京ICP备10001474号-1 电信业务审批[2006]字第258号函 京公网安备 11010802033920号 Copyright © 2005-2026 EEWORLD.com.cn, Inc. All rights reserved