超越计算:FPGA——人工智能数据中心稳定与信任的基石

发布者:EE小广播最新更新时间:2026-01-26 来源: EEWORLD关键字:FPGA  人工智能  数据中心  基础设施 手机看文章 扫描二维码
随时随地手机看文章

人工智能的持续发展正在重塑数据中心设计与开发的基础。随着工作负载日益复杂且资源密集,运营商面临着数据中心性能、可靠性和安全性方面的重重挑战。若无法持续满足工作负载需求,基础设施将难以实现无中断的扩展。


在本文中,我们将探讨日益迫切的安全数据中心的控制需求,安全与信任如何与可管理性相结合,以及现场可编程门阵列(FPGA)为何能够成为构建安全人工智能基础设施的关键战略使能器件。


人工智能数据中心需求的转变


人工智能模型不仅改变了数据中心的功能,还改变了其构建方式。随着工作负载以前所未有的速度增长,数据中心架构变得高度异构。它们通常将各种组件——图形处理单元(GPU)、中央处理单元(CPU)、定制加速器、先进冷却系统等——集成在同一机架内,使得基础设施比以往任何时候都更大、更复杂。


这种本质上更为复杂的数据中心环境使其在管理上颇具挑战性。每个组件都为架构带来了独特的属性,从启动时序到不同的遥测格式和故障响应。若没有统一的控制层,哪怕是系统协调中微小的故障也可能像滚雪球一样演变成更大的错误和系统停机。与此同时,不断发展的数据中心接口和模块化机架设计要求有能够快速适应且不中断运行的解决方案。


归根结底,高性能不会是人工智能数据中心发展的唯一关注点。这些设施需要确定性、始终在线的控制和嵌入式安全功能,以便在日益分散的环境中可靠、安全地运行。


安全控制的重要性


人工智能已将控制从幕后功能转变为数据中心运营的战略支柱,要求系统在极端工作负载下表现出可预测性并能即时响应异常情况。确定性控制有助于确保这种一致性,支持组件间的可靠协调,避免出现延迟或失调。


随着数据中心变得更加模块化和多供应商化,安全性和信任必须融入控制功能之中。设备管理人员必须对系统内的每个组件和固件进行身份验证和证明,并在整个生命周期内实施保护,以防止篡改和信息泄露。此外,系统还必须跟上不断发展的标准和法规,从安全协议和数据模型(SPDM)标准的证明要求,到商业国家安全算法套件2.0(CNSA 2.0)等后量子框架的未来合规需求。


多层控制架构


为了保持韧性,数据中心依赖于分层控制系统:


• 服务器级基板管理控制器(BMC):负责安全启动、电源时序和健康状态遥测功能。

• 机架级资源监控与控制(RMC):集成数据、管理电源和冷却,并协调安全操作。

• 卫星控制器:实时监测泄漏情况并立即隔离故障。


嵌入在这些控制器中的FPGA可对遥测数据进行标准化处理,实现实时故障响应,并连接Redfish、PMBus和通过PCIe的MCTP等协议。


FPGA作为战略使能器件


基于硬件的解决方案可提供软件无法比拟的确定性控制。莱迪思FPGA提供:


  • 即时响应能力。当人工智能工作负载在极端温度和功率水平下运行时,毫秒之差都至关重要。莱迪思FPGA可实现纳秒级时序和实时故障响应,在液体冷却泄漏等潜在破坏性事件发生时立即采取行动。

  • 并行处理和接口灵活性。传统串行处理无法支持充满传感器和加速器的机架。莱迪思FPGA可同时处理I3C、PMBus/SMBus、通过PCIe的MCTP、I2C、SPI和GPIO等多种协议,避免瓶颈并实现可扩展性。

  • 内置安全功能。作为最先启动和最后断电的器件,适用于安全控制的莱迪思FPGA可作为硬件信任根(HRoT),执行安全启动和证明,确保只有受信任的固件和系统组件才能运行。

  • 加密灵活性。莱迪思FPGA支持部署后重新配置,为开发人员提供所需的灵活性,以支持随着标准不断发展而推出的新的更新和后量子加密(PQC)算法。


为数据中心的进一步发展做好准备


随着数据中心不断扩展并纳入更多样化的硬件组件,运营商将需要在性能与信任之间取得平衡。控制、安全性和适应性必须相结合,以确保在不断演进的人工智能基础设施中实现韧性和可靠性。


您可在此处查看上述LinkedIn现场小组讨论会的全部内容。如需了解莱迪思FPGA如何实现安全、可扩展的数据中心控制,请立即联系我们的团队。


关键字:FPGA  人工智能  数据中心  基础设施 引用地址:超越计算:FPGA——人工智能数据中心稳定与信任的基石

上一篇:Microchip推出SDI IP内核与四通道CoaXPress™桥接工具包,扩展PolarFire@ FPGA视频生态系统
下一篇:智能边缘:为下一代边缘人工智能应用赋能

推荐阅读最新更新时间:2026-03-20 16:23

数据中心和5G基础设施量身定做,联发科MT3729问市
7月30日消息, MediaTek发布其800GbE(双端口400GbE)MACsec retimer PHY收发器MT3729产品系列,此系列产品的解决方案主要面向数据中心和5G基础设施应用所需的高速和超低功耗数据传输以及严格的安全性需求。MT3729系列是基于MediaTek的56G PAM4 SerDes技术的标准产品 (ASSP), 赋能一级网络设备和服务提供商为网络基础设施实现安全、可靠和高速的数据传输。 据行业报告预估,数据中心对400GbE以上的网络需求将在2020年底出现强劲增长,并在2024年达到行业出货量的25% 以上。MT3729产品系列非常适用于线卡或交换机结构,可构建具有安全高速数据链路和高精度的Cl
[嵌入式]
俄罗斯顶尖矿业公司选择台达方案打造数据中心基础设施
近期,俄罗斯顶尖矿业公司选择全球电力及散热管理解决方案提供商台达,帮助其在俄罗斯打造数据中心基础设施。项目中,台达在总功率容量达到365 kW的四个数据中心设置站点,提供包括不间断电源(UPS)系统、精密冷却装置、电力配送系统、环境监控系统的整合式数据中心解决方案。而凭借台达丰富的行业经验,可以保证该矿业公司的数据中心能够在最佳的状况下,维持非常可靠的持续运转。 项目中涉及到的四座数据中心,包括两座已建成的,以及两座分别位于西伯利亚和俄罗斯西部的新建数据中心。在两座已建成的现代化数据中心中,使用超过30个的42U机柜,扩容后总容量高达275 kW,是从前的两倍。而两座新建置的数据中心由大约20个机柜组成,可支持最多90
[物联网]
俄罗斯顶尖矿业公司选择台达方案打造<font color='red'>数据中心</font><font color='red'>基础设施</font>
三大策略助力基础设施和运营团队成功拥抱生成式 AI
目前生成式 AI 技术快速发展、新的大预言模型层出不穷, Gartner 调研显示,中国企业对生成式 AI 的采用率从 2024 年的 8% 激增至 2025 年的 43% 。许多企业机构希望利用AI 来改进 I&O 团队中的 IT 运营。 2025 年 Gartner I&O 标志性角色调研显示,推动 AI 采用的前三大因素为:优化成本、提高效率与性能、改善客户体验( CX )。 随着企业日益拥抱生成式 AI ,基础设施和运营( I&O )的重要性也随之提升,这要求 I&O 团队掌握新的技能并承担新的角色。针对这一现状,Gartner 对正在进行员工队伍规划并为采用生成式 AI 做准备的中国 CIO 和 I&O 领导者提出三
[网络通信]
Microchip推出首款3纳米PCIe@ Gen 6交换机,赋能现代AI基础设施
Switchtec™ Gen 6 PCIe 扇出型交换机提供高带宽、低延迟和高级安全功能,适用于高性能计算、云计算和超大规模数据中心 随着人工智能(AI)工作负载和高性能计算(HPC)应用对数据传输速度与低延迟的需求持续激增, Microchip Technology Inc.(微芯科技公司)宣布推出下一代Switchtec™ Gen 6 PCIe ® 交换机 。作为业界首款采用3纳米制程工艺的PCIe Gen 6交换机,Switchtec Gen 6系列旨在实现更低功耗,并支持最多160通道,满足高密度AI系统的连接需求。该系列交换机的高级安全功能包括基于硬件的信任根、安全启动功能,并采用符合美国商用国家安全算法规范2.0(
[网络通信]
Microchip推出首款3纳米PCIe<sup>@</sup> Gen 6交换机,赋能现代<font color='red'>AI</font><font color='red'>基础设施</font>
WAIC 直击|Arm 邹挺:突破基础设施、数据安全与人才三重挑战,释放 AI 发展新潜能
在 2025 世界人工智能大会 (WAIC) 期间,Arm 举办了以“AI 无处不在:从云到边尽在 Arm” 为主题的技术论坛。该论坛汇聚了 Arm 技术专家及支付宝、联想等合作伙伴代表,共同分享人工智能 (AI) 行业的发展趋势与前沿洞察。开场环节,Arm 中国区业务全球副总裁邹挺深入解读了 AI 技术的演进趋势,分享了由 Arm 调研的《AI 就绪指数调研报告》,报告中揭示了针对中国市场的核心发现,并系统剖析了 AI 发展面临的挑战及对应解决方案。 Arm 中国区业务全球副总裁邹挺发表主题演讲 AI 技术演进趋势:从模型优化到自主智能 AI 行业的发展日新月异。综观行业全局,可清晰梳理出三大演
[半导体设计/制造]
WAIC 直击|Arm 邹挺:突破<font color='red'>基础设施</font>、数据安全与人才三重挑战,释放 <font color='red'>AI</font> 发展新潜能
​拥抱基础设施变革,抓住人工智能的万亿美元机遇
随着人工智能重塑整个行业,支撑这场变革的技术基础也必须随之演进 众所周知,人工智能 (AI) 有望革新人类活动的方方面面。然而,要充分释放这一潜力,就必须面对一个基本事实:支撑传统计算的基础设施已无法满足未来 AI 发展的需求。 当前, 产业已经见证了这场变革所呈现出的惊人规模: 训练 ChatGPT-4 使用了超过 1PB 的数据——相当于两亿首歌曲连续播放长达 1,000 年。 OpenAI 每月为 10 亿活跃用户提供服务,每位用户消耗的数据量是传统应用的一万倍。 到 2030 年,这场 AI 革命将带动超过一万亿美元的基础设施投资。 这一爆炸性增长正在推动数据中心的能耗从兆瓦级跃升至吉瓦级,由
[网络通信]
​拥抱<font color='red'>基础设施</font>变革,抓住<font color='red'>人工智能</font>的万亿美元机遇
机器“掘金潮”:面向人工智能时代扩展基础设施
作者:是德科技Jenn Mullen 在淘金热时期,怀揣着致富梦想的探矿者们纷纷涌入美国西部,希望通过淘金发家致富。如今,科技领域的开拓者也同样跃跃欲试,希望在人工智能(AI)领域大展拳脚。普华永道(PWC)估计,到2030年,全球经济总收益的45%将由人工智能驱动,越来越多的行业将受益于人工智能带来的生产力和产品性能提升。普华永道的研究进一步指出,人工智能有望为全球GDP额外贡献15.7万亿美元,增幅约为14%。然而,这一具有划时代意义的经济机遇,对计算能力和功率密度的需求已经远远超过了当前的承载能力。 无论是为淘金者提供商品、服务和安全保障,还是为企业提供服务器、存储系统、网络设施和数据存储,基础设施始终是推动发展的重要驱
[测试测量]
机器“掘金潮”:面向<font color='red'>人工智能</font>时代扩展<font color='red'>基础设施</font>
Gartner:生成式人工智能基础设施和运营的影响显著增加
在近期举办的2024大中华区高管交流大会上,Gartner发布了对基础设施和运营(I&O)的最新研究。 ChatGPT自2022年11月问世以来,生成式人工智能(GenAI)引发了一场全球技术革命,超过50%的企业已经开始测试或大规模应用GenAI技术 。GenAI不仅改变了传统的运营模式,还带来了新的挑战和机遇。 GenAI对I&O团队来说是一场“哥白尼式的革命”,它改变了传统的运营模式,开启了人类与AI合作的新纪元。在这种新模式下,机器将遵循人类的指令,而不是人类适应机器的语言和操作方式。基于AI助手和大语言模型,企业能够实现智能卓越运维的目标。 Gartner高级研究总监周玲 表示:“在新的运营模式下,GenAI技术
[网络通信]
小广播
最新嵌入式文章
何立民专栏 单片机及嵌入式宝典

北京航空航天大学教授,20余年来致力于单片机与嵌入式系统推广工作。

厂商技术中心

 
EEWorld订阅号

 
EEWorld服务号

 
汽车开发圈

 
机器人开发圈

电子工程世界版权所有 京ICP证060456号 京ICP备10001474号-1 电信业务审批[2006]字第258号函 京公网安备 11010802033920号 Copyright © 2005-2026 EEWORLD.com.cn, Inc. All rights reserved