展会资讯
AI数据中心OT安全威胁深度分析报告
2026-06-16 19:12
AI数据中心OT安全威胁深度分析报告

当攻击者的目标从"数据"转向"电力、温度与控制权",AI时代最关键的物理基础设施正面临前所未有的安全挑战。


一、执行摘要

全球科技巨头正以前所未有的速度建设AI数据中心。但一个被长期忽视的风险正在浮出水面——运营技术(OT)设备中的高危漏洞可能让攻击者直接控制供电、制冷和环境监测系统,在物理层面瘫痪整个数据中心。

关键数据一览:

2025-2026年,安全研究领域接连披露了一系列关键发现:

  • 全球近70,000台OT设备暴露在公网中
  • 仅2025年上半年就披露了670个可能影响OT环境的新漏洞
  • UPS不间断电源和HVAC空调控制器被发现存在CVSS 9.8的严重漏洞
  • 检测到272,512次OT/ICS相关威胁事件

这些数据指向同一个现实:AI数据中心的物理基础设施,正在成为网络攻击的新靶心

本报告基于四篇arXiv学术论文及2025-2026年最新行业研究,系统分析AI数据中心OT安全威胁的现状、攻击路径与防护策略。


二、研究背景:OT安全的历史欠账

运营技术(Operational Technology, OT)是直接控制物理设备的硬件和软件系统,包括可编程逻辑控制器(PLC)、分布式控制系统(DCS)、数据采集与监控系统(SCADA)、人机界面(HMI)等。

在过去几十年中,OT设备的设计和部署始终以功能性和可用性为优先,安全性长期被置于次要位置。

三大结构性缺陷

缺陷类型
具体表现
风险等级
更新困难
设备生命周期长达10年以上,补丁更新需停机维护
? 高
默认配置薄弱
默认密码、弱认证、缺少加密通信
? 高
IT与OT融合
OT设备连接企业网络甚至互联网,攻击面急剧扩大
? 中高

核心洞察: OT系统的安全问题不是"新发现",而是长期积累的历史欠账。AI数据中心的快速建设正在加速IT与OT的融合,将这一历史问题推向前台。

对工业控制系统(ICS)和关键基础设施的长期研究不断指出:攻击者已经具备利用OT漏洞影响物理过程的能力。当这些漏洞出现在AI数据中心时,后果将不只是数据泄露,而是直接演变为物理层面的业务中断。


三、OT漏洞全景:暴露在公网中的工业设备

全球暴露态势

Rodda和Mavroudis在2025年8月发表于arXiv的论文中,对公网可访问的OT设备进行了系统性测绘。研究发现,全球范围内存在近70,000台暴露于公网的OT设备,主要集中在美国和欧洲。

▲ 图1: 全球暴露OT设备的协议分布

漏洞数量激增

IBM X-Force的威胁情报数据显示,2025年上半年已披露了670个可能影响OT环境的漏洞,其中11%的CVSS严重性评级为"严重"(9.0-10.0分),21%的严重漏洞已公开漏洞利用代码。

▲ 图2: 2025年上半年OT新披露漏洞严重程度分布

威胁检测数据

Trellix发布的2025年11月OT威胁报告显示,2025年4月至9月期间,其遥测系统检测到272,512次OT/ICS相关威胁,覆盖572个独立客户,同期发生了333起专门针对关键基础设施的勒索软件攻击。

▲ 图3: 全球OT/ICS威胁检测态势趋势 (Trellix报告)

暴露在公网中的具体设备

设备类型

暴露数量

主要风险

来源

通用OT设备

~70,000

固件过时、认证缺失

[1]

Rockwell PLC

~6,000

远程操控物理流程

[7]

Telnet服务器

~800,000

明文通信、后门

[8]

HVAC/BMS控制器

大量暴露

远程代码执行

[3]

UPS网络管理卡

广泛部署

认证绕过、关断

[3]

▲ 表1: 全球暴露OT设备详情清单

OT安全专家Pascal Ackerman通过Shodan搜索引擎发现: - 近6,000台 Rockwell Automation PLC 可从全球任意位置访问 - 多达80万台 Telnet服务器暴露在公网中


四、数据中心OT攻击面分析

一个现代AI数据中心真正依赖的不仅是计算资源,更依赖电力系统、UPS不间断电源、制冷设备、环境监测系统以及楼宇自动化控制系统——这些共同构成了数据中心的OT网络。

数据中心OT资产全景

系统类别

关键设备

被攻破后的影响

供配电系统

UPSPDU、发电机

切断电力、宕机

制冷系统

CRAC/CRAH, 液冷CDU

温度失控、硬件损坏

环境监测

温湿度传感器、漏水检测

篡改告警、掩盖痕迹

楼宇自动化

DDC控制器、BMS平台

横向跳板

DCIM管理

管理平台、网络卡

统一遥控所有设施

▲ 表2: 数据中心OT资产全景图

制冷系统:AI工作负载的关键命脉

GPU集群往往运行在高功耗状态,单机柜功耗可达20kW以上。研究表明:

通过计算负载操控发起"热攻击",可使局部热点温度在60秒内上升10-15°C,导致服务器性能下降15-25%,冷却能耗增加30-40%

Uptime Institute数据显示,13-19%的数据中心严重宕机事件由制冷系统故障引发。

▲ 图4: 制冷系统攻击连锁效应 —— 温度攀升时间线

UPS系统:停电等于停机

Claroty Team82在2026年6月披露的 Vertiv Liebert UPS 网络管理卡漏洞(CVSS 9.8) 尤为触目惊心。攻击者如果能够通过互联网访问这些管理卡,可以远程登录配置界面并直接关闭所有由UPS供电的设备

对于一个AI数据中心而言,这意味着整个设施可能瞬间断电


五、真实案例与威胁态势

案例一:Vertiv UPS 与 Trane HVAC 漏洞

2026年6月,OT安全公司Claroty的研究团队Team82在SANS ICS安全峰会上披露了两类关键漏洞:

  • Vertiv Liebert UPS
    :2个CVSS 9.8严重漏洞(认证绕过 + 远程代码执行)
  • Trane Tracer SC+ HVAC控制器
    :5个中等漏洞,可链式利用实现未认证RCE

CISA已就此发布安全公告,建议用户确保设备不可从互联网直接访问

案例二:AWS中东数据中心遭无人机袭击

2026年3月,伊朗无人机袭击了Amazon Web Services位于阿联酋和巴林的数据中心设施,导致整个地区云服务中断。

世界经济论坛称:这是现代战争中商业数据中心首次成为明确的动能打击目标。

案例三:印尼国家数据中心勒索攻击

2024年6月,印尼国家数据中心遭LockBit 3.0变种"Brain Cipher"攻击,超过210个政府机构受影响。事后审计发现:该中心超过98%的数据未做备份

案例四:波兰能源部门OT入侵事件

2026年2月,波兰能源部门遭网络攻击,攻击者通过暴露在互联网的边缘设备获得初始访问权限,破坏远程终端单元(RTU),导致失去可视性和控制能力。

威胁态势数据汇总

指标

数据

时间

来源

OT/ICS威胁检测

272,512

2025 H2

[6]

勒索攻击

333

2025 H2

[6]

OT新漏洞

670

2025 H1

[2]

严重级漏洞占比

11%

2025 H1

[2]

暴露OT设备

~70,000

截至2025.8

[1]

宕机平均成本

>$100,000

2026调查

[10]

▲ 表3: 威胁态势核心数据汇总

六、攻击路径深度剖析

基于现有研究,针对数据中心OT系统的攻击路径可归纳为四大类

向量一:网络层热操控

Modbus TCP协议在设计中不含加密和认证机制,所有通信均为明文传输。攻击者一旦进入管理VLAN,即可直接向冷却控制器发送任意指令。

攻击流程:Nmap扫描 → mbpoll读取/写入寄存器 → 修改温度设定点使冷却失效

向量二:供应链固件植入

大多数冷却控制器基于BusyBox Linux运行专有固件,厂商常为远程诊断预留后门或使用硬编码凭据。攻击者入侵厂商构建服务器后,设备即成为持久化植入点。

向量三:IoT传感器欺骗

如果MQTT Broker缺乏认证,攻击者可以直接发布伪造的温度读数,诱使控制器降低冷却功率,而实际温度持续攀升。这种攻击路径几乎不留痕迹。

向量四:物理端口与维护接口

许多冷却控制器启动时若检测到控制台线缆连接,会直接进入root shell,完全绕过网络层认证。

▲ 图5: 数据中心OT攻击链全景 

七、防护体系与行动建议

1. 网络分段与零信任架构

必须为所有冷却设备创建专用OT VLAN,默认拒绝来自IT VLAN的流量。对OT网络的访问必须通过加固的跳板机。对于Modbus TCP等明文协议,应在BMS服务器和CDU之间建立VPN隧道封装。

零信任的核心原则——"永不信任,始终验证"——应成为OT安全的基础信条。

2. 资产管理与补丁更新

建立数据中心OT资产的完整清单,对固件进行已知CVE扫描。对于确实无法修补的设备,应考虑网络隔离或虚拟补丁方案

3. 异常检测与行为基线

需要建立物理行为基线:对于给定的计算负载,冷却响应应当是可预测的。如果服务器功率超过10kW但冷却液温度低于18°C且泵速低于20%——这在物理上是不可能的。SIEM系统应纳入此类物理逻辑规则

4. 物理安全加固

冷却控制器的USB和控制台端口应配备防篡改封条,在软件层面禁用控制台接口。

5. 供应链安全

对关键OT设备执行固件完整性校验,在采购合同中要求无硬编码凭据、定期安全更新、SBOM交付。

6. 应急响应

一旦检测到热攻击,响应必须即时且物理层面。核心步骤:隔离OT网络 → 切换至手动模式 → 物理旁路 → 数字取证。应定期进行热攻击场景的桌面推演。


八、结论:重新定义数据中心的边界

过去十年,网络安全行业一直在讨论"数字世界的攻击"。而今天,一个更根本的问题正在浮现:

如果黑客不再攻击服务器,而是直接攻击服务器赖以生存的环境怎么办?

全球近70,000台暴露在公网中的OT设备、CVSS 9.8的UPS漏洞、272,512次OT威胁检测——这些数据共同描绘了一幅令人警醒的图景。

Claroty CTO Amir Preminger的判断值得深思:

"由于当前的计算需求,任何因数据中心支持系统被攻击而导致的停机,都将对托管在该设施上的人工智能服务造成灾难性影响。"

在AI算力竞赛中,最昂贵的损失可能不是数据泄露,而是一场持续几分钟的停电。

数据中心的物理基础设施,正在成为数字世界的最后一道防线。


参考文献

[1] Rodda M, Mavroudis V. Analysis of Publicly Accessible Operational Technology and Associated Risks. arXiv:2508.02375, Aug 2025.

[2] IBM X-Force. Operational Technology Threat Landscape: Insights from IBM X-Force. 2025.

[3] Waterman S. Data Center OT Flaws Could Help Hackers Kill Power and AC. ISMG / DataBreachToday, Jun 2026.

[4] arXiv. I Can't Patch My OT Systems! A Look at CISA's KEVC Workarounds & Mitigations for OT. arXiv:2510.06951, 2025.

[5] arXiv. Vulnerabilities and Attacks Against Industrial Control Systems and Critical Infrastructures. arXiv:2109.03945, 2021.

[6] Trellix. Operational Technology Threat Report. Nov 2025.

[7] OT Security Research. 6,000 Rockwell Automation PLCs Leaking Critical Infrastructure Secrets on the Public Internet. 2025.

[8] Security Research. 800,000 Telnet Servers Exposed: Complete Security Guide 2025.

[9] RaSEC Team. Thermal Warfare: 2026 Data Center Cooling System Attack Vectors. Jan 2026.

[10] Veridify. Zero Trust Security for Building Management Systems in Data Centers. Mar 2025.

[11] CISA. Schneider Electric EcoStruxure IT Data Center Expert. ICSA-25-203-06, Jul 2025.

[12] World Economic Forum. AI infrastructure critical infrastructure. Apr 2026.

[13] CISA. Poland Energy Sector Cyber Incident Highlights OT and ICS Security Gaps. Feb 2026.

[14] arXiv. The Global State of Security in Industrial Control Systems. arXiv:2111.13862, 2021.


? 关注「James谈安全」,看懂AI时代的每一个安全暗流。

发表评论
0评