
AI基础设施范式迁移:从GPU单点竞争到异构协同
随着人工智能产业从模型训练阶段迈向推理与智能体(Agentic AI)阶段,AI基础设施的核心矛盾与竞争逻辑正在发生根本性变化。过去两年,行业关注点主要集中在“训练算力不足”,GPU因承担大规模并行矩阵运算而成为产业链绝对核心,CPU则逐渐边缘化为辅助处理器。然而,进入推理时代后,系统工作负载从高度规则化的计算转向复杂请求的实时处理与系统调度,瓶颈开始从GPU浮点算力向CPU侧的请求处理、编排调度与数据加工转移。
在智能体AI时代,AI系统不再仅仅是“回答问题”的一次性推理引擎,而是演变为“持续执行”的任务完成系统。Agent需要自主拆解任务、调用外部工具、获取环境反馈并持续调整执行路径。这种工作负载天然具备强CPU密集特征,涉及任务规划、工具调用、工作流编排、状态维护及异常处理等复杂逻辑。研究指出,在部分Agent场景中,CPU部分最高可占整体系统延迟的88%,且GPU性能越强,CPU瓶颈越容易暴露。因此,AI基础设施正从“单芯片竞争”进入“系统级竞争”,CPU重新成为决定系统效率与扩展能力的核心中枢。
CPU需求结构性拐点:配比提升与架构升级
AI应用落地驱动系统复杂度提升,促使CPU需求迎来结构性拐点。在训练阶段,行业普遍采用“4~8个GPU配1个CPU”的架构,CPU:GPU配比约为1:8。随着AI重心转向推理,CPU负载显著提升,配比演进至1:3~1:4。而在Agentic AI阶段,由于Agent执行过程中大量系统任务运行在CPU侧,CPU与GPU的配比甚至接近1:2。这种配比变化意味着未来AI数据中心的资源配置逻辑将从单纯追求“更多GPU”转向优化“CPU+GPU”的协同能力。
与此同时,AI工作负载的复杂化推动CPU架构向系统级协同优化演进。新一代CPU设计不再仅关注单点算力提升,而是追求更多核心、高带宽缓存、CXL互联及新型共享内存架构。例如,CXL技术正在成为下一代AI基础设施的重要标准,旨在实现CPU、GPU与内存之间的统一共享与低延迟访问,缓解大模型推理中的内存瓶颈。此外,针对长上下文Memory、KV Cache管理以及RAG检索等场景,CPU的大缓存容量和高内存带宽变得至关重要,行业开始全面追求更高性能的CPU互联与内存体系。
产业链机遇:全球市场扩张与国产替代加速
CPU需求的回升已开始在产业链供需关系中得到验证。全球范围内,服务器CPU价格普遍上涨,交货周期显著拉长,部分高端型号甚至出现数月延迟,反映出先进制程资源重新向CPU倾斜。资本市场对CPU价值的认知也在快速重估,Intel、AMD等传统厂商及ARM阵营均因AI基础设施定位而受到关注。云厂商如Meta、Google、AWS等开始大规模部署或自研CPU集群,专门用于支持Agentic AI工作负载,标志着AI数据中心将形成GPU Rack与Agentic CPU Rack并存的架构。
在国内市场,国产CPU厂商正迎来产业链布局窗口。在国际市场由Intel、AMD和ARM主导的背景下,海光信息、龙芯中科、中国长城等国产厂商通过自主指令集、RISC-V生态及国产EDA/IP支持,加速在服务器及AI算力市场的突破。国产CPU不仅受益于信创替代政策,更因AI推理与智能体应用对高性能、高可靠性算力的需求而获得新的增长动力。建议关注国产CPU芯片设计、服务器整机制造、虚拟机管理及云厂商等相关产业链环节,这些领域有望在CPU价值重估中迎来结构性机遇。
报告全文可扫描下方图片二维码进入星球社群查阅下载

(报告来源:国泰海通证券。本文仅供参考,不代表我们的任何投资建议。如需使用相关信息,请参阅报告原文。)
