AI向Agent架构演进,从纯对话转向执行任务,推动AI算力需求出现结构性分化,打破了市场对AI算力=GPU、CPU仅负责调度的认知,CPU的核心算力地位显著抬升。
1.执行控制流呈现CPU化特征,Agent行动阶段的分支类任务适配CPU微架构,GPU执行此类任务会导致算力利用率急剧下降;
2.记忆体系走向去GPU化,Agent长上下文推理产生的KV cache易耗尽GPU HBM容量,CPU搭配大容量内存并通过CXL扩展,成为承载KV Cache与部分参数的主流架构。
CPU成为Agentic AI的真实瓶颈,工具处理环节在CPU上的耗时占端到端延迟比例最高达90.6%,高并发场景下CPU端到端延迟从2.9秒升至6.3秒以上,系统吞吐受限于CPU核心数并发调度问题,CPU侧的工具执行与调度能力成为需单独规划优化的核心资源池。
产业端正加速推进Agent相关基础设施建设与技术升级,头部CSP加速搭建Agent沙盒环境软硬件基础设施,完善运行时与调度体系,为CPU侧基础设施规模化部署奠基;
CPU龙头向超多核架构演进,AMD Turin最高192核、Intel SierraForest核心数可达144甚至288核,超多核CPU以高并行度、低单位功耗适配Agent任务降成本的需求;
英伟达也在新架构中提升CPU配比,从系统层面确认大内存CPU是承载海量KV Cache的最优容器。
投资方面,看好海光信息、澜起科技,前者受益于CPU核心算力地位抬升,后者受益于CXL驱动的“存力+算力”协同升级;建议关注龙芯中科、万通发展(数渡科技)。
存在Agent落地节奏不及预期、新型硬件架构替代、CSP资本开支波动的相关风险。

下载链接:
https://pdf.dfcfw.com/pdf/H3_AP202601281818495927_1.pdf?1769599419000.pdf


