半导体行业深度报告:Agentic AI时代的算力重构:CPU,从“旁观者”到“总指挥”的价值回归-附PDF下载

日期：2026-01-29 08:37:45 来源：网络整理作者：本站编辑评论：0

AI向Agent架构演进，从纯对话转向执行任务，推动AI算力需求出现结构性分化，打破了市场对AI算力=GPU、CPU仅负责调度的认知，CPU的核心算力地位显著抬升。

1.执行控制流呈现CPU化特征，Agent行动阶段的分支类任务适配CPU微架构，GPU执行此类任务会导致算力利用率急剧下降；

2.记忆体系走向去GPU化，Agent长上下文推理产生的KV cache易耗尽GPU HBM容量，CPU搭配大容量内存并通过CXL扩展，成为承载KV Cache与部分参数的主流架构。

CPU成为Agentic AI的真实瓶颈，工具处理环节在CPU上的耗时占端到端延迟比例最高达90.6%，高并发场景下CPU端到端延迟从2.9秒升至6.3秒以上，系统吞吐受限于CPU核心数并发调度问题，CPU侧的工具执行与调度能力成为需单独规划优化的核心资源池。

产业端正加速推进Agent相关基础设施建设与技术升级，头部CSP加速搭建Agent沙盒环境软硬件基础设施，完善运行时与调度体系，为CPU侧基础设施规模化部署奠基；

CPU龙头向超多核架构演进，AMD Turin最高192核、Intel SierraForest核心数可达144甚至288核，超多核CPU以高并行度、低单位功耗适配Agent任务降成本的需求；

英伟达也在新架构中提升CPU配比，从系统层面确认大内存CPU是承载海量KV Cache的最优容器。

投资方面，看好海光信息、澜起科技，前者受益于CPU核心算力地位抬升，后者受益于CXL驱动的“存力+算力”协同升级；建议关注龙芯中科、万通发展（数渡科技）。

存在Agent落地节奏不及预期、新型硬件架构替代、CSP资本开支波动的相关风险。

下载链接:

https://pdf.dfcfw.com/pdf/H3_AP202601281818495927_1.pdf?1769599419000.pdf

打赏

更多>同类资讯

0 条相关评论

推荐图文

推荐资讯

点击排行