推广 热搜： 采购方式滤芯带式称重给煤机甲带气动隔膜泵减速机型号无级变速机链式给煤机履带减速机

半导体行业深度报告:Agentic AI时代的算力重构:CPU,从“旁观者”到“总指挥”的价值回归(附下载)

日期：2026-02-13 09:19:53 来源：网络整理作者：本站编辑评论：0

加入星球，获取所有报告哦~

需要下载报告的朋友，可直接扫下方二维码入圈。

来源：东吴证券

扫码加入星球，可获取无限次下载机会！

从对话模型到行动智能体：Agent架构重塑CPU与GPU分工：市场认为AI算力=GPU，CPU只是负责调度。https://www.hibor.com.cn【慧博投研资讯】但AI落地方向来到Agent，由“纯对话”转向“执行任务”时，算力需求发生了结构性分化。https://www.hibor.com.cn（慧博投研资讯）1）执行控制流CPU化：Agent的行动阶段是大量if/else判断与系统调用。Manus等主流Agent架构为每个Agent/任务分配一个隔离的云端虚拟机，不同任务在逻辑上高度异构（如网页浏览、代码修改、环境部署等），任务之间可并行但控制流完全不同。分支类任务不适合由GPU执行，因控制流发散导致算力利用率急剧下降。而分支类任务却正是CPU微架构长期优化的主战场。2）记忆体系去GPU化：在Agent场景下，长上下文推理会产生巨大的KV cache，其占用随对话轮次与上下文长度线性增长，快速耗尽GPUHBM容量。而CPU搭配大容量DDR5 / LPDDR5（并通过CXL扩展）承载KVCache与部分参数，正在成为兼顾吞吐、扩展性与成本效率的主流架构选择。

　　Agent软件基础设施加速落地，CPU多核化与需求放量进入确定性通道：从实验数据复盘来看，CPU成为Agentic AI的真实瓶颈。研究显示，在完整的Agent执行链路中，工具处理相关环节（检索、Python/Bash执行、Web请求等）在CPU上消耗的时间占端到端延迟的比例最高可达90.6%。在高并发场景下（Batch Size提升至128），CPU端到端延迟从2.9秒跃升至6.3秒以上。我们认为研究结果揭示了在大量Agentic场景中，系统吞吐受限的并非GPU计算能力，而是CPU的核心数并发调度问题。我们由此判断，进入Agent时代后，CPU侧的工具执行与调度能力将从GPU的附属角色，演化为需要被单独规划与优化的核心资源池。

　　产业端推进方面，AWS和Google Cloud等头部CSP正在加速建设面向Agent的沙盒环境软硬件基础设施，率先在软件层面强化Agent Sandbox的隔离与编排能力，通过运行时与调度体系的完善，为后续CPU侧基础设施规模化部署奠定基础。与此同时，CPU龙头也在Agent驱动下向超多核架构演进：AMD推出的Turin最高可达192核；Intel的SierraForest采用纯能效核设计，核心数可达144甚至288核。我们认为，随着Agent商业化推进，厂商必须持续压低每次任务执行成本。在这一目标下，超多核CPU以更高的并行度、更低的单位功耗，支撑大规模、长期运行的Agent执行环境。英伟达亦在新架构中提升CPU配比，CPU的重要性抬升，挂钩Agentic的叙事。我们认为NVIDIA主动提升CPU权重，等同于在系统层面确认：在长上下文与高并发Agent场景中，大内存CPU是承载海量KVCache的最优容器。