【行研】DPU行业_展会资讯_资讯

【行研】DPU行业

1. DPU 行业发展概况

DPU（Data Process Unit，数据处理芯片）被认为是继 CPU 和 GPU 之后的“第三颗主力芯片”。主要承担 CPU 和 GPU 不擅长的计算加速、存储加速、网络加速、算力集群组网、网络流量及任务分发调度等功能。DPU 要解决的核心问题是基础设施的“降本增效”，即将“CPU处理效率低下、 GPU 处理不了” 的负载卸载到专用 DPU，提升整个计算系统的效率，降低整体系统的总体拥有成本（TCO）。

在 AI 时代，计算模式发生了根本性转变：从以 CPU （中央处理器）为核心的通用计算，转向了由 GPU/NPU 等集群驱动的规模化智能计算。可以将一个 AI 算力中心类比为一个超级物流枢纽：GPU 是数以万计的“超级分拣机器人”，负责执行核心的计算任务； CPU 是 “枢纽的总指挥”，负责整体的任务调度与逻辑管理； DPU（数据处理单元）则是枢纽的“智能交通指挥系统”，部署于每个计算节点，实现所有数据的调度、传输与安全保障，确保海量数据包能够毫不停歇地、精准地送达每一个 GPU。

CPU 资源负载过大为行业痛点，智能网卡（Smart NIC）为 DPU 前身。在通信领域，伴随着 5G、云网融合时代的到来，以及虚拟交换等技术的引入，基于服务器的网络数据平面的复杂性急剧增加。海量的数据搬运工作被 CPU 承担，导致网络接口带宽急剧增加， CPU 资源负载过大，大大影响了 CPU 将计算能力释放到应用程序中，为了提高主机 CPU 的处理性能，Smart NIC 将部分 CPU 的网络功能转移到网卡硬件中，起到了加速运算的目的，其可视为 DPU 的前身。

新一代的 DPU 的优势在于不仅可以作为运算的加速引擎，还具备控制平面的功能，可以更高效的完成网络虚拟化、I/O 虚拟化、存储虚拟化等任务，并彻底将 CPU的算力释放给应用程序。

2. DPU 产业链

DPU 产业链具体构成如下：

DPU 产品上游涉及如 EDA 设计软件、IP 核、封装测试、制造代工等环节，下游则主要对应 AI 计算/云计算、数据通信、智能驾驶、网络安全等领域需求。

中游的 DPU 研发、制造厂商主要向上游采购基础组件、芯片及加工服务，并基于核心芯片进行研究开发形成 DPU 产品。中游供应商（包括自研自用厂商）主要包括三类，即通用芯片厂商（如 Nvidia、博通等）、互联网及科技巨头（如亚马逊、微软、华为、阿里巴巴等）以及国内行业初创企业（如云豹智能、云脉芯联等）等。技术路线主要包括 ASIC、FPGA、SoC 三类，不同路线的产品，在成本、编程的易用性和灵活性方面存在各种权衡。

FPGA（Field-Programmable Gate Array，现场可编程逻辑门阵列）是一种特殊的逻辑芯片，和 ASIC 芯片的不同之处在于，用户可以随时定义其硬件功能。虽然 CPU、GPU 都可以实现编程，但这种可编程是指改变其寄存器的配置，用户并不能改变其硬件功能。而 FPGA 可编程的是硬件可编程，内部的门电路逻辑块、连线、I/O 等资源都可以由用户配置，使得同一片 FPGA 既可以在 5G的基站实现信道编码的功能，也可以在重新配置后放在 AI 基础设施中实现网络传输及协议控制的功能。因此，FPGA 芯片又被称作“万能”芯片。

FPGA 具有以下技术特点及优势：1）灵活性高，适合高速迭代的场景：FPGA 可以实现任何电路功能，重新配置逻辑功能耗时甚至不超过一秒，修改不限次数，这一特性尤其适合标准/协议/算法经常更改的行业、快速迭代成本敏感的行业、小批量的行业以及需要反复修改验证的设计领域等；2）并行性好，适合要求低时延和大量并行计算的场景： FPGA 内部数十万个可配置逻辑块可以同时独立工作，实现大规模的低时延并行计算，由于不存在线程或者资源冲突的问题，FPGA 的时延是确定的低时延，特别适合低时延高性能的计算场景。由于 FPGA 的技术特性，在数据通信处理、高性能计算、工业控制、航空航天、汽车电子等部分应用领域占据重要作用； 3）开发周期快，一般 FPGA 芯片开发周期 6-12 个月，远远快于 ASIC 芯片 2-3 年的设计和流片周期。

3. DPU 主要技术路线

当前 DPU 主要采用的架构方案包括 NP/MP+CPU、FPGA+CPU、ASIC+CPU 及DPU SoC 等。在这些不同路线之间，在成本、编程的易用性和灵活性方面存在各种权衡，主要技术路线介绍如下：

其中，通用市场主要以 ASIC/SoC 技术路线为主导，代表企业为 Nvidia，Nvidia 占有市场份额接近 60%；而 FPGA 技术路线由于其本身具有高度可编程性、低延迟、高并发的特点，在工业控制、航空航天、通信、汽车电子等细分领域具有一定市场份额，同时依靠其高度灵活、可深度定制的特点，在互联网、云计算等应用领域也具有一定市场份额，与 Nvidia 主导的通用产品生态形成差异化竞争。

4. DPU 产品受益于算力基础设施投资，市场规模不断扩大

人工智能（AI）是数字经济的核心驱动力，是新质生产力的关键要素。随着多模态、大模型的快速发展，各行业对智能化需求迅速增加，全球对 AI 算力基础设施的需求也不断增长。其中， AI 服务器作为智算中心核心计算架构，随着 AI 技术升级应用， CPU 的串行处理架构不能满足 AI 时代的算力需求，企业需要为人工智能、机器学习和深度学习建设全新的 IT 基础架构，逐渐由 CPU 密集型转向搭载 GPU、 FPGA、ASIC 芯片的加速计算密集型架构，且越来越多地使用搭载 GPU、 FPGA、 ASIC 等加速卡的服务器。

在市场规模方面，Gartner 报告显示，得益于 AIGC 技术的快速迭代，2024 年全球都在加大对 AI 算力基础设施的投资，全球服务器市场规模将达到 2,164.0 亿美元，预计 2023 年-2028 年市场将以 18.8%的年复合增长率保持高速增长，2028 年市场规模将达 3,328.7 亿美元，其中 AI 服务器将占据近七成市场份额。

受益于技术方案成熟度提升、服务器市场规模扩大及边缘计算应用落地等因素驱动，全球 DPU 产品市场规模快速增长。以 Nvidia 为例，其 2023 财年（2022 年 1月 31 日-2023 年 1 月 29 日）数据中心网络业务板块（包括网络交换芯片、DPU 及光模块等）收入为 36.88 亿美元，至 2025 财年（2024 年 1 月 29 日-2025 年 1 月 26 日）增长至 129.90 亿美元，年化增长率 87.68%。

国内市场，从整体发展趋势看，中国 DPU 市场保持稳定增长态势， 2020 年国内DPU 市场规模为 0.88 亿美元，而根据市场机构预测，预计到 2025 年市场规模有望达到 37.41 亿美元，年均复合增长率达到 111.69%。这一发展前景主要得益于云计算、5G 和边缘计算等技术的快速普及，以及各行业数字化转型带来的算力需求激增。

5. 产品供需情况

应用于 AI 算力集群的 DPU 产品可以是基于 ASIC、FPGA 和 SoC 的。在这些不同路线之间，在成本、编程的易用性和灵活性方面存在各种权衡。ASIC 具有成本效益，可能提供最佳性价比，但灵活性有限； SoC 芯片集成了 NiC 和 ARM 等，兼具灵活性，但可编程部分以 CPU 为核心，性能有限；相比之下，FPGA 具有高度可编程性、低延迟、高并发的特点，但存在功耗高、成本高、单位面积大的问题，在部分要求低时延处理和高灵活变化场景的细分领域具有相对优势，如工业控制、互联网、通信、航空航天、汽车电子等。基于不同路线产品以及特定应用领域的需求特点，市场整体供需结构较为复杂。具体分析如下：

在需求端， DPU 产品需求整体呈现爆发式增长的趋势： ①伴随着 5G、云网融合时代的到来，以及虚拟交换等技术的引入，基于服务器的网络数据平面的复杂性急剧增加。在当前数据增幅大幅提升的大背景下，CPU 性能的增速减缓，成本大幅增加，而 DPU 可有效减少算力损耗，提升算力中心运行效率，展现出强劲的发展潜力。②随着数据量的爆发式增长与数据类型的多元化发展，单一超算服务器（Scale-Up，纵向扩展）已无法满足大模型训练需求，万卡级集群成为头部企业的标配，横向扩展（Scale-Out）架构成为目前算力集群建设的主流选择，在此架构下，网络通信效率直接决定整体算力效率， DPU 成为提升集群效率的关键因素之一，逐渐成为 AI 算力集群的必选项。③各大算力中心呈现存算分离与算力协同的发展趋势，通过跨域扩展（Scale Across）将分布在不同地理位置的多个数据中心视为一个统一的、巨型的“虚拟计算机”，协同完成一项任务。这为 DPU 在广域网加速、数据调度等领域创造了新市场。据研究机构预测， 2025 年全球 DPU 市场规模将达到 135.7 亿美元，而中国 DPU市场规模将达到 37.4 亿美元。基于不同路线产品以及特定应用领域的需求特点，市场整体需求结构较为复杂，不同性能参数、技术路线及应用场景的产品需求规模及价格差异较大。其中， FPGA 路线产品凭借其深度适配、高灵活性及极致性能等特点，在部分领域具有比较优势，有望获得一部分市场增量。

在供给端， DPU 产品总体市场集中度较高，但因技术路线及细分领域应用特点的差异，不同类型的 DPU 产品并非简单的“替代”关系，而是一个由不同技术路径和客户需求驱动的多层次竞争格局。其中通用市场主要由 Nvidia 主导，占据绝大部分市场份额；但面对部分客户如互联网厂商的自主可控、定制适配的需求，国内采用ASIC/SoC 路线的厂商凭借本土化策略、特定场景优化及兼容性提供部分替代选择；FPGA 路线的 DPU 产品凭借本身低延迟、高并发的技术特点以及可编程高适配性，在部分应用领域如数据通信处理、高性能计算、AI 算力集群组网等具有一定的市场份额。

总体上，DPU 产品呈现需求爆发式增长，而供给端呈现高端供给分化且仍需要进一步适配客户需求的发展特点。

6. 行业竞争格局

因 DPU 产品技术路线及细分领域应用特点的差异，不同类型的 DPU 产品并非简单的“替代”关系，而是一个由不同技术路径和客户需求驱动的多层次竞争格局。Nvidia 凭借其成熟的端到端生态（NV Link+IB+CUDA）以及行业领先的产品性能主导通用市场，市场份额接近 60%；但面对部分客户如互联网厂商的自主可控、定制适配的需求，国内采用 ASIC/SoC 路线的厂商凭借本土化策略、特定场景优化及与其他非 Nvidia 产品的兼容性提供替代选择；FPGA 路线的 DPU 产品凭借本身低延迟、高并发的技术特点以及对部分领域的高适配性，在部分应用领域如数据通信处理、高性能计算、工业控制、航空航天、汽车电子等具有一定的市场份额， FPGA 路线厂商则通过极致的灵活性与快速适配性解决头部客户的极致需求，形成差异化竞争。

当前全球 DPU 产品通用市场主要由 Nvidia 主导，占据了绝大部分市场份额，其中 Nvidia 2025 财年（2024 年 1 月 29 日-2025 年 1 月 26 日）数据中心网络业务板块（包括网络交换芯片、系统、 DPU 及光模块等）营业收入约为 129.90 亿美元， 2024财年（2023 年 1 月 30 日-2024 年 1 月 28 日）数据中心网络业务板块营业收入约为85.75 亿美元，其中中国大陆及港澳地区业务收入占比约为 10%-15%（根据 Nvidia披露数据进行估算）。

而在以 FPGA 为技术路线的 DPU 细分赛道中，竞争格局相对复杂，这一领域需求高度集中于阿里巴巴、字节跳动等基于自身业务特点对算力网络有深度定制化需求的头部互联网及云厂商。该部分企业对算力网络有深度定制化需求，如阿里巴巴采用“全栈自研”战略路径，在基础设施层持续推进包括自研 AI 芯片、高性能网络（HPN8.0）和存储系统在内的软硬件协同创新，其底层网络协议和通信库往往需要与核心芯片计算任务深度耦合，标准的 ASIC 或 SoC 的 DPU 方案难以有效满足其灵活性和独特性需求。因此，基于 FPGA、支持硬件级定制的 DPU/AI NIC 成为了它们在特定业务领域的优先选择之一。

当前 DPU/AI NIC 的市场存在两种鲜明的技术路径：一种是以 Nvidia、云豹智能为代表的 ASIC/SoC 方案，追求标准化、高性能与低功耗；另一种则是恒扬数据为代表的 FPGA 方案，核心价值在于硬件级的可编程性与深度定制能力。

Nvidia 提供的是端到端的封闭生态解决方案。其 Connect-X 系列（ASIC 网卡）与 BlueField 系列（SoC DPU）配合 Quantum（IB 交换机）和 Spectrum（RoCE 交换机），基于 Nvidia 自研的通信协议、标准及计算核心，能构建一个集成了自适应路由、在网计算等高级功能的完整 AI 网络。这些特有功能仅在全部使用 Nvidia 产品时才能

完全发挥，一旦与第三方产品配合则无法发挥产品全部功能及性能，这构成了其强大的生态护城河，Nvidia 定义了高端 AI 网络的标准，但其封闭生态策略也为其他市场参与者创造了在开放生态中竞争的机会。

国内其他厂商如云脉芯联、云豹智能的 ASIC/SoC 路线产品分别对标 Nvidia 的不同产品线，在特定领域凭借本土化策略、特定场景优化及与其他非 Nvidia 产品的兼容性提供替代选择。

恒扬数据采用 FPGA 路线，产品业务灵活性高，核心价值在于硬件级的可编程性与业务场景深度定制能力。客户可以基于 FPGA 为核心定制高速网络接口、系统侧互联接口以及外部缓存等特性，基于 FPGA 的可编程特性从应用层到网络层，甚至数据链路层协议开始进行定制，实现与自身业务场景的深度适配。全球头部互联网及云服务厂商（如 Meta、Google、亚马逊 AWS、阿里巴巴、腾讯、字节跳动等）以及拥有大规模算力网络的运营商，其业务和模型架构千差万别，为了极致地提升核心计算芯片利用率，并减弱对 Nvidia 生态的依赖，它们普遍倾向于自研Scale-Up/Out 解决方案、AI 加速器（GPU/NPU/TPU/PPU）、协议标准（如中国移动、华为、阿里云联合制定的算力路由协议标准，阿里云联合烽火通信等制定的 AI 计算集群网络体系标准等）、通信库（如 xCCL）等。FPGA 架构具有灵活性高、并行性强、低时延等技术优势，能更好的满足客户快速迭代与深度定制的需求特点，是前述主体在部分应用领域的最优选择，这为恒扬数据的产品提供了广泛的市场应用空间。

7. 行业进入壁垒

7.1 技术研发与整合壁垒

DPU 并非简单的硬件组件，而是集成了多核处理器、高速网络接口以及各类硬件加速引擎的复杂系统。企业需要同时精通高性能计算、网络协议、虚拟化技术、芯片设计以及软硬件的深度协同优化，这种跨领域的尖端技术整合能力构成了极高的研发门槛。随着数据中心网络向 400G 甚至 800G 升级，以及 AI 算力需求对低时延、高吞吐提出的极致要求，DPU 的技术架构需要持续快速迭代，新进入者难以迅速匹配行业及客户需求的变化节奏。

7.2 产业生态与标准壁垒显著

当前 DPU 的软硬件生态仍由行业巨头主导，新厂商面临显著的生态壁垒。一方面，亚马逊 AWS、微软 Azure 等超大规模云服务商普遍采用自研 DPU 方案（如 AWS Nitro），形成封闭的内部生态系统，第三方产品难以切入。另一方面，在通用市场，DPU 需要与主流的云计算平台、操作系统以及应用软件进行深度适配和优化。然而，行业在硬件接口、管理规范、软件 API 等方面尚未形成完全统一的标准，导致每进入一个新客户环境都可能需要高昂的定制化开发成本，极大地限制了产品的规模化扩张。

7.3 市场信任与服务能力

企业级客户，尤其是云服务商和金融行业，对底层基础设施的可靠性、稳定性和安全性有着近乎苛刻的要求，该类客户更倾向于选择已有品牌背书和大量成功案例的供应商。对于新进入者而言，需要经历一个漫长的“验证-试用-小规模部署-大规模应用”周期才能建立起市场信任。此外，DPU 的价值实现离不开强大的服务能力，厂商需要具备为客户提供从部署调试、驱动优化到持续运维和定制化开发的全生命周期技术支持，这需要深厚的技术积累和资源投入。

【免责声明】本文摘自致尚科技问询函回复，版权归原作者所有，仅用于知识分享与交流，非商业用途！对文中观点判断均保持中立，若您认为文中来源标注与事实不符，若有涉及版权等请告知，将及时修订删除！查看更多报告请关注微信公众号