推广 热搜: 采购方式  滤芯  带式称重给煤机  甲带  气动隔膜泵  减速机型号  无级变速机  链式给煤机  履带  减速机 

【行研】AI加速卡行业

   日期:2026-01-23 17:07:30     来源:网络整理    作者:本站编辑    评论:0    
【行研】AI加速卡行业

1. 人工智能算力基础设施行业发展概况

1.1 AI 算力需求增长促使全球云厂商加大 AI 资本开支,进一步带动人工智能算力基础设施的规模增长

GPT DeepSeek,人工智能技术作为一项革命性技术,近年来在自然语言处理、深度学习、神经网络等领域不断取得重大突破。目前阶段的人工智能产业发展相比过去全面提速,模型的泛化能力越来越强,使得大模型凭借强迁移性可以在产业中得到广泛应用。这种通用性反过来也使得大模型具备规模效应和经济性。通用大模型以及芯片、算力基础设施等底层环节能力的不断改善,带来人工智能在应用场景类别、场景深度的持续提升,并最终带来产业基础能力、应用场景之间的不断相互促进,并在正向循环逻辑下,驱动全球 AI 产业发展不断提速。在旺盛的市场需求、丰富应用场景的驱动下,全球智能算力(指基于 AI 加速芯片的加速计算平台提供人工智能训练和推理的计算能力)规模呈现增长态势。根据 IDC 最新预测结果显示,2025 年中国智能算力规模将达到1,037.3EFLOPS (基于FP16),并在2028 年达到2,781.9EFLOPS (基于FP16),2024-2028 年中国智能算力规模的年均复合增长率为 39.94%

全球人工智能市场持续呈现增长态势,成为各行业智能化升级的重要驱动力。在技术创新、应用场景拓展的多重驱动下,全球企业对于人工智能技术的投资普遍提升,IDC 预测,2025 年全球 2000 强企业会将超过 40%IT 预算投入到人工智能项目中,旨在推动产品和流程创新,并促成两位数的营收增长。根据花旗研究的数据,全球人工智能资本支出规模将由 2024 0.2 万亿美元增长至 2028 年的 1.4 万亿美元,年均复合增长率超 50%根据相关数据统计,AI 服务器价值量约占人工智能资本支出的比例约为 40%-50%AI 加速卡约占 AI 服务器的 70%,综合考虑,AI 加速卡约占人工智能支出的 30%左右,人工智能资本支出的提升将拉动 AI 加速卡市场规模的提升。

1.2 AI 加速卡 2024 年全球市场已超过 1,000 亿美元,预计 2028 年将超5,000 亿美元,届时中国市场需求将超过万亿人民币,占全球市场约 30%

云端 AI 芯片往往以AI 加速卡的形式进行销售,或进一步集成至智算系统及集群售往各类客户。以互联网巨头及 AI 大模型企业为代表的各类企业逐步增大的人工智能资本开支进一步带动了全球 AI 加速卡的规模。根据灼识咨询数据,2024 年全球 AI 加速卡以收入计的市场规模约为 1,190.28 亿美元。在人工智能技术持续演进与数字化基础设施加速完善的推动下,人工智能的商业化应用有望加快落地,并进一步带动人工智能芯片市场的快速增长,预计 2028 年全球 AI 加速卡市场规模将达到 5,257.70 亿美元。

作为全球最大的人工智能市场之一,中国对 AI 加速卡的需求也在快速增长。中国AI 加速卡从2020 年的122.54 亿元增长到2024 年的2,164.77 亿元,复合年增长率为 105.01%。预计到 2028 年,该市场将达到11,076.46 亿元,从2024年到 2028 年的复合年增长率为 50.40%2028 年中国 AI 加速卡市场需求将占届时全球市场需求的约 30%

这一增长趋势主要源于人工智能应用需求的快速提升,尤其是 AI 大模型训练和推理对算力的强烈需求,使 AI 加速卡成为数据中心计算加速的关键硬件。同时,国家不断出台政策支持以及“东数西算”等战略的推进,加快了数据中心的建设,也进一步推动需求增长。

1.3 人工智能的商业化应用带动 token 调用的上涨,拉动算力需求,乐观预计下 2030 年全球 AI 加速卡市场空间预计达万亿美金

AI 应用在各个领域开始快速渗透,进一步带动 token 调用的上涨。2024 以来,头部大模型公司日均token 消耗数量从千亿级已增长至十万亿级。根据火山引擎 2025 Force 原动力大会、谷歌 2025 I/O 开发者大会,2025 9 月,字节日均 token 消耗量超过30 万亿,一年多时间增长 250 倍;谷歌日均 token 耗量已达 43 万亿,一年半时间增长 134 倍。

根据中信证券研究部预计,2030 年全球月 token 调用量在保守和乐观情况的假设下预计将达到 559-1,878 千万亿的水平,约为2025 年的全球 token 调用5.5 千万亿的 100-349 倍。5 年百倍以上的推理需求增长预计,进一步打开算力建设的想象空间。根据推理计算量约为2*token*激活参数量*1.12 的近似公式,同时考虑整体算力利用率、推理算力占比等因素,初步预计 2030 年全球新增算力需求将达到 24-90 EFLOPS,相当于 2025 年新增算力需求的 10-39 倍,假设单位算力价格由 2025 年的 8.3 美元/EFLOPS,年均下降 15%-25%2030 年的 2.0-3.7 美元/TFLOPS2030 年全球 AI 加速卡市场空间为 0.9-1.8 万亿美元,约为 2025 年的5-9 倍。

2. 人工智能算力基础设施行业发展趋势

2.1 云端 AI 芯片是全球 AI 芯片的主流,预计 2024 年至 2028 年云端 AI芯片的市场规模占比始终超过 80%

AI 加速卡根据部署位置可分为云端和边缘端,云端 AI 加速卡主要应用于数据中心和云端服务器等,随着全球互联网厂商对于数据中心的投入持续扩大,云AI 加速卡市场规模快速增长。根据灼识咨询预测,全球 AI 加速卡的云端应用市场规模将从 2024 年的 1,078.66 亿美元增长到 2028 年的 4,523.96 亿美元,复合增长率为 43.11%,占全球 AI 加速卡市场规模超80%

2.2 大模型行业逐渐从大规模训练阶段走向推理落地阶段,预计 2026 全球 AI 推理对 AI 加速卡需求将超过 AI 训练场景,中国市场这一趋势更加明显

随着 DeepSeek 系列大模型的发布,大幅提升开源模型的性能并降低 AI 件、AI 硬件的使用成本,加速人工智能应用的落地,进而推动推理端算力需求。根据灼识咨询预测,到2028 年,AI 加速卡的推理用需求将呈现爆发式增长,市场规模将从 2024 年的 476.11 亿美元增长到 2028 年的 3,256.18 亿美元,复合增长率为 61.71%。这一增速远超整体 AI 加速卡市场的平均水平,反映出推理在实际应用部署中的巨大需求。

对于中国而言,依托DeepSeek 模型性价比的持续提升,国内 AI 应用凭借丰富的产业生态与成熟的流量优势,实现了在各领域的规模化发展。其中,互联网厂商凭借庞大的存量客户群体,推出的各类 AI 应用一经上线即对推理算力形成大规模需求;而随着用户粘性的逐步增强,推理算力的需求规模预计将进一步扩大。此外,DeepSeek、千问等主流 AI 模型的开源化发展,大幅降低了非头AI 厂商在模型预训练环节的投入需求,进一步推动推理算力需求在整体算力需求中的占比持续提升。从细分结构来看,中国训练用AI 加速卡市场规模在2020年至 2024 年间以 97.95%的复合增速增长,预计在 2028 年将达到 2,990.64 亿元。而推理用AI 加速卡则展现出更快的增长趋势,2020 年至 2024 年的年均增速为 111.06%,未来四年有望以 59.41%的高增速扩张至 8,085.82 亿元,占比逐步提升至超 70%

2.3 推理场景对于 CUDA 生态的依赖在持续减弱,AI 加速卡性价比成为关键,非 GPGPU 架构 AI 加速卡需求占比逐步提高

ChatGPT 的诞生标志着大语言模型从技术探索走向大规模应用的转折点,DeepSeek 系列模型的发布打破了闭源模型的垄断并吸引全球开发者参与生态建设,加速了 AI 应用的渗透,在开源模型的基础上实现技术普惠,推动人工智能真正进入“全民时代”。AI 应用的底层大模型开发者也逐步收敛至头部几家大模型厂商,这使得 AI 加速卡厂商所需适配的大模型逐步收敛,逐步减弱了对CUDA 生态的依赖,而AI 加速卡的能效比正成为技术发展的核心指标。

目前AI 芯片的主流架构分为以英伟达为首的GPGPU 架构和包含谷歌TPU华为 NPU 等架构的非 GPGPU 架构。GPGPU 架构基于 GPU 的多核并行计算能力,通过裁剪GPU 的图形渲染特性,将相应芯片资源设计用于通用计算和张/矩阵计算,其通用性设计适用于更广泛的应用场景。非 GPGPU 架构以算法为中心、针对特定问题域比如人工智能计算特征进行设计和优化,在应用场景下运行效率更高,性价比更优。

在推理阶段,AI 芯片需要在功耗、成本和实时性等方面进行优化,由于非 GPGPU 可针对特定模型所需算子进行优化定制,相较于 GPGPU 架构加速卡在针对特定场景或模型下有更好的适配性,在成本、性价比等方面具备优势。此外,近期谷歌发布完全依靠自研的TPU 芯片训练的大模型Gemini 3 系列且在多项测试中均处于行业领先地位,强化了非 GPGPU 架构 AI 加速卡能够实现万亿参数大模型全流程训练的落地能力,进一步提升市场对于非 GPGPU 芯片远期市场份额和格局的预期。基于高盛全球投资研究部的模型预测,在 AI 服务器的 AI 芯片中非 GPGPU 芯片的出货占比将呈现明确上升趋势,预计将从 2024 年的 36%,逐步增长至 2027 年的 45%

2.4 AI 加速卡基础设施向集群化和综合化演进

随着大模型的不断发展,相关主流 AI 大模型参数已高达数千亿,单一 AI 加速卡已难以满足超大规模计算需求。行业供应重点正从单点性能提升,转向系统化集群解决方案。

现代智算集群通过三项关键策略突破应对挑战:

一是纵向扩展策略(Scale-Up),即通过增加单个节点的资源来提升性能,如改进 AI 加速卡芯片架构和采用更先进的制程进行制造,以提升 AI 芯片的峰值算力;或通过高速互联架构(如英伟达的 NVLink、公司的 GCU-LARE)实现芯片间超低延迟通信以提升单个节点内部的数据流通效率。

二是横向扩展策略(Scale-Out),即通过增加更多的算力节点来分散负载和提升处理能力,用于需要处理大规模数据集和复杂模型的应用场景。但提高集群系统的可用性和可靠性十分重要,从千卡集群到万卡、十万卡集群,节点故障几率会随集群规模增长而上升,数据中心需要更加高效的监控体系和先进的故障恢复机制,基于诸如智能显存分配、故障点恢复管理等技术,确保集群在发生节点故障时能够迅速响应,最小化停机时间。

三是跨区域扩展(Scale-Across),即通过高性能网络将地理上分散的多个数据中心连接起来,形成统一的计算资源池,突破单个数据中心的物理限制。这一策略依赖光通信技术和网络优化算法以解决长距离传输的带宽和延迟问题。

2.5 未来中国 AI 加速卡需求主要集中在头部互联网厂商,2028 年头部三家互联网厂商 AI 资本支出国内占比接近 50%

伴随大模型演进、AIGC 爆发及产业智能化加速,中国企业 AI 资本支出持续攀升。但当前趋势显示,中小企业更倾向于通过云服务弹性租赁算力快速构建 AI 能力,而非自建AI 算力集群。头部互联网企业因自身大模型训练及海量推理需求,正持续加大AI 投入,导致市场呈现头部集中态势。根据 BERNSTEIN 测,到 2028 年,字节跳动、阿里巴巴和腾讯的 AI 资本支出将占据中国 AI 资本支出的近50%,凸显了进入头部互联网厂商供应链对AI 加速卡供应商的重要性。

3. 行业壁垒

3.1 技术壁垒

人工智能算力基础设施行业作为前沿技术领域,一款云端 AI 芯片的研发涵盖芯片架构设计、工程实现、软件生态及系统级技术整合等关键环节,其技术跨计算机科学、电子工程、数学、物理学、材料科学等领域,具有跨学科、多领域融合的特征,因而要求人工智能芯片企业具备相应的技术积累。此外,持续的产品迭代能力不可或缺。从芯片定义、设计验证到商业落地需快速响应算力需求增长,如支持高带宽内存、提升互联带宽等,需通过多代产品迭代积累技术经验,形成“设计-流片-验证-优化”的闭环能力,这对研发投入、人才储备与技术沉淀构成硬性门槛。

3.2 专业人才壁垒

人工智能算力基础设施研发涉及芯片架构设计、先进制程工艺、软件生态构建、系统级整合等多领域技术,需具备跨学科知识储备的高端人才,包括芯片设计工程师、算法优化专家、软件栈开发人员等,而这类复合型人才的培养需长期技术积累与实践沉淀,难以快速满足行业高速发展的需求。当前,由于中国人工智能算力基础设施行业起步较晚,且尚处于发展阶段,人工智能芯片相关高素质专业人才较为缺乏。行业专业人才供不应求的情况普遍存在,人工智能技术的快速迭代进一步提升了对人才的要求,需同时掌握硬件设计、软件适配及场景落地等多维度能力。此外,随着行业竞争加剧,核心研发人才流动性增加,企业需持续投入资源吸引和留存人才,而新进入者由于缺乏品牌与资源优势,难以组建稳定的高水平研发团队,这进一步强化了人才层面的行业壁垒。

3.3 客户和市场壁垒

人工智能算力基础设施的底层硬件人工智能芯片属于高端半导体产品,客户在选择一款新产品时,通常需要经过较长时间的测试及验证过程,测试验证通过后,亦存在小批量试用过程,才会进入大规模采购阶段。互联网头部厂商要求则更加严格,需经过产品精度(推理结果的准确率)、延时(推理请求的响应速度)、吞吐量(单位时间能满足的推理请求数量)、性价比(业务场景实测中的性能表现和价格与其他竞品的比较)、供货能力(是否能够及时满足业务需求以及对上游供应链的把控度)和技术延续性(软件适配能力)等多个维度进行考虑,壁垒较高。

3.4 资金壁垒

人工智能算力基础设施行业属于典型的资金密集型行业,在核心技术和新产品的研发过程中,需要大量的研发投入和较高的人力成本。上述费用和成本的支出在企业的经营过程中会持续产生。行业需持续投入高额研发费用以维持技术竞争力,同时软件生态建设也依赖长期资金支持,包括工具链开发、框架适配、开发者生态培育等,需持续投入资源以降低用户迁移成本并提升产品易用性。对于新进入者而言,难以在短期内积累足够资金支撑从芯片设计到生态建设的全流程投入,而现有企业通过持续资本投入形成的技术与产品优势,进一步强化了资金层面的行业壁垒。

3.5 产业链整合壁垒

对于采用 Fabless 经营模式的人工智能芯片企业来说,除专注于研发、设计外,在制造、封装、测试、销售环节均需要通过与产业链上下游充分协调与配合,从而实现产业链资源的有效整合。在制造环节,采用 Fabless 经营模式的人工智能芯片企业需要借助晶圆制造厂完成晶圆制造。在封装、测试环节,相关企业亦需要借助封装测试厂完成封装和测试工作。在销售环节,Fabless 企业需要与下游客户保持密切沟通,以实时掌握客户需求,跟踪市场最新动态,更好地服务客户和指导公司研发方向。新进入企业由于尚未积累产业链上下游相关资源,难以保证相关环节的顺利衔接,企业经营容易面临较高的经营风险,因而也成为其进入该行业的壁垒之一。

4. 行业面临的机遇与挑战

4.1 面临的机遇

4.1.1 人工智能应用浪潮为行业带来发展机遇

在人工智能应用浪潮的推动下,各行业开始积极探索如何运用人工智能技术提升工作效率、降低运营成本,并改善用户体验。这一趋势催生了对各类人工智能算力基础设施的增量需求。同时,DeepSeek 系列模型的发布亦降低应用过程中算力需求,使得更具能效比和供应稳定性的国产 AI 芯片有望成为中国大模型厂商的最优选择。此外,国产 AI 芯片企业的技术迭代时间相对较短,能够更加敏捷地适应新兴技术的发展趋势,针对大客户的要求,可协同开发并精准定制更加满足其需求的产品,从而在竞争激烈的市场中脱颖而出。随着人工智能技术步入全新阶段,国产 AI 芯片企业正迎来发展的重大机遇,通过不断创新和突破有望在人工智能领域获得更大的市场份额和影响力。

4.1.2 国际竞争环境下与本土供应商展开合作成为大势所趋

目前全球人工智能芯片市场主要由英伟达主导,但随着国际贸易摩擦加剧,供需结构矛盾严重影响我国人工智能产业的供应链安全,国内尤其是云厂商对于本土 AI 加速卡厂商合作态度日益开放,甚至是必选项,长期来看国内人工智能芯片产业的国产替代进程将不断加速。

4.1.3 国家政策大力扶持人工智能、算力基础设施及集成电路产业发展

近年来,国家出台了多项人工智能、算力基础设施及集成电路产业利好政策,在京津冀、长三角、粤港澳大湾区、成渝、内蒙古、贵州、甘肃及宁夏八地全面启动建设国家算力枢纽节点,并规划了 10 个国家数据中心集群。国家政策的支持为人工智能算力基础设施行业提供了良好的发展环境,促进整体行业的可持续发展。

4.2 面临的挑战

4.2.1 行业高端人才短缺

人工智能技术的快速发展导致 AI 芯片是一个高度依赖技术研发和创新的产业,且AI 芯片的研发涉及架构设计、软件开发、生产工艺、AI 计算优化等多学科的知识,对于行业专业人才的培养提出了更高的要求。虽然我国近年来 AI 片行业人才队伍不断壮大,但拥有较强的研发能力及较高的技术水平的专业人才仍是行业发展所迫切需要的资源之一。

4.2.2 先进制程的供应链建设

AI 芯片的性能提升高度依赖先进的制造工艺、封装技术及显存配置,我国集成电路产业起步相对较晚,在先进制程的产能规模与良率控制方面,仍与国际领先的晶圆制造厂存在差距。目前全球先进制程产能高度集中于少数国际厂商,导致供应趋紧与成本上升,因此加速构建自主可控的国产供应链显得尤为重要。

4.2.3 市场竞争加剧

英伟达等海外巨头凭借其长期的技术积累和市场布局,目前占据国内的主要市场份额。随着我国近年来不断推出人工智能算力基础设施行业的鼓励政策,华为海思、寒武纪、燧原科技、摩尔线程和沐曦股份等一众国产 AI 芯片厂商共同推动国内人工智能产业的发展,并占据了一定的市场份额,但随着行业内企业数量不断增多,竞争逐步加剧,国产 AI 芯片企业需加大研发投入,不断快速研发迭代推出有竞争力的产品以保证自身的市场地位。

5. 行业在产业链中的地位和作用

人工智能算力基础设施行业是人工智能产业中的重要组成部分,主要为下游人工智能的训练及推理提供算力,以支持人工智能技术的持续创新以及人工智能应用对各行各业的赋能。人工智能算力基础设施产业链市场景气度与下游半导体和终端应用市场高度相关,其产业链环节以及上下游行业之间的关联性如下:

随着人工智能技术的发展与突破,尤其是大模型技术的不断发展,智能算力需求呈现快速发展的态势。一方面,大模型不断往大参数、多模态的方向发展,以实现更智能、功能更完善的人工智能,因而在训练端存在大规模的智能算力需求;另一方面,随着大模型的不断迭代升级,人工智能对于包括智慧城市、智慧金融、智慧创作设计等多个行业和场景的赋能作用愈发显现,也使得在推理端存在大规模的智能算力需求。人工智能算力基础设施行业通过一系列的创新技术及产品迭代,为人工智能产业提供算力支撑,在产业链中具有基础性的重要地位和作用。

6. 竞争格局与行业内主要企业

全球 AI 加速卡的主要构成情况如下:

6.1 全球竞争格局

目前,全球云端AI 芯片行业中呈现英伟达独大的竞争格局。根据灼识咨询,按收入计算,2024 年英伟达 AI 加速卡的份额约为 76%。英伟达相应产品均采用了 GPGPU 架构。随着 AI 大模型推理需求不断提升,具有更高效能、更大数据吞吐量和更低功耗特性的非 GPGPU 架构算力产品开始加速部署。谷歌在 2025 11 月发布了综合性能强大的 Gemini3 大模型,该模型由谷歌采用自研 TPU(非 GPGPU 架构)训练完成,打破了英伟达在 AI 大模型训练领域的绝对垄断。未来随着谷歌、亚马逊、META 和微软等主要互联网厂商量产自研云端 AI 芯片产品(均为非 GPGPU 架构)以及谷歌TPU 产品逐步对外销售,预计英伟达全球市场的垄断地位将受到挑战。

6.2 中国竞争格局

国内云端 AI 芯片行业处于发展初期,国际厂商英伟达占据中国市场主要份额,但中国本土企业不断突破技术壁垒,占据了一定的市场份额。中国本土云端 AI 芯片厂商包括以华为海思、寒武纪和燧原科技等为代表的非 GPGPU 架构厂商和以摩尔线程、沐曦股份、天数智芯和壁仞科技等为代表的 GPGPU 架构厂商。

根据IDC数据和燧原科技销售量情况,2024年中国AI加速卡整体出货规模超270万张,其中英伟达以约190万张出货量占据约70%的市场份额。燧原科技当年AI加速卡及模组销售量达3.88万张,对应中国AI加速卡市场的占有率约1.4%,在国内其他AI芯片厂商中位居前列。未来,英伟达在国内市场销售存在一定不确定性,国产AI芯片厂商在中国市场出货量占比不断提升是大概率趋势。

6.3 行业内主要企业介绍

6.3.1 英伟达(美国纳斯达克证券交易所上市,NVDA.O

英伟达(NVIDIA)成立于 1993 年,是最早将3D 图形引入游戏和多媒体市场的公司,推出全球首款 GPU,使显卡成为独立的图形处理核心。英伟达专注于设计和制造图形处理器、数据中心加速芯片及全栈 AI 软件工具,在优越产品性能和 CUDA 生态加持下,已经从一家游戏显卡公司转型为全球 AI 计算领域的领导者。

6.3.2 AMD(美国纳斯达克证券交易所上市,AMD.O

AMD(超威半导体)成立于 1969 年,是全球领先的半导体设计公司,专注于计算机、通信和消费电子行业的微处理器(CPUGPU、主板芯片组等)设计和制造,提供高性能计算解决方案,并提供闪存和低功率处理器解决方案。

6.3.3 寒武纪(上海证券交易所科创板上市,688256.SH

寒武纪成立于 2016 年,提供云边端一体、软硬件协同、训练推理融合、具备统一生态的系列化智能芯片产品和平台化基础系统软件,核心产品包括思元系列云端芯片、MLU 系列边缘芯片及终端 IP 授权,主要应用于服务器厂商和产业公司,面向互联网、金融、交通、能源、电力和制造等领域的复杂 AI 应用场景。

6.3.4 海光信息(上海证券交易所科创板上市,688041.SH

海光信息成立于 2014 年,主要从事高端处理器、加速器等计算芯片产品和系统的研发、设计和销售,主要产品包括高端通用处理器(CPU)和协处理器DCU)。海光 CPU 处理器兼容市场主流的 x86 指令集,DCU 产品基于通用图形处理器设计理念,为科学计算、人工智能计算提供算力,可以全面支持深度学习训练、推理场景,以及大模型场景等,在国产服务器芯片市场占据重要地位。

6.3.5 摩尔线程(上海证券交易所科创板上市,688795.SH

摩尔线程成立于 2020 年,主要从事全功能 GPU 及相关产品的研发、设计和销售,致力于为 AI、数字孪生、科学计算等高性能计算领域提供加速计算的基础设施和一站式解决方案,自主研发 MUSA 统一架构,核心产品包括桌面级显卡、AI 智算芯片及智能SoC 类产品。

6.3.6 沐曦股份(上海证券交易所科创板上市,688802.SH

沐曦股份成立于 2020 年,主要从事人工智能训练和推理、通用计算与图形渲染三大领域的全栈 GPU 芯片研发、设计和销售,自主研发 XCore 架构及MXMACA 软件栈,核心产品是曦云 C 系列训推一体芯片。

6.3.7 壁仞科技(香港联合交易所,6082.HK

壁仞科技成立于 2019 年,主要从事开发 GPGPU 芯片及基于 GPGPU 的智能计算解决方案,为 AI 提供所需的基础计算能力。通过整合自主研发的基于GPGPU 的硬件及专有的 BIRENSUPA 软件平台,壁仞科技的解决方案支持从云端到边缘的广泛应用中 AI 模型的训练及推理。

6.3.8 天数智芯(香港联合交易所,9903.HK

天数智芯成立于 2015 年,提供针对不同行业的通用 GPU 产品及AI 算力解决方案,其产品组合主要包括通用 GPU 芯片及加速卡,以及定制 AI 算力解决方案(包括通用GPU 服务器及集群),将硬件与专有的软件栈结合,以满足客户在训练及推理场景中的特定需求。

6.3.9 华为海思(未上市)

华为海思成立于2004 年,系华为集团的全资子公司,在人工智能计算领域,华为海思基于昇腾系列(AscendAI 处理器和基础软件构建 Atlas 人工智能计算解决方案,包括 Atlas 系列模块、板卡、小站、服务器、集群等丰富的产品形态,打造面向“端、边、云”的全场景 AI 基础设施方案,覆盖深度学习领域推理和训练全流程。

6.3.10 昆仑芯(未上市)

昆仑芯成立于 2011 年,前身为百度智能芯片及架构部,目前为百度控股子公司,是一家在体系结构、芯片实现、软件系统和场景应用均有深厚积累的 AI 芯片企业。

6.3.11 平头哥(未上市)

平头哥成立于 2018 年,系阿里巴巴集团的全资半导体芯片业务主体,拥有端云一体全栈产品系列,涵盖数据中心芯片、IoT 芯片等,实现芯片端到端设计链路全覆盖。

7. 与同行业可不公司的比较情况

选择英伟达、AMD、寒武纪、摩尔线程、沐曦股份、壁仞科技、天数智芯为可比公司。

7.1 业务和经营情况比较

7.2 产品技术实力和技术指标比较

7.2.1 燧原科技技术水平及特点

燧原科技产品指标处于国内领先水平,已经在互联网大厂多个 AI 应用场景商业化部署,且支持 FP8 和超节点。比较选取以下技术指标:

功耗:功耗是 AI 芯片运行过程中的能量消耗,是芯片运行经济性的量化指标。在性能相同的前提下,功耗越低,运行阶段的用电成本越低,芯片的经济性与性价比越优。

是否支持 FP8AI 芯片对 FP8 低数据精度计算的兼容能力,是适配当前大模型技术趋势的关键指标。随着大模型厂商逐步扩大 FP8 数据精度进行训练与推理,支持该精度已成为通过低精度算力提升芯片性能的核心行业趋势之一。

算力:算力是 AI 芯片在计算密集型场景(如大模型运行的预填充阶段)中的核心性能指标。该指标数值越高代表 AI 芯片在计算密集型场景下的性能表现越优异。

显存容量和显存带宽: 显存容量和显存带宽是 AI 芯片在内存密集型场景(如大模型运行的解码阶段)中的核心性能指标。显存容量与显存带宽越大代表 AI 芯片在内存密集型场景下的性能表现越突出。

互联带宽:互联带宽是多卡协同场景下的卡间数据通信效率指标。在大模型训练和进行千亿参数以上大模型的推理时,需要单机多卡甚至大规模集群部署,互联带宽越高,多卡运行的整体性能越高。

超节点支持:AI 芯片对超节点系统方案的支持,是提升大规模集群通信效率的关键指标。超节点方案可显著提升服务器间及机架间的数据通信效率,进而大幅优化千亿参数以上规模大模型的运行性能。

7.2.2 技术指标对比

8. 盈利能力或财务状况的主要影响因素分析

8.1 人工智能行业高速发展赋能燧原科技盈利能力提升

近年来,随着人工智能技术不断实现突破、应用场景持续拓宽,叠加政策支持力度不断加强,我国人工智能产业已步入快速增长阶段。这一趋势直接驱动了智能算力需求的迅速扩张。根据中信证券研究部预测,中国 AI 加速卡市场规模有望持续高速增长,预计到2030 年将突破3,000 亿美元。鉴于燧原科技盈利能力与业务收入规模密切相关,人工智能行业蓬勃发展态势将对燧原科技盈利形成有力支撑。

8.2 头部互联网厂商合作与供应链稳定是持续运营的核心

当前,国内能够实现AI 大模型商业闭环的企业主要集中在字节跳动、腾讯、阿里巴巴等头部互联网平台,这些厂商也将成为国产 AI 加速卡的关键客户。能否进入其供应链体系,对国内 AI 芯片企业的发展至关重要。此外,云端 AI 芯片需要先进工艺制程、先进存储物料,相应产品交付周期长,是否具有稳定的供应链保障,是产品交付的核心,这将成为影响企业持续运营的关键因素。

8.3 持续的研发投入以保证产品竞争力

云端 AI 芯片属于技术密集型前沿领域,持续的高强度研发是保持技术领先的必要条件。目前,本土企业与国外领先厂商在技术上仍存在一定差距,尽管国内厂商已在部分细分领域凭借自身技术特点形成局部优势,但仍需进一步优化产品,以满足大模型训练的效率需求及推理场景的性价比要求。为了应对日益加剧的竞争,燧原科技需要持续加大研发投入,通过技术的创新以及产品的迭代,为市场提供更先进、性能更佳的人工智能芯片及算力产品,构筑以研发实力为核心的技术护城河。同时,燧原科技还需积极推进供应链体系建设,通过完善本土供应链保障产品稳定交付。因此,人工智能算力基础设施行业的竞争态势,要求燧原科技保持较高的研发投入水平,这也将在一定程度上影响短期盈利能力。

8.4 资金充裕性成为公司业绩释放的前提

由于先进制程产能供应紧张,AI 加速卡厂商通常需预付货款以锁定上游晶圆厂产能。加之后续流片、生产、封装、测试等环节耗时较长,产能规划往往需提前一年以上进行布局。因此,燧原科技的资金充裕程度直接决定其可锁定的产能规模,进而对下一年度的业绩表现产生关键影响。

【免责声明】本文摘自燧原科技招股说明书版权归原作者所有,仅用于知识分享与交流,非商业用途!对文中观点判断均保持中立,若您认为文中来源标注与事实不符,若有涉及版权等请告知,将及时修订删除!查看更多报告请关注微信公众号

 
打赏
 
更多>同类资讯
0相关评论

推荐图文
推荐资讯
点击排行
网站首页  |  关于我们  |  联系方式  |  使用协议  |  版权隐私  |  网站地图  |  排名推广  |  广告服务  |  积分换礼  |  网站留言  |  RSS订阅  |  违规举报  |  皖ICP备20008326号-18
Powered By DESTOON