调研纪要 | 算力租赁行业调研总结_展会资讯_资讯

调研纪要 | 算力租赁行业调研总结

2026-05-21 01:18

调研纪要 | 算力租赁行业调研总结

本文内容基于本次金融交流整理，仅作行业专业交流参考，不构成任何投资建议，市场有风险，投资需谨慎。

摘要

2026 年春节后国内算力租赁价涨约 30%，C 端应用爆发是核心驱动，高端显卡现货溢价 30%-40%，呈 “一机难求” 态势；算力消耗结构逆转，2026 年推理需求达训练的 3-4 倍，成增长核心。国产算力在成本、生态、性能上与英伟达差距显著且持续扩大，仅用于信创项目。租赁利润率升至 30%，旧设备实现三年零折旧；H200 供应放开短期回调 10%-15%，长期需求增速或超供给。中国大模型凭成本优势承接全球 70%-80% 中低端算力需求，核心计算留存国内。

算力租赁现在有多疯狂？

2026年春节后国内算力租赁整体涨了30%。H100服务器用了三年，二手价和买入价一模一样。现在高端卡现货溢价30%-40%，拿着现金都抢不到货。

价格涨成什么样了

拿超微服务器来说，B100现货价格已经高得离谱，2T版本640万到660万，3T版本680万，4T版本直接冲到700万。H200服务器涨得更凶，2025年9月内存涨价前才220万到230万，现在已经涨到350万。

服务器从期货到现货的溢价普遍在30%到40%。B100的4T满配期货，2025年11月还是450万到460万，现在已经涨到520万，现货更是高达680万。

租赁价格按年为最短租期算，H100服务器月租6.7万到6.8万；H200月租8万以上；H800月租6.3万到6.4万；H20的141G版本月租相对低些，4万多。租金会随合约时长浮动，H100签三年合约，月租能降到6.4万到6.5万；签五年闭口合约，月租大概能到6万左右。

现在价格处于持续上涨通道，跟着供需水涨船高。资源太紧张，价格每周都可能变，越晚签合约，溢价大概率越高。往后看，价格肯定还会继续涨。单个渠道就有十几个客户在找H100、H200的64卡、128卡大型集群，但市场上几乎没有这类资源，只有前期用户训练、推理完释放的10台、8台规模的小集群。

现在市场就是一机难求。

谁在抢算力

核心驱动是C端智能体应用爆发，直接打通了算力需求的稳定收入市场。之前市场主要做B端，服务大模型公司、互联网厂商和政府项目，需求断断续续，市场一直不温不火。现在C端市场激活，英伟达高端显卡一下子就紧缺了，H100、H200甚至A800的32卡集群，就算签一年的租赁合同，都很难找到资源。

全球尤其是欧美地区的初创企业、独立开发者，越来越多使用中国大模型服务，核心就是成本优势。中国大模型的Token价格，比如Kimi、MiniMax，大概只有ChatGPT-5这类欧美顶尖模型的十分之一。除了需要高精度、专业性的大型企业和科研机构，还愿意用贵的美国模型，全球70%到80%的中低端算力需求、大模型应用和Token消耗，都流向中国，直接带动国内算力需求持续扩大。

海外用户能在当地接入服务，但智谱AI这类中国大模型的计算核心都在国内。顶多在东南亚做部分部署，主体计算和数据处理肯定还是在中国，这里面还牵扯数据安全、数据出海的复杂问题。目前实际情况就是，出于成本考虑，全球开发者都在广泛使用中国的Token，选中国模型解决大部分应用需求。

主要客户是阿里云、字节跳动，还有润泽、协创这些。合作模式一般是客户直接买显卡，或者投资方买我们的显卡，投到和这些客户的合作项目里。除了这些大客户，我们也服务一些相对分散的客户，像月之暗面、阶跃星辰、MiniMax、深势科技这些大模型公司。

算力都用在哪了

不管是计划出海还是专注国内的Token销售方，都缺高端算力，H100、H200成规模的集群根本找不到。

消耗算力的主要场景有四类。短视频生成排在前面，抖音这类平台上的C端工具用得特别多，月费几十到几千元不等，算力消耗很大。然后是垂直行业应用，医疗、工业、金融这些领域，企业和机构大规模部署智能体，替代传统人工服务。互联网大厂是算力消耗主力，阿里、百度、腾讯、字节这些公有云服务商，自持或租赁大量算力服务器，整合大模型和云服务，给政府、工业、大模型公司提供智算公有云服务，这些头部厂商消耗了国内高端显卡60%到65%的算力。编程辅助也是基础且重要的算力消耗场景。

推理算力的主要应用场景和上面差不多，还有对话式AI。其中对话式AI增长最快，普及过程和微信、抖音很像，用户从不用到高频使用，使用量呈指数级上涨，用户越熟悉，用量就越高。

算力消耗结构的变化非常明显。2025年，训练和推理的算力规模比例大概是1:1.5到1:2，推理算力已经超过训练算力。到2026年，各类推理应用普及，推理算力规模变成训练的3到4倍，后续这个比例还会继续扩大。大模型训练就是整合海量知识，一旦做完，后续算力消耗基本全靠规模大、增长快的推理应用带动。

从高端算力整机、算力卡保有量来看，互联网大厂占主导，持有全国约60%的高端算力资源；其次是政府、银行、军方这些机构，项目对价格不敏感，占20%左右份额。华为接政府智慧城市、信创项目，会用自研升腾910B这些产品，但这部分只占项目总量10%，剩下90%还是得采购英伟达显卡。

从实际算力消耗看，格局和保有量差不多。互联网大厂消耗占比约60%；地方政府、金融机构、信创智算项目合计消耗20%到30%；初创企业，也就是那些不用大厂云，在小型数据中心部署32台、64台规模集群的客户，消耗约15%的算力。

现在市场根本没有算力闲置的问题，整体使用率特别高。不管是高端还是低端英伟达算力，使用率基本维持在90%到95%。但政府信创类项目不一样，它们虽然占着物理服务器，实际运行效率很低，很多部署完根本没真正跑起来，属于占满不是跑满。国产算力整体使用率更低，主要就是硬件贵、生态不完善、适配难这些问题导致的。

国产算力到底差在哪

国产算力在商业应用上和英伟达差距特别明显。硬件成本高，一台八卡服务器，国产方案比如华为、海光这些，价格是英伟达同等算力方案的1.5到2倍。生态薄弱，英伟达有成熟的CUDA生态，买了就能直接部署任务，国产算力得做软件适配，过程可能长达半年，时间和编程修改成本都很高。实际性能差，宣传说能到H100的80%到90%，实测连60%都不到。能效比低，耗同样电量，国产算力产出的有效算力更少，经济账算不过来。

综合下来，商业客户考虑经济效益，基本不会选国产算力。国产算力目前就用在军工、金融这些不在乎成本的信创项目里。

更让人担心的是，差距一直在扩大。国家虽然在努力追赶，但英伟达产品迭代太快，B200到B300也就半年，代差越来越大。根本制约在底层硬件，比如光刻机技术。国内勉强用7纳米旧设备，美国已经到0.3纳米制程，往0.2纳米走，我们可能还没到0.5纳米，直接落后一代半。这种基础制造工艺差距，会导致后续功耗、集成度、训练速度的差距越来越大。就算国内能用混合专家大模型省五分之一到四分之一的训练成本，也补不上硬件的根本短板。做过产业的人都知道，这种代差一旦拉开，后面想追就难了。

未来价格还会涨吗

价格上限完全和外部政策挂钩。如果美国放开H200供应限制，对市场影响会很明显。供应一放开，短期价格会先平稳，之后可能回调10%到15%，最后达到新的稳定状态。但要是H200供应不放开，市场供应只会越来越紧张，价格上限自然也会跟着抬升。

假设美国批准向中国市场供应70万片H200芯片，差不多能组成10万台八卡服务器，相当于国内现有高端算力存量的30%到40%，会对市场有一定冲击，但价格不会大跌。

不过话又说回来，服务器成本结构已经变了，内存、硬盘这些组件价格大涨，内存成本在整机里的占比从之前10%涨到了30%到40%，就算芯片供应多了，整机成本上涨也会限制降价空间，价格回不到2025年七八月份的水平。C端市场打开后，用户用智能体、调用Token的需求涨得特别快，慢慢成了习惯，需求增速大概率会超过供给增速。

短期来看，供应放开的消息和预期，可能让价格短暂平稳或小幅回调。但长期来说，要是C端应用带来的需求增长一直比供给增加快，价格最后还是会回到上涨轨道。现在市场核心驱动力，不只是国内大模型应用，应用场景还在不断往外拓展。

算力供给紧张的局面大概率会持续，价格可能还会涨。关键变量在H20芯片能不能放开进口。就算表面达成协议，实际执行还涉及业务交换、对等条件。就算协议成了，从生产到运到国内还要两三个月过渡期，库存里没大量现货等着发。所以短期供给短缺的状况缓解不了。

这个生意现在有多赚钱

现在算力租赁业务盈利能力特别强。市场需求旺，B300这类高端卡一卡难求，现货拿现金都买不到。供不应求的局面推高租赁价格，利润率也跟着涨。之前行业竞争激烈时，利润率只有10%到20%，现在基本能到30%。B300五年期租赁，之前12万，现在涨到16万到19万还供不应求。租赁价格涨幅完全能覆盖禁运带来的硬件采购溢价，内存、硬盘这些组件的成本上涨也都能覆盖。

现在行业测算投资回报周期普遍按五年算。要是按三年算，回本需要的租赁定价会高于市场均价，没竞争力。对已入场服务商来说，旧设备议价优势很明显。三年前210万买的H100服务器，现在二手价还是210万，相当于三年零折旧使用。A100、A800这些旧型号算力，推理场景需求还很旺，市场上基本都卖光了，很难买到。

行业普遍觉得，算力租赁正处于高速发展初期，是前景广阔的蓝海市场。训练需求带动推理需求，推理应用成熟又会催生医疗、生物、工业等专用大模型的训练需求，形成良性循环。市场火热吸引了很多人，想入局算力贸易、租赁分发或AI创业。其中Token分发业务被看好，自建或租赁算力，整合开源大模型API，建面向全球用户的聚合分发平台，像算力领域的淘宝，商业前景好。

我们的服务是全流程的，从帮客户在英伟达代工厂下单订服务器，到运输回国，再到上架前压力测试、交付实施，还有后续运维运营。2023到2024年7月给阿里做的H800项目，我们派了20人团队在东莞普洛斯机房现场维护。虽然我们给大模型公司、金融机构甚至军方处理软硬件问题，但出于合规要求，拿不到客户后台流量消耗、模型运行这些核心运营数据。所以我们对需求的判断大多是定性观察，没法给精确量化数据。

#算力租赁 #AI算力 #H100 #H200 #大模型 #推理算力 #国产算力 #英伟达 #算力经济学 #C端AI应用 #产业调研 #算力供需 #GPU租赁

免责声明：市场有风险，投资需谨慎。本文内容仅代表调研观点，不代表本公众号立场。

材料收集自网络，如侵犯到您的权益，请直接后台联系删除

整理不易，希望各位领导能够多多支持！您的一个点赞、一次转发、随手分享，都是我们继续坚持的最大动力~~~~

——END——

本期内容分享完毕。后续将持续更新行业分析、调研纪要、外资研报与市场复盘内容。

感兴趣的朋友，可自行参考文末体验通道。

打赏