本文内容基于本次金融交流整理,仅作行业专业交流参考,不构成任何投资建议,市场有风险,投资需谨慎。
摘要
2026 年春节后国内算力租赁价涨约 30%,C 端应用爆发是核心驱动,高端显卡现货溢价 30%-40%,呈 “一机难求” 态势;算力消耗结构逆转,2026 年推理需求达训练的 3-4 倍,成增长核心。国产算力在成本、生态、性能上与英伟达差距显著且持续扩大,仅用于信创项目。租赁利润率升至 30%,旧设备实现三年零折旧;H200 供应放开短期回调 10%-15%,长期需求增速或超供给。中国大模型凭成本优势承接全球 70%-80% 中低端算力需求,核心计算留存国内。
算力租赁现在有多疯狂?
2026年春节后国内算力租赁整体涨了30%。H100服务器用了三年,二手价和买入价一模一样。现在高端卡现货溢价30%-40%,拿着现金都抢不到货。
价格涨成什么样了
拿超微服务器来说,B100现货价格已经高得离谱,2T版本640万到660万,3T版本680万,4T版本直接冲到700万。H200服务器涨得更凶,2025年9月内存涨价前才220万到230万,现在已经涨到350万。
服务器从期货到现货的溢价普遍在30%到40%。B100的4T满配期货,2025年11月还是450万到460万,现在已经涨到520万,现货更是高达680万。
租赁价格按年为最短租期算,H100服务器月租6.7万到6.8万;H200月租8万以上;H800月租6.3万到6.4万;H20的141G版本月租相对低些,4万多。租金会随合约时长浮动,H100签三年合约,月租能降到6.4万到6.5万;签五年闭口合约,月租大概能到6万左右。
现在价格处于持续上涨通道,跟着供需水涨船高。资源太紧张,价格每周都可能变,越晚签合约,溢价大概率越高。往后看,价格肯定还会继续涨。单个渠道就有十几个客户在找H100、H200的64卡、128卡大型集群,但市场上几乎没有这类资源,只有前期用户训练、推理完释放的10台、8台规模的小集群。
现在市场就是一机难求。
谁在抢算力
核心驱动是C端智能体应用爆发,直接打通了算力需求的稳定收入市场。之前市场主要做B端,服务大模型公司、互联网厂商和政府项目,需求断断续续,市场一直不温不火。现在C端市场激活,英伟达高端显卡一下子就紧缺了,H100、H200甚至A800的32卡集群,就算签一年的租赁合同,都很难找到资源。
全球尤其是欧美地区的初创企业、独立开发者,越来越多使用中国大模型服务,核心就是成本优势。中国大模型的Token价格,比如Kimi、MiniMax,大概只有ChatGPT-5这类欧美顶尖模型的十分之一。除了需要高精度、专业性的大型企业和科研机构,还愿意用贵的美国模型,全球70%到80%的中低端算力需求、大模型应用和Token消耗,都流向中国,直接带动国内算力需求持续扩大。
海外用户能在当地接入服务,但智谱AI这类中国大模型的计算核心都在国内。顶多在东南亚做部分部署,主体计算和数据处理肯定还是在中国,这里面还牵扯数据安全、数据出海的复杂问题。目前实际情况就是,出于成本考虑,全球开发者都在广泛使用中国的Token,选中国模型解决大部分应用需求。
主要客户是阿里云、字节跳动,还有润泽、协创这些。合作模式一般是客户直接买显卡,或者投资方买我们的显卡,投到和这些客户的合作项目里。除了这些大客户,我们也服务一些相对分散的客户,像月之暗面、阶跃星辰、MiniMax、深势科技这些大模型公司。
算力都用在哪了
不管是计划出海还是专注国内的Token销售方,都缺高端算力,H100、H200成规模的集群根本找不到。
消耗算力的主要场景有四类。短视频生成排在前面,抖音这类平台上的C端工具用得特别多,月费几十到几千元不等,算力消耗很大。然后是垂直行业应用,医疗、工业、金融这些领域,企业和机构大规模部署智能体,替代传统人工服务。互联网大厂是算力消耗主力,阿里、百度、腾讯、字节这些公有云服务商,自持或租赁大量算力服务器,整合大模型和云服务,给政府、工业、大模型公司提供智算公有云服务,这些头部厂商消耗了国内高端显卡60%到65%的算力。编程辅助也是基础且重要的算力消耗场景。
推理算力的主要应用场景和上面差不多,还有对话式AI。其中对话式AI增长最快,普及过程和微信、抖音很像,用户从不用到高频使用,使用量呈指数级上涨,用户越熟悉,用量就越高。
算力消耗结构的变化非常明显。2025年,训练和推理的算力规模比例大概是1:1.5到1:2,推理算力已经超过训练算力。到2026年,各类推理应用普及,推理算力规模变成训练的3到4倍,后续这个比例还会继续扩大。大模型训练就是整合海量知识,一旦做完,后续算力消耗基本全靠规模大、增长快的推理应用带动。
从高端算力整机、算力卡保有量来看,互联网大厂占主导,持有全国约60%的高端算力资源;其次是政府、银行、军方这些机构,项目对价格不敏感,占20%左右份额。华为接政府智慧城市、信创项目,会用自研升腾910B这些产品,但这部分只占项目总量10%,剩下90%还是得采购英伟达显卡。
从实际算力消耗看,格局和保有量差不多。互联网大厂消耗占比约60%;地方政府、金融机构、信创智算项目合计消耗20%到30%;初创企业,也就是那些不用大厂云,在小型数据中心部署32台、64台规模集群的客户,消耗约15%的算力。
现在市场根本没有算力闲置的问题,整体使用率特别高。不管是高端还是低端英伟达算力,使用率基本维持在90%到95%。但政府信创类项目不一样,它们虽然占着物理服务器,实际运行效率很低,很多部署完根本没真正跑起来,属于占满不是跑满。国产算力整体使用率更低,主要就是硬件贵、生态不完善、适配难这些问题导致的。
国产算力到底差在哪
国产算力在商业应用上和英伟达差距特别明显。硬件成本高,一台八卡服务器,国产方案比如华为、海光这些,价格是英伟达同等算力方案的1.5到2倍。生态薄弱,英伟达有成熟的CUDA生态,买了就能直接部署任务,国产算力得做软件适配,过程可能长达半年,时间和编程修改成本都很高。实际性能差,宣传说能到H100的80%到90%,实测连60%都不到。能效比低,耗同样电量,国产算力产出的有效算力更少,经济账算不过来。
综合下来,商业客户考虑经济效益,基本不会选国产算力。国产算力目前就用在军工、金融这些不在乎成本的信创项目里。
更让人担心的是,差距一直在扩大。国家虽然在努力追赶,但英伟达产品迭代太快,B200到B300也就半年,代差越来越大。根本制约在底层硬件,比如光刻机技术。国内勉强用7纳米旧设备,美国已经到0.3纳米制程,往0.2纳米走,我们可能还没到0.5纳米,直接落后一代半。这种基础制造工艺差距,会导致后续功耗、集成度、训练速度的差距越来越大。就算国内能用混合专家大模型省五分之一到四分之一的训练成本,也补不上硬件的根本短板。做过产业的人都知道,这种代差一旦拉开,后面想追就难了。
未来价格还会涨吗
价格上限完全和外部政策挂钩。如果美国放开H200供应限制,对市场影响会很明显。供应一放开,短期价格会先平稳,之后可能回调10%到15%,最后达到新的稳定状态。但要是H200供应不放开,市场供应只会越来越紧张,价格上限自然也会跟着抬升。
假设美国批准向中国市场供应70万片H200芯片,差不多能组成10万台八卡服务器,相当于国内现有高端算力存量的30%到40%,会对市场有一定冲击,但价格不会大跌。
不过话又说回来,服务器成本结构已经变了,内存、硬盘这些组件价格大涨,内存成本在整机里的占比从之前10%涨到了30%到40%,就算芯片供应多了,整机成本上涨也会限制降价空间,价格回不到2025年七八月份的水平。C端市场打开后,用户用智能体、调用Token的需求涨得特别快,慢慢成了习惯,需求增速大概率会超过供给增速。
短期来看,供应放开的消息和预期,可能让价格短暂平稳或小幅回调。但长期来说,要是C端应用带来的需求增长一直比供给增加快,价格最后还是会回到上涨轨道。现在市场核心驱动力,不只是国内大模型应用,应用场景还在不断往外拓展。
算力供给紧张的局面大概率会持续,价格可能还会涨。关键变量在H20芯片能不能放开进口。就算表面达成协议,实际执行还涉及业务交换、对等条件。就算协议成了,从生产到运到国内还要两三个月过渡期,库存里没大量现货等着发。所以短期供给短缺的状况缓解不了。
这个生意现在有多赚钱
现在算力租赁业务盈利能力特别强。市场需求旺,B300这类高端卡一卡难求,现货拿现金都买不到。供不应求的局面推高租赁价格,利润率也跟着涨。之前行业竞争激烈时,利润率只有10%到20%,现在基本能到30%。B300五年期租赁,之前12万,现在涨到16万到19万还供不应求。租赁价格涨幅完全能覆盖禁运带来的硬件采购溢价,内存、硬盘这些组件的成本上涨也都能覆盖。
现在行业测算投资回报周期普遍按五年算。要是按三年算,回本需要的租赁定价会高于市场均价,没竞争力。对已入场服务商来说,旧设备议价优势很明显。三年前210万买的H100服务器,现在二手价还是210万,相当于三年零折旧使用。A100、A800这些旧型号算力,推理场景需求还很旺,市场上基本都卖光了,很难买到。
行业普遍觉得,算力租赁正处于高速发展初期,是前景广阔的蓝海市场。训练需求带动推理需求,推理应用成熟又会催生医疗、生物、工业等专用大模型的训练需求,形成良性循环。市场火热吸引了很多人,想入局算力贸易、租赁分发或AI创业。其中Token分发业务被看好,自建或租赁算力,整合开源大模型API,建面向全球用户的聚合分发平台,像算力领域的淘宝,商业前景好。
我们的服务是全流程的,从帮客户在英伟达代工厂下单订服务器,到运输回国,再到上架前压力测试、交付实施,还有后续运维运营。2023到2024年7月给阿里做的H800项目,我们派了20人团队在东莞普洛斯机房现场维护。虽然我们给大模型公司、金融机构甚至军方处理软硬件问题,但出于合规要求,拿不到客户后台流量消耗、模型运行这些核心运营数据。所以我们对需求的判断大多是定性观察,没法给精确量化数据。
#算力租赁 #AI算力 #H100 #H200 #大模型 #推理算力 #国产算力 #英伟达 #算力经济学 #C端AI应用 #产业调研 #算力供需 #GPU租赁
免责声明:市场有风险,投资需谨慎。本文内容仅代表调研观点,不代表本公众号立场。
——END——
本期内容分享完毕。后续将持续更新行业分析、调研纪要、外资研报与市场复盘内容。
感兴趣的朋友,可自行参考文末体验通道。
