总论:算力围城——每个行业都在自建浪费
核心命题:
任何独立公司自身一定是围城的算能潮汐浪费。没有一个公司能在全球任何一个角落拥有绝对稳定的算力需求。GPU集群不是电灯——不能24小时以恒定功率运转。它是一台算能潮汐发电机,需求涨落随行业节律、地理时区、事件驱动而剧烈波动。
围城的含义:
每家公司为了峰值需求自建了足够大的算力城池。但城池在99%的时间里是半空的。这个「半空的城池」就是算力做市商的库存。
本文档覆盖12个独立行业的系统工程分析。每个行业提供算能潮汐特征画像、3个全球算能潮汐调度核心案例、做市商切入与收益估算。
1. AI/大模型训练
算能潮汐特征:训练是AI行业最剧烈的算力消耗行为——千卡到万卡集群连续运转数周到数月,训练完成后集群利用率骤降至10-20%。峰谷比可达100:1。
案例1:Meta训练Llama 4 — 3.2万GPU集群的「完成后真空」
场景:Meta为训练Llama 4组建了3.2万块H100集群,连续运行11周。训练结束后,集群中约2.5万块GPU进入闲置或极低利用率状态。
算能潮汐浪费:若闲置6周,按$2/GPU-hr计算,浪费≈$5,040万。
算能潮汐调度方案:通过做市商将2.5万块GPU挂牌出租。800块分配给欧洲AI初创微调,1,200块分配给亚洲游戏公司渲染,剩余分配给全球推理服务。
关键启示:即使是Meta这种体量的公司,也无法为每一块GPU找到24/7/365的内部需求。训练完成的GPU是天然的市场供给。
案例2:Mistral AI — 欧洲初创的跨大洲训练降本
场景:Mistral AI训练7B参数模型,需要2,048块GPU×4周。欧洲本地GPU价格$2.5-3.0/hr,而同期新加坡/中东机房夜间价格$1.2-1.5/hr。
算能潮汐调度:通过做市商系统,Mistral将训练任务分片到3个大洲的4个机房——新加坡(夜间)、迪拜(夜间)、法兰克福(白天)、蒙特利尔(夜间),综合均价$1.4/hr。
成本对比:自建/全价租赁$3,456,000 vs 跨洲调度$1,935,360,节省44%。
关键启示:中型AI公司没有Meta的财力自建万卡集群,跨大洲调度是唯一出路。
案例3:中国大模型公司 — 训练→推理的无缝切换
场景:一家中国大模型公司完成MoE模型训练后,5,120块H800集群面临3-4个月的下一次训练空窗期。
算能潮汐调度:做市商系统在训练完成48小时内,将5,120块GPU重新分配——60%转为自有推理服务,30%出租给国内AI应用公司的微调需求,10%调度到东南亚机房服务海外推理。
经济效果:原本3-4个月的闲置成本约$1,500万,通过做市商回收约$900万(60%利用率),同时自有推理服务创造了新业务收入。
关键启示:训练集群天然是推理集群的供应源——做市商的核心价值就是加速这个转换。
2. 游戏
算能潮汐特征:游戏行业是全球时区算能潮汐的最典型案例。同一款游戏,东京晚上8点的峰值利用率可能是法兰克福中午12点的5-10倍。新赛季/新资料片上线首日更是日常的5-10倍。
案例1:Epic Games Fortnite — 新赛季300%峰值容量的全球调度
场景:Fortnite新赛季Chapter 6上线首日,全球并发玩家从日常150万飙升至520万。Epic需要在24小时内扩张300%的服务器算力。
算能潮汐调度:通过算力做市商提前72小时在全球8个机房租用预留容量——北美3个(AWS/GCP/Azure)、欧洲2个、亚洲2个、南美1个。新赛季上线后7天,流量回归正常,所有临时租约自动终止。
经济效果:如果自建峰值容量,年成本增加$2.8亿。通过做市商按需购买,年成本约$4,500万——节省84%。
关键启示:游戏公司只需要谷值容量+做市商峰值租约。不需要为每年10天的峰值建365天的城池。
案例2:Riot Games — 全球总决赛的观赛AI处理
场景:英雄联盟全球总决赛(Worlds 2026),全球峰值观赛人数超4,500万。Riot需要在直播中实时运行AI高光剪辑、多语言解说、选手操作热力图、弹幕内容审核。
算能潮汐调度:比赛进行期间(3-4小时/天),实时AI处理需求是平时的20倍。Riot通过做市商在全球——首尔、东京、新加坡、法兰克福、圣保罗——锁定GPU容量,精确到分钟级调度。
技术细节:比赛结束后10秒内,AI系统完成高光片段提取、5语种自动解说、选手热点图渲染——所有计算在3个大洲的GPU集群上并行完成。
关键启示:电竞赛事是游戏行业最极端的算能潮汐脉冲——每年只有几周,峰值需求是日常的20倍+。
案例3:米哈游原神 — 亚洲-北美-欧洲接力峰值
场景:原神版本更新日,亚洲服务器(UTC+8)首先迎来峰值,6小时后欧洲(UTC+1)接力,再过6小时北美(UTC-8)接力。同一批后端算力可以三班倒。
算能潮汐调度:做市商系统利用时区接力,将同一批GPU集群在24小时内服务三个大洲的峰值——东京20:00(亚洲峰值)→ 柏林20:00(欧洲峰值)→ 加州20:00(北美峰值)→ 回到亚洲凌晨低谷。
容量优化:自建3倍容量服务三个大洲 vs 时区接力复用——容量需求降低60%。
关键启示:时区不仅是问题,也是解法。做市商把时区差异从成本变成套利工具。
3. 金融服务
算能潮汐特征:金融行业拥有全球最精确的算能潮汐日历——月底结算、季末报表、年度审计、监管压力测试,全部是预先可知的固定窗口。峰谷比3-8:1。
案例1:伦敦量化对冲基金 — 月末T+0风险重算
场景:一家管理$300亿的伦敦量化对冲基金,每月最后一个交易日需要运行全组合风险模型(VaR+Stress Test+Scenario Analysis),计算量是平时的5-8倍。平时300块A100足够,月末需要1,500块×18小时。
算能潮汐调度:做市商系统基于历史规律提前7天预测该基金的需求。从东京(UTC+9,月末交易日已结束进入夜间)和新加坡机房锁定1,200块闲置GPU,以$1.2/hr(平时的60%)交付给伦敦客户。
三方共赢:机房赚到闲置收入,基金节省40%成本,做市商赚取价差。
关键启示:金融机构有全球最精确的需求日历——做市商可以提前数周乃至数月安排调度。
案例2:华尔街银行CCAR压力测试 — 年度算力海啸
场景:美国六大银行每年需向美联储提交CCAR综合资本分析审查,包括在数十种极端经济情景下模拟全行资产负债表,计算量是日常的10-15倍,集中在4-6周的窗口内。
算能潮汐调度:一家华尔街银行平时拥有2,000块H100用于日常风控。CCAR季需要额外8,000块×6周。通过做市商从全球机房租入——包括AI公司训练结束后的闲置集群、亚洲金融公司非结算期的过剩容量。
经济效果:如果自建8,000块GPU集群只用于每年6周,年折旧+运维$1.2亿。通过做市商按需租赁,年成本$1,800万——节省85%。
关键启示:年度监管窗口是算力做市商最甜蜜的生意——需求确定、提前可知、金额巨大。
案例3:Coinbase — 市场暴跌日的实时风控
场景:加密市场暴跌日,BTC单日跌15%,全网交易量暴增10倍,清算引擎、风控模型、链上分析的算力需求同时飙升。Coinbase后端服务需要瞬时扩容3-5倍。
算能潮汐调度:做市商系统检测到市场波动率指标超过阈值,自动触发「风暴模式」——在5分钟内从全球闲置GPU池中调度1,500块GPU注入Coinbase的后端计算集群。
响应速度:手动扩容需要30-60分钟,自动做市商调度在5分钟内完成——在市场暴跌中,15分钟的计算延迟可能意味着数百万美元的穿仓损失。
关键启示:金融算力调度不仅是成本问题——是风险管理和生存问题。
4. 电商/零售
算能潮汐特征:全球购物节分散在不同月份——中国双十一、中东斋月、西方黑五、Amazon Prime Day——做市商可以在一个区域的淡季把算力调度到另一个区域的旺季。峰谷比10-50:1。
案例1:阿里巴巴双十一 — 全球最大电商算力峰值
场景:双十一当天,淘宝/天猫的推荐算法、搜索排序、定价引擎、欺诈检测、物流调度同时达到年度峰值。日常需要约8,000块GPU,双十一峰值需要约35,000块——4.4倍。
算能潮汐调度:提前30天在全球锁定额外27,000块GPU容量。来源:新加坡/马来西亚机房(东南亚电商淡季)、欧洲机房(非购物季)、美国机房(双十一在美国是普通工作日)。
经济效果:如果自建35,000块GPU集群全年运行,年成本$6.1亿。通过做市商按峰值天购买,年增量成本$2,100万——节省96.5%。
关键启示:双十一是电商算能潮汐的极端案例——11月11日一天的算力消耗超过全年其余364天总和。
案例2:Amazon Prime Day — 推荐+定价+欺诈检测三重峰值
场景:Prime Day(48小时)期间,Amazon的推荐引擎、动态定价算法、欺诈检测系统同时达到峰值——三个系统平时各自独立运行,Prime Day期间全部同时满负荷。
算能潮汐调度:Amazon通过做市商在全球——北美、欧洲、日本、印度——提前锁定GPU。Prime Day结束后,额外容量在24小时内全部释放。
技术细节:推荐引擎从「小时级刷新」切换到「分钟级实时更新」;价格引擎从「每日调整」切换到「竞争对手每次变价后30秒内响应」;欺诈检测从「采样分析」切换到「全量实时扫描」。
关键启示:电商峰值不仅是量的问题——是系统模式切换的问题。做市商需要理解每个客户的「峰值模式」来正确调度容量。
案例3:Shopify独立站黑五 — 碎片化电商的统一算力需求
场景:数百万Shopify独立站在黑五期间同时需要推荐+支付+物流AI服务。单个独立站的峰值需求很小(2-4块GPU),但数百万独立站聚合后是巨大的需求。
算能潮汐调度:做市商以「聚合买家」身份出现——为Shopify平台全体独立站统一采购算力,而非让每个独立站自己去租GPU。做市商在黑五前从全球锁定了约15,000块GPU。
经济效果:聚合采购将单价从$2.8/GPU-hr压低到$1.6/GPU-hr——因为有规模优势。单体独立站如果自己去买,不仅价格高,而且根本买不到。
关键启示:碎片化需求天然需要聚合者。做市商不仅提供流动性,还提供「需求聚合」的价值。
5. 生物医药
算能潮汐特征:AI制药的算力需求高度集中在两个阶段——分子模拟(可预测、可调度)和临床试验申报(不可延期、窗口集中)。峰谷比5-20:1。
案例1:Moderna mRNA序列优化 — 非申报期出租GPU
场景:Moderna的AI团队在非申报窗口期(一年中约8个月)的GPU利用率仅30-40%。申报窗口期(FDA前1-2个月)利用率飙升至95%。
算能潮汐调度:非申报期通过做市商将60%的GPU容量(约1,500块H100)出租给AI训练任务和学术机构。申报窗口临近时,做市商自动从全球网络中召回等量GPU容量。
经济效果:出租收入约$1,200万/年,覆盖了GPU集群年度折旧的40%。申报期的容量召回成本远低于自持全年闲置的损失。
关键启示:制药行业的监管日历是公开信息——做市商可以提前18个月预测每家药企的算力需求窗口。
案例2:DeepMind AlphaFold — 蛋白质结构预测的批处理模式
场景:AlphaFold数据库包含2亿+蛋白质结构预测。每次新增物种或更新模型版本时,需要批处理运行数百万次推理——每次推理1-10分钟。
算能潮汐调度:批处理任务天然可分割、无实时性要求。DeepMind可以将任务分片到全球任何有空闲GPU的机房——夜间、周末、节假日——利用最低价格窗口完成。
成本优化:如果在单一云供应商全价运行,2亿次推理×$0.5/次=$1亿。通过做市商在全球最低价GPU上分批运行,成本降至$3,500万——节省65%。
关键启示:科学计算的批处理任务是算力做市商最理想的需求——可分割、可延迟、全球任何地方都可以跑。
案例3:罗氏临床试验数据分析 — FDA窗口期的集中计算
场景:罗氏一款肿瘤新药进入FDA快速审批通道,需要在6周内完成对3年临床试验数据的全量重新分析——包括基因组学、蛋白质组学、影像组学的多模态融合。
算能潮汐调度:做市商在罗氏提交FDA申请前3个月即开始准备容量。窗口期开始时,从全球14个机房调度了4,500块GPU投入计算。
时间价值:如果只用罗氏自有GPU(600块),计算需要45周——远超FDA要求的6周。跨全球调度将时间压缩到5.5周。延迟提交意味着上市推迟,每周损失约$8,000万营收。
关键启示:制药行业的算力调度不仅是成本问题——是时间=生命=数十亿美元营收的问题。
6. 影视/流媒体
算能潮汐特征:影视行业是项目制算力消耗的极端代表——一部大片的VFX渲染可能需要1亿+核心小时,但全部集中在后期制作的2-3个月内。流媒体的推荐算法则在热门剧集上线时面临瞬时峰值。峰谷比20-100:1。
案例1:Weta Digital漫威VFX渲染 — 项目制万卡需求
场景:Weta Digital为一部漫威电影做最终渲染,需要5,000块GPU连续运转8周。项目结束后,这些GPU在Weta内部可能闲置3-4个月直到下一部大片。
算能潮汐调度:通过做市商从全球3个洲的5个机房租用容量——而非自建。渲染完成后,所有租约自动终止。这5个机房立刻接到下一个任务——2个转给AI训练,3个转给自动驾驶仿真。
经济效果:如果自建5,000块GPU集群,年折旧+运维约$8,700万,实际利用率仅35-40%。通过做市商按需租赁,年成本$2,100万——节省76%。
关键启示:VFX渲染是项目制算力的教科书案例——需求确定、时长已知、完成后100%释放。做市商就像为每一部电影搭建临时渲染农场。
案例2:Netflix新季上线 — 全球转码+推荐刷新
场景:《怪奇物语》最终季上线首周末,Netflix需要为190个国家/地区生成多种分辨率+多语言字幕的版本,同时刷新所有用户的推荐页面。算力需求是平时的12倍。
算能潮汐调度:Netflix平时运行约3,000块GPU用于持续的内容处理和推荐。新季上线前48小时,通过做市商在全球——AWS、GCP、本地IDC——额外锁定30,000+块GPU容量。
时间窗口:新季上线后72小时,转码任务完成95%+,额外GPU全部释放。做市商已经为这些GPU安排好了下一个任务——其中一批将服务即将到来的体育赛事。
关键启示:流媒体的算能潮汐峰值精确绑定上线时间表——Netflix每年公布的内容日历是做市商的免费需求预测。
案例3:世界杯实时AI剪辑 — 奥运会转播式的瞬时并发
场景:2026世界杯期间,数十亿观众同时观看,转播商需要实时运行AI高光剪辑、多语言自动解说、球员追踪、战术分析。64场比赛,全球20+语种同时推送。
算能潮汐调度:做市商提前3个月锁定全球容量——比赛期间每天3-4场同时进行时,峰值需求约12,000块GPU。非比赛日/凌晨时段需求接近于零。赛程表就是需求日历。
全球分布:GPU部署在距离每个转播区最近的数据中心——南美比赛→巴西+智利机房处理,欧洲比赛→法兰克福+伦敦,亚洲→东京+新加坡。
关键启示:体育赛事是流媒体算能潮汐峰值的最佳可预测场景——4年赛程表公开,做市商可以提前规划全球调度。
7. 自动驾驶
算能潮汐特征:自动驾驶是算力管道式消耗——旧金山白天路测数据在东京夜间被处理,形成天然的24小时全球接力。峰谷比3-5:1,相对温和但持续。
案例1:Waymo旧金山路测 — 10PB/天全球分片处理
场景:Waymo在旧金山的自动驾驶车队每天产生约10PB的传感器数据(摄像头+激光雷达+雷达+IMU)。旧金山本地GPU集群无法在24小时内处理完毕。
算能潮汐调度:做市商系统自动将每天的数据分片,同时分发到东京、新加坡、法兰克福、圣保罗的闲置GPU集群并行处理。旧金山的白天数据,在东京的夜间GPU上被处理。
时间压缩:本地集群需要72小时处理完毕→全球分片调度8小时完成。这意味着处理延迟从3天压缩到1天内——对安全关键更新至关重要。
关键启示:自动驾驶的数据处理天然是「follow the night」模式——跟着全球夜间闲置GPU走。
案例2:Tesla Dojo — 全球影子模式数据回流
场景:Tesla全球数百万辆车持续上传「影子模式」数据——Autopilot预测与驾驶员实际行为的差异。这些数据需要持续处理以改进模型。
算能潮汐调度:Dojo超级计算机是核心训练集群。但数据预处理、清洗、标注可以在全球任何GPU上完成。做市商将预处理任务分散到全球闲置GPU——形成24小时不间断数据处理管道。
容量管理:Dojo本身利用率维持在90%+(只做训练),预处理100%由做市商调度到外部GPU——Tesla不需要为预处理自建额外集群。
关键启示:核心训练+外围预处理的分工,是自动驾驶行业的标准模式。做市商吃掉外围预处理的全部需求。
案例3:Mobileye高精地图 — 新城市扩展的峰值需求
场景:Mobileye每进入一个新城市,需要构建高精地图——处理百万公里级的街景数据。一个城市的地图构建峰值需求可达1,000块GPU×4周。
算能潮汐调度:Mobileye的扩展计划是公开的(每年进入N个新城市)。做市商基于扩展日历提前锁定容量——例如当Mobileye宣布进入东京和首尔时,做市商已经在亚洲锁定了2,000块GPU。
经济效果:如果每进入一个城市自建1,000块GPU集群,年成本增加$1,700万×N个城市。通过做市商按城市按项目租赁,总成本降低70%+。
关键启示:城市扩展日历是做市商可提前获取的需求信号——Mobileye的市场公告就是做市商的采购清单。
8. 气象/气候
算能潮汐特征:气象计算是全球最定时定量的算力消耗——全球气象模型每天在固定时刻运行,飓风/台风季频率翻倍。峰谷比2-4:1。
案例1:ECMWF全球天气预报 — 每日4次定时模型运行
场景:欧洲中期天气预报中心(ECMWF)每天运行4次全球天气模型(00Z/06Z/12Z/18Z),每次需要数千CPU核心连续计算2-3小时。模型运行间隙(约4小时),计算集群完全空闲。
算能潮汐调度:做市商将ECMWF模型运行间隙的4小时窗口出租给气候研究机构、大学的模拟、农业公司的作物模型。GPU版本的气象模型(如GraphCast)运行时间更短(几分钟),间隙窗口更大。
经济效果:ECMWF的超算中心年运维成本$8,000万+,利用率约40%。通过做市商出售间隙算力,年回收$1,500-2,000万。
关键启示:气象计算拥有全球最固定的时间表——做市商可以将「间隙窗口」作为产品打包出售。
案例2:NOAA飓风季 — 频率从1次/日→4次/日
场景:大西洋飓风季(6-11月)期间,NOAA将飓风模型运行频率从每日1次提升至每日4次,每次需要更高分辨率,计算量暴增30倍。
算能潮汐调度:飓风季是年度可知事件——做市商提前3个月锁定额外GPU容量。非飓风季(12-5月),NOAA的大量GPU闲置,通过做市商出租给其他气候研究机构。
资源共享:大西洋飓风季(6-11月)和西北太平洋台风季(5-10月)重叠,但南半球气旋季(11-4月)正好互补——做市商可以在不同区域之间调度。
关键启示:气候灾害的季节性算力需求是全球分布且互补的。
案例3:CMIP6气候模型 — 多模型集合模拟的年度项目
场景:CMIP6需要全球数十个气候研究中心同时运行上百种气候情景模拟,每种模拟需要数千核心年。这是大规模、一次性、全球同步的批处理任务。
算能潮汐调度:做市商将CMIP6模拟任务拆分到全球参与机构的闲置GPU上运行——每个机构贡献自己的闲置容量,同时也借用其他机构的闲置容量。做市商充当全局调度器。
协同效应:全球合作项目中,做市商可以优化整个网络的利用率——而非每个机构各自浪费。
关键启示:科学合作的全球分布式计算,天然需要一个中心化的算力调度者。
9. 半导体EDA
算能潮汐特征:芯片设计流程中的布局布线、时序分析、物理验证是高度批处理化的计算任务。Tape-out前2-4周是「地狱周」——全部计算资源100%满负荷,其他时间利用率30-50%。峰谷比10-30:1。
案例1:NVIDIA芯片设计 — tape-out前的「地狱周」
场景:NVIDIA设计下一代GPU时,tape-out前4周需要运行数万个布局布线+时序分析+DRC验证任务。平时1,000块GPU够用,tape-out周需要10,000+块。
算能潮汐调度:做市商在NVIDIA的tape-out日历(提前1年可知)前锁定全球GPU容量。来自AI公司训练完成后的闲置集群、亚洲芯片公司非tape-out期的过剩容量。
经济效果:如果NVIDIA自建10,000块GPU集群只为每年2-3次tape-out(每次4周),利用率不足15%。通过做市商按需租赁,年成本从$1.7亿降至$3,500万。
关键启示:半导体行业的tape-out日历是最可预测的算力需求信号——NVIDIA/AMD/Intel/Apple的芯片路线图公开发布。
案例2:台积电工艺仿真 — 有限元分析的批量峰值
场景:台积电为3nm/2nm工艺开发进行有限元分析仿真——电磁场、热传导、应力分析——每个仿真任务独立可并行。新工艺开发期间需求是平时的15倍。
算能潮汐调度:做市商将台积电的仿真任务拆分为数千个独立子任务,分发到全球闲置GPU上。任务间无依赖关系——天然的Embarrassingly Parallel计算。
成本对比:如果台积电自建峰值容量,GPU利用率<20%。通过做市商,成本降低75%+。
关键启示:EDA/工艺仿真的「天然并行」特性,使其成为算力做市商最理想的工作负载类型之一。
案例3:ARM IP验证 — 多配置并行regression测试
场景:ARM每发布一个新的CPU/GPU IP核心,需要在数百种配置组合上运行全套regression测试。每个配置独立运行,峰值需要数千块GPU×2-3周。
算能潮汐调度:做市商将ARM的regression测试矩阵分发到全球GPU上并行执行。测试天然可独立运行,零通信开销。
时间价值:ARM自有集群(500块GPU)需要4个月完成全矩阵测试→做市商调度3,000块GPU×3周完成。将IP交付周期压缩了3个月——对ARM意味着早3个月开始收版税。
关键启示:IP验证的「矩阵并行」是最适合全球分布式调度的计算模式——零通信开销,可无限分片。
10. 能源/油气
算能潮汐特征:油气勘探的地震数据处理是项目制+季节性的典型算力消耗——勘探船在夏季作业季采集数据,冬季进入室内处理季。峰谷比5-15:1。
案例1:Shell地震数据处理 — 勘探季的批处理海啸
场景:Shell每年夏季在墨西哥湾/北海/西非进行海上地震勘探,采集数十PB原始数据。冬季进入数据处理季——需要大规模GPU集群进行全波形反演(FWI)和深度偏移成像。
算能潮汐调度:勘探季(夏季)算力需求接近零。处理季(冬季)需要15,000+块GPU×3-4个月。Shell自持5,000块GPU满足基本需求,额外10,000块通过做市商租赁。
季节互补:Shell的冬季处理季正好与AI训练的传统淡季(年末假期)重叠。做市商在这个时间段有大量闲置GPU供给。
关键启示:能源行业的季节性是做市商套利的理想土壤——Shell的淡季刚好是别人的旺季,反之亦然。
案例2:国家电网潮流计算 — 实时+离线混合算力
场景:中国国家电网需要在夏季用电高峰(7-8月)和冬季供暖高峰(12-1月)运行高精度的电网潮流计算和安全校核。平时每日运行1次,高峰期每小时运行1次+15分钟实时更新。
算能潮汐调度:非高峰期的GPU闲置容量(每天23小时)通过做市商出租给其他行业。高峰期做市商从其他行业(如处于淡季的电商)召回GPU容量。
跨行业互补:国家电网的夏季高峰=电商的618后淡季。国家电网的冬季高峰=电商双十一后的喘息期。两个行业的峰谷天然互补。
关键启示:电网+电商的峰谷互补是做市商跨行业调度的教科书案例。
案例3:Orsted风电场选址 — 年度集中模拟计算
场景:Orsted(全球最大海上风电开发商)每年进行一轮风电场选址——需要运行数万次CFD模拟和尾流效应分析。模拟集中在2-3个月的规划窗口内。
算能潮汐调度:Orsted的CFD模拟任务天然可并行。做市商将模拟任务分发到全球GPU上,在3周内完成Orsted自有集群需要5个月的计算。
时间=政策窗口:选址确定越快,越早进入审批流程——审批窗口每年只有1-2次。错过一个窗口意味着项目延迟一年。
关键启示:可再生能源开发的政策窗口时间表,是做市商可提前获取的需求信号。
11. 网络安全
算能潮汐特征:网络安全拥有全球最极端的峰谷比——平时1x,零日漏洞爆发日100x。攻击事件不可预测但可瞬时响应。峰谷比1-100:1。
案例1:Cloudflare DDoS缓解 — 攻击期间的瞬时算力需求
场景:一次针对Cloudflare客户的1.5Tbps DDoS攻击,需要在边缘节点实时分析+过滤恶意流量。平时每条流量检测只需0.1ms,攻击期间需要完整的深度包检测(10ms+)。
算能潮汐调度:做市商系统检测到攻击流量模式,自动触发「防御模式」——从全球闲置GPU池中瞬时调度算力注入Cloudflare的受影响边缘节点。攻击停止后,算力自动释放。
响应速度:手动响应需要触发→通知→决策→部署(15-60分钟)。自动做市商调度在30秒内完成GPU注入——在DDoS攻击中,每1分钟的中断可能意味着数百万美元的损失。
关键启示:网络安全是算力做市商「风暴模式」的原型用例——瞬时、不可预测、需要自动触发。
案例2:CrowdStrike威胁情报 — 每日全球日志分析
场景:CrowdStrike每天处理来自全球客户端的数万亿条安全事件日志。日志量在重大攻击事件(如供应链攻击)期间暴增10-50倍。
算能潮汐调度:日常日志分析使用CrowdStrike自有GPU集群。事件爆发时,做市商自动从全球调度额外GPU容量处理暴增的日志。事件平息后,容量释放。
技术细节:日志分析天然适合批处理+流处理混合——做市商为事件期间的「突发批处理」提供算力,而CrowdStrike自有集群专注于实时流处理。
关键启示:安全日志的「日常流量+事件爆发」双模需求,天然匹配做市商的「基量+弹性峰值」供应模式。
案例3:零日漏洞爆发时的全网扫描
场景:一个关键零日漏洞(如Log4Shell级)爆发,全球安全团队需要在12-24小时内扫描所有暴露资产——数十亿个IP/端口/服务。单个组织的扫描算力不足,全行业的扫描需求同时爆发。
算能潮汐调度:做市商在漏洞公告发布后30分钟内启动「全网扫描模式」——从全球调度数万块GPU为安全公司、企业、政府机构提供扫描算力。
网络效应:做市商为所有客户统一扫描,结果共享——避免了数十万个组织各自扫描同一批IP的重复浪费。一次扫描,全员受益。
关键启示:零日漏洞爆发是「全行业同时需要同一件事」的典型案例。做市商的聚合扫描比分散扫描高效数百倍。
12. 广告/营销
算能潮汐特征:广告行业是算力的「实时+节日」双模消耗——RTB需要毫秒级持续算力,超级碗/黑五等节日期间竞价量暴增5-10倍。峰谷比3-10:1。
案例1:Google Ads实时竞价 — 毫秒级全球RTB
场景:Google Ads每天处理超过100亿次实时竞价请求,每次竞价需要在50ms内完成用户画像匹配、出价计算、欺诈检测。日常算力需求稳定,但超级碗/黑五/节礼日期间竞价量暴增5-8倍。
算能潮汐调度:Google自持基量GPU(日常需求)。节日峰值通过做市商从全球租赁额外容量——这些GPU在节日结束后立即释放,回到原来的任务。
毫秒约束:RTB对延迟极端敏感——做市商在每个大洲锁定「就近容量」——北美节日用北美闲置GPU,亚洲节日用亚洲。
关键启示:低延迟需求约束了调度半径——做市商需要在每个大洲都有供给池,而非纯全球自由调度。
案例2:Meta广告投放优化 — 超级碗期间竞价量暴增
场景:超级碗期间,Meta的广告竞价系统每秒处理量暴增6倍——品牌商实时调整出价以匹配比赛进程(达阵后的30秒是广告投放的黄金窗口)。
算能潮汐调度:Meta平时自持足够GPU。超级碗当天,做市商提前在北美4个城市的机房锁定额外GPU——全部在10ms延迟圈内。超级碗结束后1小时,所有额外GPU释放。
经济效果:如果Meta自建6倍峰值容量只为超级碗1天+黑五2天+圣诞节3天(共6天/年),年成本增加$3.5亿。通过做市商按天租赁,年成本$2,400万。
关键启示:广告峰值集中在一年不到10天的事件——自建峰值容量的ROI为负。做市商是最经济的解法。
案例3:TikTok推荐算法 — 爆款视频的瞬时算力需求
场景:一条视频在TikTok上突然爆火,1小时内从零到5,000万次观看。推荐算法需要瞬时为这条视频生成个性化推荐路径——否则视频的热度窗口(通常只有几小时)就浪费了。
算能潮汐调度:做市商系统检测到单条视频的流量异常(类似金融市场的波动率飙升),自动触发「爆款模式」——从全球闲置GPU中瞬时调度算力,在10分钟内将推荐容量翻倍。
时间=热度窗口:如果推荐算法在视频发布后1小时内未能充分推荐,潜在观看量损失50%+。做市商将响应时间从「人工扩容30分钟」压缩到「自动触发30秒」。
关键启示:广告/内容平台的瞬时爆款,与金融市场的价格闪崩是同一种算力需求模式——都需要亚分钟级的自动扩容。
结语:36个案例的跨行业规律
一、算能潮汐峰谷类型学
12个行业的算能潮汐可归纳为6种峰谷类型:
• 脉冲式(AI训练)——完成后100%闲置
• 日历式(金融、气象)——固定时刻表
• 节日式(电商、广告)——全球购物节日历
• 项目式(影视、半导体、能源)——制作周期驱动
• 管道式(自动驾驶)——持续但可调度的全球接力
• 突发式(网络安全)——不可预测但可瞬时响应
二、做市商价值的三种形态
• 成本套利(大多数行业)——按需租赁 vs 自建峰值容量,节省60-95%
• 时间套利(制药、半导体、广告)——加速完成计算 = 数十亿美元的窗口价值
• 风险管理(金融、网络安全)——算力扩容速度 = 风险暴露窗口 = 生存问题
三、可扩展的行业数量
本文档覆盖12个行业的36个核心案例。以下行业可作为第二梯队扩展:
• 农业科技 — 作物模型+精准农业的种植季驱动
• 教育科技 — 学期制的批处理作业评分+个性化学习
• 建筑/BIM — 项目制的渲染+结构分析
• 物流/供应链 — 节日季的路线优化+需求预测
• 保险精算 — 年度定价模型更新+巨灾建模
• 太空/航天 — 发射窗口驱动的轨道计算+仿真
• 法律科技 — 案件驱动的e-discovery+合同审查
预计可扩展至18-20个行业的60+核心案例。
四、做市商的不可替代性
36个案例指向同一个结论:算力做市商系统不是一个选项——它是算力市场从碎片化走向统一市场的必然产物。就像1900年的石油市场需要Standard Oil来整合、1970年的电力市场需要PJM来调度、2000年的金融市场需要Citadel来提供流动性一样,2026年的算力市场需要它的做市商。
AIEX算力做市商系统。我们是这个必然产物的定义者。
附注:本文档36个案例中,部分案例中的具体数字为基于公开数据的合理估算,实际数值以客户签约数据为准。所有公司名称仅作为行业分析参考,不代表任何商业关系。