本公众号是《思维纪要社》的备用账号,通道↓↓↓
本次播客访谈围绕存算一体芯片的技术原理、发展现状、国内外进展及商业化难点展开,专家系统解析了存算一体相较传统架构的优势、主要技术路线、应用场景与未来趋势,并在与主持人的多轮问答中探讨了国产化机会、产业生态及投资视角等内容如下:
存算一体芯片概述与技术优势
·存算一体的定位与初衷:存算一体指将存储与计算单元集成在同一芯片上,更接近AI计算芯片的“终极形态”,克服当前GPU因高带宽显存“卡脖子”的结构性缺陷(显存占芯片成本30%以上)。传统GPU属过渡架构,导致算力冗余、功耗高、成本高企,难以满足算力普惠需求。
·解决算力痛点的路径:AI算力需求快速增长与昂贵供给形成矛盾,推动芯片向专用化演进。GPU在推理场景算力利用率仅约60%,存算一体专用芯片可显著降低功耗(主流800W降至100W以下)与成本(未来降幅可达50%以上),并提升特定场景推理速度(较GPU快5-10倍)。
·与传统架构的本质区别:严格意义上的存算一体须存储与计算同芯片,计算时直接调用存储数据;广义的存算融合、近存计算仍存距离。量子专用计算因存算同体,也可归入存算一体范畴。
主要技术路线与物理材料特性
·SRAM路线(代表:美国Groq):采用静态随机存储器为介质,技术成熟但单颗存储容量仅数百MB,远低于高带宽显存,部署70B模型推理需更多芯片,成本比GPU高10-15倍。优势是可利用成熟制程快速落地,推理速度突出,英伟达已将其纳入CUDA生态并通过NVLink/NVSwitch互联提升可用性。
·MRAM路线(磁阻内存):基于电子自旋实现存储,断电不丢数据、寿命无限、抗辐射,天然适合太空等极端环境。但当前单颗粒容量更小,未用先进制程(7nm及以下),部署成本与SRAM类似偏高。预计明后年有初创公司流片,可与光互联结合降低集群成本。若采用先进制程,单芯片算力与存储密度可翻倍,部署成本有望降至GPU的5倍。
·DRAM与RRAM路线:DRAM被认为可行性低;RRAM在科研层面具潜力,但成熟度落后于MRAM。未来可能出现SRAM、MRAM、RRAM多路线并存与封装融合(如光电共封、3D堆叠)以平衡速度与成本。
·材料物理差异与功耗优势:传统硅基芯片依赖电子流动,耗电高;MRAM基于自旋/隧穿效应,仅需少量电流即可计算,功耗显著低于SRAM/GPU。
国内外发展现状与产业化进程
·国外进展:英伟达在GTC大会后收购Groq,补齐GPU推理速度短板,并布局光互联/光计算初创公司以完善专用芯片矩阵。Groq原用成熟制程,性能属上一代,英伟达计划推出新版本并整合进CUDA生态。美国另有初创企业在研发MRAM/RRAM存算芯片。
·国内现状:基于SRAM的存算一体企业极少,处萌芽阶段;MRAM路线有零星企业,产品预计明年初现POC验证。代工可由华宏、中芯国际等成熟制程产线完成。国内企业与英伟达CUDA生态距离较远,倾向适配国产主流大模型及行业模型。中美存算芯片预计明年前後脚问世,技术路径不同但时间差不超半年。
·供应链与制程依赖:存算一体对先进制程依赖低(7nm已属高配),国内成熟制程良率与海外差距有限,供应链安全可控。
应用场景与市场前景
·核心场景:面向模型推理尤其是端侧、行业智能体(金融、政务、医疗、智慧城市等)对速度与成本敏感的场景。SRAM型适合极致速度需求(约占推理需求50%),MRAM型适合成本敏感且可长期稳定运行场景。
·市场趋势:伴随行业智能体爆发,推理芯片需求占比将从当前大幅提升,未来3-5年推理芯片或占训练+推理总需求的80%。仅少数大厂训练仍需高功耗GPU,绝大多数用户将采用低成本、低功耗、低维护的专用推理芯片。
·专用芯片复苏契机:DeepSeek等国产行业可用大模型出现后,专用芯片仅需适配少数模型即可规模化商用(如DeepSeek一体机热销),在交通、能源、教育、科研、生物医药等领域具备成本与功耗优势。
商业化难点与生态挑战
·材料与容量瓶颈:存储介质容量受限导致大模型参数部署需更多芯片,推高成本,是目前最大瓶颈。
·软件生态适配:存算芯片需大量算子与框架迁移适配(CUDA、昇腾等),工作量大、周期长。
·芯片互联难题:片间互联协议与物理特性差异大,需芯片厂与互联方案商协同研发;初创企业常依赖外部合作,技术门槛高。
·成本与速度平衡:现有SRAM方案速度快但部署贵,MRAM/RRAM待突破容量与成本关,英伟达亦需寻找新标的补齐低成本短板。
国内外对比与“弯道超车”探讨
·硬件与架构:国内在光互联/光交换等前沿互联技术上已局部领先(如上海西智落地案例),在超节点架构设计上亦有创新;但在成熟高速互联方案(如NVLink、InfiniBand)与私有协议上仍落后。
·生态差距:英伟达凭借CUDA生态与硬件体系具开发与架构优势;国内需构建自主生态,适配国产大模型与行业应用。
·弯道超车可能性:存算一体不依赖先进制程与被英伟达定义的GPGPU路线,可通过低成本、成熟制程、低显存依赖切入最大公约数用户需求。结合国内行业智能体领先优势,推理侧专用芯片有望在性价比与易用性上赶超美国;但训练侧高性能芯片仍存差距。多路线并存与产业协作是缩小差距的关键。
投资者关注与延伸讨论
·英伟达未来标的预测:除SRAM外,英伟达可能优先布局MRAM,其次RRAM,最后DRAM,因MRAM具非易失、长寿命、抗辐照等独特物理优势,适合太空等特殊场景。未来或通过先进封装与多芯片集成(如存算+GPU+光电共封)实现训推一体与极速推理。
·Scale Up互联水平:国内在光互联/光交换等前沿互联技术不晚于美国且有实际落地;在传统高速互联与私有协议方面仍落后,但超节点等新架构已跑在前面。
·IC芯片需求旺盛领域:DeepSeek等可用行业大模型带动专用芯片复苏,需求集中在政务、医疗、教育、金融、交通、能源、科研、生物医药等需行业智能体的领域。
·赛道选择观点:专家更看好卖“铲子”的A芯片赛道,因模型趋向大厂垄断,而芯片可依托多样化行业场景孕育更多小而美公司;硬件具可见性与稳定营收属性,伴随模型落地销量更大。





