国内外存算一体芯片公司全景报告

一、为什么存算一体如此重要？

传统计算架构以“冯·诺伊曼架构”为核心：存储单元与计算单元相互分离，数据在两者之间频繁搬运。英伟达CEO黄仁勋曾指出，“GPU有七成时间在等待数据”，这形象地描绘了“内存墙”（Memory Wall）问题——数据搬移的能耗和时间，严重制约了芯片算力的进一步提升。

存算一体（Compute-in-Memory, CIM）的核心理念，是将计算直接嵌入存储单元内部或附近，从根本上减少甚至消除数据搬移。根据存储与计算融合程度的不同，业界通常将其分为三大技术流派：

1. 近存计算（Near-Memory Computing）

仓库（存储）与车间（计算）同园区——物理距离大幅缩短，数据搬运功耗和延迟显著降低，但计算仍在独立单元完成。典型方案包括HBM（高带宽内存）+ GPU Chiplet协同封装，以及美光、三星推动的HMC（混合存储立方体）路线。

2. 存内处理（In-Memory Processing）

在存储内部嵌入初加工能力，对数据进行局部预处理或过滤，减少传向计算单元的数据量。典型的“存算近邻”设计，已在部分AI推理芯片中实现商用。

3. 存内计算（In-Memory Computing / Compute-in-Memory）

将整条计算流水线搬入存储阵列，数据在同一位置完成乘加运算，无需搬移。这是融合程度最高、技术难度最大、但能效提升潜力也最大的方案，被认为是AI芯片的“终极形态”之一。

据市场研究机构预测，2025年全球存算一体芯片市场规模已突破120亿美元，其中中国占比约30%。随着大模型推理需求的爆发，存算一体正从学术前沿快速走向产业落地。

二、技术路线全景：五大技术派系

根据底层存储介质和电路实现方式的不同，存算一体芯片可分为以下五条主要技术路线：

三、国际存算一体公司巡礼

全球存算一体芯片创业生态以美国最为活跃，集中在硅谷周边。以下是按技术路线分类的主要国际玩家：

3.1 数据中心与大算力阵营

d-Matrix（美国·加州）

d-Matrix是目前最受关注的存算一体创业公司之一，采用“数字存算一体”（DIMC）路线，专注AI推理加速。

•融资规模：2025年11月完成2.75亿美元融资，估值20亿美元。

•核心产品：Corsair芯片（数字存算一体，2024年11月开始出货）；Raptor推理平台（2025年）。

•技术亮点：2025年9月在Hot Chips大会上发布3D堆叠数字存内计算（3DIMC）技术，与Alchip合作实现商业化，宣称比HBM4方案徫10倍。每台服务器可运行高达1000亿参数模型。

•商业化状态：已开始向客户发货，与数据中心客户深度合作。2025年11月完成2.75亿美元C轮融资，估值达20亿美元，成为国际存算一体领域估值最高的公司。本轮由全球财团联合领投，此前已获微软投资。Corsair-X采用3D堆叠数字内存计算(3DIMC)技术，带宽达150TB/s，每台服务器可运行高达1000亿参数模型。与SK海力士合作高带宽内存方案。

Untether AI（加拿大·多伦多）

Untether AI成立于2018年，以"内存计算"架构闻名。专注于SRAM-based数字存算一体芯片，面向低功耗AI推理场景。团队工程化能力强，已有多代产品路线图推进中。2025年6月，AMD收购了Untether AI的AI硬件和软件工程师团队。

•技术路线：全数字SRAM存算一体，精度可编程。

•应用定位：边缘推理、终端设备，已与多家OEM展开合作。

•2025年6月5日，AMD宣布收购Untether AI的AI硬件和软件工程师团队（非整体收购）。公司核心产品speedAI240集成1400个RISC-V内核，推理性能达2 PFLOPS。

TetraMem（美国·加州）

由多位顶级学术和工业界专家创立，是模拟存算一体领域的技术先驱，核心技术基于ReRAM/忆阻器。

•技术亮点：能效比超过20 TOPS/W，已在28nm制程上验证。

•商业模式：IP授权为主，向大型芯片公司提供存算一体IP核。

•商业化状态：处于技术授权阶段，已与多家芯片厂商建立合作。

•2024年2月在《Science》杂志发表重大突破，实现忆阻器任意高精度模拟计算；2024年12月与Andes晶心科技合作，整合RISC-V向量处理器，支持5nm、3nm及更先进工艺。与台积电等代工厂合作，推进先进制程落地。

3.2 边缘AI与终端低功耗阵营

Mythic（美国·德克萨斯）

模拟存算一体的早期明星公司，采用基于Flash存储的模拟计算方案。技术成熟度较高，在边缘视觉AI领域积累深厚。

•核心产品：GEN 1 APU模拟存算一体芯片（2025年12月发布），已进入多家边缘视觉客户供应链。

•技术亮点：模拟计算在特定功耗预算下可提供极高的MAC（乘加运算）密度，适合always-on视觉场景。

•商业化状态：产品已出货。2025年12月完成1.25亿美元融资；2026年2月与本田（Honda）宣布联合开发车规级模拟AI SoC。

•GEN 1 APU采用SST SuperFlash memBrain技术，能效比达120 TOPS/W，模拟计算将AI参数直接存储在Flash单元中，无需权重数据搬移。2026年3月与Microchip/SST达成战略合作，将SuperFlash memBrain技术应用于AI计算。已进入多家边缘视觉客户供应链。

EnCharge AI（美国·新泽西）

采用电容式模拟存算一体方案，目标是PC端和移动端的AI加速。

•核心产品：EN100芯片，面向轻薄本和AI PC。

•技术亮点：模拟计算在端侧能效方面优势显著。

•商业化状态：积极与PC OEM厂商接触，产品导入验证中。

Lightmatter（美国·加州）

将光子技术引入计算，采用硅光子进行矩阵运算，堪称存算一体领域的“另类玩家”。

•核心产品：Passage M1000光子超级芯片（2025年4月发布），可实现全球最快AI互连。

•技术亮点：光速矩阵运算，无电阻电容延迟，极低功耗，特别适合AI集群内部的高速互连。

•商业化状态：已与SK海力士等存储大厂合作推进商业化，估值达44亿美元。

3.3 欧洲与以色列阵营

Axelera AI（荷兰·埃因霍温）

欧洲最活跃的AI芯片创业公司之一，采用数字存算一体（Digital In-Memory Computing）+RISC-V架构的异构方案。

•核心产品：Metis AI平台，面向边缘AI推理。

•技术亮点：数字存算计算单元与RISC-V控制核心深度集成，提供完整的边缘AI解决方案。

•商业化状态：积极拓展欧洲及全球客户。

NeuroBlade（以色列·特拉维夫）

专注于近存计算（Near-Memory Computing）路线，主要面向数据中心和大型数据库分析场景。2025年10月，NeuroBlade被AWS（亚马逊云科技）收购。

•技术路线：近存计算，在存储控制器附近集成专用计算引擎。

•应用场景：大数据分析、数据库加速，已有多家合作伙伴。

Sagence AI（美国·加州）

模拟存算一体技术公司，专注于减少数据搬移以提升AI推理效率，已获数千万美元融资。

Rain Neuromorphics（美国·加州）

融合神经形态计算与忆阻器技术，探索类脑计算与存算融合的新路径，研究属性较强。

四、国内存算一体核心玩家

中国是全球存算一体技术最为活跃的市场之一。国内企业覆盖了从超低功耗端侧到大算力智驾的全场景，技术路线也极为多元。2026年ISSCC会议上，清华大学、华为与字节跳动联合发布了28nm混合存内计算芯片，推荐系统能效提升1-2个数量级，标志着国内学术与产业界的深度协同。

4.1 大算力阵营（智驾/数据中心）

后摩智能（上海）

后摩智能创立于2020年，是国内存算一体AI芯片领域的领军企业。基于先进的存算一体架构和存储工艺，致力于突破芯片性能与功耗瓶颈，加速AI技术普惠落地。

自研天枢架构，Int8精度下AI核心能效比达15 TOPS/W。鸿途H30芯片（256 TOPS算力，35W功耗）已完成车规认证并量产；后摩漫界M50（160 TOPS，10W）面向端侧AI。2025年实现量产，已与联想、科大讯飞、中国移动等建立合作。投资方包括中国移动产业链发展基金（中移数字新经济产业基金、上海中移数字转型产业基金）。

亿铸科技（苏州/上海）

亿铸科技是国内ReRAM（阻变存储器）存算一体路线的代表性企业，核心技术基于忆阻器介质，面向数据中心和云计算场景。

•技术路线：ReRAM存算一体，拥抱RISC-V生态。

•核心进展：2023年成功流片并点亮原型验证芯片，计划2026年推出国产AI算力卡。

•应用定位：数据中心大模型推理、云计算加速。

•2025年10月完成A轮融资。国内唯一能够自主设计并量产基于新型存储全数字存算一体大算力AI芯片的公司，破解"存储墙""能耗墙""编译墙"瓶颈。布局低空经济等新兴领域，拥抱RISC-V生态。

4.2 端侧AI与低功耗IoT阵营

知存科技（北京）

知存科技是国内存算一体商业化最成功的公司之一，采用NOR Flash路线，已实现百万颗级别的芯片出货。

WTM2101芯片（300词连续识别功耗小于1mA，含麦克风数据处理）已实现百万颗级别出货。WTM-8系列（至少24 TOPS算力，功耗仅为市场同类方案的10%，支持10ms超低延迟Video See Through）。WTM8600新一代视觉AI正在研发中。与科创板上市公司安凯微深度合作。2024年荣获财联社"最具投资价值奖"。

炬芯科技（珠海）

炬芯科技采用SRAM存内计算路线，构建CPU+DSP+NPU三核异构架构，率先实现了存内计算技术在品牌音频产品中的商业化落地。

•ATS323X芯片：已落地品牌客户旗舰无线麦克风和无线电竞耳机。

•ATS362X芯片：切入专业音频头部品牌供应链，已在品牌耳机和麦克风中跑量。

•年报披露：率先实现存内计算技术商业化应用，是目前存算一体商业化进展最快的细分场景之一。

•模数混合SRAM存内计算（MMSCIM），CPU+DSP+NPU三核异构架构，支持全链路48KHz@32bit高清音频通路，48K双麦AI ENC降噪算法，2.4G私有协议端到端延迟小于20ms。ATS323X系列已实现品牌客户量产（旗舰无线麦克风、无线电竞耳机）；ATS362X切入专业音频头部品牌供应链。荣获"2025年度中国IC设计成就奖"；入选"2025年度中国数智产业创新产品榜"。

智芯科（杭州/合肥）

智芯科（AISTARTEK）创立于2019年，是国内SRAM数字存算一体路线的重要代表。创始团队均来自UTSTARCOM、Adobe、Marvell、展讯等国内外知名半导体企业，平均行业经验30年。公司专注于基于SRAM的精度无损数字存内计算，产品线覆盖从超低功耗端侧到具身智能大算力的全场景。

AT680（22nm，7.8 TOPS/W，多模态存算一体AI芯片，语音+视频，已量产50万片）。AT690（22nm，稀疏优化后24 TOPS/W，首款支持语音+视频的多模态芯片，2024年8月成功点亮并跑通端侧语音和图像模型）。AT8600（超大算力，面向大模型、低空飞行、自动驾驶SoC）。已与科创板上市公司炬芯科技深度合作（IP授权+独立SoC）。

苹芯科技（北京）

苹芯科技专注于存算一体AI芯片设计与应用，2025年发布了两款重磅产品，在边缘AI领域取得显著突破。

•PiMCHIP-N300：存算一体NPU芯片，功耗低至毫瓦级，面向端侧AI推理。

•PiMCHIP-S300：多模态智能感知SoC芯片，深度融合存算一体技术与多处理器架构，适用于智能家居、智能穿戴等场景。

•制程进展：在28nm及22nm制程节点上首次实现存算一体技术产品化，已交付客户使用。

•获奖荣誉：2025年11月获AABI火炬技术转移奖。未来规划：联合代工厂推进eNVM工艺量产，构建“存算+”生态。

•PiMCHIP-N300（28nm/22nm存算一体NPU，毫瓦级功耗，面向端侧AI推理）。PiMCHIP-S300（28nm/22nm多模态智能感知SoC，深度融合存算一体与多处理器架构）。2024年8月发布国内首颗商用端侧28nm存算一体AI芯片；2025年5月推出N300存算一体NPU，突破传统MCU算力瓶颈。已交付客户使用，面向智能家居、智能穿戴等场景。

4.3 新型存储介质与标准阵营

微纳核芯（北京）

微纳核芯孵化于北大信研院，首创三维存算一体（3D-CIM）架构，技术路线独特，获得兆易创新战略入股。

•核心技术：3D-CIM（三维存算一体），将计算逻辑与存储垂直堆叠，实现极致融合。

•性能数据：相比传统架构，可实现4倍以上算力密度提升、10倍以上功耗降低。

•标准主导：牵头启动全球首个RISC-V存算一体标准研制，引领行业生态建设。

•商业进展：已与多家手机龙头厂商深度合作，推进存算一体芯片在移动端的落地。

•资本动态：2026年3月获兆易创新战略入股，强化存储-计算协同生态。

•3D-CIM（三维存算一体），在存内计算基础上创造性加入"近存计算"和"RISC-V存算"，可扩展至先进制程（22nm及以下）。相比传统架构，可实现4倍以上算力密度提升、10倍以上功耗降低。受中国RISC-V工委会任命，牵头全球首个RISC-V存算一体标准研制。2025年10月完成超亿元B轮融资（蓝驰创投领投，中芯聚源、锦秋基金等）。已完成多个客户导入，与多家手机龙头厂商深度合作。

昕原半导体（上海）

昕原半导体是国内唯一实现28nm ReRAM存储芯片量产的企业，技术可用于VR/AR等新型终端设备。

•技术路线：阻变存储器（ReRAM），28nm制程已实现量产。

•资本背景：字节跳动曾战略入股，技术方向与元宇宙终端高度契合。

•应用方向：VR/AR、智能穿戴等新型终端，兼顾低功耗与高计算密度需求。

•国内唯一实现28nm/22nm ReRAM存储芯片量产的企业，Fab-lite模式，自建先进制程ReRAM中试后道生产线。覆盖器件材料、工艺制程、芯片设计及中试量产全链条，与CMOS工艺和常规Foundry兼容。2024年3月完成近亿美元Pre-A轮融资（上海联和投资领投）；2025年9月获阿里巴巴（蚂蚁集团）、字节跳动战略投资；2026年3月完成C轮融资（蚂蚁集团等参与）。

五、商业化全景：谁已跑通从0到1？

综合各公司公开信息，以下按商业化成熟度对主要存算一体公司进行分层梳理：

六、大模型时代的演进路径

存算一体技术并非一蹴而就，其在AI时代的价值将分阶段释放：

第一阶段：专用加速器（当下~2027年）

存算一体芯片作为GPU万卡集群的补充，处理推理任务中的特定计算密集型操作（如矩阵乘法）、数据预处理和推荐系统。与GPU协同而非替代，共同构成异构计算底座。

第二阶段：深度融合（2027~2030年）

随着Chiplet技术和3D堆叠封装工艺成熟，存算一体单元将与GPU/NPU通过先进封装深度融合，形成“近存+存内”的混合架构，整体系统能效再提升一个数量级。

第三阶段：主导万卡集群（2030年以后）

当ReRAM、MRAM等新型存储介质成熟量产，存算一体将从补充角色升级为主导角色，彻底重构AI计算集群的基础架构，颠覆延续七十年的冯·诺伊曼架构，推动AGI时代算力基础设施的范式转变。

七、总结与展望

存算一体正从学术前沿走向产业爆发的前夜。2025年全球120亿美元市场规模、中国约30%的占比背后，是国内外企业从不同技术路线切入、竞相推进商业化的生动局面。

在端侧，知存科技百万颗出货、炬芯科技品牌落地，证明存算一体已具备真实商业价值；在智驾领域，后摩智能完成车规认证并量产，标志着存算一体叩开万亿级汽车市场的大门；在数据中心，d-Matrix的Corsair芯片出货和Lightmatter的光子技术商业化，展示了存算一体在大模型推理时代的巨大潜力；在端侧多模态赛道，智芯科的AT680已量产出货50万片、AT690实现语音+视觉多模态融合，展现了SRAM数字存算一体的商业化活力；在前沿探索上，清华-华为-字节跳动联合发布的28nm混合存内计算芯片，则代表了中国力量在全球最高学术舞台上的亮相。

与此同时，挑战依然严峻：模拟计算的精度限制、存算一体EDA工具链的成熟度、大算力场景下的良率控制，以及与现有软件生态（CUDA等）的兼容性问题，都需要整个行业共同攻克。

但趋势已不可逆转。当摩尔定律逼近物理极限，当大模型对算力的需求永无止境，当能效比成为AI芯片最重要的竞争维度——存算一体，正在成为AI计算史上最重要的一次架构革命。

Edge AI Pulse·2026年4月

本报告综合公开资料整理，如有疏漏欢迎指正。不构成任何投资建议。