推广 热搜: 采购方式  甲带  滤芯  气动隔膜泵  减速机型号  带式称重给煤机  无级变速机  链式给煤机  履带  减速机 

国内外存算一体芯片公司全景报告

   日期:2026-04-22 09:23:53     来源:网络整理    作者:本站编辑    评论:0    
国内外存算一体芯片公司全景报告

一、为什么存算一体如此重要?

传统计算架构以·诺伊曼架构为核心:存储单元与计算单元相互分离,数据在两者之间频繁搬运。英伟达CEO黄仁勋曾指出,“GPU有七成时间在等待数据,这形象地描绘了内存墙Memory Wall)问题——数据搬移的能耗和时间,严重制约了芯片算力的进一步提升。

存算一体(Compute-in-Memory, CIM)的核心理念,是将计算直接嵌入存储单元内部或附近,从根本上减少甚至消除数据搬移。根据存储与计算融合程度的不同,业界通常将其分为三大技术流派:

1. 近存计算(Near-Memory Computing

仓库(存储)与车间(计算)同园区——物理距离大幅缩短,数据搬运功耗和延迟显著降低,但计算仍在独立单元完成。典型方案包括HBM(高带宽内存)+ GPU Chiplet协同封装,以及美光、三星推动的HMC(混合存储立方体)路线。

2. 存内处理(In-Memory Processing

在存储内部嵌入初加工能力,对数据进行局部预处理或过滤,减少传向计算单元的数据量。典型的存算近邻设计,已在部分AI推理芯片中实现商用。

3. 存内计算(In-Memory Computing / Compute-in-Memory

将整条计算流水线搬入存储阵列,数据在同一位置完成乘加运算,无需搬移。这是融合程度最高、技术难度最大、但能效提升潜力也最大的方案,被认为是AI芯片的终极形态之一。

据市场研究机构预测,2025年全球存算一体芯片市场规模已突破120亿美元,其中中国占比约30%。随着大模型推理需求的爆发,存算一体正从学术前沿快速走向产业落地。

二、技术路线全景:五大技术派系

根据底层存储介质和电路实现方式的不同,存算一体芯片可分为以下五条主要技术路线:

三、国际存算一体公司巡礼

全球存算一体芯片创业生态以美国最为活跃,集中在硅谷周边。以下是按技术路线分类的主要国际玩家:

3.1 数据中心与大算力阵营

d-Matrix(美国·加州)

d-Matrix是目前最受关注的存算一体创业公司之一,采用数字存算一体DIMC)路线,专注AI推理加速。

融资规模:202511月完成2.75亿美元融资,估值20亿美元。

核心产品:Corsair芯片(数字存算一体,202411月开始出货);Raptor推理平台(2025年)。

技术亮点:20259月在Hot Chips大会上发布3D堆叠数字存内计算(3DIMC)技术,与Alchip合作实现商业化,宣称比HBM4方案徫10倍。每台服务器可运行高达1000亿参数模型。

商业化状态:已开始向客户发货,与数据中心客户深度合作。202511月完成2.75亿美元C轮融资,估值达20亿美元,成为国际存算一体领域估值最高的公司。本轮由全球财团联合领投,此前已获微软投资。Corsair-X采用3D堆叠数字内存计算(3DIMC)技术,带宽达150TB/s,每台服务器可运行高达1000亿参数模型。与SK海力士合作高带宽内存方案。

Untether AI(加拿大·多伦多)

Untether AI成立于2018年,以"内存计算"架构闻名。专注于SRAM-based数字存算一体芯片,面向低功耗AI推理场景。团队工程化能力强,已有多代产品路线图推进中。20256月,AMD收购了Untether AIAI硬件和软件工程师团队。

技术路线:全数字SRAM存算一体,精度可编程。

应用定位:边缘推理、终端设备,已与多家OEM展开合作。

202565日,AMD宣布收购Untether AIAI硬件和软件工程师团队(非整体收购)。公司核心产品speedAI240集成1400RISC-V内核,推理性能达2 PFLOPS

TetraMem(美国·加州)

由多位顶级学术和工业界专家创立,是模拟存算一体领域的技术先驱,核心技术基于ReRAM/忆阻器。

技术亮点:能效比超过20 TOPS/W,已在28nm制程上验证。

商业模式:IP授权为主,向大型芯片公司提供存算一体IP核。

商业化状态:处于技术授权阶段,已与多家芯片厂商建立合作。

20242月在《Science》杂志发表重大突破,实现忆阻器任意高精度模拟计算;202412月与Andes晶心科技合作,整合RISC-V向量处理器,支持5nm3nm及更先进工艺。与台积电等代工厂合作,推进先进制程落地。

3.2 边缘AI与终端低功耗阵营

Mythic(美国·德克萨斯)

模拟存算一体的早期明星公司,采用基于Flash存储的模拟计算方案。技术成熟度较高,在边缘视觉AI领域积累深厚。

核心产品:GEN 1 APU模拟存算一体芯片(202512月发布),已进入多家边缘视觉客户供应链。

技术亮点:模拟计算在特定功耗预算下可提供极高的MAC(乘加运算)密度,适合always-on视觉场景。

商业化状态:产品已出货。202512月完成1.25亿美元融资;20262月与本田(Honda)宣布联合开发车规级模拟AI SoC

GEN 1 APU采用SST SuperFlash memBrain技术,能效比达120 TOPS/W,模拟计算将AI参数直接存储在Flash单元中,无需权重数据搬移。20263月与Microchip/SST达成战略合作,将SuperFlash memBrain技术应用于AI计算。已进入多家边缘视觉客户供应链。

EnCharge AI(美国·新泽西)

采用电容式模拟存算一体方案,目标是PC端和移动端的AI加速。

核心产品:EN100芯片,面向轻薄本和AI PC

技术亮点:模拟计算在端侧能效方面优势显著。

商业化状态:积极与PC OEM厂商接触,产品导入验证中。

Lightmatter(美国·加州)

将光子技术引入计算,采用硅光子进行矩阵运算,堪称存算一体领域的另类玩家

核心产品:Passage M1000光子超级芯片(20254月发布),可实现全球最快AI互连。

技术亮点:光速矩阵运算,无电阻电容延迟,极低功耗,特别适合AI集群内部的高速互连。

商业化状态:已与SK海力士等存储大厂合作推进商业化,估值达44亿美元。

3.3 欧洲与以色列阵营

Axelera AI(荷兰·埃因霍温)

欧洲最活跃的AI芯片创业公司之一,采用数字存算一体(Digital In-Memory Computing+RISC-V架构的异构方案。

核心产品:Metis AI平台,面向边缘AI推理。

技术亮点:数字存算计算单元与RISC-V控制核心深度集成,提供完整的边缘AI解决方案。

商业化状态:积极拓展欧洲及全球客户。

NeuroBlade(以色列·特拉维夫)

专注于近存计算(Near-Memory Computing)路线,主要面向数据中心和大型数据库分析场景。202510月,NeuroBladeAWS(亚马逊云科技)收购。

技术路线:近存计算,在存储控制器附近集成专用计算引擎。

应用场景:大数据分析、数据库加速,已有多家合作伙伴。

Sagence AI(美国·加州)

模拟存算一体技术公司,专注于减少数据搬移以提升AI推理效率,已获数千万美元融资。

Rain Neuromorphics(美国·加州)

融合神经形态计算与忆阻器技术,探索类脑计算与存算融合的新路径,研究属性较强。

四、国内存算一体核心玩家

中国是全球存算一体技术最为活跃的市场之一。国内企业覆盖了从超低功耗端侧到大算力智驾的全场景,技术路线也极为多元。2026ISSCC会议上,清华大学、华为与字节跳动联合发布了28nm混合存内计算芯片,推荐系统能效提升1-2个数量级,标志着国内学术与产业界的深度协同。

4.1 大算力阵营(智驾/数据中心)

后摩智能(上海)

后摩智能创立于2020年,是国内存算一体AI芯片领域的领军企业。基于先进的存算一体架构和存储工艺,致力于突破芯片性能与功耗瓶颈,加速AI技术普惠落地。

自研天枢架构,Int8精度下AI核心能效比达15 TOPS/W。鸿途H30芯片(256 TOPS算力,35W功耗)已完成车规认证并量产;后摩漫界M50160 TOPS10W)面向端侧AI2025年实现量产,已与联想、科大讯飞、中国移动等建立合作。投资方包括中国移动产业链发展基金(中移数字新经济产业基金、上海中移数字转型产业基金)。

亿铸科技(苏州/上海)

亿铸科技是国内ReRAM(阻变存储器)存算一体路线的代表性企业,核心技术基于忆阻器介质,面向数据中心和云计算场景。

技术路线:ReRAM存算一体,拥抱RISC-V生态。

核心进展:2023年成功流片并点亮原型验证芯片,计划2026年推出国产AI算力卡。

应用定位:数据中心大模型推理、云计算加速。

202510月完成A轮融资。国内唯一能够自主设计并量产基于新型存储全数字存算一体大算力AI芯片的公司,破解"存储墙""能耗墙""编译墙"瓶颈。布局低空经济等新兴领域,拥抱RISC-V生态。

4.2 端侧AI与低功耗IoT阵营

知存科技(北京)

知存科技是国内存算一体商业化最成功的公司之一,采用NOR Flash路线,已实现百万颗级别的芯片出货。

WTM2101芯片(300词连续识别功耗小于1mA,含麦克风数据处理)已实现百万颗级别出货。WTM-8系列(至少24 TOPS算力,功耗仅为市场同类方案的10%,支持10ms超低延迟Video See Through)。WTM8600新一代视觉AI正在研发中。与科创板上市公司安凯微深度合作。2024年荣获财联社"最具投资价值奖"

炬芯科技(珠海)

炬芯科技采用SRAM存内计算路线,构建CPU+DSP+NPU三核异构架构,率先实现了存内计算技术在品牌音频产品中的商业化落地。

ATS323X芯片:已落地品牌客户旗舰无线麦克风和无线电竞耳机。

ATS362X芯片:切入专业音频头部品牌供应链,已在品牌耳机和麦克风中跑量。

年报披露:率先实现存内计算技术商业化应用,是目前存算一体商业化进展最快的细分场景之一。

模数混合SRAM存内计算(MMSCIM),CPU+DSP+NPU三核异构架构,支持全链路48KHz@32bit高清音频通路,48K双麦AI ENC降噪算法,2.4G私有协议端到端延迟小于20msATS323X系列已实现品牌客户量产(旗舰无线麦克风、无线电竞耳机);ATS362X切入专业音频头部品牌供应链。荣获"2025年度中国IC设计成就奖";入选"2025年度中国数智产业创新产品榜"

智芯科(杭州/合肥)

智芯科(AISTARTEK)创立于2019年,是国内SRAM数字存算一体路线的重要代表。创始团队均来自UTSTARCOMAdobeMarvell、展讯等国内外知名半导体企业,平均行业经验30年。公司专注于基于SRAM的精度无损数字存内计算,产品线覆盖从超低功耗端侧到具身智能大算力的全场景。

AT68022nm7.8 TOPS/W,多模态存算一体AI芯片,语音+视频,已量产50万片)。AT69022nm,稀疏优化后24 TOPS/W,首款支持语音+视频的多模态芯片,20248月成功点亮并跑通端侧语音和图像模型)。AT8600(超大算力,面向大模型、低空飞行、自动驾驶SoC)。已与科创板上市公司炬芯科技深度合作(IP授权+独立SoC)。

苹芯科技(北京)

苹芯科技专注于存算一体AI芯片设计与应用,2025年发布了两款重磅产品,在边缘AI领域取得显著突破。

PiMCHIP-N300:存算一体NPU芯片,功耗低至毫瓦级,面向端侧AI推理。

PiMCHIP-S300:多模态智能感知SoC芯片,深度融合存算一体技术与多处理器架构,适用于智能家居、智能穿戴等场景。

制程进展:在28nm22nm制程节点上首次实现存算一体技术产品化,已交付客户使用。

获奖荣誉:202511月获AABI火炬技术转移奖。未来规划:联合代工厂推进eNVM工艺量产,构建存算+”生态。

PiMCHIP-N30028nm/22nm存算一体NPU,毫瓦级功耗,面向端侧AI推理)。PiMCHIP-S30028nm/22nm多模态智能感知SoC,深度融合存算一体与多处理器架构)。20248月发布国内首颗商用端侧28nm存算一体AI芯片;20255月推出N300存算一体NPU,突破传统MCU算力瓶颈。已交付客户使用,面向智能家居、智能穿戴等场景。

4.3 新型存储介质与标准阵营

微纳核芯(北京)

微纳核芯孵化于北大信研院,首创三维存算一体(3D-CIM)架构,技术路线独特,获得兆易创新战略入股。

核心技术:3D-CIM(三维存算一体),将计算逻辑与存储垂直堆叠,实现极致融合。

性能数据:相比传统架构,可实现4倍以上算力密度提升、10倍以上功耗降低。

标准主导:牵头启动全球首个RISC-V存算一体标准研制,引领行业生态建设。

商业进展:已与多家手机龙头厂商深度合作,推进存算一体芯片在移动端的落地。

资本动态:20263月获兆易创新战略入股,强化存储-计算协同生态。

3D-CIM(三维存算一体),在存内计算基础上创造性加入"近存计算""RISC-V存算",可扩展至先进制程(22nm及以下)。相比传统架构,可实现4倍以上算力密度提升、10倍以上功耗降低。受中国RISC-V工委会任命,牵头全球首个RISC-V存算一体标准研制。202510月完成超亿元B轮融资(蓝驰创投领投,中芯聚源、锦秋基金等)。已完成多个客户导入,与多家手机龙头厂商深度合作。

昕原半导体(上海)

昕原半导体是国内唯一实现28nm ReRAM存储芯片量产的企业,技术可用于VR/AR等新型终端设备。

技术路线:阻变存储器(ReRAM),28nm制程已实现量产。

资本背景:字节跳动曾战略入股,技术方向与元宇宙终端高度契合。

应用方向:VR/AR、智能穿戴等新型终端,兼顾低功耗与高计算密度需求。

国内唯一实现28nm/22nm ReRAM存储芯片量产的企业,Fab-lite模式,自建先进制程ReRAM中试后道生产线。覆盖器件材料、工艺制程、芯片设计及中试量产全链条,与CMOS工艺和常规Foundry兼容。20243月完成近亿美元Pre-A轮融资(上海联和投资领投);20259月获阿里巴巴(蚂蚁集团)、字节跳动战略投资;20263月完成C轮融资(蚂蚁集团等参与)。

五、商业化全景:谁已跑通从01

综合各公司公开信息,以下按商业化成熟度对主要存算一体公司进行分层梳理:

六、大模型时代的演进路径

存算一体技术并非一蹴而就,其在AI时代的价值将分阶段释放:

第一阶段:专用加速器(当下~2027年)

存算一体芯片作为GPU万卡集群的补充,处理推理任务中的特定计算密集型操作(如矩阵乘法)、数据预处理和推荐系统。与GPU协同而非替代,共同构成异构计算底座。

第二阶段:深度融合(2027~2030年)

随着Chiplet技术和3D堆叠封装工艺成熟,存算一体单元将与GPU/NPU通过先进封装深度融合,形成近存+存内的混合架构,整体系统能效再提升一个数量级。

第三阶段:主导万卡集群(2030年以后)

ReRAMMRAM等新型存储介质成熟量产,存算一体将从补充角色升级为主导角色,彻底重构AI计算集群的基础架构,颠覆延续七十年的冯·诺伊曼架构,推动AGI时代算力基础设施的范式转变。

七、总结与展望

存算一体正从学术前沿走向产业爆发的前夜。2025年全球120亿美元市场规模、中国约30%的占比背后,是国内外企业从不同技术路线切入、竞相推进商业化的生动局面。

在端侧,知存科技百万颗出货、炬芯科技品牌落地,证明存算一体已具备真实商业价值;在智驾领域,后摩智能完成车规认证并量产,标志着存算一体叩开万亿级汽车市场的大门;在数据中心,d-MatrixCorsair芯片出货和Lightmatter的光子技术商业化,展示了存算一体在大模型推理时代的巨大潜力;在端侧多模态赛道,智芯科的AT680已量产出货50万片、AT690实现语音+视觉多模态融合,展现了SRAM数字存算一体的商业化活力;在前沿探索上,清华-华为-字节跳动联合发布的28nm混合存内计算芯片,则代表了中国力量在全球最高学术舞台上的亮相。

与此同时,挑战依然严峻:模拟计算的精度限制、存算一体EDA工具链的成熟度、大算力场景下的良率控制,以及与现有软件生态(CUDA等)的兼容性问题,都需要整个行业共同攻克。

但趋势已不可逆转。当摩尔定律逼近物理极限,当大模型对算力的需求永无止境,当能效比成为AI芯片最重要的竞争维度——存算一体,正在成为AI计算史上最重要的一次架构革命。

Edge AI Pulse·20264

本报告综合公开资料整理,如有疏漏欢迎指正。不构成任何投资建议。

 
打赏
 
更多>同类资讯
0相关评论

推荐图文
推荐资讯
点击排行
网站首页  |  关于我们  |  联系方式  |  使用协议  |  版权隐私  |  网站地图  |  排名推广  |  广告服务  |  积分换礼  |  网站留言  |  RSS订阅  |  违规举报  |  皖ICP备20008326号-18
Powered By DESTOON