社会热点
行业观察 | 国产MRAM存算一体芯片140 TOPS/W的背后:华中科技大学冯丹团队翻越“喻家山”
2026-06-26 10:43
行业观察 | 国产MRAM存算一体芯片140 TOPS/W的背后:华中科技大学冯丹团队翻越“喻家山”

在人工智能模型参数动辄千亿、万亿的时代,传统冯·诺依曼计算架构正遭遇前所未有的 “存储墙”瓶颈 ——计算单元与存储单元分离,导致数据在两者间频繁搬运,其功耗占比高达总能耗的90%以上。华中科技大学信息存储系统教育部重点实验室冯丹教授团队,自2006年起便前瞻性地瞄准这一难题,历经近二十年从材料、器件、架构到系统的全栈式攻关,于2024年11月底成功流片“喻家山一号”存算一体芯片

冯丹教授是华中科技大学副校长、计算机学院院长,国家级人才计划入选者及IEEE Fellow。她领衔的教育部信息存储系统重点实验室是中国信息存储领域顶尖的研究基地之一,拥有50余名教师及300余名研究生的科研力量。团队在存储系统领域有着深厚的学术与产业积淀:早在2014年便凭借“主动对象海量存储系统”获得国家技术发明奖二等奖;2023年度再获国家科技进步奖二等奖。近年来,团队在大数据存储方向形成了一系列核心技术突破,累计获授权发明专利213项,制定国家标准9项(其中牵头6项)。冯丹教授始终强调 “国家需求就是科研工作者努力的方向” ,其研究主线始终聚焦于解决存储技术“卡脖子”问题,推动核心技术的国产化替代。

冯丹教授团队是一支典型的学科交叉科研团队,核心成员来自武汉光电国家研究中心、光学与电子信息学院、计算机科学与技术学院等多个单位。王芳教授担任计算机学院存储所所长及信息存储研究部执行主任,深耕海量网络存储系统;华宇教授为国家杰青获得者,国际上最早提出元数据智能存储结构的学者之一,主攻新型存储器件与高性能存储系统;邹雪城教授任物联网研究院院长及武汉国际微电子学院执行院长,专长于超大规模集成电路;游龙教授长期从事自旋电子技术及自旋存储器研究;刘冬生教授为国家级领军人才,主攻后量子密码芯片与高速互连集成电路;秦磊华教授任计算机学院副院长,系教育部计算机类专业教指委委员;胡燏翀教授、谭支鹏教授均在存储系统领域开展深入研究;童薇教授、陈俭喜副教授和施展副教授作为核心骨干,深度参与了“喻家山一号”的研发及国家科技进步奖项目。这支跨学科团队在存储系统领域持续产出重要成果。

面对AI算力瓶颈,工业界初期多采用将计算单元与SRAM缓存更紧密集成的近存计算路线,虽易于适配现有工艺,但SRAM密度有限且断电易失。冯丹团队则在技术路线选择上展现出战略定力,毅然选择了更难走的MRAM(磁性随机存储器)非易失性存储技术路线。要理解其原理,可以把它想象成一个由“磁隧道结”构成的微缩物理系统:数据的“0”或“1”由磁性材料的磁化方向决定,计算时直接在存储单元上施加电压,根据其阻值变化得出结果。另一种并行的ReRAM(阻变存储器) 则更像一个“可变电阻”,通过电压改变内部“导电细丝”的通断来改变阻值代表数据,计算时直接读取电流大小得出结果。两者的共同目标都是让数据“原地办公”,就地完成计算。这一抉择意味着必须攻克器件级逻辑运算延迟、非易失介质擦写耐受度低等根本性难题。团队从底层机制出发进行了长期理论验证:利用自旋轨道矩配合集成的面内奥斯特场,在单个MRAM器件内部实现了无须初始化的完整布尔逻辑功能,从物理层面证明了低延迟存内计算的可行性;针对NVM擦写次数有限的痛点,设计了写优化存算一体加速器架构及多值存储读写编码方案,仿真测试表明软硬件协同优化能将器件写入频次降至原来的15%左右,显著延长了硬件工作寿命。这些底层理论成果为后续的大规模阵列集成与物理流片扫清了关键障碍。

理论成果最终在“喻家山”系列测试芯片上完成了工程转化。2024年1月,团队提交芯片数据。十个月后,封装好的芯片送到实验室。团队同步研发了两款芯片,一款基于MRAM介质,另一款基于ReRAM介质。初期的板卡点亮测试阶段,ReRAM芯片比较顺利,能正常工作;但MRAM芯片连续一个月测试没有任何反应——“示波器测量不到任何信号,输入激励后也没有输出,虽然能上电,但无法激活”。据童薇教授透露,当时实验室气氛压抑到了极点,冯丹带领团队一遍遍排查,最终发现是芯片的一个引脚定义弄反了。“那一刻,悬着的心才重重落下”。最终,“喻家山一号”芯片单芯片面积不足2厘米见方,基于全国产28nm工艺设计实现,实测单核容量达到64Mb,为全球已报道的最大容量MRAM存算一体芯片算力达30.10 TOPS,能效比达到140.54 TOPS/W。作为对比,英伟达A100的能效比约为3.8 TOPS/W华为Ascend 310P约为10.2 TOPS/W——“喻家山一号”的能效比分别是它们的37倍和近14倍。冯丹解释,在传统芯片上数据必须像搬运工一样从存储区长途跋涉到计算区,消耗了90%以上的能量和时间,而“喻家山一号”能让数据“原地办公”,直接在存储单元完成计算。2025年,随着ChatGPT和DeepSeek相继上线,冯丹决定做一个大胆的尝试:将1.5B参数规模的模型部分计算任务卸载到“喻家山一号”上运行。测试结果验证了芯片具备支撑大模型推理的系统级能力。冯丹解释:“就像CPU需要编译器将高级语言转化为机器码一样,我们的存算一体芯片也需要一套专用编译工具链,将目标操作转换为芯片可理解的指令”。团队完成了从芯片设计到软件工具链的全套工作。目前,“喻家山二号”芯片的研发已进入冲刺阶段。2026年6月20日,实验室里电流嗡鸣声不绝于耳,冯丹表示“喻家山二号”将在现有技术基础上进一步提升算力与能效,优化存储容量与集成度。

存算一体架构的商业化不仅依赖硬件性能,更需要重构产业标准与应用生态。冯丹团队积极与华为、海康威视、中兴通讯等企业开展深度合作。2023年度国家科技进步奖获奖项目中,华为技术有限公司、杭州海康威视系统技术有限公司、中兴通讯股份有限公司、中移(苏州)软件技术有限公司均为主要完成单位。团队的技术成果已成功转化为23种高质量产品,远销全球51个国家,广泛应用于安防、国防等重要领域。在应用场景端,基于芯片极低的静态功耗特性,团队正与企业推进小批量试产。团队成员童薇教授透露,这块新型芯片很快会被装入智能摄像头——识别陌生人、异常情况时,摄像头只把结果传给你,画面不出家门,隐私信息更安全。目标市场定位于基于RISC-V处理器的终端硬件(如智能电视、电脑)、智能摄像头、家庭机器人等物联网设备。在产业协同方面,由于国内存算一体技术路线长期缺乏统一规范,冯丹团队牵头联合国内科研院所与龙头企业,系统梳理了技术架构、性能指标与测试方法,正式提交了存算一体技术的国家标准申报材料。值得注意的是,2025年9月,由中国电子工业标准化技术协会RISC-V工作委员会主办的RISC-V存算一体产业论坛已正式启动了全球首个RISC-V存算一体标准的研制工作。冯丹还在全国两会上发出呼吁:支持湖北打造世界级存算一体化产业基地

放眼国内存算一体赛道,冯丹团队并非孤军奋战。中国科学院微电子所设计并流片验证了一款具有16个计算核心的近阈值RRAM存算一体芯片,计算能效可达55.21至88.51 TOPS/W。清华大学在忆阻器存算一体芯片领域持续深耕,其研制的支持片上学习的忆阻器存算一体芯片,在相同任务下能耗仅为先进工艺下专用集成电路系统的3%。在产业化方面,后摩智能已发布即将量产的端边大模型AI芯片“漫界M50”,这是一款单芯片就能运行百亿参数大模型的存算一体芯片。“喻家山一号”采用全国产工艺,为国家开辟了一条特有的芯片技术路径。放眼全球市场,台积电依托强大产业资源在存算一体芯片产业化上走得很快,美国明尼苏达大学等技术团队也在同步探索,例如王建平教授团队研发出计算随机存取存储器(CRAM),基于磁性隧道结技术,数据可直接在内存阵列内处理。“我们起步不晚,这条路大家都在走,只是各有各的路径” ,冯丹说。

然而,必须客观看待其产业化壁垒。现阶段的测试芯片与当前主流的千亿参数大模型在绝对算力承载上仍有量级差距。MRAM芯片需要专门的后道生产线来实现,其先进制程下的良率控制与批量生产成本远高于传统CMOS工艺。从实验室的“小批量”到晶圆厂的“大规模量产”,良率提升和成本控制是巨大挑战。在软件生态方面,存算一体芯片需要全新的软件栈,团队已完成专用编译工具链的研发,但要实现与PyTorch、TensorFlow等主流AI框架的无缝对接,仍需长期生态建设。从边缘场景走向通用计算生态,仍需经历制造工艺长期迭代与软件框架的无缝迁移验证。总体而言,“喻家山一号”标志着中国在非易失性存算一体核心技术上的重大突破,为后摩尔时代打破“存储墙”提供了坚实的国产技术底座,其产业化进程虽任重道远,但已在关键节点上迈出了决定性一步。

发表评论
0评