推广 热搜: 采购方式  甲带  滤芯  带式称重给煤机  减速机型号  气动隔膜泵  无级变速机  链式给煤机  履带  减速机 

机构纪要|存算一体与云边端一体化行业趋势

   日期:2026-04-29 00:18:48     来源:网络整理    作者:本站编辑    评论:0    
机构纪要|存算一体与云边端一体化行业趋势

「机构眼·调研内参」机构投研资源平台

加入社群·微信:Buddha_Research

机构音频纪要 部分转译展示

发言人 问:醇酸一体芯片相较于传统计算芯片有哪些优势,以及目前在国内外的发展状况如何?

发言人 答:醇酸一体芯片是一种旨在通过将存储和计算结合在一起,以突破冯诺依曼瓶颈、降低成本和提高效能的技术路径。相较于传统计算芯片,它更接近于AI芯片最理想的形态——存算合一。目前,尽管纯算一体技术门槛较高且降低成本的技术难度较大,但在AI产业链对算力需求日益增长的背景下,该技术受到越来越多的关注。国内外都有公司在研发存算一体芯片,如国内有少数企业尝试这一方向,而在美国,英伟达等公司在GTC大会上也对此有所动作,通过收购或深度合作如brook GLK等存算一体芯片公司来丰富其产品线,并计划进一步扩展到专用芯片领域。

发言人 问:存算一体芯片与GPU在算力利用和成本方面有何不同?

发言人 答:GPU在设计上虽然实现了计算与高带宽显存的结合,但其在很多行业的推理场景中存在算力冗余的问题,即花费高昂购买的GPU芯片中,真正用于推理作业的部分可能只占60%,其余40%处于闲置状态,导致了用户既要承担额外的算力采购成本,也要承担更高的能耗使用成本。而存算一体芯片则致力于解决这一问题,预计未来能将通用芯片的功耗和价格降低至少50%,同时保证一定的计算速度,从而实现算力普惠的目标。

发言人 问:存算一体芯片的主要技术路线有哪些,以及其与GPU在性能和部署成本上的对比如何?

发言人 答:存算一体芯片主要分为底层物理材料的不同技术路线,以美国group为例,他们采用SRAM介质进行存储并放置计算单元。然而,SRAM的物理存储容量有限,限制了单颗芯片处理大型模型的能力,导致其部署成本比GPU高10到15倍。尽管如此,基于SRAM的存算一体芯片在特定应用场景下,如模型推理速度上能比GPU快5到10倍,满足对速度有极致要求的用户需求,占据推理需求约50%的市场份额。此外,还有其他材料如DRAM和MRAM的存算一体芯片在探索中,但大规模降低物理部署成本和使用成本的路径尚不明确。

发言人 问:M浪MM在未来的趋势中为何被认为是一个有前景的方向?基于先进制程的M浪MM芯片在性能上会有哪些提升?

发言人 答:M浪MM作为非主流但极具前景的趋势,其优势在于其材料特性最接近物理器件本身,并且即使在断电后也能保持存储信息不丢失。此外,M2M芯片具有抗辐射和太阳光特性,适合太空计算场景,功耗也较低,符合马斯克、英伟达等公司在太空算力方向的发展需求。基于8纳米或7纳米等先进制程的M浪MM芯片,单颗芯片的算力预计可以翻倍甚至更多,存储密度也会显著提升。这将使M浪MM芯片在模型推理方面的部署成本相比GPU降低到约五倍,同时速度更快,功耗更低。

发言人 问:现阶段及未来两三年内有望落地的存算一体芯片有哪些?

发言人 答:现阶段和未来能见到的存算一体芯片主要包括基于现有技术的s RAM以及预计明年出现的基于M浪MM工艺制作的存算一体芯片。目前m RAM的存储容量相较于s RAM较小,受限于材料和技术制程,但随着7纳米、6纳米甚至5纳米先进工艺的应用,有望在明年由初创公司推出基于m RAM流片的存算一体芯片。

发言人 问:使用M浪MM存算一体芯片与s RAM相比,在模型推理部署成本上的差异是什么?

发言人 答:部署同等参数量大小的模型推理时,M浪MM存算一体芯片所需数量和物理成本与s RAM类似,都会较高,但主要取决于材料成本和芯片间高速互联技术。如果未来能采用国内公司研发的光交换、光互联等先进技术,将有助于降低集群部署的成本。

发言人 问:未来存算一体芯片的成本和性能预期如何?

发言人 答:预计未来存算一体芯片的成本能够压到5万块钱以下,售价至少比市场上主流的英伟达H200、A100芯片便宜一半以上,且功耗更低。s RAM架构的存算一体芯片有望成为弥补英伟达整个算力体系中对模型推理成本要求较低短板的部分。

发言人 问:目前DRAM和M浪MM存算一体芯片各自的优缺点是什么?除了M浪MM和DRAM存算一体芯片外,还有哪些其他架构或性质的芯片?

发言人 答:M浪MM存算一体芯片目前无法进行模型训练,只能做推理,这是其天生的缺陷,因为数据写入速度较慢。而DRAM存算一体芯片理论上能够实现训练和推理,但在物理成本和性能上可能存在瓶颈。除了上述存算一体芯片外,还存在量子专用芯片这一具有潜力的方向,预计在未来2到3年或3到5年内可能出现基于模拟量子或超导量子的专用计算芯片。不过,近存计算虽然存算融合,但在严格意义上并不算作存算一体,因为存储和计算并未放在同一颗芯片上。

发言人 问:存算一体芯片落地商用方面,当前面临的主要挑战是什么?

发言人 答:目前在落地商用上,主要难点在于底层存储材料特性导致的存储容量不足以及与主流开发者习惯的GPU生态系统的兼容性问题。此外,芯片的互联也是一个瓶颈,不仅芯片厂商需要自研高效的片间互联技术,对于合作伙伴来说,配合存算一体芯片进行互联的研发也是个挑战,因为这种芯片在架构、通信协议和IP接口等方面与传统硅基芯片不同。

发言人 问:从商业化角度来看,目前存算一体芯片主要的难点在哪里?如果从每瓦输出token数这种效率来看,国产存算一体芯片能否达到group的水平?

发言人 答:目前看瓶颈主要在存算一体底层的存储材料特性,受材料限制,其存储容量尤其是与高带宽存储相比,容量较低,这直接影响到部署模型时的参数大小。如果参数无法全部放入,会导致需要更多芯片,从而提高成本,这是最大的瓶颈。这个问题没有直接给出具体答案,但提到的是中美两国预计明年都会推出自己的存算一体芯片,并且从模型效率角度看,国产存算一体芯片正在逐渐接近甚至有可能达到与group相当或更好的水平。然而,实际达到的性能还需考虑包括存储容量、功耗、成本等因素,并且在软件适配和生态系统兼容性上,国内外芯片也存在一定的差距。

发言人 问:从性价比角度看,中国和美国在存算一体芯片方面目前的情况如何?在硬件优势方面,中国与美国有何不同?

发言人 答:目前中国和美国在存算一体芯片的性价比上没有明确的数字对比,因为该领域还未实现真正的商用,缺乏直接的参照物。但从各行业智能体的发展趋势来看,中国在包括金融、政府治理、生物医药等在内的多个领域比美国走得更快,因此在应用层面和部署成本上有望在性价比上超过美国。硬件优势方面相对较小。国内有华为等企业在研发超节点,采用ARM CPU、自研计算芯片、网络和存储等全套技术,甚至在某种程度上影响了英伟达下一代产品的架构设计。因此,在硬件层面,中国存算一体芯片未必会落后于美国,甚至可能在超节点方面领先。

发言人 问:目前我国有哪些主要企业参与存算一体芯片的设计和代工?

发言人 答:国内参与存算一体芯片设计和代工的企业不多,但了解到有初创公司如寒武纪(已更名为“沐芯”)及其技术路线,以及杭州的一家名为“三个字”的公司、北大物理系背景的两家初创企业也在做存算一体芯片。代工方面,华虹和中芯国际完全有能力进行存算一体芯片的代工。

发言人 问:国产存算一体芯片能否采用与英伟达不同的协议如NPU或GPU架构?

发言人 答:目前国内的NPU(如华为NPU)、ASIC架构(如百度昆仑芯、穗源科技的ACK架构)以及航迹等芯片都是基于GPU或类似GPU的产品设计路线,它们依赖高带宽显存进行数据读取和存储,无法实现纯数据计算,因此无法做出存算一体的芯片。

发言人 问:存算一体芯片是否为中国在AI领域实现弯道超车提供机会?

发言人 答:存算一体芯片确实为中国提供了一个通过区别于英伟达定义的GPU架构,以及减少对先进制程依赖的机会,以低成本、成熟制程、低功耗的优势满足中小用户模型推理需求的细分赛道。叠加中国在行业智能体方面的优势,有望在性价比、易用性和灵活性上超过美国。

发言人 问:在依赖先进制程的算力芯片领域,特别是对于模型训练,英伟达是否面临与其他公司的差距?

发言人 答:是的,在这一领域,英伟达确实会与华为等拥有创新架构的公司存在差距。华为的384超节点就是一个例子,这代表了在大芯片上的“弯道超车”方向。

发言人 问:对于存算一体底层材料的选择,您认为英伟达GLK采用SRAM的路线是否理想?存算一体芯片需要满足哪些关键需求?

发言人 答:不认为英伟达在GLK上选择SRAM路线是最佳方案。他可能是由于找不到更好的选择而选择了GLK。英伟达肯定还会寻找第二个合作伙伴以解决基于SRAM成本较高的问题。存算一体芯片需满足国内几个关键刚需,包括速度快和低成本。目前虽然可以实现速度,但降低成本是瓶颈。预计英伟达会寻找其他供应商来降低基于SRAM的成本问题。

发言人 问:国内在存算一体芯片领域的发展情况如何?

发言人 答:国内在存算一体芯片方面也有多种技术路线并存的趋势,例如mRAM、sRAM甚至dRAM的进一步挖掘,以及新的底层架构设计。这将使得中国在成本和推理速度上实现较大降低,与美国的竞争格局类似,多种技术路线将共存发展。

发言人 问:英伟达在研发过程中可能采用哪些替代技术,并为何优先考虑mRAM和rRAM?

发言人 答:英伟达可能首先考虑mRAM,其次是rRAM,最后是dRAM。mRAM具有数据非失性、持久性和抗辐射等优势,物理特性上更适合高端应用。尽管目前mRAM在单颗芯片存储容量和部署成本上相较于sRAM存在挑战,但通过先进的制程设计和3D封装技术有望提高其性能。rRAM也是一个潜在的技术路线,尤其是在航天器等严苛环境下有潜在应用价值。

发言人 问:在国内,特别是在芯片互联方向上,目前我们的技术水平处于什么水平?

发言人 答:目前国内在芯片互联技术方面,特别是在光交换和光互联领域,已经达到了与美国相当甚至领先的地位。例如上海矽智公司在光互联和光计算方面已有实际案例,并且在前沿技术上领先于英伟达。但在基于传统高速网卡和私有协议(如NV link)的卡间互联方面,国内相较于英伟达仍稍落后一些,因为英伟达通过收购IB拥有成熟的高速网卡技术。

发言人 问:在服务器间互联的网络方案方面,国内又处于怎样的位置?

发言人 答:在服务器间互联的网络方案上,英伟达凭借其成熟的ID整套网络方案在全球范围内处于领先地位。而国内厂商自研的高速网卡虽然有200G、400G甚至800G的产品,但成本较高且未大规模应用,因此在传输速度上仍不如英伟达的产品。但在全新的计算服务器内通讯架构设计上,比如华为的超级点技术,国内已经做出了创新设计,绕过CPU实现了不同于传统架构的新架构设计,这在某种程度上甚至超过了英伟达。

发言人 问:目前在哪些领域对ASIC芯片的需求比较旺盛?

发言人 答:随着DPU等专用架构芯片技术的发展,原本在通用架构芯片生态下生存艰难的专用芯片在24年下半年特别是25年迎来活力。特别是在面对百模大战中层出不穷的各种大模型时,基于特定大模型优化的专用芯片能够更高效地适配如GPT这类主流大模型,从而在交通、能源、教育、科研、生物医药等行业智能体应用中崭露头角,实现良好的市场销售。

发言人 问:对于大模型和ASIC赛道,哪个更看好?

发言人 答:从长远来看,卖铲子(ASIC芯片)的更有前景。虽然通用大模型由几家大厂垄断,但基于特定行业需求的专用芯片将在中国市场有更多发展空间,尤其随着中国模型、算力及智能体的出海竞争,将孕育出更多小而美的专用芯片公司,在特定行业中建立竞争优势。相较于模型厂商,ASIC芯片厂商可能有更多的发展潜力。

 
打赏
 
更多>同类资讯
0相关评论

推荐图文
推荐资讯
点击排行
网站首页  |  关于我们  |  联系方式  |  使用协议  |  版权隐私  |  网站地图  |  排名推广  |  广告服务  |  积分换礼  |  网站留言  |  RSS订阅  |  违规举报  |  皖ICP备20008326号-18
Powered By DESTOON