GPGPU(General-Purpose Graphics Processing Unit,通用图形处理器),设计核心是利用GPU的大规模并行计算能力,来处理原本由CPU负责的、数据密集型的通用计算任务。
图:GPGPU性能指标示意(以英伟达A100为例)

注:图源灼识咨询
GPGPU和GPU比较——

其中,CUDA是英伟达于2007年前瞻性发布的一种通用并行计算平台和编程模型,它提供了一套简单的编程模型,让开发者能用近似C语言的方式,轻松地驾驭GPU内部成百上千个并行核心。CUDA在全球GPGPU开发市场占比已超过 80%,除此之外,市场上还有AMD的ROCm、Intel的oneAPI、开源的OpenCL等GPGPU编程平台。
GPGPU和其他主流的AI训练、推理芯片比较——

工艺方面,3D堆叠正努力打破AI计算的“内存墙”瓶颈。
“内存墙”瓶颈:传统2D布局下,数据在CPU/GPU和内存之间搬运消耗了大量时间和能耗,成了AI计算的拖累。
物理极限逼近:靠缩小晶体管尺寸来提升性能的摩尔定律正在放缓,先进制程的成本急剧攀升。
3D堆叠通过垂直堆叠多个芯片并利用硅通孔(TSV)或混合键合等技术实现紧密互连,显著提升了芯片的集成度、性能和能效。
图:3D堆叠把计算和存储芯片从“平房”盖成“楼房”

注:图源芝能智芯
目前,技术复杂性和高昂的开发成本是主要限制因素。3D堆叠芯片的设计和制造需要解决多芯片集成、热管理、信号完整性等问题,这对技术能力和资源投入提出了极高要求。
END
// 小编观点仅供参考 //



