近日,专注于3D架构AI云端大算力芯片研发的算苗科技对外宣布,其自主研发的3D TokenPU芯片A4E已于6月15日成功完成流片。这款芯片专为满足大模型推理需求而设计,基于自研的RISC-V架构,并采用成熟的国产工艺制造,旨在实现推理场景下的极致性能与更低的总拥有成本(TCO)。
算苗科技创始人兼CEO汪福全,同时也是中科院声学所国家重点实验室的博士,在接受采访时表示:“我们并非在既有的赛道上追赶,而是致力于开辟全新的方向。3D TokenPU专为大模型的Token处理而设计,无需过度依赖制程的缩小,就能实现算力密度和能效比的显著提升。”
A4E芯片的一大创新在于其存储与计算架构。它将8层存储晶圆垂直堆叠在计算逻辑晶圆之上,通过硅通孔(TSV)与凸点(bump)技术实现微米级的互联。这一设计将传统芯片间毫米级的传输距离大幅压缩,带来了超大的访存带宽,有效缓解了大模型推理过程中因数据搬运效率低下而导致的“数据饥饿”问题。
当前,AI算力的需求正逐渐从训练侧向推理侧转移。据德勤预测,长期来看,全球推理负载在AI算力中的占比有望超过80%。与此同时,开源的RISC-V架构正从“备选”逐渐走向“主流”,在数据中心及AI推理等场景中加速渗透。
车百智库的报告也指出,无论是电子电气架构还是智能驾驶解决方案,都高度依赖算力的合理分布与高效利用。算力已成为智能汽车的核心要素。与车端计算芯片相比,云端芯片需要承担更为复杂的训练任务和海量数据处理,因此其算力更为强劲。
据算苗科技的技术人士介绍,3D TokenPU目前主要面向云端大算力AI推理场景,可应用于头部大模型公司的超节点服务器、大型智算中心服务器,以及部分金融等专业领域需要私有化部署到本地的场景。随着汽车智联、智驾功能的日益普及,许多智能化处理同样需要通过云端服务器完成,其中就会涉及云端AI服务器,因此3D TokenPU这类推理芯片也将有机会在这些领域得到应用。
