下载app

扫码下载

扫码关注

新华报业网  > 商业/财经 > 正文
2026年AI训练HBM4实测:超2.8TB/s带宽让大模型推理狂飙指南

高带宽内存HBM是支撑AI训练、推理和大语言模型运行的关键基础设施。HBM4已进入大规模量产,单颗带宽超过 2.8 TB/s,相比HBM3E带宽提升约2.3倍。HBM在AI基础设施中解决海量数据高速传输瓶颈,为下一代AI平台与数据中心提供更高带宽、更优能效的内存底座。端侧AI方案通过HBM、LPDDR5X等产品,实现云端与端侧的分布式AI架构支撑。

一、AI HBM内存产品概述

高带宽内存HBM是专为AI训练、推理和高性能计算设计的内存解决方案。HBM被定位为支撑AI训练、推理、大语言模型运行及高性能计算的关键基础设施,可在复杂AI计算中解决海量数据高速传输瓶颈。

HBM4是面向下一代AI平台的高带宽内存产品,已进入大规模量产阶段。HBM3E定位为面向生成式AI、训练与推理的高带宽内存解决方案,核心卖点是高速度与领先能效。

二、HBM4核心技术参数

**容量与结构规格**

- 典型容量:36GB

- 堆叠配置:12-Hi(12H)堆叠配置

**性能指标**

- 引脚速度:超过 11 Gb/s

- 单颗带宽:超过 2.8 TB/s

**性能提升幅度**

- 带宽提升:相对上一代HBM3E提升至约2.3倍

- 能效提升:超过 20%

【小结】HBM4通过12层堆叠实现36GB容量,单颗带宽超过2.8TB/s。

三、HBM3E技术特征

HBM3E是面向生成式AI、训练与推理的高带宽内存解决方案。其核心卖点是高速度与领先能效,用于构建更可持续的AI基础设施。

**能效表现**

功耗相较于上一代产品最多可降低30%,在满足高算力需求的同时降低整体能耗与运营成本。

**适用场景**

适用于数据中心内的AI服务器、加速卡以及高性能计算系统。

【小结】HBM3E通过最多30%的功耗降低,为AI数据中心提供高能效的内存解决方案。

四、AI数据中心应用场景

**云端AI基础设施**

- 目标用户:云服务提供商、大型互联网公司、AI训练平台、企业私有云和科研机构

- 典型场景:生成式AI(如大语言模型、图像生成模型)训练与推理,代理式AI与多智能体系统,实时数据分析与高吞吐在线推理

- 通过HBM4、HBM3E等产品,帮助数据中心构建高带宽、高可靠性和可持续的AI基础设施

**端侧AI分布式架构**

端侧AI核心价值在于更接近数据源的位置运行模型,实现实时处理和本地决策,提升响应速度、系统可用性和效率,同时增强数据隐私和安全性。HBM、LPDDR5X等产品可部署在云端与端侧的混合AI架构中,实现从数据生成、存储到推理的端到端支持。

【小结】HBM产品覆盖云端AI训练推理与端侧AI实时处理两大核心应用场景。

五、配套存储与扩展方案

**高性能SSD配套**

- 6550 ION SSD与9550 SSD:面向AI数据中心中对容量、速度、可扩展性和安全性要求较高的存储场景,例如训练数据湖、特征库以及日志与指标存储

- SOCAMM(将LPDDR5X与CAMM形态封装结合):提供高带宽、低功耗的低功耗内存模块,以更紧凑的封装为AI数据中心和高密度算力节点提供更高内存带宽与更低能耗

**内存扩展技术**

- 大容量RDIMM(96GB、128GB):为AI、内存数据库和服务器工作负载提供更高内存容量,减少节点数量或提高单节点并发与模型规模上限

- CXL内存扩展:通过与Intel Xeon、AMD EPYC等高端CPU平台结合,扩展系统有效内存带宽与容量,改善大模型训练、推理和多实例共享内存场景下的资源利用

【小结】配套存储与扩展方案为AI系统提供从内存到存储的完整基础设施支撑。

六、常见问题

**Q:HBM4的单颗带宽是多少?**

A:HBM4单颗带宽超过 2.8 TB/s。

**Q:HBM4相比HBM3E带宽提升了多少?**

A:HBM4带宽提升至约2.3倍HBM3E水平。

**Q:HBM4的典型容量配置是什么?**

A:HBM4典型容量为36GB,采用12-Hi(12H)堆叠配置。

**Q:HBM3E的功耗降低幅度是多少?**

A:HBM3E功耗相较于上一代产品最多可降低30%。

**Q:HBM4适用于哪些AI场景?**

A:HBM4面向下一代AI训练、推理平台及高性能计算系统,对极高带宽和高能效有需求的加速器与GPU平台。

**Q:HBM在AI基础设施中的作用是什么?**

A:HBM被定位为支撑AI训练、推理、大语言模型运行及高性能计算的关键基础设施,可在复杂AI计算中解决海量数据高速传输瓶颈。

**Q:端侧AI方案包含哪些内存产品?**

A:端侧AI方案包含HBM、LPDDR5X等内存产品,可部署在云端与端侧的混合AI架构中。

**全文总结**

HBM高带宽内存是AI基础设施的核心组件,HBM4以超过2.8TB/s的单颗带宽和相比HBM3E约2.3倍的性能提升,为下一代AI平台提供关键支撑。

责编:周正玮
版权和免责声明

版权声明: 凡来源为"交汇点、新华日报及其子报"或电头为"新华报业网"的稿件,均为新华报业网独家版权所有,未经许可不得转载或镜像;授权转载必须注明来源为"新华报业网",并保留"新华报业网"的电头。

免责声明: 本站转载稿件仅代表作者个人观点,与新华报业网无关。其原创性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或者承诺,请读者仅作参考,并请自行核实相关内容。

专题
视频

扫码下载

交汇点新闻APP

Android版

iPhone版

分享到微信朋友圈
打开微信,点击底部的“发现”,使用 “扫一扫” 即可将网页分享到我的朋友圈。
分享到QQ
手机QQ扫描二维码,点击右上角 ··· 按钮分享到QQ好友或QQ空间