找回密码
 注册
关于网站域名变更的通知
查看: 362|回复: 3
打印 上一主题 下一主题

现代高端FPGA的重要拼图:HBM

[复制链接]

该用户从未签到

跳转到指定楼层
1#
发表于 2021-10-22 09:30 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式

EDA365欢迎您登录!

您需要 登录 才可以下载或查看,没有帐号?注册

x
HBM(High Bandwidth Memory,高带宽存储)已成为现代高端FPGA的一个重要标志和组成部分,尤其是在对带宽要求越来越高的现如今,DDR已经完全跟不上节奏。本篇将分享学习一下HBM的基本情况。
8 X0 j0 p; x, E2 l3 m/ t
  a* o. Z- v# h) Q) u7 _什么是HBM
* K5 J9 o' p; [$ v1 \% L7 d4 B& A. S8 F; A+ s2 z5 [
   高带宽存储(HBM)是三星、AMD和SK Hynix推出的基于3D堆叠同步动态随机存取存储器(SDRAM)的高速计算机内存接口。它使用在高性能图形加速器、网络设备、高性能数据中心AI ASIC和FPGA以及一些超级计算机中。(如NEC SX-Aurora TSUBASA和富士通A64FX) 第一款HBM芯片是由SK Hynix在2013年生产的,而2015年AMD首次研发了使用这种技术的GPU芯片。
8 q) p  E/ y, V( v# @3 k' H- g7 q+ C* _2 J  _
    2013年10月,JEDEC(电子器件工程联合会)采用高带宽内存作为行业标准。第二代HBM2,于2016年1月被JEDEC所承认。: Z% i% z$ f9 \# F: p6 p3 O0 q$ t

/ `" ?6 E) N) I$ E+ HHBM及其接口% u$ [! I( W5 `% G3 q* K$ r

' y7 W, t* c( ?0 J+ `2 D1 X   HBM以比DDR4或GDDR5功耗更低,带宽更高。这是通过堆叠8个DRAM die(3D集成电路)来实现的,包括可选的基die(通常是硅interposer)和memory控制器,该控制器通过硅通孔(TSV)和微突点(microbump)相互连接。HBM技术与Micron的Hyrid Memory Cube技术在原理上相似,但不是一回事。( g4 p3 j7 x2 i: i$ K6 E
2 j/ s  f1 a0 ~( K3 u
    与其他DRAM内存(如DDR4或GDDR5)相比,HBM内存总线非常宽。一个HBM stack由4个DRAM die(4-Hi)堆叠而成,并拥有8个128位信道(每个die上2个),总宽度为1024位。因此,具有四个4-Hi HBM stack的GPU将拥有4096位宽度的内存总线。相比之下,GDDR存储器的总线宽度为32位,同样16个信道则只具有512位存储器接口。HBM支持每个package的容量最多为4GB。2 g; z/ V: @# P2 |5 |' B6 F4 Z

( q! n4 j9 J8 T: q* O3 b& p0 ]. N2 k   HBM DRAM与具有分布式接口的主计算die进行紧密耦合。该接口被分为若干完全独立的信道但信道间不一定完全同步。HBM DRAM使用wide-inteRFace架构来实现高速、低功耗运算。HBM DRAM使用一个500MHz的差分时钟CK_t/CK_c(其中后缀“_t”表示差分对的“真”或“正”分量,“_c”代表“互补”分量)。命令在CK_t,CK_c的上升沿进行寄存。每个信道接口管理一个128位的数据总线,以双倍数据速率(DDR)运行。HBM支持每个pin上1GT/s的传输速率(传输1bit),提供128GB/s的总package带宽。  n- l$ W% {, B# h
9 k, O* f% y% f) }: u" b" A4 R
    第二代高带宽存储,HBM2,该标准指定了每个stack多达8个die,将pin传输速率提高一倍来到2GT/s。保留1024位宽的存取,HBM2能够达到每个package 256GB/s存储带宽。HBM2规范允许每个package容量高达8GB。HBM2对性能敏感的消费类应用,如虚拟现实,特别有吸引力。- F' b0 @, g7 C6 F+ g: `

" v: N$ t( v: L( {5 _    2018年底,JEDEC宣布了对HBM2规范的更新,增加了带宽和容量。官方规范现在支持每堆栈高达307GB/s(2.5Tbit/s有效数据速率),尽管以此速度运行的产品已经问世。此外,该更新还增加了对12-Hi stack(12个die)的支持,使每个堆栈的容量高达24GB。2019年3月20日,三星宣布了他们的Flashbolt HBM2E,每stack 8个die,传输率为3.2GT/s,每stack可提供410GB/s带宽。2019年8月12日,SK Hynix发布了他们的HBM2E,每stack8个die,传输速率为3.6GT/s,每stack可提供460GB/s带宽。
# Q" K% _' e2 `" H) _' u( q2 U- K; V' D
    2020年底,Micron公司发布了下一代标准HBMnext并表示将全程参与JEDEC的标准制定工作,预计2022年面世。这个未来很有可能是HBM3的标准很可能还是服务于数据中心。
0 f" |! M1 _2 E* X7 ^' u! j; ]$ n! V: r7 P
   近年来,FPGA厂商对HBM的态度甚至比GPU厂商还要积极,随着数据中心上越来越高的性能要求,相信带有HBM3的FPGA也会在不远的未来和大家见面。
& }. b% K) j* ~6 b% J- k& m$ _0 m

该用户从未签到

推荐
发表于 2021-10-22 11:23 | 只看该作者
FPGA厂商对HBM的态度甚至比GPU厂商还要积极,随着数据中心上越来越高的性能要求,相信带有HBM3的FPGA也会在不远的未来和大家见面
! c5 H5 C' G. z+ |

该用户从未签到

2#
发表于 2021-10-22 10:43 | 只看该作者
高带宽存储(HBM)是三星、AMD和SK Hynix推出的基于3D堆叠同步动态随机存取存储器(SDRAM)的高速计算机内存接口2 ~( Z9 e, z0 p* W9 S

该用户从未签到

4#
发表于 2021-10-22 11:24 | 只看该作者
HBM DRAM与具有分布式接口的主计算die进行紧密耦合。该接口被分为若干完全独立的信道但信道间不一定完全同步
' {# `2 s0 y9 ~1 M
您需要登录后才可以回帖 登录 | 注册

本版积分规则

关闭

推荐内容上一条 /1 下一条

EDA365公众号

关于我们|手机版|EDA365电子论坛网 ( 粤ICP备18020198号-1 )

GMT+8, 2025-10-29 21:13 , Processed in 0.140625 second(s), 24 queries , Gzip On.

深圳市墨知创新科技有限公司

地址:深圳市南山区科技生态园2栋A座805 电话:19926409050

快速回复 返回顶部 返回列表