在 11 月份于亚特兰大举行的 SC24 超级计算大会上,扮演《权力的游戏》中“魔山”的演员哈夫索尔·尤利乌斯·比约恩松,举起了一个由 453 公斤(1000 磅)固态硬盘组成的定制杠铃。这些硬盘中存储的数据总量超过 280 PB。
“毫无疑问,这是人类历史上举起的最大数据量,” 铠侠电子业务发展高级总监 Andy Higginbotham 说。高性能数据平台 VDURA 与铠侠合作,共同创造了这项打破纪录的壮举。
在这场宣传噱头背后,隐藏着一个真实的趋势——为了满足人工智能对数据的无限渴望,存储驱动器正在变得越来越大,而且这种趋势没有停止的迹象。铠侠最近宣布推出迄今为止最大的 SSD 存储驱动器,存储容量高达 128 TB,并将数百个这样的驱动器堆叠在比约恩松的杠铃上。几周后,Solidigm 也宣布推出自己的 123 TB 驱动器。三星和西部数据最近也开始销售类似的产品。
数据中心中人工智能工作负载的增加,导致了对功耗极高的芯片(主要是 GPU)的需求激增。由于数据中心的整体功耗正在上升,人们正在寻找各种方法,尽可能地降低功耗。与此同时,大型语言模型和其他人工智能模型需要越来越多的内存。
“你可以看到存储需求的发展趋势,” Solidigm 人工智能和领导力营销高级总监 Roger Corell 说。“几年前,大型语言模型的内存需求是每机架 0.5 PB 或更低。而现在,大型语言模型的内存需求已经上升到每机架 3 到 3.5 PB 之间。存储效率对于人工智能基础设施的持续扩展至关重要。”
最重要的是,这一系列新型固态硬盘在计算机机架中的占地面积和功耗预算与它们大约 32 TB 和 64 TB 的前代产品相同——尽管它们略高一些——这意味着它们可以轻松地替换到数据中心中,从而带来立竿见影的效果。
提升 SSD 容量的三种方法
“你可以从三个方面进行创新,以提高每个 SSD 的容量,” Corell 说。“一个是每单元的比特数,二是可以在一层中容纳多少单元,以及可以堆叠多少层这样的存储单元。”
每单元的比特数实际上是指单个 NAND 闪存浮栅晶体管可以存储的不同值的个数。这些晶体管被紧密地排列在一个层上,密度不断增加。增加层数确实会使设备更高,但 Corell 说,高度在当今的数据中心中并不是一个限制因素,因此还有扩展的空间。
Solidigm 已经生产了每单元 4 比特的设备,因此它通过在每层中容纳更多单元来进行创新,从 60 TB 型号升级到 122 TB 型号,主要方法是使用最小的可用 NAND 技术并减小非 NAND 组件的尺寸。铠侠从 3 比特 NAND 单元升级到 4 比特 NAND 单元,在所有三个方面都进行了改进,从而将其驱动器从 32 TB 升级到 128 TB。
使用更高的每单元比特数会使写入时间略微变慢,但这在许多应用中仍然是一个优势,铠侠技术营销高级经理 Allyn Malventano 说。
保持与较小设备相同的功耗是一个微妙的平衡。Malventano 说:“驱动器开发人员总是需要弄清楚,如果我们以这种特定方式配置它,我们也许可以获得更高的性能,但如果我们这样做,它将需要更多的功耗才能做到这一点。因此,对于任何特定容量,都需要进行调整。”
对更高容量存储驱动器的需求并没有放缓。Higginbotham 说:“这种需求永远不会停止。对更大 SSD 的需求永远不会停止。” Solidigm 的 Corell 预测,在十年内,市场上将出现 PB 级 SSD。