光速连接:微型LED照亮AI数据中心未来
在通往全光学AI数据中心的竞赛中,半导体制造巨头台积电(TSMC)与硅谷初创公司Avicena联手,押注了一种全新的技术路线:微型LED光互连。这种技术巧妙地将光学连接取代了传统的电气连接,为日益增长的GPU集群提供了一种低成本、高能效的通信解决方案。
大型语言模型及其衍生技术的计算需求不断攀升,AI集群对数据量、带宽、延迟和速度的要求也随之水涨船高。在不久的将来,连接单个AI数据中心机架内处理器和内存的铜线将不可避免地被光学连接取代。台积电副总裁Lucas Tsai表示:“将光学连接尽可能靠近电路板是当前的趋势。”
Avicena的方案独树一帜,利用数百个蓝色微型LED通过成像光纤传输数据。该公司模块化的LightBundle平台巧妙地避开了激光带来的复杂性,从而避免了其他光学芯片在可靠性、成本和功耗方面的挑战。Tsai评价道:“这是一种非常非传统的方案!”但它非常适合短距离应用,这正是其吸引人的地方。
告别激光
现有的光学连接能够以极高的数据速率在数据中心内传输大量数据,传输距离可达数十至数百米。传统上,可插拔模块将光纤连接到机架,并在其中进行电光信号转换。为了摆脱这些能耗较高的可插拔收发器,业界正在积极探索共封装光学(CPO)技术,将电光转换直接集成到硅芯片旁边。目前,CPO技术已在网络交换机领域得到商业化应用,而针对GPU的原型产品也正在快速发展。大多数光学芯片设计采用激光和调制器将电子比特编码到不同波长的光信号上。
然而,基于激光的方案面临着激光本身的挑战。激光器和光纤附件在可靠性、制造和成本方面带来了最大的问题。此外,一根光纤承载着数十个GPU到交换机的多波长连接,会带来额外的计算开销:将每个数据通道独立传输到单独的光纤上,比在接收端解析一个大型通道要简单得多。
Avicena的LightBundle光互连技术应运而生。它摒弃了将多波长激光传输到光纤并解析成单个通道的传统方案,而是利用数百个蓝色微型LED通过多芯成像光纤连接到光电探测器阵列,每个光纤对应一个10Gb/s的数据通道。发射器就像一个微型显示屏,而探测器就像一个摄像头。Avicena首席执行官Bardia Pezeshki表示:“我们实现了无需激光复杂性的光学互连。”
一个简单的光学连接,仅使用300个像素,每个通道速率为10Gb/s,可以覆盖10米的距离,总传输速率达到3Tb/s。由于显示屏和摄像头可以扩展到数百万像素,因此该技术可以扩展到更高的数据速率,同时功耗更低,密度更高,远超铜线连接。
成熟产业的优势
Avicena强调,其技术利用了LED、摄像头和显示屏等成熟产业的优势。Pezeshki表示:“我们可以快速将我们的方案扩展到所需的规模和成本,而无需开发新的基础组件。”尽管硅光子技术在光学互连领域拥有30年的领先优势,但它们仍然需要开发新的组件,例如环形谐振器和梳状激光器。Pezeshki指出:“这些组件需要很长时间才能成熟。”相比之下,LightBundle光互连设计只需要对现有的摄像头和显示屏技术进行微调。
这也是台积电与Avicena合作生产光学芯片光电探测器阵列的主要原因之一。Tsai表示:“LED产业已经非常成熟,有很多消费类产品。”当然,LED的功耗比激光器低,但对于机架内和机架之间的10米距离来说,LED的功耗已经足够了。Tsai补充道:“这种方案有潜力实现更低的成本,并且天生具有很高的冗余性。”
Pezeshki表示,Avicena的成果已经“远远超过”了硅光子技术所能达到的水平。LightBundle原型已经展示了低于pJ/bit的整链能耗,而其他光学方案“难以达到”5 pJ/bit的能耗水平。
Pezeshki承认,Avicena还需要克服一些挑战才能将产品推向市场并实现规模化。但他表示:“出色的成果加上成熟的组件,正在吸引越来越多的用户。”