龙空技术网

AI算力的桥梁——流量膨胀助推800G光模块加速落地

核芯产业观察 2902

前言:

此时各位老铁们对“xfr算力”大约比较重视,各位老铁们都需要剖析一些“xfr算力”的相关内容。那么小编在网上收集了一些对于“xfr算力””的相关知识,希望我们能喜欢,咱们一起来了解一下吧!

电子发烧友网报道(文/梁浩斌)英伟达今年以来股价涨幅超过200%,这足以说明在AI算力需求下对GPU等算力硬件的需求到底会有多大。而除了GPU之外,在数据中心的AI训练中,AI服务器集群对于数据传输的速率要求也相当高,随着数据中心规模的增大,新的架构也对光模块的使用量有了指数级的增长。

光模块的速率在过去10年间发展迅速,在2015年之前,数据中心光模块普遍以10G和40G为主;2016年开始,25G和100G光模块开始部署;2019年100G光模块已经实现广泛应用,200G和400G产品开始出货;到2022年,200G和400G产品已经大规模部署,800G光模块开始进入量产导入阶段。

为什么需要800G光模块?

首先光模块在数据中心的应用,主要是用于数据传输,通常在数据中心领域,会将数据中心外部用户与内部服务器之间传输的数据称为南北向流量;而数据中心与数据中心之间,以及数据中心与内部服务器之间互相传输的数据被称为东西向流量。

随着数据中心数据容量的增大,根据思科的预测,2021年东西向流量会占到总体数据中心流量的85%,其中数据中心内部服务器流量占71.5%,数据中心之间的流量占13.6%。但要注意的是,这个预测是在AI大模型热潮之前所进行的,因此自2022年底ChatGPT引爆的AI大模型市场后,东西向流量以及数据中心内部服务器流量的占比仍将会进一步提高。

数据中心计算规模,以及东西向流量的不断膨胀,数据中心网络架构也在不断变化。而在传统的三层拓扑结构中,服务器与服务器之间的数据交换,需要经过接入交换机、汇聚交换机以及核心交换机才能完成,这给汇聚交换机以及核心交换机带来了巨大的工作压力。

图源:HPE Aruba

如果按照传统三层拓扑架构继续扩大服务器集群规模,那么则需要在核心层和汇聚层部署极高性能的设备,设备成本会显著增加。那么这个时候就有了新的叶脊拓扑架构出现了,它在传统的三层拓扑架构上进行了扁平化,变成了两层架构。

其中叶交换机相当于传统三层架构中的接入层交换机,与服务器直接进行连接。脊交换机相当于核心层交换机,但脊交换机与叶交换机直接连接,并且一台脊交换机需要与所有叶交换机进行连接。

所以叶交换机的数量取决于交换机下行端口数量,同时叶交换机的上行端口数量又取决于脊交换机的数量。

叶脊架构大大提高了服务器之间数据传输的效率,且当服务器数量需要扩展时,只需增加脊交换机数量,加强了数据中心的扩展性。唯一的问题是,相比传统三层拓扑架构,叶脊架构所需的端口数量同样大大增加。相应地,服务器与交换机都需要更多的光模块来进行光纤通信。

从需求量来看,按照国泰君安证券的数据,以1000个机柜的中大型数据中心计算,传统三层拓扑架构中,大约需要128000个10G光模块、160个40G光模块和8个100G光模块;叶脊架构下,这个数据中心需要的光模块数量则为120000个10G、4800个40G、32个100G。

对于大量应用到GPU的AI训练而言,在英伟达DGX H100服务器中,集成了8颗H100 GPU,仅计算和存储网络对应的需求约为12个800G光模块、18个400G光模块。

可以看出,叶脊架构下数据中心所需的高速率光模块数量成指数级增加,随着数据中心的规模扩大,特别是AI大模型训练的需求下,GPU服务器更高的传输速率需求,让800G光模块加快了落地的速度。

光模块玩家加速布局

GPU作为AI算力基座,以英伟达为首的厂商已经供不应求,此前有消息称订单能见度已经排至2024年。在GPU的需求确定性强的情况下,光模块市场也必然会跟随得到上涨空间。

在800G光模块领域,目前全球头部厂商基本上都在加紧布局。根据Lightcounting的数据,2022年全球光模块供应商Top 10中,中际旭创、华为海思、光迅科技、海信、新易盛、华工科技等中国厂商分列第1、4、5、6、7、8名,占据前十中的6个名额。另外四名分别是与中际旭创并列第一的Coherent(II-VI收购Coherent后合并命名)、排名第三的思科、排名第九的英特尔以及排名第十的索尔思光电。

中际旭创早在2020年底就推出了业界首个800G可插拔OSFP和QSFP-DD800系列光模块,包括4x100Gx2和8x100G两种架构方案;2022年在OFC2022现场展示基于自主设计硅光芯 800G可插拔 OSFP2*FR4和QSFP-DD 800G DR8+硅光光模块;2023年3月,公司于OFC展会上推出全球首款1.6T光模块。

近期中际旭创表示,公司800G光模块已在2023年上半年逐步起量,已向海外重点客户持续交付与GPU相配套的800G产品,但更多的客户需求和订单交付预计会在2023年下半年以及2024年。

Coherent今年3月也展示了基于200G单通道的800G/1.6T收发器,公司在一季度财报会议上表示800G光模块的出货正在加速,预计从24年开始呈现指数级增长。

光迅科技在OFC 2023首次展出基于50GBd VCSEL技术的800G QSFP-DD800 SR8光模块。不过光迅科技近期表示,目前800G产品已小批量出货,但销售占公司总体营收比例不高,预计今年800G光模块的量不会很大。

同在OFC 2023上,海信宽带推出了业内首款800G QSFP-DD BiDi SR4.2光模块产品,同时展示其他基于PAM4码型的800G系列光模块产品,包括800G QSFP-DD SR8/AOC,800G OSFP SR8/AOC,800G OSFP 2xFR4/DR8和800G QSFP-DD 2xFR4/DR8等产品,已具备完备的产品阵列。

新易盛在2021年就推出了其800G光模块产品组合,包括基于EML和SiPh的解决方案,产品组合由AOC和SM光模块组成,有OSFP和QSFP-DD800两种外形尺寸,传输距离覆盖30m-2km。OFC 2023上新易盛展示了最新的基于薄膜铌酸锂调制器TFLN技术的800G OSFP DR8,配合5nm DSP以及集成的TIA实现11.2W的业界领先功耗水平。近期公司表示,部分800G光模块产品已实现小批量出货。

华工科技子公司华工正源去年发布了800G硅光模块系列产品,数据中心侧涵盖800G DR8 SiPh/2*FR4/SR8/DR8等,采用OSFP封装,模块全温功耗小于15W。华工科技在近期的投资者交流中表示,目前公司800G光模块已与北美头部客户进行了良好的沟通和对接,并向客户进行了产品送样,预计出货量将在23年下半年快速增长。

小结

800G光模块在GPU订单需求的确定性环境下,将会从今年下半年开始进入大规模出货阶段。作为AI算力的桥梁,800G光模块随着数据中心的规模扩大,AI训练的需求持续增长,市场规模增速以及落地速度将持续加速。而布局较早的玩家,也能够更早享受到算力需求带来的市场红利。

标签: #xfr算力