华为全联接大会2024期间,在以“加速F5G-A,共赢行业智能化”为主题的全光峰会上,华为重磅发布数据中心全光交换机Huawei OptiXtrans DC808,打造面向AI的新一代光电融合智算DCN 网络(Data Center Network, 数据中心网络)。 随着大模型参数规模不断增长,对智算算力提出更高要求,智算集群规模不断扩大,传统的交换机组网在组网规模、扩展性、可用率、功耗等方面存在多项挑战。 第一,扩展困难。智算集群需要提前明确规模,锁定堆叠层级和架构,按照规划一次性部署,每次算力扩展都需要对数据中心网络进行重新组网,调整端口连接和路由关系,不仅调整周期长、成本高,而且在重构过程会中断集群训练,算力隐形损失大,缺乏有效的集群网络扩展手段。 第二,光模块易失效。光模块长时间运行会失效,据统计万卡集群每年因光模块失效影响训练任务超过100次以上,严重影响集群可用时间。 第三,演进升级困难。已部署的交换机受架构制约端口速率固定,无法平滑升级支持更高速率,引入更先进智算算力时,需要替换为更高速交换机。 华为创新性地将全光交叉(OXC)技术引入到数据中心网络,推出业界领先的数据中心全光交换机Huawei OptiXtrans DC808,打造面向AI的新一代光电融合智算DCN网络。该全光交换机支持256*256无阻塞全光交换,超高集成度(6U高)、超低功耗(整机小于200W)、超高可靠(电信级可靠性),带来四大价值: 大规模弹性组网:全光交换机端口密度高,耗电超低,智算集群组网可基于中长期规划的目标组网,按PoD(Point of Delivery,数据中心规划时的最小业务单位)颗粒度分期建设;支持算力资源分钟级灵活分割和租售;灵活可变拓扑,提升计算集群算效。 超高可靠:全光交换机无需光模块,有效减少整网光模块的总数量,DCN网络因光模块失效导致的故障率降低20%。 平滑演进:基于全光交换,不感知下联交换机的端口速率和协议,支持从400G、800G甚至更高速率平滑演进,无须更换全光交换机;支持DCN网络跨代际复用,多代速率在统一架构中融合,稳定DCN网络架构,降低投资成本。 绿色节能:采用全光交换,省掉传统交换机的光电转换和数据转发过程,以400G端口为例,相比传统交换机功耗降低98%,整网能耗降低20%。 华为数据中心全光交换机预计将于2025年正式商用,助力智算集群网络规模和效率提升,以光强算,为AI时代数据中心发展提供新质生产力。
|