数据中心互联的核心器件 · 中际旭创全球领先 · InfiniBand vs RoCE
光模块将电信号转为光信号,通过光纤传输,是数据中心互联的核心器件。AI训练集群需要数千到数万个光模块连接GPU服务器,网络带宽成为算力的重要瓶颈。
800G光模块是2024-2025年主流,1.6T正在量产爬坡(2025年全球约2.7M只),3.2T在标准制定中(预计2027-2028年)。中际旭创(Innolight/ HG Genuine)是中国光模块龙头,全球800G市占约42%(行业第一),1.6T市占约55-60%。
EML(电吸收调制激光器)是最稀缺组件,Lumentum占全球EML产能50-60%,是光模块供应链中最关键的瓶颈。800G光模块单价约$400-600,1.6T约$1200-1800,随规模效应逐步下降。
Coherent(II-VI合并)是美国光模块龙头,拥有硅光+LUMENTUM EML双线布局,技术实力强。新易盛(300502.SZ)1.6T已规模出货,华为海思国内800G自供。
硅光(Silicon Photonics)将光波导、调制器、探测器等光学元件集成在硅芯片上,替代传统III-V族材料(InP GaAs)光器件,大幅降低成本和功耗。
Intel是硅光领域最领先者,拥有成熟的硅光调制器和集成工艺,在CPO(共封装光学)领域布局领先。硅光模块在800G出货中预计占约2/3(2025年),是主流技术路线。
相比传统光模块,硅光优势:集成度高(减少封装体积)、功耗低(<6W vs 8-12W)、成本低(硅工艺规模化)、适合CPO集成。劣势:损耗较高、长距离传输性能略弱于EML。
CPO(Co-Packaged Optics,共封装光学)将光引擎与交换芯片封装在一起,大幅降低功耗和体积,是1.6T/3.2T时代的演进方向。Cisco(Acacia)和Intel在CPO标准制定中扮演重要角色。
SiC(碳化硅)功率器件在AI数据中心的电力转换系统中发挥关键作用。数据中心电力转换链路长(AC→DC→负载),每次转换都有损耗。SiC MOSFET相比传统Si IGBT:开关损耗降低50-70%、工作频率提升10倍、功率密度提高3倍。
在AI服务器PSU(电源)中,SiC二极管已广泛使用,SiC MOSFET正在导入。在UPS中,SiC提升效率的同时减小设备体积。在48V总线配电架构中,SiC价值尤其高(高电压=低电流=低损耗)。
Wolfspeed是全球SiC衬底龙头(市占约45%),但2025年申请破产保护重组,行业格局可能重塑。onsemi和Infineon在SiC器件上快速扩张。中国厂商(天岳先进688234.SH、露笑科技、三安光电)在SiC衬底上加速追赶。
AI训练集群需要高速网络互联将数千颗GPU连接在一起。网络拓扑分为三层:GPU间互联(NVLink,900GB/s双向)、Rack间互联(InfiniBand/NVLink Switch)、Pod间互联(InfiniBand/RoCE)。
InfiniBand(NVIDIA收购Mellanox后拥有)是AI HPC集群的主流网络,Quantum系列(NDR 400G)市占约70-80%。InfiniBand的特点:专用网络、无拥塞、延迟极低(~1μs)、SHARP(网络内计算)技术可在网络内做部分数据聚合,进一步提升训练效率。
RoCEv2(RDMA over Converged Ethernet v2)是基于以太网的RDMA方案,可在现有以太网基础设施上运行,成本更低、与云环境兼容。Marvell和Broadcom的以太网交换芯片(Tomahawk 5、Broadcom Thor3)支持RoCEv2。
NVIDIA NVLink是GPU间点对点互联(900GB/s双向带宽,H100上12个NVLink端口),NVIDIA独家。NVLink Switch则将NVLink扩展到多GPU集群。
| 网络类型 | 代表技术 | 带宽 | 延迟 | AI集群市占 |
|---|---|---|---|---|
| GPU间互联 | NVLink | 900GB/s | ~1μs最快 | NVIDIA独有 |
| InfiniBand | NVIDIA Quantum | 400G/端口 | ~1μs低 | ~70-80% AI HPC |
| RoCEv2 | 以太网+RDMA | 200-400G | ~2-5μs中等 | ~20-30% |
| 以太网(传统) | 标准以太网 | 100-400G | >10μs高 | 通用云 |
以太网联盟(UEC,Ultra Ethernet Consortium)成立于2023年,由 AMD、Broadcom、Cisco、HPE、Intel、Meta、Microsoft 等全球科技巨头联合发起,旨在从物理层、链路层、传输层到软件层对传统以太网进行重构,以满足 AI 级大规模高吞吐、低延迟、无损的网络需求,直接叫板 NVIDIA 独占的 InfiniBand 方案。
核心痛点与改良点:传统以太网在大规模集群下存在较严重的“拥塞”和“丢包”问题。UEC 推出全新传输协议(UET),引入了“非按序递交”(Out-of-Order Delivery)、“多路径路由”(Multi-pathing)以及极其精细的拥塞控制机制,突破了传统以太网和 RoCEv2 的性能上限,将大规模训练集群下的尾部延迟(Tail Latency)降低了数倍。
博通与以太网生态的受益逻辑:博通(Broadcom)是 UEC 最大的芯片受益者,其最新的 Tomahawk 5 和 Thor3 交换芯片为 UEC 以太网标准提供强力的物理基石。Meta 和 Microsoft 也极力推进 UEC 标准的落地,以降低对 NVIDIA 闭环生态的依赖,提升供应链自主权与议价能力。
1. 中际旭创1.6T全球领先(55-60%市占):800G+1.6T双轮驱动,量价齐升,2024年净利润同比增长超200%。
2. 硅光渗透率提升(800G出货约2/3是硅光):推动技术迭代,Intel/Coherent受益。
3. CPO是1.6T/3.2T时代的演进方向:Cisco/Intel领先,长期可能颠覆可插拔光模块。
4. SiC在数据中心电力电子中加速渗透:onsemi/Infineon快速扩张,Wolfspeed重组带来格局重塑机会。
5. 网络互联(InfiniBand vs RoCE/UEC)决定AI集群效率:NVIDIA生态闭环优势明显,但以太网联盟(UEC)正通过重构以太网协议栈加速追赶,Broadcom与以太网生态大厂将深度受益。
1. EML激光器供应瓶颈持续:Lumentum一家独大,是光模块供应链最薄弱环节。
2. CPO颠覆风险:长期来看,CPO可能颠覆可插拔光模块,对现有厂商构成威胁。
3. 光模块价格竞争激烈:中国厂商(华为海思、中际旭创、新易盛)价格竞争,利润率存在压力。
4. AI CapEx周期性风险:若云厂商削减CapEx,光模块需求可能受影响。