首页 > 公众号研报 > 【华泰科技】光通信:乘AI东风起,扬帆正启航

【华泰科技】光通信:乘AI东风起,扬帆正启航

作者:微信公众号【华泰证券科技研究】/ 发布时间:2023-07-19 / 悟空智库整理
(以下内容从华泰证券《》研报附件原文摘录)
  如果您希望第一时间收到推送,别忘了加“星标”! 随着以GPU为核心的分布式计算系统成为AI大模型训练的算力底座,提升节点互联带宽成为优化GPU集群计算效率的重点之一。AI网络一方面采用800G光模块,未来有望引入1.6T,以助推集群的高效计算;另一方面,多采用无阻塞Fat-Tree网络拓扑保证在多层级间数据传输的均匀分布。根据我们测算,英伟达DGX H100、GH200集群中,GPU与800G光模块的配比分别达到1:2.5、1:9,相比数据中心传统三层网络架构下服务器与光模块约1:0.55的配比有明显提升。全球AI算力侧投资浪潮背景下,我们看好光模块产业链投资机遇。 核心观点 光模块市场竞争格局展望:东升西落大势所趋,强者恒强地位稳固 近十年来中国厂商在全球光模块市场中的份额持续提升,根据LightCounting统计,全球前十大光模块供应商中,中国厂商数量由2010年的1家上升至2022年的7家;从市场份额看,中国厂商销售额占比由2010年的15%增至2021年的50%,其中中际旭创排名自2021年起与II-VI(现Coherent公司)并列全球第一位,新易盛、华工科技、光迅科技等厂商亦稳居全球前十位。目前在数通高速以太网光模块领域,需求主要由海外头部云厂商主导,考虑到该客户群体的供应商准入壁垒高,我们认为已切入海外数通光模块供应体系的国产厂商具有较强先发优势,未来有望呈现强者恒强局面。 光模块技术发展趋势:关注LPO、CPO、薄膜铌酸锂等有望快速落地 随着AI、云计算的快速发展对网络带宽提出更高要求背景下,我们判断未来光模块行业仍将沿着追求更高速率、更低单位功耗&成本两条脉络发展,传统可插拔光模块技术或面临一定瓶颈,亟需技术的迭代升级。更低单位功耗及成本方面,博通等厂商积极推动LPO、CPO等方案,LPO方案中光模块有望省去DSP芯片(在光模块中的功耗占比达49%)的使用;CPO方案则将光引擎和交换芯片共同封装在一块基板上,大幅缩短两者间的物理距离以实现高集成度和低功耗。更高速率方面,薄膜铌酸锂方案基于高调制速率、低功耗等优良性能受到业界青睐,未来有望在1.6T时代实现规模化应用。 光模块产业链上游:关注高速光芯片国产化机遇 根据我们的拆解,高速以太网光模块中的核心上游原材料包括高速DSP芯片、高速光芯片、无源光器件等,其中无源光器件已基本实现国产化,而高速DSP芯片仍由Marvell、博通等海外厂商主导;高速光芯片方面,以800G单模光模块所采用的100G EML芯片为例,主要玩家为Lumentum、三菱、博通、II-VI、住友,国内厂商已实现2.5/10/25G DFB的批量供货,并在快速推进100G EML等高速光芯片产品的落地,我们认为未来高速光芯片国产化是大势所趋,进一步有望迈向全球竞争。 中国光模块产业链上市公司梳理 【光模块】:中际旭创、新易盛、华工科技、光迅科技、剑桥科技、联特科技、博创科技;【光芯片】:源杰科技、长光华芯、光迅科技、仕佳光子、华西股份(参股索尔思光电);【光引擎&光器件】:天孚通信、太辰光、光库科技、福晶科技、腾景科技、富信科技;【连接器&线缆】太辰光、兆龙互连、立讯精密、致尚科技等。 《生成式人工智能服务管理暂行办法》对比《生成式人工智能服务管理办法(征求意见稿)》 正文 光通信产业链:800G光模块放量元年开启,市场前景广阔 光模块是光通信系统中实现光电转换的关键器件 光模块是光通信中的核心器件,核心功能是实现光电转换。光通信与电通信相比,具备传输频带宽、通信容量大、传输损耗低、中继距离长等优势,目前已成为重要的信息通信基础设施。光模块是用于网络设备和光纤之间光电转换的接口模块,主要由光器件、功能电路和光接口组成,其中核心部分为光器件中的光发射组件(TOSA)和光接收器件(ROSA),分别实现电光转换和光电转换。在发射部分,一定码率的电信号经驱动芯片处理后,驱动TOSA中的激光器发射出相应速率的调制光信号;在接收部分,一定速率的光信号由ROSA中的探测器转换为电信号,再经跨阻放大器(TIA)和限幅放大器(LA)处理后输出相应码率的电信号。 光模块位于光通信产业链中游。根据天孚通信于2020年8月披露的定增募集说明书中的定义,光通信产业链涵盖了光芯片、光组件、光器件、光模块、光通信设备和终端客户等环节。产业链上游为光通信的基础器件,包括光芯片、光组件等,其中光芯片决定光模块性能表现,技术要求高,工艺流程复杂,存在研发周期大、投入大、壁垒高等特点,是光模块中技术含量最高的部分之一;产业链中游各种光组件加工组装得到光器件,多种光器件封装组成光模块,实现光信号和电信号的转换;产业链下游为交换机、路由器等系统设备,应用于电信市场和数通市场,如光纤接入、4G/5G移动通信网络,云计算厂商数据中心等领域。 2022年全球光模块市场规模超120亿美金,数通为最大下游市场 2022年光模块市场规模122亿美元,增长前景广阔。光模块市场为需求驱动型,其增长主要受下游数通市场和电信市场影响。2018年全球4G建设放缓,电信市场光模块需求下降,同时互联网厂商进入库存消化阶段,导致2018-2019年光模块增速缓慢。2019年之后,5G建设加速,云厂商数据中心规模快速扩张,拉动光模块市场持续增长。根据LightCounting数据,2022年全球光模块市场规模为122亿美元,预计2023年同比增速放缓,主要系北美云厂商资本支出放缓,市场短期承压,但随着数据流量快速增长、云计算、AI发展拉升算力需求,光模块市场增长前景广阔。 数通市场为光模块最大下游领域。光模块市场可大致分为电信侧以及数通侧,其中电信场景需求主要受通信技术迭代推动,通信技术迭代带来新一代网络基础设施建设,比如5G基站建设带来对前传、中传、回传光模块的增量需求,周期特性明显。数通场景下,其需求主要由全球数据流量增长、互联网厂商数据中心建设驱动,而其周期性来自互联网厂商资本开支波动和库存周期,总体而言成长特性更为明显。随着全球云计算、AI快速发展,光模块发展的核心驱动力由早年的骨干网城域网建设、光纤入户这些电信场景转变为数通场景,据LightCounting数据,2021年数通光模块在整个光模块市场中的销售额占比超过60%,而电信光模块占比不足40%。我们认为数通市场有望成为光模块发展的主要驱动力,其成长性将引领光模块持续发展。 光模块成长逻辑:流量增长驱动 全球数据流量攀升提升带宽容量,拉动光模块需求。云计算、AI的快速发展对数据吞吐量和延迟提出更高要求,全球数据流量快速增长。根据思科全球云指数,全球数据中心IP流量从2016年的6.8ZB增长至2021年的20.6ZB,期间CAGR为25%。而数据流量攀升需要更高的带宽支持,带来光模块需求提升。据Equinix统计,2017-2021年全球互联网带宽容量以48%的年复合增长率增长。据LightCounting统计,数通光模块由2018年的38.34亿美元增长到2022年的59.75亿美元,期间CAGR达12%。 北美头部云厂商未来有望加码AI算力侧投入。据Factset于2023年2月的一致预期,由于宏观经济承压,2023年北美头部云厂商资本开支增速下滑,但AI超预期发展或为云计算提供新机遇,我们认为云厂商资本开支有望逐渐向AI倾斜。微软向OpenAI追加投资,并宣布其旗下所有产品全线整合ChatGPT;谷歌将其两个主要的人工智能研究部门Google Brain和DeepMind合并为Google Deepmind,专门从事AI相关研究,并发布集成了生成式 AI能力的“试验版”谷歌搜索;亚马逊发布Amazon Bedrock、Titan等多款AIGC产品,将投资1亿美元成立生成式AI创新中心,加码AI建设。 电信市场:千兆光网和算力网络建设驱动需求增长。PON光模块用于接入网中的有线接入,其需求主要取决于终端设备数。1)政策驱动10G PON光模块部署:《“双千兆”网络协同发展行动计划(2021-2023)》和《“十四五”信息通信行业发展规划》相继出台,明确持续扩大千兆光纤网络覆盖范围。在政策推动下,千兆光纤网路建设加速,对应10G PON光模块需求增长。据工信部统计,2022年底具备千兆网络服务能力的10G PON端口数达1523万个,同比增长94%,10G PON已进入大规模部署期。2)FTTR布局带来PON光模块增量需求:接入网进一步向用户终端延伸,由FTTH(光纤入户)向FTTR(光纤入房间)升级,终端设备数增加,推动FTTx模块需求增长。据LightCounting预测,全球FTTx光模块出货量将从2022年的9610万增长到2028年的1.3亿,且其中大部分收入来自10G PON。 运营商资本开支向算力网络建设倾斜,骨干网升级推动电信光模块需求。2019-2022年,5G进行大规模建设,运营商资本开支明显增加,推升电信光模块需求。根据运营商公布指引,2023年三大运营商资本开支为3591亿元,微幅增长2%,从结构上看,5G建设投入下降,资本开支向算力网络建设倾斜。中国移动计划2023年算力建设投入452亿元,占资本开支比重相比上一年增加6.58pct;中国电信2023年产业数字化投资同比增长40%至380亿元;中国联通规划2023年其算网投资占比将超过19%,预计同比增长超过20%,着力打牢数字底座。而骨干网升级是算力网络建设的重点,根据中国移动于2023年6月发布的《400G全光网技术演进及应用展望》,传统100G无法满足东数西算业务对带宽的需求,基于400G技术构建大容量、低时延的新型全光骨干网是实现算力网络目标的关键举措。算力网络建设将推动骨干网升级,对应电信场景光模块需求稳定增长。 技术迭代:800G产品周期开启,正处红利窗口期 数通市场光模块3-5年为一个迭代周期。光模块有明显的速率迭代周期,其中数通市场光模块速率迭代周期为3-5年,据Yole统计,2016年云厂商开始部署100G光模块,2019年大规模放量;2019年400G光模块开始布局,2021年大规模放量;2022年头部云厂商开始导入800G产品,800G光模块周期开启。由于电信市场通信技术迭代周期较长,光模块速率升级压力小,代际更迭速度慢于数通市场,迭代周期在7年左右。 从产业基础、供应商交付能力、客户需求看,光模块已进入800G产品周期。从产业基础看,交换机芯片成熟是光模块速率升级的前提条件,目前800G交换机芯片较为成熟,厂商已发布对应的800G交换机:思科2021年5月推出Silicon One G100芯片,支持25.6T交换能力,提供32个800G端口,2022年10月发布基于该芯片的交换机Nexus 9232E和8111;博通于2022年8月推出Tomahawk 5交换机芯片,交换能力为51.2T,可容纳64个800G端口。从光模块供应商交付能力看,800G OSFP和QSFP-DD光模块推出,根据中际旭创、新易盛等公司公告披露,中际旭创和新易盛已规模出货800G 产品,具备量产能力。从客户需求端看,AI大模型应用加速落地,其训练侧和推理侧算力快速增长,对光模块速率、功耗提出更高要求,推动800G光模块上量。 AI高性能网络为光通信产业链注入成长新动力 GPU集群成为AI大模型训练侧核心算力底座 AI大模型发展突破新高度,算力需求升级。自2022年以来,AI产业实现技术和应用端的快速发展,尤其是2022年11月OpenAI发布ChatGPT,将人机对话推向新高度,上线2个月突破1亿月活,其文本生成、逻辑推理能力突出,全球各大科技企业也不断推出相关技术和应用平台,加速AI发展。以ChatGPT为代表的AI大模型以参数多、数据量大为突出特点,用参数和数据规模的升级不断提升模型性能,而模型规模的持续扩大对算力资源、通信带宽提出了更高的要求。我们认为产业趋势已明晰:全球AI算力侧投入有望持续加码,大规模GPU集群对于互联带宽提出更高要求,催生800G等高速率光模块需求。 AI大模型算力底座是以GPU为核心的分布式计算系统。AI大模型的参数量和数据量不断增大,所需的计算时间也随之增加。为了提升模型训练和推理的速度,分布式计算应运而生。分布式计算允许数据、模型等在不同的节点上同时进行训练,有效提升了计算效率和内存吞吐量,加速模型训练和推理过程。实现分布式计算需要将原来单卡的计算负载和内存负载切分到多卡上,构建GPU集群,通过集群的作业调度和管理系统来完成各类型任务。据英伟达官网披露,在工作负载为1.28M图像数据集对ResNet-50网络训练90次情况下,单GPU卡K80需要运行25天,8个V100 GPU需运行8小时,1536个V100 GPU仅需运行1.33分钟,可以看出以GPU为核心的分布式计算系统大幅提升了训练效率。 GPU间通信带宽亟需提升,光通信迎来新一轮成长周期 GPU集群优化策略的重点之一是提升通信效率。当分布式训练在GPU集群上执行时,集群中的每个节点分别进行一部分计算,不同计算节点之间存在数据依赖和数据共享,需要在其中传输大量的模型参数和变量,对于系统内部通信效率的要求上升。根据总训练速度=单卡速度*加速芯片数量*多卡加速比(多卡训练下单卡吞吐量与单卡训练下吞吐量之比,是评估GPU集群扩展能力和加速能力的指标,主要由通信效率决定,数值越大越好),当模型的参数量达到十亿甚至万亿级别后,模型计算产生的临时变量规模庞大,由于通信瓶颈的存在,增加GPU的边际效应减弱,此时需要对通信方式进行优化。因此,通信性能对大模型运行速度和效率影响较大,优化通信策略是GPU集群调试优化的关键之一。 存储和计算能力大幅提升后,通信成为大模型性能优化瓶颈所在。大模型训练效率由计算、存储、网络通信三方面决定,近年来存储和计算能力增长迅速,所耗费的时间大幅下降。存储领域中,根据中国信通院于2021年发布的《下一代数据存储技术研究报告》,存储介质从机械硬盘(HDD)演进到闪存盘(SSD),介质访问时延从2ms下降到20μs;计算领域中,GPU半精度浮点运算能力由P100的21.2TFlops增加到H100的1979TFlops。另外,在分布式计算架构下,计算能力提升可以通过GPU数量增加实现,但通信带宽却无法通过简单堆叠而增加,反而计算节点数增加使得网络堵塞加剧,或带来更高的网络通信时延。因此,随着存储介质和计算处理器的演进,网络通信成为计算和存储性能发挥的瓶颈,根据开放数据中心委员会2021年9月发布的《数据中心网络技术白皮书》,在端到端时延中,网络通信时延占比超过80%,只有进一步提升通信效率,才能提高整体模型性能。 光模块是AI光网络的核心底座,通信性能提升依赖光模块用量增加和速率升级。在GPU集群中,通信主要分为两个部分:①节点内通信,指一个计算节点内GPU间的信息传输,提升节点内通信带宽需要优化互联技术。比如英伟达引入NVLink互联技术代替PCle,避免了数据通过PCI Express总线传输带来的瓶颈问题,根据英伟达技术经理路川在2022智算峰会上的演讲,互联技术由PCIe转变为NVLink后,程序的通信时间由656ms下降到70ms,速度提升8倍;②节点间通信,指不同计算节点之间的信息传输,节点间通信性能依赖于网络架构所能承载的最大数据流量。在网络架构中,交换机承载着各层级间的传输流量,而光模块的数量和速率决定交换机的实际传输能力,从而影响整个架构的数据传输流量上限。因此,光模块的性能决定了光网络的传输能力,增加光模块用量和提升光模块速率可以有效提高通信效率。 光模块升级至800G,叠加算力需求提升迎来高景气周期。高带宽、低延迟通信需求和功耗成本驱动光模块速率升级至800G。在分布式训练架构下,计算节点增多,大量数据需在不同节点间频繁通信,对传输速率和时延提出更高要求,推动光模块速率从400G升级至800G。同时随着AI模型规模不断增大,数据中心密度逐年上升,功耗显著增加,带来更高的热负荷和散热需求,因此降低功耗对数据中心建设尤为重要,根据ICC数据,相比2个400G光模块16W的功耗,新易盛800G FR8光模块功耗为11.2W,功耗下降30%,使用更高速率的光模块可缓解功耗焦虑。从升级周期看,800G光模块步入放量元年,北美头部云厂商开始批量采购,叠加AI浪潮下算力需求升级,光模块有望迎来新一轮高景气。 英伟达DGX H100搭配400G的InfiniBand网卡,在交换机一侧搭配800G光模块。英伟达DGX A100中,每个A100 GPU配一张NVIDIA Mellanox HDR 200Gb/s InfiniBand网卡,支持200G速率;升级到DGX H100后,一台服务器中搭载8个H100 GPU,每个H100 GPU配一张NVIDIA Mellanox NDR 400Gb/s InfiniBand网卡,速率提升至400G;在IB网络架构中,在InfiniBand交换机中搭载800G光模块的使用,催生了800G光模块需求。 AI网络中东西向流量大幅增长,通信带宽升级需求迫切。数据中心流量可分为南北向流量和东西向流量,南北向流量指数据中心之外的客户端到数据中心服务器之间的流量,以及数据中心服务器访问互联网的流量,东西向流量指数据中心内服务器之间的流量,以及不同数据中心间的流量。公有云业务中存在较多外部访问量,比如用户云端存储、计算需求,形成大量南北向流量。相比之下,AI大模型训练中大量的GPU服务器同时训练一个模型,这些设备之间需要频繁访问其他GPU的内存、进行数据通信,因此AI大模型训练网络的流量大多来自GPU之间的传输,东西向流量占比更大,对于GPU间的通信性能提出更高要求,带宽升级需求更为迫切。 不同于传统数据中心的三层网络架构,AI网络架构较多采用无阻塞Fat-Tree结构,带来光模块用量的提升。数据中心领域传统的网络架构为三层架构,其带宽逐层收敛,树根处的网络带宽小于叶节点处带宽总和。当存在大量东西向流量时,汇聚交换机和核心交换机的压力会大大增加,影响网络性能。根据中际旭创2021年8月发布的定增募集说明书,传统三层架构下光模块数为机柜数的8.8倍,结合天翼云数据,一个机柜中可容纳16台服务器,可估算出传统三层架构下服务器与光模块配比为1:0.55。无阻塞胖树(Fat-Tree)架构从叶子到树根,网络带宽不收敛,其中的每个节点都需要保证上行带宽和下行带宽相等,能确保在多个层级间数据传输的均匀分布,从而促进整体通信的平滑运行,同时能灵活扩展网络规模,因此Fat-Tree架构较为适合用于AI大模型的训练网络中。 定量测算:AI网络架构下,GPU与光模块需求配比如何? NVIDIA DGX SuperPOD网络架构是当前AI模型训练的主流架构选择。NVIDIA DGX SuperPOD网络架构是NVIDIA总结出的一套适用于大中小型AI模型训练的最优的数据中心运营建设方案,已发展成为AI大模型训练的主流架构选择。SuperPOD网络架构采用模块化设计,其基础组成单元为扩展单元(SU),每一个SU包含20台服务器,每台服务器8张H100 GPU,共160张GPU。每个SU的计算网络和存储网络分别由八张和两张400G InfiniBand交换机组成,作为叶交换机。服务器和网络结构之间的连接采用二层或三层胖树网络拓扑结构,实现上下层数据1:1的全流通。此结构采用的所有交换机都相同,因此能以较低成本构建大规模无阻塞网络。 依照英伟达IB网络架构设计,我们测算DGX H100中GPU:400G光模块:800G光模块之间的配比为1:1:2.5。英伟达采用的网络架构为IB(InfiniBand)网络,是一种无阻塞架构(胖树),网络侧自下而上可分为架顶交换机、叶交换机、脊交换机三层架构:1)服务器层,每台服务器中含有8颗GPU,每个GPU与一个400G网卡相连,通过一个400G光模块输出数据。2)架顶交换机和叶交换机层,分为上行和下行两个链路,上行/下行链路均使用800G光模块作为连接,为保证足够的网络带宽,IB采用无收敛的网络架构,交换机的上行端口数与下行端口数相等,使用的光模块数也相等。3)脊交换机层,由于是最上层架构,仅需下行链路,每个端口对应需一个800G光模块作为连接。综上,假设GPU用量为N个,仅服务器层用到N个400G光模块,架顶交换机和叶交换机层上行、下行链路共需2N个800G光模块,脊交换机层需0.5N个800G光模块。 英伟达推出DGX GH200,800G光模块用量大幅提升。继DGX H100之后,英伟达于2023年5月推出DGX GH200,把256个Grace Hopper超级芯片连接为一起,可提供1EFlops的FP8 Transform Engine算力,目标使用场景为存在GPU内存容量瓶颈的AI和HPC应用。GH200首次把Grace Hooper超级芯片与NVLink Switch System配对使用:1)Grace Hooper超级芯片采用NVLink-C2C技术,可实现超快速的芯片到芯片、裸片到裸片互联,使得Grace CPU和Hopper H100 GPU构成一个完整的系统,并实现内存的相互访问,而不需要沿着“CPU-内存-主板-显存-GPU”的PCIe路线,功耗效率、带宽大幅提升。2)NVLink Switch System使得系统中的GPU能够以全频宽互连,并在丛集中协同合作,可为运算密集的工作负载提供更高的频宽并减少延迟。两者配对使用,使得内存容量大幅上升,突破存储瓶颈,在巨型内存AI工作负载下性能表现突出。 DGX GH200集群中,单颗GPU对外互联带宽提升至450GB(单向)。GH200网络架构亦采用胖树无阻塞结构,包括L1交换机和L2交换机层,我们用流量法自下而上进行测算,各层级带宽情况为:1)芯片接入层:每个GPU采用18个NVLink,每条NVLink单向带宽为25GB,即单个GH芯片带来18×25GB=450GB的单向接入带宽,全部256个芯片带来256×450GB=115200GB的接入带宽;2)L1 NVLink交换机层:共有96个交换机,每个交换机有32个网络端口,下行和上行流量分别需要占用交换机115200GB/96/100GB=12个端口;3)L2 NVLink交换机层:共有36个交换机,每个交换机有32个网络端口,端口容量为36×32×100GB=115200GB,和接入层流量吻合,也印证该网络架构为两级、无阻塞Fat-Tree结构。 依据DGX GH200网络架构设计,我们测算出GPU与800G光模块的比例为1:9。1)芯片层与L1层之间:使用铜缆形态连接,无光模块需求;2)L1层与L2层之间:256颗芯片带来的流量为115200GB/s,单个800G光模块传输能力为100GB/s,单向传输需要115200GB/100GB=1152个光模块,即L1层上行链路和L2层下行链路分别需要1152光模块,共需要2304光模块。基于以上推理,芯片接入层与L1层之间流量传输不需要光模块(采用背板互联方案), L1层与L2层之间流量传输需要2304个光模块,整个网络架构需要2304个光模块,GPU与800G光模块需求比例为1:9。 市场竞争格局展望:东升西落大势所趋,强者恒强地位稳固 国产厂商强势崛起,东升西落趋势确定 国产厂商在全球光模块市场的份额持续提升。近十年国产光模块厂商不断拓展产品线和技术能力,凭借对光模块产品的交付能力、研发实力以及成本优势,在市场中的竞争实力大幅提升。据LightCounting数据,2010年全球光模块销售额前十大供应商中,国产厂商仅有武汉电信器件一家上榜,而2022年上榜中国厂商达到7家,分别为旭创(和Coherent并列第一)、华为海思(第四)、光迅科技(第五)、海信宽带(第六)、新易盛(第七)、华工科技(第八)、索尔思(第十,被华西股份收购);中国厂商在光组件和光模块市场上份额从2010年的15%上升至2021年的50%。其中中际旭创排名自2021年起与II-VI(现Coherent公司)并列全球第一位。 北美云厂商为最主要客户群体,在高速光模块需求端占主导地位 数通市场光模块需求主要来自TOP5云厂商,北美云厂商占据主导位置。根据LightCounting数据,2021年数通市场光模块需求中超过60%来自TOP5云厂商(亚马逊、谷歌、Facebook、微软、阿里巴巴),而且这一份额仍有扩大的趋势。据Canalys统计,2022年全球云厂商基础设施投入为2471亿美元,其中AWS、Azure、谷歌云分别占比32%、22%和9%,总占比达63%。以亚马逊、微软、谷歌为代表的北美云厂商凭借完善的底层基础设施、全面敏捷的PaaS软件能力、丰富多元的应用和服务生态在市场中处于领先地位,而随着AI、云计算的快速发展,头部厂商优势将进一步加强,领先地位或将更加突出。 北美云厂商光模块供应商准入壁垒较高,强者恒强地位稳固。数通市场下游竞争格局集中,北美云厂商占需求方主导地位,而由于不同厂商光模块之间或存在兼容性问题,下游厂商通常会选择少量光模块供应商,与其保持稳定合作。另外,头部厂商的光模块供应链进入验证时间较长,整个流程包括发光收光、眼图、消光比、高低温、兼容性等测试,从送样到通过验证周期较长。一旦进入供应链体系,客户较少会对供应商进行替换,除非供应商出现质量不佳或产能短缺问题。我们认为已切入海外数通光模块供应体系的国产厂商具有较强先发优势,未来有望呈现强者恒强局面。 国内光模块产业链厂商出海建厂,规避地缘政治风险 光模块企业陆续在海外建厂,满足不同地域客户交付需求。为应对地缘政治风险,及时响应不同地域客户需求,国内光模块企业陆续在海外建厂,进一步拓展在海外市场的交付能力。根据中际旭创于2023年5月5日披露的《投资者关系记录表》,其泰国工厂已完成设备调试、生产和客户验厂等工作,进入生产状态,主要出货400G和800G产品;根据新易盛于2023年7月3日披露的《投资者关系记录表》,其泰国工厂一期工程已建设完成,具备量产条件,二期工程已开始设计施工阶段,预计2024年建成;根据天孚通信于2023年5月31日披露的《投资者关系记录表》,其已在泰国购置土地用于工厂建设,建设筹备工作目前正在按计划顺利开展,预计今年海外工厂会投入运营;根据源杰科技于2023年6月2日发布的《对外投资设立境外子公司的公告》,其拟在新加坡设立境外子公司,进一步拓展海外市场,及时响应全球不同地域客户的需求。 技术发展趋势:关注LPO、CPO、薄膜铌酸锂等有望快速落地 AI算力升级趋势下,光模块降功耗、提带宽需求迫切。AI大模型训练需要调用大规模GPU集群,大量数据需在不同节点间频繁通信,对带宽提出更高要求,同时功耗成本迅速提升。据斯坦福人工智能研究所,GPT-3训练一次需要消耗128.7万度电。随着数据中心流量和功耗的增加,网络通信功耗占比也不断攀升。据EPIC上微软Azure首席工程师Mark Filer的演讲,在100G带宽下,网络通信功耗占数据中心总功耗不足10%,而800G带宽下这一数值升至20%。据Cisco研究员Rakesh Chopra在以太网联盟会议上的演讲,2022年单交换机的总体功耗是2010年单交换机功耗的22倍,其中光模块功耗增长了26倍。我们认为,AI发展带来低功耗、高带宽光模块需求,LPO、CPO作为降功耗&成本方案、薄膜铌酸锂作为提升带宽方案,有望赋能大模型高性能计算。 LPO:可插拔光模块架构下新演进,商业化落地进行时 LPO方案节省DSP芯片,带来光模块降低功耗及成本。LPO(线性驱动可插拔光模块)是基于Linear Driver芯片技术实现的可插拔光模块,不再采用DSP电芯片,只留下Driver和TIA电芯片,而把DSP功能集成到交换芯片中。目前主流的200G/400/800G产品都是基于PAM4的技术加上DSP芯片来实现高速、高调制的信号恢复和传输,DSP优势是具有很强的信号恢复能力,用来补偿信号损伤、降低误码率,劣势是成本高、延迟大、功耗高、发热明显,据R. Nagarajan 于2021年发表的论文《Low Power DSP-Based Transceivers for Data Center Optical Fiber Communications (Invited Tutorial)》,DSP芯片功耗占到整个光模块功耗的49%。LPO方案通过去掉DSP芯片,以有效节省光模块自身的功耗。 LPO方案满足数据中心短距离、低功耗、低延迟的连接需求。LPO方案的优势主要体现在:1)降功耗:根据Arista在OFC 2023上的分享,采用LPO方案后,不同光学方案(SiPh硅光、TFLN薄膜铌酸锂、VCSEL)的功耗均下降50%左右,交换机系统整体功耗下降25%左右;2)降延迟:LPO中不再使用DSP芯片,不涉及对信号的复原,整体系统的延迟会大大降低;3)降成本:DSP芯片在整个光模块成本中占比较大,使用更高性能的Driver和TIA芯片增加的成本小于DSP成本,总体来看光模块的成本下降;4)维护方便:LPO方案沿用可插拔的形式,可靠性较高,维护方便,可以利用现有成熟的光模块供应链。LPO方案的劣势主要体现在误码率或有所上升,去掉DSP芯片后或导致系统误码率会有所上升,或更适用于短距离传输场景。 产业链共同推动LPO方案落地。LPO方案对于供应链的冲击主要体现在:1)LPO方案中光模块不再采用DSP电芯片,同时Driver和TIA电芯片需要分别集成CTLE和Equalization功能,对于现有电芯片供应需求有所变化;2)LPO配套的交换机需要具备DSP功能,对于交换机提出了更高的要求,需要和交换机芯片以及交换机厂商共同推动LPO进展。从目前厂商布局情况看,产业链上下游均积极布局LPO,共同推动LPO发展。OFC 2023上,Macom(电芯片厂商)、博通(交换机芯片厂商)、Arista(交换机厂商)等厂商均展示了线性驱动方案;光模块厂商剑桥科技、新易盛等也纷纷布局LPO技术;根据剑桥科技于2023年5月发布的《投资者关系活动记录表》,下游云厂商Meta等亦在配合推进LPO的相关测试工作。 LPO出货量有望快速增长。跟据LightCounting于2023年5月的预测,LPO预计于2023年下半年到2024年开始部署,出货量有望从2023年的1.31万件增长到2028年的418万件,对应期间CAGR达217%,在800G及以上速率光模块中,LPO出货量占比预计从2023年的3%增长到2028年的19%。 CPO:高算力下新解决方案,发展前景广阔 光电共封装CPO提升了集成度并显著降低功耗。光电共封装CPO(co-packaged optics),指的是将光引擎和交换芯片共同封装在一起的光电共封装。较之传统方案中可插拔光模块插在交换机前面板的形式,CPO 方案显著缩短了交换芯片和光引擎之间的距离,使得损耗减少,高速电信号能够高质量地在两者之间传输,同时提升了集成度并能够降低功耗。与以往方案相比,CPO方案具有多方面优势:1)降功耗:在高速可插拔光模块中,高速电信号在交换机和光模块之间传输,由于传输距离较长,带来的功耗也较高,而CPO通过共封装形式大幅缩短交换芯片和光引擎间的布线距离,从而降低驱动功耗成本,据OFC 2023上Cisco的分享,CPO 方案可以节省高达25-30%的总系统功耗;2)提升系统可靠性:CPO方案有更高的系统可靠性,因为信号分布在许多独立的激光源中,单个激光器的故障不会使系统停机;3)增加集成度:光纤可插拔设备可能已达到其密度限制,CPO方案提高了整体系统密度。 CPO受制于工艺成熟度、产业链完备性,尚未大规模普及。CPO采用全新封装形式,目前面临的挑战主要体现在1)可维护性:CPO方案不再采用可插拔模式,和现有光模块差异较大,维护成本较高;2)下游客户采购模式:目前下游云厂商直接向光模块厂商采购产品,而CPO方案中光引擎和交换芯片共同封装,交换机厂商在产业链中位置提升,可能会对现有产业链造成冲击,从目前产业链布局看,CPO方案主要由交换机芯片厂商(博通等)以及交换机厂商(Cisco等)推进;3)技术成熟度:CPO在技术方面仍存在尚未解决的问题,包括高密度光电PCB板工艺、高精度的光电芯片封装工艺和散热设计、高度集成化光电芯片可靠性设计等。 多家厂商布局CPO产品,市场空间可期。博通是CPO开发领域为数不多的领导者之一,在2023年光纤通信会议(OFC)上展示了其最新的交换机产品Broadcom Tomahawk StrataXGS 5,将交换机芯片和100G PAM4接口共同封装在一起,光学连接所需的功率可降低50%以上。其他厂商思科、天孚通信、亨通光电等也纷纷研发CPO技术,布局相关产品。据LightCounting于2023年5月的预测,2022-2027年800G CPO累计出货量将占800G光模块总数的20%,1.6T CPO的出货量将占1.6T光模块总数的16%,CPO的出货量将从2022年的7816件增加到2028年的179万件。 薄膜铌酸锂:调制器新型材料,适用高速高带宽的长距离通信 薄膜铌酸锂材料集成度高,适用于光通信、光学传感等领域。铌酸锂(LiNbO3)材料具有光电效应多、性能可调控性强、物理化学性能稳定、光透过范围宽等特点,基于铌酸锂的调制器广泛用于100G-1.2T长距骨干网相干通讯和单波100/200G的超高速数据中心。而薄膜铌酸锂(TFLN)是通过“离子切片” 的方式,从块状的铌酸锂晶体上剥离出铌酸锂薄膜,并键合到附有SiO?缓冲层的Si晶片上,形成的薄膜铌酸锂材料。相比于传统的体材料结构,薄膜铌酸锂平台可以实现更高的集成度、更好的性能。作为一种新型的光学材料,在光通信、光学传感和光子集成电路等领域具有巨大发展潜力。 薄膜铌酸锂调制器具有低功耗、高速率等卓越性能。薄膜铌酸锂材料具有以下优势:1)高带宽:薄膜铌酸锂电光效应性能突出,其电光系数比InP(磷化铟)更高,因此调制效率更高,拥有更高的带宽;2)低损耗:薄膜铌酸锂调制器的驱动电压和光损耗较低,在长距离通信中信号传输损耗小,优势明显;3)响应速度快:薄膜铌酸锂的光学响应速度非常快,适用于高速光通信和光调制等应用。根据LightCounting于2023年5月发布的报告,与InP和SiP调制器相比,TFLN调制器具有更高的透明度和低驱动电压,从而导致更低的插入损耗和更高的输出功率。根据LightCounting预测,TFLN技术预计将在一些可插拔的1.6T光模块、更高速的DWDM光模块等场景中使用。 多家厂商布局薄膜铌酸锂技术和产品,加速商业化落地。2021年10月,富士通推出世界首款可商用的200GBaud薄膜铌酸锂调制器;2022年1月,中山大学与华为合作推出世界首例基于铌酸锂薄膜的偏振复用相干光调制器芯片,实现高达1.96Tb/s的单载波传输速率,支持130G波特率,随后铌奥光电推出铌酸锂薄膜相干调制器芯片,首次实现波特率高达260G波特的DP-QPSK信号100公里传输距离;2023 OFC上,新易盛推出基于薄膜铌酸锂调制器的800G DR8光模块,功耗仅为11.2W;2023年美国西部光电展上,光库科技展示了薄膜铌酸锂强度调制器产品“C+L波段70GHz 强度调制器(AM70)”,具有高带宽、小体积特点;联特科技有基于薄膜铌酸锂调制技术的800G光模块。 薄膜铌酸锂调制器适用高速高带宽的长距离通信,有望规模量产。薄膜铌酸锂作为调制器新型材料,相比其他材料,比如InP(成本和集成难度大)、SiP(性能受限,适用短距离传输)、铌酸锂(体积较大),其具有高调制带宽、良好消光比和优越的器件稳定性,可广泛应用于高速高带宽的长距离通信。随着AI高性能计算对带宽要求提升,薄膜铌酸锂调制器需求将持续增长,据LightCounting于2023年5月的预测,基于薄膜铌酸锂调制器的光模块销售额将从2023年的0.23亿美元增加到2028年的23.34亿美元,销售额占比将从2023年的0.19%增加到2028年的11.08%。 光模块产业链上游:关注高速光芯片国产化机遇 光芯片、电芯片是光通信系统上游核心元器件。光芯片、电芯片与其他基础构件构成光通信产业上游,产业中游为光器件,包括光组件与光模块,产业下游组装成系统设备,最终应用于电信市场与数通市场。根据前瞻产业研究院于2022年3月发布的《中国光通信器件行业全景图谱》,光模块成本构成中TOSA和ROSA分别占比35%、23%,电芯片占比18%;结合亿渡数据,光芯片在TOSA和ROSA中的成本占比达85%,综上可以得到光芯片和电芯片在光模块成本占比分别为50%和18%,是主要的成本来源。光芯片是实现光电信号转换的基础元件,包括实现电光转换的激光器芯片和光电转换的探测器芯片,其性能直接决定了光模块的传输效率。电芯片主要对复杂的数字信号进行处理,并为光芯片工作提供配套支持,其中高速率光模块普遍使用的DSP电芯片门槛较高,市场份额集中于Marvell、博通等少数国外厂商。 光芯片决定光通信系统传输效率,25G及以上激光芯片具备较高工艺壁垒 光芯片决定光通信系统传输效率。光芯片按功能可以分为激光器芯片和探测器芯片,其中激光器芯片主要用于发射信号,将电信号转化为光信号,探测器芯片主要用于接收信号,将光信号转化为电信号。激光器芯片,按出光结构可进一步分为面发射芯片和边发射芯片,面发射芯片包括VCSEL芯片,边发射芯片包括FP、DFB和EML芯片。高速光芯片是现代高速通讯网络的核心之一,光芯片系实现光电信号转换的基础元件,其性能直接决定了光通信系统的传输效率。光纤接入、4G/5G移动通信网络和数据中心等网络系统里,光芯片都是决定信息传输速度和网络可靠性的关键。 25G及以上激光芯片具备较高工艺壁垒。相较于2.5G、10G中低速率DFB激光器芯片,25G DFB激光器芯片的技术研发、工艺设计具有更高开发难度与门槛。根据源杰科技于2022年5月7日提交的上市审核问询函回复材料,25G DFB激光器芯片尺寸已逼近工艺物理极限,结构设计的精度要求极高,制造一颗25G DFB激光器芯片的生产工序超过280道,比中低速率激光器多出50~70道,每道生产工序都将影响产品最终的性能和可靠性,因此对生产线工艺成熟和稳定有极高要求。此外,25G DFB激光器芯片相较于中低速率产品,在量子阱有源区、光栅层结构区等关键结构的设计与开发上,需综合考虑光电特性、产品可靠性等相互制约因素,因此存在较高壁垒。 晶圆有源发光区的量子阱设计和制造是激光器芯片的核心。根据源杰科技于2022年5月7日提交的上市审核问询函回复材料,量子阱外延片共包含20-30层结构,每层量子阱厚度4-10nm不等。相较于中低速率激光器芯片,25G DFB激光器芯片有源区量子阱堆叠层数更多。25G DFB激光器芯片的有源区量子阱层数较中低速率激光器芯片超过50%,要求对每层量子阱实现埃米级(0.1nm)控制,以及量子阱厚度精度误差小于0.2nm。 高速率DFB光栅层制作难度较高。根据源杰科技2022年5月7日上市审核问询函回复材料,高速率DFB芯片光栅层要求变相非等周期结构,传统生产设备无法制备在激光器芯片的光栅结构中,等周期布拉格光栅结构一般可满足中低速率激光器芯片性能要求,而25G及以上速率DFB激光器芯片要求使用变相非等周期的布拉格光栅。等周期光栅可利用传统的全息曝光系统制作,但变相非等周期光栅需利用更高精度、更先进的电子束光栅系统,要求工艺精度达到1nm,才能实现晶圆上每颗芯片一致的光电特性。电子束光栅系统设备价格昂贵,采购与工艺开发周期长,目前掌握该技术的厂商数量较少。 竞争格局:2.5G/10G光芯片已实现国产化,25G及以上高端市场亟待突破 2.5G/10G光芯片市场已实现国产化。根据ICC统计,2021年全球2.5G及以下 DFB/FP激光器芯片市场中,国产厂商占比较高,武汉敏芯(出货量份额为17%)、中科光芯(17%)、光隆科技(13%)、光安伦(11%)较为领先。其中在部分附加值较高的产品方面,如PON(GPON)数据下传光模块使用的2.5G 1490nm DFB激光器芯片,根据C&C统计,2020年源杰科技出货量占据该细分市场80%的份额;10G光芯片方面,根据ICC统计,2021年全球10G DFB激光器芯片市场中,较为领先的厂商包括源杰科技、住友电工等,其中源杰科技发货量占比为20%,全球市场份额居首。但另一方面,部分10G光芯片产品性能要求较高、难度较大,如10G VCSEL/EML激光芯片等,国产化率不到40%。 25G产品进口替代空间广阔。随着5G建设推进,我国光芯片厂商在应用于5G基站前传光模块的25G DFB激光器芯片有所突破,数据中心市场光模块企业开始逐步使用国产厂商的25G DFB激光器芯片,根据ICC统计,25G光芯片的国产化率约20%,但25G以上光芯片的国产化率仅为5%,当前25G及以上高速率光芯片仍多依赖进口,未来伴随国产厂商技术的进一步提升,对高速率光芯片的进口替代有望持续推进。 光模块产业链代表性公司梳理 光模块产业链主要由光芯片、DSP芯片、光器件、光模块、连接器/线缆构成。在光模块上游原材料中,光芯片、DSP芯片专业化程度高、技术门槛高,其中DSP芯片以海外厂商占据主导位置,国产光芯片厂商正快速突破;光器件包括TOSA、ROSA等有源器件,以及光隔离器、光分离器等无源器件,是光模块的主要组成部分,由于该环节产品形态较为多元化,无源和有源类器件类目较多,并涉及陶瓷、金属、塑料、玻璃等多种材料技术的应用,故产品综合研发难度较大,国内主要参与者包括天孚通信、光库科技、腾景科技等;光模块环节国产化程度较高,中际旭创、新易盛等厂商在全球占据领先地位;连接器/线缆包括MPO、DAC等连接产品,主要参与者包括太辰光、兆龙互连、致尚科技等。 风险提示: 1)全球AI算力侧投入不及预期:以ChatGPT为代表的AI大模型快速发展,全球AI算力需求升级,带来光模块需求增长。若全球AI算力侧投入不及预期,或导致光模块需求不及预期,对光模块厂商业绩增长产生一定负面影响; 2)光模块行业竞争加剧:随着AI大模型快速发展带来算力升级,光模块下游需求持续增长,国内光模块行业呈现较快发展态势,若行业厂商竞争态势加剧,或对产品的销售价格产生负面影响,继而对厂商销售收入和利润率产生一定负面影响; 3)国产高速光芯片研发进展不及预期:目前光芯片市场由海外厂商占据领先地位,国内厂商有望把握进口替代机遇,但若国产高速光芯片研发进展和进口替代进展不及预期,或导致业绩增长不及预期风险。 相关研报 研报:《光通信:乘AI东风起,扬帆正启航》 2023年7月17日 黄乐平 S0570521050001/AUZ066 关注我们 华泰证券研究所国内站(研究Portal) https://inst.htsc.com/research 访问权限:国内机构客户 华泰证券研究所海外站 https://intl.inst.htsc.com/mainland 访问权限:美国及香港金控机构客户 添加权限请联系您的华泰对口客户经理 免责声明 ▲向下滑动阅览 本公众号不是华泰证券股份有限公司(以下简称“华泰证券”)研究报告的发布平台,本公众号仅供华泰证券中国内地研究服务客户参考使用。其他任何读者在订阅本公众号前,请自行评估接收相关推送内容的适当性,且若使用本公众号所载内容,务必寻求专业投资顾问的指导及解读。华泰证券不因任何订阅本公众号的行为而将订阅者视为华泰证券的客户。 本公众号转发、摘编华泰证券向其客户已发布研究报告的部分内容及观点,完整的投资意见分析应以报告发布当日的完整研究报告内容为准。订阅者仅使用本公众号内容,可能会因缺乏对完整报告的了解或缺乏相关的解读而产生理解上的歧义。如需了解完整内容,请具体参见华泰证券所发布的完整报告。 本公众号内容基于华泰证券认为可靠的信息编制,但华泰证券对该等信息的准确性、完整性及时效性不作任何保证,也不对证券价格的涨跌或市场走势作确定性判断。本公众号所载的意见、评估及预测仅反映发布当日的观点和判断。在不同时期,华泰证券可能会发出与本公众号所载意见、评估及预测不一致的研究报告。 在任何情况下,本公众号中的信息或所表述的意见均不构成对任何人的投资建议。订阅者不应单独依靠本订阅号中的内容而取代自身独立的判断,应自主做出投资决策并自行承担投资风险。订阅者若使用本资料,有可能会因缺乏解读服务而对内容产生理解上的歧义,进而造成投资损失。对依据或者使用本公众号内容所造成的一切后果,华泰证券及作者均不承担任何法律责任。 本公众号版权仅为华泰证券所有,未经华泰证券书面许可,任何机构或个人不得以翻版、复制、发表、引用或再次分发他人等任何形式侵犯本公众号发布的所有内容的版权。如因侵权行为给华泰证券造成任何直接或间接的损失,华泰证券保留追究一切法律责任的权利。华泰证券具有中国证监会核准的“证券投资咨询”业务资格,经营许可证编号为:91320000704041011J。

大部分微信公众号研报本站已有pdf详细完整版:https://www.wkzk.com/report/(可搜索研报标题关键词或机构名称查询原报告)

郑重声明:悟空智库网发布此信息的目的在于传播更多信息,与本站立场无关,不构成任何投资建议。