【光大海外】英伟达FYQ3 过渡期指引稳健,FYQ4 Blackwell 出货助力业绩高增
(以下内容从光大证券《【光大海外】英伟达FYQ3 过渡期指引稳健,FYQ4 Blackwell 出货助力业绩高增》研报附件原文摘录)
【特别提示】本订阅号中所涉及的证券研究信息,均取自于光大证券已正式外发研究报告,由光大证券海外研究团队(TMT/消费/医药/制造等)编写,仅面向光大证券专业投资者客户,用作新媒体形势下研究动态的宣传。研究报告有时效性,任何研究报告内容仅代表报告外发时特定时点的研究信息汇总,任何关于研究报告、研究观点的解读,请联系对口销售或具体研究员。非光大证券专业投资者客户,请勿订阅、接收或使用本订阅号中的任何信息。本订阅号难以设置访问权限,若给您造成不便,敬请谅解。光大证券研究所不会因关注、收到或阅读本订阅号推送内容而视相关人员为光大证券的客户。 报告发布信息 报告标题:《FQ3 过渡期指引稳健,FQ4 Blackwell 出货助力业绩高增——英伟达(NVDA.O)FY25Q2 业绩点评 & SIGGRAPH、Hot Chips 点评》 报告发布日期:2024年9月2日 分析师:付天姿,CFA,FRM(执业证书编号:S0930517040002) 分析师:王贇(执业证书编号:S0930522120001) 联系人:董馨悦 联系人:沈昱恒 往期回顾 【光大海外】英伟达:Q1业绩和Q2指引超预期,B系列加快出货、预计FY25贡献显著 【光大海外】“AI核弹”Blackwell发布,英伟达向AI软硬一体平台转型 【光大海外】英伟达:预计FY25业绩持续高速增长,关注多模态机遇和后续H200、B100表现 【光大海外TMT】英伟达FY24Q3业绩跟踪 【光大海外TMT】英伟达FY24Q2业绩 & SIGGRAPH 2023大会点评 要点 事件:美国时间2024年8月28日盘后,英伟达发布截至2024年7月28日的FY25Q2季报。FY25Q2英伟达营收和盈利均超市场预期。FY25Q2营收300.4亿美元,QoQ+15%,YoY+122%,超过此前公司280亿美元的营收指引,较286.8亿美元的一致预期高逾4.7%,系Hopper GPU计算及网络平台需求强劲。盈利方面,Non-GAAP毛利率达75.7%,QoQ-3.2pct,YoY+4.5pct,高逾此前公司指引的75.5%;Non-GAAP净利润169.5亿美元,QoQ+11%,YoY+152%,对应EPS 0.68美元,超过市场预期的0.64美元。FY25Q3指引营收325亿美元,增速有所放缓。FY25Q3收入指引325亿美元,QoQ+8%,YoY+79%,较319亿美元的一致预期高逾1.8%,但增速有所放缓且低于买方业绩前瞻;FY25Q3 Non-GAAP毛利率指引75%。英伟达董事会已批准500亿美元的股票回购计划。 点评:Hopper GPU强劲需求驱动数据中心高增。1)数据中心业务:FY25Q2营收263亿美元,QoQ+16%,YoY+155%,营收贡献占比增至87.5%,成为拉动业绩的强力引擎;客户结构,45%收入来自云服务提供商,50%+的收入来自消费互联网公司和企业级客户;过去四个季度,推理对数据中心收入贡献40%+,为长期增长驱动力。2)游戏业务:FY25Q2营收29亿美元,YoY+16%,QoQ+9%,系返校季需求强劲;3)专业可视化业务:FY25Q2营收4.54亿美元,YoY+20%,QoQ+6%,目标构建可视化虚拟世界提升运营效率;4)汽车业务:FY25Q2营收3.46亿美元,YoY+37%,QoQ+5%,系自动驾驶和人工智能驾驶舱需求提升。 AI算力需求持续高涨,CoWoS和HBM加速扩产助力供给改善。1)需求:AI算力产业链高景气,云厂商持续加大投入,大模型性能升级提振长期需求。中际旭创和超微电脑等相关供应商均在最新业绩期表明AI业务高速增长,印证AI算力产业链高景气度;北美云厂商表明将大力投资AI基础设施建设;大模型在MAS等技术趋势下持续升级,提振AI芯片长期需求。2)供给:CoWoS积极扩产,HBM3E量产在即,助力Blackwell量产出货。台积电积极扩产、CoWoS产能有望连续两年翻倍增长,CoWoS-L生产改善助力Blackwell FY25Q4量产出货。 Blackwell延期可控,丰富产品带动FY25Q4后业绩高增。1)延期可控:Blackwell掩膜更改完成,FY25Q2已送样,FY25Q4将出货并贡献数十亿美元营收;2)Blackwell家族:产品丰富,涉及单卡、超级芯片、服务器、网络和机架系统等,其中机架解耦式出货实现灵活部署,液冷需求强劲。FY25Q3系产品转换期,看好供给改善&Blackwell平台出货助力FY25Q4及FY26业绩持续高速增长。 盈利预测与估值:我们认为CoWoS、HBM新增产能释放将驱动供给端持续改善,叠加Blackwell生产问题基本解决、将于FY25Q4生产出货,预计需求强劲且高价值量的Blackwell平台能带动英伟达业绩在FY25Q4和FY2026期间持续高速增长。我们上调英伟达FY2025 GAAP净利润至679.6亿美元,同时新增FY2026~FY2027 GAAP净利润预测1072.3/1544.9亿美元,对应同比增速128%/58%/44%,对应FY2025~FY2027 GAAP EPS为2.77/4.37/6.30美元。8月29日收盘价117.59美元对应FY2025/FY2026 42x/27x PE,考虑到FY25Q4 Blackwell预计加速出货,英伟达业绩有望进入新增长阶段,维持“买入”评级。 风险分析:1)下游应用程序开发和场景拓展较慢,导致AI商业化进度不及预期;2)CoWoS和HBM产能扩张受限的风险;3)AI算力行业竞争加剧的风险。 目录 正文 1 整体业绩:英伟达FY25Q2营收超预期、净利润水平持续提升 1.1、FY25Q2营收和净利润持续提升,Hopper GPU计算平台强劲需求驱动数据中心业务营收破百亿美元 英伟达FY25Q2业绩超市场预期和公司指引,数据中心业务成为强劲增长引擎。英伟达FY25Q2实现收入300.4亿美元,环比增长15%,同比增长122%,大幅超过24年5月公司指引的280亿美元,较Refinitiv一致预期286.8亿美元高逾4.7%,营收表现强势主要系英伟达Hopper GPU计算及网络平台的强劲需求,驱动数据中心业务大幅增长;FY25Q2数据中心业务营收创纪录,达263亿美元,环比增长16%,同比增长154%。2024年8月,董事会批准500亿美元的股票回购计划。 净利润水平升至历史高位。FY25Q2 Non-GAAP毛利率达75.7%,环比减少3.2pct,同比增长4.5pct,高于24年5月时公司指引的75.5%;Non-GAAP净利润实现169.5亿美元,环比增长11.2%,同比增长151.5%;毛利率环比下降主要系数据中心中新产品比例增加以及对低回报率Blackwell材料的库存拨备。Non-GAAP摊薄每股收益为0.68美元,环比增长11.5%,同比增长151.9%,较Refinitiv一致预期每股0.64美元高逾6.3%。 1.2、四大业务板块分析:数据中心收入大幅增长37亿美元,游戏、专业可视化收入实现环比增长 FY25Q2数据中心业务收入相比FY25Q1大幅增长37亿美元,游戏和可视化业务收入环比向上。其中,1)数据中心:Q2营收实现262.7亿美元,相比Q1的225.6亿美元环比上升37.1亿美元,环比增长16.4%,同比增长154.5%,较Refinitiv一致预期251.1亿美元高逾4.6%。数据中心业绩飞跃,带动公司整体收入增长;Q2数据中心的营收贡献占比由Q1的86.6%增长至87.5%;2)游戏:Q2营收实现28.8亿美元,环比增长8.8%,同比增长15.8%,较Refinitiv一致预期27.6亿美元高逾4.4%。营收贡献占比因数据中心高速增长而压缩至9.6%,环比下降0.6pct;3)专业可视化:Q2营收实现4.5亿美元,环比增长6.3%,同比增长19.8%,较Refinitiv一致预期4.6亿美元低逾1.9%。对应营收贡献占比为1.5%,环比下降0.1pct;4)汽车:Q2营收实现3.5亿美元,环比增长5.2%,同比增长36.8%,较Refinitiv一致预期3.4亿美元高逾0.6%。对应营收贡献占比为1.2%,环比下降0.1pct。 数据中心业务:收入同比高增,Hopper平台需求强劲。 25Q2数据中心收入 263 亿美元,同比增长 154%,环比增长 16%,其中算力收入226 亿美元,同比增长 162%,环比增长 17%;网络收入37 亿美元,同比增长 114%,环比增长 16%,由InfiniBand 和以太网驱动。从客户结构上看,约45%的收入来自云服务提供商,超50%的收入来自消费互联网公司和企业客户。 AI推理为数据中心收入重要来源,下一代生成式AI模型对算力需求将进一步增加。生成式AI模型的训练和推理、视频图像和文本数据的处理等需求推动数据中心业务高增长。最新MLPerf 推理测试中,Hopper与Blackwell平台取得领先,彰显公司在AI推理领域领先地位。根据公司业绩会,在过去四个季度,推理对数据中心收入贡献超过40%。云服务厂商、消费互联网公司以及大量初创企业,在广告、教育、医疗、机器人等各领域构建生成式AI应用,对生态系统丰富程度和云端可用性的需求进一步提高,下一代模型对算力的需求将达到目前的10-20倍。 Hopper需求强劲,Blackwell有望于25Q4开启量产爬坡。根据公司业绩会,公司下游客户加速采购 Hopper 架构芯片,基于Hopper架构的H200平台于FY25Q2开启量产爬坡进程,向大型云服务提供商、消费者互联网以及企业公司发货。FY25Q2 H200在中国的数据中心收入环比增长,是数据中心业务的重要收入来源。公司预计FY25H2Hopper出货量有望提高。Blackwell的供应方面, Blackwell GPU的量产爬坡有望于FY25Q4启动,并持续至FY2026年,公司预计FY25Q4Blackwell产品的收入将高达数十亿美元。Blackwell 的需求方面,公司表示客户对Blackwell的需求远超供应,供不应求的状态将持续至明年。 Spectrum-X以太网平台大受好评,NIM推理微服务助力开发生成式AI应用。Spectrum-X的AI处理性能是传统以太网的1.6倍,并能够连接全球最大GPU计算集群。根据公司业绩会,数百家GPU云提供商、企业以及OEM和ODM合作商采用Spectrum-X以太网平台。FY25Q2的AI以太网收入环比增长1倍,未来1年内Spectrum-X的产品线规模有望达到数十亿美元。为满足计算集群扩展的巨大拓展需求,公司拟每年推出全新的Spectrum-X 产品。3月公司推出NIM推理微服务并于7月宣布升级,公司通过Llama 3.1模型集合NVIDIA AI Foundry服务与NIM微服务,加速全球企业生成式AI应用的开发进程,已有150+家公司在其平台上集成了NIM。 游戏业务:游戏目录品类不断拓展,RTX AI PC支持NVIDIA ACE试用。 FY25Q2游戏收入29 亿美元,同比增长 16%,环比增长 9%,由于返校季GeForce RTX 40系列GPU和游戏主机系统级SOC的需求强劲。英伟达持续强化游戏生态的建设,公司对RTX技术在生成式AI领域的发展前景表示乐观,推出了600+RTX游戏与应用,并将GeForce NOW游戏目录拓展至2000+。RTX AI PC独家支持NVIDIA ACE 生成式AI微服务的运行,Megabreak是首款搭载NVIDIA ACE的游戏。 专业可视化业务:数字化工作流程与虚拟世界构建成为业务亮点。 FY25Q2专业可视化收入4.54亿美元,同比增长20%,环比增长6%。制造业公司与汽车公司广泛开启工作流程的数字化,构建可视化虚拟世界。富士康、奔驰就在Omniverse云平台上搭建工业数字双胞胎,以提高运营效率。USD NIM与连接器使开发者能够将生成式AI助手和代理整合到USD工作负载中,由此强化构建高精度虚拟世界的能力。此外,USD NIM微服务赋能WPP为可口可乐等客户提供基于生成式AI的可视化广告创作。 汽车业务:自动驾驶平台和人工智能驾驶舱需求驱动收入增长。 FY25Q2汽车业务收入3.46亿美元,同比增长37%,环比增长5%。同比高增长主要系自动驾驶平台的新客户数量增加以及人工智能驾驶舱的需求提升。在计算机视觉与模式识别(ComputeVisionandPatternRecognition)大会上,公司赢得了大规模端到端驾驶挑战赛,表现超过了400多个来自全球的竞争对手。此外,波士顿动力、比亚迪电子、西门子等厂商均使用公司Isaac机器人平台自主进行机器人手臂、人形机器人和移动机器人的开发。 1.3、FY25Q3指引及前景展望:Q3营收增速有所放缓,看好Blackwell放量带动Q4及FY2026高速增长 FY25Q3英伟达营收增速有所放缓,但公司对Blackwell新平台需求指引积极。公司FY25Q3收入指引325亿美元,对应环比增长8.2%,同比增长79.4%,较Refinitiv市场一致预期319.13亿美元高逾1.8%;GAAP和Non-GAAP毛利率分别指引74.4%和75.0%,相比Q2出现下降趋势,指引Non-GAAP毛利率同比和环比分别变化0pct和-0.7pct。FY25Q3指引的营收和毛利率小幅低于买方业绩前瞻,且FY25Q3预期增速有所放缓,导致英伟达业绩发布第二天(2024年8月29日)股价下跌6.38%。但我们认为FY25Q3为Blackwell产品未出货的过渡期,英伟达对Blackwell新平台的需求指引乐观,看好FY25Q4及FY2026在供给改善和Blackwell加速放量的催化下驱动业绩持续高速增长。 2 AI算力需求持续高涨,CoWoS和HBM加速扩产助力供给端改善 2.1、需求:AI算力产业链高景气,云厂商持续加大投入,大模型性能升级提振长期需求 2.1.1、AI算力高景气持续,光模块、服务器等相关产业链公司表述AI需求强劲 受益于下游客户对算力基础设施的资本开支加大,光模块需求强劲。CoherentFY24Q4业绩会表明,AI的快速发展推动数据通信市场的增长到达转折点,受益于面向AI的800G数据通信收发器的强劲增长,FY24Q4通信业务收入环比增长10%。公司看好AI机器学习的ROI,加大云基础设施支出以抓住机遇。中际旭创24H1营业收入同比大幅增长169.70%,重点客户对算力基础设施领域资本开支的进一步加大,极大促进了对400G、800G光模块的需求。 生成式AI浪潮推动服务器需求激增。服务器厂商超微电脑和英伟达联系紧密,由于大规模数据中心客户的增加,FY24Q4超微电脑超大数据中心业务收入同比上升192%,收入占比环比提升14pct。超微电脑FY24Q4业绩会表明:公司大规模数据中心客户增加,超大数据中心业务占比增加,FY24Q4毛利率相应下降;由于客户对DLC液冷服务器机架强劲需求超出预期,6月关键零组件一度发生短缺。 2.1.2、北美云厂商持续加大AI投入,英伟达客户多元性持续提升 北美四大云厂商的AI算力军备竞赛激烈,AI芯片需求高涨。谷歌、微软、亚马逊最新季度资本支出均高于100亿美元,且同比增幅超50%;Meta于24Q2上调24年资本支出指引,并计划大力提高25年资本支出。四大云厂商大力投资于AI相关基础设施建设和芯片升级,以支持日益增长的计算、推理需求。根据Gartner的最新预测,2024年全球AI芯片市场规模预计同比增长33%到达710亿美元,AI算力需求强劲与算力基础设施的高增长态势将推动高性能芯片需求持续提升。 各国AI专业知识与AI基础设施意识的增强,为英伟达主权AI的增长带来巨大机遇。各国十分重视开发能融入本国语言、文化和本国AI大模型的生成式AI,AI专业知识和AI GPU等核心基础设施已成为“国家当务之急”。黄仁勋与日本、加拿大、印度、阿联酋等多个国家的领导人进行会谈,推广主权 AI战略,帮助各国建立自主可控的数据中心、发展本国的 AI 能力和产业。日本先进工业科学技术研究正与英伟达携手推动人工智能桥接云基础设施3.0超级计算机的建设。根据公司业绩会,公司预计FY25主权AI收入将从FY24的零达到数十亿美元。 2.1.3、AI大模型性能持续升级,推动AI芯片需求长期增长 多代理系统提升复杂任务工作流,AI大模型性能仍有较大提升空间。多代理系统(Multi-Agent System,MAS)由诸多独立自治的智能体组成,拥有独立算法资源、可通过灵活交互协作完成复杂的决策任务。与高度集中的单一代理(Single-Agent System)系统不同,MAS能够更好将复杂任务拆解成步骤清晰的工作流,通过不同职责与工作的模块化分工,发挥不同智能体的特长、进行高度专业化的工作,并让各Agent间真正交互,从而显著提升任务处理的效率与准确性。同时,结合反馈规划(Planning with Feedback)机制的引入,使得模型能够在执行任务的过程中,实时调整、强化学习和复杂任务应对能力,从而得以让模型在动态环境中实现更高的推理精度,使其更加接近人类智能。新技术趋势的出现驱动AI大模型持续迭代升级,进而推动各AI大模型研发团队继续加大的AI芯片等硬件基础设施的投入。 大模型的可预测扩展性助力未来AI计算需求呈现可预测的持续增长。Predictable Scaling(可预测扩展性)作为GPT-4模型开发与部署的核心概念,可在大模型训练初期,利用大模型和小模型的同源性,通过拟合较小模型的性能曲线预测大模型性能,进而指导大模型优化训练,降低大模型训练时的计算资源成本。同时,Predictable Scaling仍满足AI大模型的底层逻辑Scaling Law,因此在Predictable Scaling的指导下,随着后续AI大模型的参数量和数据量逐渐复杂,其训练所需的计算量是可预测且持续增长的,进而对AI芯片等训练资源提出更多需求。 AI推理贡献占比40%+,更多生成式AI应用程序的部署推动其长期需求增长。推理业务已成为英伟达数据中心收入的重要驱动力,过去四个季度中推理相关业务贡献了英伟达数据中心40%+的收入。推理方面,英伟达的芯片需求主要来自前沿模型制造商、消费互联网公司和初创企业,他们在各自领域中构建生成式AI应用程序,更多AI生态和应用的部署驱动AI推理需求持续增长。 2.2、供给:CoWoS积极扩产,HBM3E量产在即,助力Blackwell量产出货 供给方面,英伟达Blackwell平台因生产问题导致延迟至FY25Q4出货,随着CoWoS产能持续提升、供给瓶颈改善,结合Blackwell平台各类丰富产品于FY25Q4加速放量,看好后续业绩持续高速增长。 2.2.1、台积电积极扩产,CoWoS-L产能情况改善助力Blackwell FY25Q4量产出货 台积电积极扩产,CoWoS产能有望连续两年翻倍增长。台积电董事长魏哲家曾在业绩会透露,2024年CoWoS产能有望较原先预期的倍增再增加,台积电位于中科的先进封装测试5厂预计将在2025年投入CoWoS量产,有望进一步推动2025年产能的增长幅度超过倍增。根据24年8月的产业链消息,台积电已将2025年底的CoWoS产能预测从先前的6-6.2万片/月上调至7万片/月。 CoWoS-L是生产B200的关键,当前面临生产问题。CoWoS-S和CoWoS-L主要区别在中介层,CoWoS-S的中介层相当于一片硅板,随着AI芯片对尺寸和性能提出更高要求,CoWoS-S在硅中介层尺寸、生产和可靠性方面面临瓶颈。台积电基于此推出CoWoS-L,在RDL中介层中加入了LSI芯片(Local Silicon Interconnect),在保留了硅中介层所有优秀特性的同时避免了大型硅中介层良率问题,帮助AI芯片实现更高布线密度和更大尺寸。英伟达B200芯片由于die size较大而必须采用CoWoS-L进行封装。当前CoWoS-L的良率较CoWoS-S偏低、约为90%,面临生产问题,主要系硅、中介层和基片之间因热膨胀系数不匹配而导致翘曲,英伟达希望通过掩膜的重新设计以进一步提高Blackwell的稳定性,这是导致Blackwell生产延期的主要原因之一。 Blackwell于FY25Q4开始量产提振后续业绩,Hopper供应持续改善。英伟达Blackwell延迟出货导致FY25Q3成为产品转换空白期,我们看好台积电CoWoS供给改善伴随Blackwell量产出货将持续提振英伟达FY25Q4及FY2026业绩。分产品来看,Hopper出货量预计将在FY25H2继续增长,许多新产品将在Q4生产,供应和可用性也将有所改善;Blackwell方面,将从FY25Q4开始量产出货,在持续供不应求的情况下,预计Blackwell相关营收保持高速增长至FY2026全年,提振FY25Q4及FY2026英伟达的整体业绩。 2.2.2、HBM多倍扩产,三星和SK海力士于24Q3加速生产HBM3E HBM全球三大厂持续扩产,HBM3E在24Q3加速放量。美光24M2已率先量产HBM3E-8H。三星HBM3E-8H已处于评估阶段,预计24Q3正式量产;三星业内首个开发推出HBM3E-12H,当前已运送样品给客户,并预计24H2扩大供应。SK海力士HBM3E-12H已向客户送样,预计24Q3量产后加速出货,预计24年HBM3E将占HBM芯片销量的一半。同时,为解决客户的差异化需求,专业化和定制化HBM产品已成趋势。产能方面,三星HBM产能2024年将较2023年扩产至4倍,2025年进一步扩产至2024年的2倍;SK海力士预计2024年HBM产能同比增长一倍以上。根据Zdnet、Trendforce统计,在SK海力士、三星、美光三巨头的大力推动下,2025年高带宽内存(HBM)芯片每月总产能将达到54万颗,相比于2024年将实现超过翻倍以上的增长。 3 Blackwell平台:延期可控,看好丰富产品和机架系统带动FY25Q4后业绩高增 3.1、Blackwell生产延期问题可控,预计FY25Q4出货并贡献数十亿美元营收 Blackwell生产问题基本解决,预计FY25Q4量产和出货,缓解市场对于更长时间维度延迟出货的担忧。Blackwell此前面临生产问题,英伟达对其掩膜重新设计以提升其生产能力。目前BlackwellGPU设计更改已经完成,并未涉及功能性更改,目前英伟达已向客户发送关于Blackwell、GraceBlackwell及多种系统级配置产品的样品。预计Blackwell将于FY25Q4开始量产并出货,有望在FY25Q4贡献数十亿美元营收。Blackwell将持续供不应求,且随着产能自FY25Q4后逐渐爬坡,我们预计Blackwell对应的营收将在FY25Q4高速增长、并持续至FY2026。 3.2、Blackwell家族产品多元丰富,机架通过解耦式交付实现灵活和定制化部署 3.2.1、Blackwell家族产品类型多元,产品线完整 1)单卡:Blackwell GPU将两个GPU die通过带宽高达10TB/s的NV-HBI接口合并为单个GPU、实现双芯片堆叠。Blackwell GPU具备2080亿个晶体管,较NVIDIA上代Hopper GPU晶体管数量提升150%,采用台积电4NP工艺,单芯片计算能力达到有史以来最高的20PFLOPS。服务器方面,可分为HGX B100/B200两种,其中HGX B100/B200搭载八个Blackwell B100/B200 GPU,分别可提供112/144PFLOPS(FP4精度)的AI计算性能。 2)超级芯片:GB200超级芯片通过NVLink-C2C技术连接2个Blackwell GPU以及1个Grace CPU,可在两个GPU之间实现900GB/s的双向带宽。服务器方面,GB200服务器由2个GB200超级芯片组成,故可搭载2个Grace CPU(搭载72个内核)和4个Blackwell GPU(即8张GPUDie)。 3)机架:基于GB200超级芯片,可组成GB200 NVL36/72两种机架形式,均通过NVLink Switch实现机架内GPU全连接。GB200 NVL36由9个GB200计算服务器+9个NVLink Switch服务器组成,组成形式为GB200计算服务器在机架上方放置5个服务器、在机架下方放置4个服务器,中间通过9个NVLinkSwitch服务器连接,实现18个GB200超级芯片(18个GraceCPU+36个BlackwellGPU)搭载;GB200 NVL72机架则搭载36个GB200超级芯片(36个Grace CPU+72个Blackwell GPU),可提供720PFLOPS的训练能力和1440PFLOPS的推理能力,带宽达130TB/s,支持高达27万亿参数的模型运行。 3.2.2、网络:NVLink+NVLinkSwitch实现机架GPU全互联,Specturm-X进军以太网 Blakckwell采用第五代NVLink技术以及第四代NVLink Switch技术。第五代NVLink技术内含18条NVLink链路,每条链路对应100GB/s双向带宽,总共可提供1.8TB/s双向带宽,最多可实现576个GPU之间互连;第四代NVLink Switch芯片用于NVLink Switch Tray中(每个NVLink Switch Tray包含两个NVLink Switch芯片),采用台积电4NP工艺制造,尺寸超过800平方毫米,可将Tray中GPU互连扩展至机架内GPU间互连。以GB200 NVL72为例,9个NVLink Switch Tray共计18个NVLink Switch芯片可实现72个GPU全连接,每个GPU对应18个NVL5端口,每个NVLink Switch芯片对应72个NVL5端口,提供7.2TB/s全互连双向带宽以及3.6TB/s的SHARP网络内计算性能。 Spectrum-X成为世界上首个专为AI打造的以太网架构。Spectrum-X由Spectrum-4和Bluefield-3 DPU两款芯片组成,可对云AI工作负载进行端到端优化,通过无损以太网进行RoCE自适应路由选择,以实现拥塞控制以及多租户流量隔离,将带宽有效利用率由60%提升至95%。目前Spectrum-X已得到NVIDIA OEM/ODM合作伙伴广泛支持,为AI进程提供相较于传统以太网1.6倍的性能,NVIDIA预计一年内Spectrum-X产品线将实现数十亿美元营收。 3.2.3、机架:解耦式出售实现灵活机架部署,高性价比的液冷方案需求强劲 解耦式系统组件单独出售,帮助客户实现灵活、定制化机架部署。机架部署方面,客户存在个性化需求,主要因客户面临的功率限制、CDU以及电源母线选择等不同,因此对数据中心的集成配置需求各不相同。英伟达在Blackwell机架系统交付时,以解耦的系统组件形式进行出售,即并不出货整个机架,而是向客户提供各种系统组件,CPU、GPU以及交换机等组件可单独发运至客户数据中心处,英伟达与全球OEM/ODM伙伴合作在当地进行组装,实现机架灵活配置和部署。 液冷成为数据中心冷却方案趋势,英伟达表述液冷方案需求显著增加。制冷方面,预计英伟达采用气液混合制冷方式(69%液冷+31%气冷),逐渐实现液冷方案向气冷方案的替代,主要因液冷制冷相较于传统气冷方式,具备更强性价比:1)数据中心总能耗降低15.6%;2)设备能耗降低28%;3)风扇能耗降低74%,导致服务器能耗降低12.4%;4)相同功率限制下,可部署3-5倍的人工智能吞吐量。 4 SIGGRAPH:英伟达NIM和Omniverse赋能工业、机器人、营销等多应用场景 全新升级的NVIDIA NIM赋能工业数字孪生与机器人开发。在SIGGRAPH 2024大会上,公司发布全球首个适用于 OpenUSD(通用场景描述)语言、几何体、物理学和材质的生成式 AI 模型,并将其融入全新升级的NVIDIA NIM 微服务。NVIDIA NIM 将生成式 AI整合到OpenUSD工作流中,通过大模型理解物理世界和构建高精度虚拟世界。用户还可以通过全新USD 连接器,将海量 NVIDIA RTX全光线追踪数据集传输到 Apple Vision Pro。基于OpenUSD的全新生成式AI,以及在 NVIDIA Omniverse 平台构建的 NVIDIA 加速开发框架,将赋能更多行业开发用于可视化工业设计和工程项目的应用程序,以及构建新一代物理 AI 和机器人的环境仿真应用。公司表示,重工业的生成式 AI 潮已经到来,NVIDIA NIM为 OpenUSD 带来了增强功能和可访问性,各个行业都可以创建基于物理学的虚拟世界和数字孪生。 三种NIM微服务加快USD拓宽新工业领域的3D 世界。Nvidia API目录现提供三种NIM微服务:1)USD Code——回答常识性 OpenUSD 问题并自动生成 OpenUSD-Python 代码,然后将代码输入 OpenUSD 查看应用程序或基于 NVIDIA Omniverse Kit 的应用,实现相应3D数据的可视化;2)USD Search——允许开发者使用自然语言或图像输入,搜索海量OpenUSD、3D和图像数据库;3)USD Validate——检查上传文件与 OpenUSD 发布版本的兼容性,并生成完全由 NVIDIA Omniverse Cloud AP驱动的 RTX 渲染路径追踪图像。 大会上英伟达发布了五个Demo,分别展现 NVIDIA Omniverse和 NVIDIA NIM在数字内容创作、物理AI、人形机器人、影像智能方面的应用。 NVIDIA NIM微服务助力WPP可口可乐的定制化全球营销。在SIGGRAPH 2024大会上,WPP推出专门为可口可乐打造的自定义创意制作服务Prod X。Prod X利用NVIDIA Omniverse开发平台并集成了全新NVIDIA NIM微服务,使多语言文本、图像和视频的创建精简化与自动化。Prod X的具体工作方式为:USD Search NIM通过书面提示快速提供WPP的海量视觉资产库;USD Code NIM帮助开发人员仅通过输入提示就可以获得构建新3D世界的 Python 代码。借助NVIDIA NIM微服务,WPP在全球100+市场中定制个性化的包含文化元素的3D广告资产,助力可口可乐更好地针对本地市场宣传产品。 深度学习框架fVDB加速物理AI的空间智能训练。物理 AI 在 3D 空间中运作,必须具备空间智能,即理解和推理现实世界的能力。实现空间智能需要将周围的现实世界转换为 AI 可以理解的虚拟表示。在SIGGRAPH 2024上,NVIDIA推出全新深度学习框架fVDB,基于OpenVDB构建了NVIDIA加速的AI算子,并通过复杂的神经网络,将现实环境的原始数据转化为实时渲染、规模庞大的AI就绪型环境,以实现空间智能。fVDB的空间规模是以往框架的 4 倍,速度是以往框架的 3.5 倍,能够运行的算子是以往框架的 10 倍,并能够根据 VDB 数据集打造全尺寸的3D环境。fVDB很快将以三种全新的NVIDIA NIM推理微服务形式推出:1)fVDB Mesh Generation NIM——生成现实世界的数字化 3D 环境;2)fVDB NeRF-XL NIM——利用 Omniverse Cloud API 和 OpenUSD 生成大规模 NeRF;3)fVDB Physics Super-Res NIM——执行超分辨率技术,以便生成基于 OpenUSD 的高分辨率物理仿真。 发布三个计算平台,助力机器人制造商打造AI机器人。英伟达在SIGGRAPH 2024上宣布,为全球领先的机器人制造商、AI 模型开发者和软件制造商提供一套服务、模型以及计算平台,以开发、训练和构建下一代人形机器人。整套产品包括1)全新NVIDIA NIM微服务和框架——用于机器人仿真和学习;2)NVIDIA OSMO 编排服务——用于运行多阶段机器人工作负载;3)远程操作工作流——允许开发者用少量远程捕捉的人类演示数据来训练机器人。英伟达还提供了三个计算平台来简化人形机器人的开发:1)NVIDIA AI 超级计算机——用于训练基础模型;2)NVIDIA Isaac Sim——基于 Omniverse 构建,使机器人在基于物理标准的虚拟环境中模拟和增强技能;3)NVIDIA Jetson Thor人形机器人计算机——用于运行模型。 英伟达为边缘构建由生成式 AI 赋能的视觉AI智能体。在SIGGRAPH 2024上,英伟达展示了基于Jetson平台服务的视觉语言模型VLM如何使用户通过自然语言与图像和视频进行交互。Jetson平台服务是一套预构建微服务,为在NVIDIA Jetson Orin上构建计算机视觉解决方案提供了“开箱即用”的基本功能。通过Jetson平台服务与NVIDIA NIM微服务,VLM将大语言模型与视觉 transformer 相结合,对输入文本和视觉图形进行复杂推理,并生成视觉 AI 智能体。借助这些视觉 AI 智能体,VLM从视频中获取信息,并基于上下文回答用户提出的自然语言问题。 5 盈利预测和估值 我们认为CoWoS、HBM新增产能释放将驱动供给端持续改善,叠加Blackwell生产问题基本解决、将于FY25Q4生产出货,预计需求强劲且高价值量的Blackwell平台能带动英伟达业绩在FY25Q4和FY2026期间持续高速增长。我们上调英伟达FY2025 GAAP净利润至679.6亿美元,同时新增FY2026~FY2027 GAAP净利润预测1072.3/1544.9亿美元,对应同比增速128%/58%/44%,对应FY2025~FY2027 GAAP EPS为2.77/4.37/6.30美元。8月29日收盘价117.59美元对应FY2025/FY2026 42x/27x PE,考虑到FY25Q4 Blackwell预计加速出货,英伟达业绩有望进入新增长阶段,维持“买入”评级。 6 风险提示 1)下游应用程序开发和场景拓展较慢,导致AI商业化进度不及预期的风险。AI算力行业的市场规模持续高增长,需要出现数量更多、覆盖人群更广、应用领域更多元的AI应用,若持续缺乏爆款应用、或应用的用户流失率较高,则不利于长期生成式AI浪潮的持续性; 2)CoWoS和HBM产能扩张受限的风险。24年甚至25年,AI算力供给仍难以满足需求,CoWoS先进封装和HBM的扩产进度直接决定AI算力供给能力,若扩产计划延迟,则会影响近两年AI算力市场规模的增速; 3)AI算力行业竞争加剧的风险。AMD、英特尔等其他芯片厂商积极布局AI芯片,同时云服务商联合博通、迈威尔科技等厂商开展定制化AI芯片研发,增加了整体AI算力行业的竞争。 免责声明 本订阅号是光大证券股份有限公司研究所(以下简称“光大证券研究所”)海外研究团队依法设立、独立运营的官方唯一订阅号。其他任何以光大证券研究所XX研究团队名义注册的、或含有“光大证券研究”、与光大证券研究所品牌名称等相关信息的订阅号均不是光大证券研究所海外研究团队的官方订阅号。 本订阅号所刊载的信息均基于光大证券研究所已正式发布的研究报告,仅供在新媒体形势下研究信息、研究观点的及时沟通交流,其中的资料、意见、预测等,均反映相关研究报告初次发布当日光大证券研究所的判断,可能需随时进行调整,本订阅号不承担更新推送信息或另行通知的义务。如需了解详细的证券研究信息,请具体参见光大证券研究所发布的完整报告。 在任何情况下,本订阅号所载内容不构成任何投资建议,任何投资者不应将本订阅号所载内容作为投资决策依据,本公司也不对任何人因使用本订阅号所载任何内容所引致的任何损失负任何责任。 本订阅号所载内容版权仅归光大证券股份有限公司所有。任何机构和个人未经书面许可不得以任何形式翻版、复制、转载、刊登、发表、篡改或者引用。如因侵权行为给光大证券造成任何直接或间接的损失,光大证券保留追究一切法律责任的权利。
【特别提示】本订阅号中所涉及的证券研究信息,均取自于光大证券已正式外发研究报告,由光大证券海外研究团队(TMT/消费/医药/制造等)编写,仅面向光大证券专业投资者客户,用作新媒体形势下研究动态的宣传。研究报告有时效性,任何研究报告内容仅代表报告外发时特定时点的研究信息汇总,任何关于研究报告、研究观点的解读,请联系对口销售或具体研究员。非光大证券专业投资者客户,请勿订阅、接收或使用本订阅号中的任何信息。本订阅号难以设置访问权限,若给您造成不便,敬请谅解。光大证券研究所不会因关注、收到或阅读本订阅号推送内容而视相关人员为光大证券的客户。 报告发布信息 报告标题:《FQ3 过渡期指引稳健,FQ4 Blackwell 出货助力业绩高增——英伟达(NVDA.O)FY25Q2 业绩点评 & SIGGRAPH、Hot Chips 点评》 报告发布日期:2024年9月2日 分析师:付天姿,CFA,FRM(执业证书编号:S0930517040002) 分析师:王贇(执业证书编号:S0930522120001) 联系人:董馨悦 联系人:沈昱恒 往期回顾 【光大海外】英伟达:Q1业绩和Q2指引超预期,B系列加快出货、预计FY25贡献显著 【光大海外】“AI核弹”Blackwell发布,英伟达向AI软硬一体平台转型 【光大海外】英伟达:预计FY25业绩持续高速增长,关注多模态机遇和后续H200、B100表现 【光大海外TMT】英伟达FY24Q3业绩跟踪 【光大海外TMT】英伟达FY24Q2业绩 & SIGGRAPH 2023大会点评 要点 事件:美国时间2024年8月28日盘后,英伟达发布截至2024年7月28日的FY25Q2季报。FY25Q2英伟达营收和盈利均超市场预期。FY25Q2营收300.4亿美元,QoQ+15%,YoY+122%,超过此前公司280亿美元的营收指引,较286.8亿美元的一致预期高逾4.7%,系Hopper GPU计算及网络平台需求强劲。盈利方面,Non-GAAP毛利率达75.7%,QoQ-3.2pct,YoY+4.5pct,高逾此前公司指引的75.5%;Non-GAAP净利润169.5亿美元,QoQ+11%,YoY+152%,对应EPS 0.68美元,超过市场预期的0.64美元。FY25Q3指引营收325亿美元,增速有所放缓。FY25Q3收入指引325亿美元,QoQ+8%,YoY+79%,较319亿美元的一致预期高逾1.8%,但增速有所放缓且低于买方业绩前瞻;FY25Q3 Non-GAAP毛利率指引75%。英伟达董事会已批准500亿美元的股票回购计划。 点评:Hopper GPU强劲需求驱动数据中心高增。1)数据中心业务:FY25Q2营收263亿美元,QoQ+16%,YoY+155%,营收贡献占比增至87.5%,成为拉动业绩的强力引擎;客户结构,45%收入来自云服务提供商,50%+的收入来自消费互联网公司和企业级客户;过去四个季度,推理对数据中心收入贡献40%+,为长期增长驱动力。2)游戏业务:FY25Q2营收29亿美元,YoY+16%,QoQ+9%,系返校季需求强劲;3)专业可视化业务:FY25Q2营收4.54亿美元,YoY+20%,QoQ+6%,目标构建可视化虚拟世界提升运营效率;4)汽车业务:FY25Q2营收3.46亿美元,YoY+37%,QoQ+5%,系自动驾驶和人工智能驾驶舱需求提升。 AI算力需求持续高涨,CoWoS和HBM加速扩产助力供给改善。1)需求:AI算力产业链高景气,云厂商持续加大投入,大模型性能升级提振长期需求。中际旭创和超微电脑等相关供应商均在最新业绩期表明AI业务高速增长,印证AI算力产业链高景气度;北美云厂商表明将大力投资AI基础设施建设;大模型在MAS等技术趋势下持续升级,提振AI芯片长期需求。2)供给:CoWoS积极扩产,HBM3E量产在即,助力Blackwell量产出货。台积电积极扩产、CoWoS产能有望连续两年翻倍增长,CoWoS-L生产改善助力Blackwell FY25Q4量产出货。 Blackwell延期可控,丰富产品带动FY25Q4后业绩高增。1)延期可控:Blackwell掩膜更改完成,FY25Q2已送样,FY25Q4将出货并贡献数十亿美元营收;2)Blackwell家族:产品丰富,涉及单卡、超级芯片、服务器、网络和机架系统等,其中机架解耦式出货实现灵活部署,液冷需求强劲。FY25Q3系产品转换期,看好供给改善&Blackwell平台出货助力FY25Q4及FY26业绩持续高速增长。 盈利预测与估值:我们认为CoWoS、HBM新增产能释放将驱动供给端持续改善,叠加Blackwell生产问题基本解决、将于FY25Q4生产出货,预计需求强劲且高价值量的Blackwell平台能带动英伟达业绩在FY25Q4和FY2026期间持续高速增长。我们上调英伟达FY2025 GAAP净利润至679.6亿美元,同时新增FY2026~FY2027 GAAP净利润预测1072.3/1544.9亿美元,对应同比增速128%/58%/44%,对应FY2025~FY2027 GAAP EPS为2.77/4.37/6.30美元。8月29日收盘价117.59美元对应FY2025/FY2026 42x/27x PE,考虑到FY25Q4 Blackwell预计加速出货,英伟达业绩有望进入新增长阶段,维持“买入”评级。 风险分析:1)下游应用程序开发和场景拓展较慢,导致AI商业化进度不及预期;2)CoWoS和HBM产能扩张受限的风险;3)AI算力行业竞争加剧的风险。 目录 正文 1 整体业绩:英伟达FY25Q2营收超预期、净利润水平持续提升 1.1、FY25Q2营收和净利润持续提升,Hopper GPU计算平台强劲需求驱动数据中心业务营收破百亿美元 英伟达FY25Q2业绩超市场预期和公司指引,数据中心业务成为强劲增长引擎。英伟达FY25Q2实现收入300.4亿美元,环比增长15%,同比增长122%,大幅超过24年5月公司指引的280亿美元,较Refinitiv一致预期286.8亿美元高逾4.7%,营收表现强势主要系英伟达Hopper GPU计算及网络平台的强劲需求,驱动数据中心业务大幅增长;FY25Q2数据中心业务营收创纪录,达263亿美元,环比增长16%,同比增长154%。2024年8月,董事会批准500亿美元的股票回购计划。 净利润水平升至历史高位。FY25Q2 Non-GAAP毛利率达75.7%,环比减少3.2pct,同比增长4.5pct,高于24年5月时公司指引的75.5%;Non-GAAP净利润实现169.5亿美元,环比增长11.2%,同比增长151.5%;毛利率环比下降主要系数据中心中新产品比例增加以及对低回报率Blackwell材料的库存拨备。Non-GAAP摊薄每股收益为0.68美元,环比增长11.5%,同比增长151.9%,较Refinitiv一致预期每股0.64美元高逾6.3%。 1.2、四大业务板块分析:数据中心收入大幅增长37亿美元,游戏、专业可视化收入实现环比增长 FY25Q2数据中心业务收入相比FY25Q1大幅增长37亿美元,游戏和可视化业务收入环比向上。其中,1)数据中心:Q2营收实现262.7亿美元,相比Q1的225.6亿美元环比上升37.1亿美元,环比增长16.4%,同比增长154.5%,较Refinitiv一致预期251.1亿美元高逾4.6%。数据中心业绩飞跃,带动公司整体收入增长;Q2数据中心的营收贡献占比由Q1的86.6%增长至87.5%;2)游戏:Q2营收实现28.8亿美元,环比增长8.8%,同比增长15.8%,较Refinitiv一致预期27.6亿美元高逾4.4%。营收贡献占比因数据中心高速增长而压缩至9.6%,环比下降0.6pct;3)专业可视化:Q2营收实现4.5亿美元,环比增长6.3%,同比增长19.8%,较Refinitiv一致预期4.6亿美元低逾1.9%。对应营收贡献占比为1.5%,环比下降0.1pct;4)汽车:Q2营收实现3.5亿美元,环比增长5.2%,同比增长36.8%,较Refinitiv一致预期3.4亿美元高逾0.6%。对应营收贡献占比为1.2%,环比下降0.1pct。 数据中心业务:收入同比高增,Hopper平台需求强劲。 25Q2数据中心收入 263 亿美元,同比增长 154%,环比增长 16%,其中算力收入226 亿美元,同比增长 162%,环比增长 17%;网络收入37 亿美元,同比增长 114%,环比增长 16%,由InfiniBand 和以太网驱动。从客户结构上看,约45%的收入来自云服务提供商,超50%的收入来自消费互联网公司和企业客户。 AI推理为数据中心收入重要来源,下一代生成式AI模型对算力需求将进一步增加。生成式AI模型的训练和推理、视频图像和文本数据的处理等需求推动数据中心业务高增长。最新MLPerf 推理测试中,Hopper与Blackwell平台取得领先,彰显公司在AI推理领域领先地位。根据公司业绩会,在过去四个季度,推理对数据中心收入贡献超过40%。云服务厂商、消费互联网公司以及大量初创企业,在广告、教育、医疗、机器人等各领域构建生成式AI应用,对生态系统丰富程度和云端可用性的需求进一步提高,下一代模型对算力的需求将达到目前的10-20倍。 Hopper需求强劲,Blackwell有望于25Q4开启量产爬坡。根据公司业绩会,公司下游客户加速采购 Hopper 架构芯片,基于Hopper架构的H200平台于FY25Q2开启量产爬坡进程,向大型云服务提供商、消费者互联网以及企业公司发货。FY25Q2 H200在中国的数据中心收入环比增长,是数据中心业务的重要收入来源。公司预计FY25H2Hopper出货量有望提高。Blackwell的供应方面, Blackwell GPU的量产爬坡有望于FY25Q4启动,并持续至FY2026年,公司预计FY25Q4Blackwell产品的收入将高达数十亿美元。Blackwell 的需求方面,公司表示客户对Blackwell的需求远超供应,供不应求的状态将持续至明年。 Spectrum-X以太网平台大受好评,NIM推理微服务助力开发生成式AI应用。Spectrum-X的AI处理性能是传统以太网的1.6倍,并能够连接全球最大GPU计算集群。根据公司业绩会,数百家GPU云提供商、企业以及OEM和ODM合作商采用Spectrum-X以太网平台。FY25Q2的AI以太网收入环比增长1倍,未来1年内Spectrum-X的产品线规模有望达到数十亿美元。为满足计算集群扩展的巨大拓展需求,公司拟每年推出全新的Spectrum-X 产品。3月公司推出NIM推理微服务并于7月宣布升级,公司通过Llama 3.1模型集合NVIDIA AI Foundry服务与NIM微服务,加速全球企业生成式AI应用的开发进程,已有150+家公司在其平台上集成了NIM。 游戏业务:游戏目录品类不断拓展,RTX AI PC支持NVIDIA ACE试用。 FY25Q2游戏收入29 亿美元,同比增长 16%,环比增长 9%,由于返校季GeForce RTX 40系列GPU和游戏主机系统级SOC的需求强劲。英伟达持续强化游戏生态的建设,公司对RTX技术在生成式AI领域的发展前景表示乐观,推出了600+RTX游戏与应用,并将GeForce NOW游戏目录拓展至2000+。RTX AI PC独家支持NVIDIA ACE 生成式AI微服务的运行,Megabreak是首款搭载NVIDIA ACE的游戏。 专业可视化业务:数字化工作流程与虚拟世界构建成为业务亮点。 FY25Q2专业可视化收入4.54亿美元,同比增长20%,环比增长6%。制造业公司与汽车公司广泛开启工作流程的数字化,构建可视化虚拟世界。富士康、奔驰就在Omniverse云平台上搭建工业数字双胞胎,以提高运营效率。USD NIM与连接器使开发者能够将生成式AI助手和代理整合到USD工作负载中,由此强化构建高精度虚拟世界的能力。此外,USD NIM微服务赋能WPP为可口可乐等客户提供基于生成式AI的可视化广告创作。 汽车业务:自动驾驶平台和人工智能驾驶舱需求驱动收入增长。 FY25Q2汽车业务收入3.46亿美元,同比增长37%,环比增长5%。同比高增长主要系自动驾驶平台的新客户数量增加以及人工智能驾驶舱的需求提升。在计算机视觉与模式识别(ComputeVisionandPatternRecognition)大会上,公司赢得了大规模端到端驾驶挑战赛,表现超过了400多个来自全球的竞争对手。此外,波士顿动力、比亚迪电子、西门子等厂商均使用公司Isaac机器人平台自主进行机器人手臂、人形机器人和移动机器人的开发。 1.3、FY25Q3指引及前景展望:Q3营收增速有所放缓,看好Blackwell放量带动Q4及FY2026高速增长 FY25Q3英伟达营收增速有所放缓,但公司对Blackwell新平台需求指引积极。公司FY25Q3收入指引325亿美元,对应环比增长8.2%,同比增长79.4%,较Refinitiv市场一致预期319.13亿美元高逾1.8%;GAAP和Non-GAAP毛利率分别指引74.4%和75.0%,相比Q2出现下降趋势,指引Non-GAAP毛利率同比和环比分别变化0pct和-0.7pct。FY25Q3指引的营收和毛利率小幅低于买方业绩前瞻,且FY25Q3预期增速有所放缓,导致英伟达业绩发布第二天(2024年8月29日)股价下跌6.38%。但我们认为FY25Q3为Blackwell产品未出货的过渡期,英伟达对Blackwell新平台的需求指引乐观,看好FY25Q4及FY2026在供给改善和Blackwell加速放量的催化下驱动业绩持续高速增长。 2 AI算力需求持续高涨,CoWoS和HBM加速扩产助力供给端改善 2.1、需求:AI算力产业链高景气,云厂商持续加大投入,大模型性能升级提振长期需求 2.1.1、AI算力高景气持续,光模块、服务器等相关产业链公司表述AI需求强劲 受益于下游客户对算力基础设施的资本开支加大,光模块需求强劲。CoherentFY24Q4业绩会表明,AI的快速发展推动数据通信市场的增长到达转折点,受益于面向AI的800G数据通信收发器的强劲增长,FY24Q4通信业务收入环比增长10%。公司看好AI机器学习的ROI,加大云基础设施支出以抓住机遇。中际旭创24H1营业收入同比大幅增长169.70%,重点客户对算力基础设施领域资本开支的进一步加大,极大促进了对400G、800G光模块的需求。 生成式AI浪潮推动服务器需求激增。服务器厂商超微电脑和英伟达联系紧密,由于大规模数据中心客户的增加,FY24Q4超微电脑超大数据中心业务收入同比上升192%,收入占比环比提升14pct。超微电脑FY24Q4业绩会表明:公司大规模数据中心客户增加,超大数据中心业务占比增加,FY24Q4毛利率相应下降;由于客户对DLC液冷服务器机架强劲需求超出预期,6月关键零组件一度发生短缺。 2.1.2、北美云厂商持续加大AI投入,英伟达客户多元性持续提升 北美四大云厂商的AI算力军备竞赛激烈,AI芯片需求高涨。谷歌、微软、亚马逊最新季度资本支出均高于100亿美元,且同比增幅超50%;Meta于24Q2上调24年资本支出指引,并计划大力提高25年资本支出。四大云厂商大力投资于AI相关基础设施建设和芯片升级,以支持日益增长的计算、推理需求。根据Gartner的最新预测,2024年全球AI芯片市场规模预计同比增长33%到达710亿美元,AI算力需求强劲与算力基础设施的高增长态势将推动高性能芯片需求持续提升。 各国AI专业知识与AI基础设施意识的增强,为英伟达主权AI的增长带来巨大机遇。各国十分重视开发能融入本国语言、文化和本国AI大模型的生成式AI,AI专业知识和AI GPU等核心基础设施已成为“国家当务之急”。黄仁勋与日本、加拿大、印度、阿联酋等多个国家的领导人进行会谈,推广主权 AI战略,帮助各国建立自主可控的数据中心、发展本国的 AI 能力和产业。日本先进工业科学技术研究正与英伟达携手推动人工智能桥接云基础设施3.0超级计算机的建设。根据公司业绩会,公司预计FY25主权AI收入将从FY24的零达到数十亿美元。 2.1.3、AI大模型性能持续升级,推动AI芯片需求长期增长 多代理系统提升复杂任务工作流,AI大模型性能仍有较大提升空间。多代理系统(Multi-Agent System,MAS)由诸多独立自治的智能体组成,拥有独立算法资源、可通过灵活交互协作完成复杂的决策任务。与高度集中的单一代理(Single-Agent System)系统不同,MAS能够更好将复杂任务拆解成步骤清晰的工作流,通过不同职责与工作的模块化分工,发挥不同智能体的特长、进行高度专业化的工作,并让各Agent间真正交互,从而显著提升任务处理的效率与准确性。同时,结合反馈规划(Planning with Feedback)机制的引入,使得模型能够在执行任务的过程中,实时调整、强化学习和复杂任务应对能力,从而得以让模型在动态环境中实现更高的推理精度,使其更加接近人类智能。新技术趋势的出现驱动AI大模型持续迭代升级,进而推动各AI大模型研发团队继续加大的AI芯片等硬件基础设施的投入。 大模型的可预测扩展性助力未来AI计算需求呈现可预测的持续增长。Predictable Scaling(可预测扩展性)作为GPT-4模型开发与部署的核心概念,可在大模型训练初期,利用大模型和小模型的同源性,通过拟合较小模型的性能曲线预测大模型性能,进而指导大模型优化训练,降低大模型训练时的计算资源成本。同时,Predictable Scaling仍满足AI大模型的底层逻辑Scaling Law,因此在Predictable Scaling的指导下,随着后续AI大模型的参数量和数据量逐渐复杂,其训练所需的计算量是可预测且持续增长的,进而对AI芯片等训练资源提出更多需求。 AI推理贡献占比40%+,更多生成式AI应用程序的部署推动其长期需求增长。推理业务已成为英伟达数据中心收入的重要驱动力,过去四个季度中推理相关业务贡献了英伟达数据中心40%+的收入。推理方面,英伟达的芯片需求主要来自前沿模型制造商、消费互联网公司和初创企业,他们在各自领域中构建生成式AI应用程序,更多AI生态和应用的部署驱动AI推理需求持续增长。 2.2、供给:CoWoS积极扩产,HBM3E量产在即,助力Blackwell量产出货 供给方面,英伟达Blackwell平台因生产问题导致延迟至FY25Q4出货,随着CoWoS产能持续提升、供给瓶颈改善,结合Blackwell平台各类丰富产品于FY25Q4加速放量,看好后续业绩持续高速增长。 2.2.1、台积电积极扩产,CoWoS-L产能情况改善助力Blackwell FY25Q4量产出货 台积电积极扩产,CoWoS产能有望连续两年翻倍增长。台积电董事长魏哲家曾在业绩会透露,2024年CoWoS产能有望较原先预期的倍增再增加,台积电位于中科的先进封装测试5厂预计将在2025年投入CoWoS量产,有望进一步推动2025年产能的增长幅度超过倍增。根据24年8月的产业链消息,台积电已将2025年底的CoWoS产能预测从先前的6-6.2万片/月上调至7万片/月。 CoWoS-L是生产B200的关键,当前面临生产问题。CoWoS-S和CoWoS-L主要区别在中介层,CoWoS-S的中介层相当于一片硅板,随着AI芯片对尺寸和性能提出更高要求,CoWoS-S在硅中介层尺寸、生产和可靠性方面面临瓶颈。台积电基于此推出CoWoS-L,在RDL中介层中加入了LSI芯片(Local Silicon Interconnect),在保留了硅中介层所有优秀特性的同时避免了大型硅中介层良率问题,帮助AI芯片实现更高布线密度和更大尺寸。英伟达B200芯片由于die size较大而必须采用CoWoS-L进行封装。当前CoWoS-L的良率较CoWoS-S偏低、约为90%,面临生产问题,主要系硅、中介层和基片之间因热膨胀系数不匹配而导致翘曲,英伟达希望通过掩膜的重新设计以进一步提高Blackwell的稳定性,这是导致Blackwell生产延期的主要原因之一。 Blackwell于FY25Q4开始量产提振后续业绩,Hopper供应持续改善。英伟达Blackwell延迟出货导致FY25Q3成为产品转换空白期,我们看好台积电CoWoS供给改善伴随Blackwell量产出货将持续提振英伟达FY25Q4及FY2026业绩。分产品来看,Hopper出货量预计将在FY25H2继续增长,许多新产品将在Q4生产,供应和可用性也将有所改善;Blackwell方面,将从FY25Q4开始量产出货,在持续供不应求的情况下,预计Blackwell相关营收保持高速增长至FY2026全年,提振FY25Q4及FY2026英伟达的整体业绩。 2.2.2、HBM多倍扩产,三星和SK海力士于24Q3加速生产HBM3E HBM全球三大厂持续扩产,HBM3E在24Q3加速放量。美光24M2已率先量产HBM3E-8H。三星HBM3E-8H已处于评估阶段,预计24Q3正式量产;三星业内首个开发推出HBM3E-12H,当前已运送样品给客户,并预计24H2扩大供应。SK海力士HBM3E-12H已向客户送样,预计24Q3量产后加速出货,预计24年HBM3E将占HBM芯片销量的一半。同时,为解决客户的差异化需求,专业化和定制化HBM产品已成趋势。产能方面,三星HBM产能2024年将较2023年扩产至4倍,2025年进一步扩产至2024年的2倍;SK海力士预计2024年HBM产能同比增长一倍以上。根据Zdnet、Trendforce统计,在SK海力士、三星、美光三巨头的大力推动下,2025年高带宽内存(HBM)芯片每月总产能将达到54万颗,相比于2024年将实现超过翻倍以上的增长。 3 Blackwell平台:延期可控,看好丰富产品和机架系统带动FY25Q4后业绩高增 3.1、Blackwell生产延期问题可控,预计FY25Q4出货并贡献数十亿美元营收 Blackwell生产问题基本解决,预计FY25Q4量产和出货,缓解市场对于更长时间维度延迟出货的担忧。Blackwell此前面临生产问题,英伟达对其掩膜重新设计以提升其生产能力。目前BlackwellGPU设计更改已经完成,并未涉及功能性更改,目前英伟达已向客户发送关于Blackwell、GraceBlackwell及多种系统级配置产品的样品。预计Blackwell将于FY25Q4开始量产并出货,有望在FY25Q4贡献数十亿美元营收。Blackwell将持续供不应求,且随着产能自FY25Q4后逐渐爬坡,我们预计Blackwell对应的营收将在FY25Q4高速增长、并持续至FY2026。 3.2、Blackwell家族产品多元丰富,机架通过解耦式交付实现灵活和定制化部署 3.2.1、Blackwell家族产品类型多元,产品线完整 1)单卡:Blackwell GPU将两个GPU die通过带宽高达10TB/s的NV-HBI接口合并为单个GPU、实现双芯片堆叠。Blackwell GPU具备2080亿个晶体管,较NVIDIA上代Hopper GPU晶体管数量提升150%,采用台积电4NP工艺,单芯片计算能力达到有史以来最高的20PFLOPS。服务器方面,可分为HGX B100/B200两种,其中HGX B100/B200搭载八个Blackwell B100/B200 GPU,分别可提供112/144PFLOPS(FP4精度)的AI计算性能。 2)超级芯片:GB200超级芯片通过NVLink-C2C技术连接2个Blackwell GPU以及1个Grace CPU,可在两个GPU之间实现900GB/s的双向带宽。服务器方面,GB200服务器由2个GB200超级芯片组成,故可搭载2个Grace CPU(搭载72个内核)和4个Blackwell GPU(即8张GPUDie)。 3)机架:基于GB200超级芯片,可组成GB200 NVL36/72两种机架形式,均通过NVLink Switch实现机架内GPU全连接。GB200 NVL36由9个GB200计算服务器+9个NVLink Switch服务器组成,组成形式为GB200计算服务器在机架上方放置5个服务器、在机架下方放置4个服务器,中间通过9个NVLinkSwitch服务器连接,实现18个GB200超级芯片(18个GraceCPU+36个BlackwellGPU)搭载;GB200 NVL72机架则搭载36个GB200超级芯片(36个Grace CPU+72个Blackwell GPU),可提供720PFLOPS的训练能力和1440PFLOPS的推理能力,带宽达130TB/s,支持高达27万亿参数的模型运行。 3.2.2、网络:NVLink+NVLinkSwitch实现机架GPU全互联,Specturm-X进军以太网 Blakckwell采用第五代NVLink技术以及第四代NVLink Switch技术。第五代NVLink技术内含18条NVLink链路,每条链路对应100GB/s双向带宽,总共可提供1.8TB/s双向带宽,最多可实现576个GPU之间互连;第四代NVLink Switch芯片用于NVLink Switch Tray中(每个NVLink Switch Tray包含两个NVLink Switch芯片),采用台积电4NP工艺制造,尺寸超过800平方毫米,可将Tray中GPU互连扩展至机架内GPU间互连。以GB200 NVL72为例,9个NVLink Switch Tray共计18个NVLink Switch芯片可实现72个GPU全连接,每个GPU对应18个NVL5端口,每个NVLink Switch芯片对应72个NVL5端口,提供7.2TB/s全互连双向带宽以及3.6TB/s的SHARP网络内计算性能。 Spectrum-X成为世界上首个专为AI打造的以太网架构。Spectrum-X由Spectrum-4和Bluefield-3 DPU两款芯片组成,可对云AI工作负载进行端到端优化,通过无损以太网进行RoCE自适应路由选择,以实现拥塞控制以及多租户流量隔离,将带宽有效利用率由60%提升至95%。目前Spectrum-X已得到NVIDIA OEM/ODM合作伙伴广泛支持,为AI进程提供相较于传统以太网1.6倍的性能,NVIDIA预计一年内Spectrum-X产品线将实现数十亿美元营收。 3.2.3、机架:解耦式出售实现灵活机架部署,高性价比的液冷方案需求强劲 解耦式系统组件单独出售,帮助客户实现灵活、定制化机架部署。机架部署方面,客户存在个性化需求,主要因客户面临的功率限制、CDU以及电源母线选择等不同,因此对数据中心的集成配置需求各不相同。英伟达在Blackwell机架系统交付时,以解耦的系统组件形式进行出售,即并不出货整个机架,而是向客户提供各种系统组件,CPU、GPU以及交换机等组件可单独发运至客户数据中心处,英伟达与全球OEM/ODM伙伴合作在当地进行组装,实现机架灵活配置和部署。 液冷成为数据中心冷却方案趋势,英伟达表述液冷方案需求显著增加。制冷方面,预计英伟达采用气液混合制冷方式(69%液冷+31%气冷),逐渐实现液冷方案向气冷方案的替代,主要因液冷制冷相较于传统气冷方式,具备更强性价比:1)数据中心总能耗降低15.6%;2)设备能耗降低28%;3)风扇能耗降低74%,导致服务器能耗降低12.4%;4)相同功率限制下,可部署3-5倍的人工智能吞吐量。 4 SIGGRAPH:英伟达NIM和Omniverse赋能工业、机器人、营销等多应用场景 全新升级的NVIDIA NIM赋能工业数字孪生与机器人开发。在SIGGRAPH 2024大会上,公司发布全球首个适用于 OpenUSD(通用场景描述)语言、几何体、物理学和材质的生成式 AI 模型,并将其融入全新升级的NVIDIA NIM 微服务。NVIDIA NIM 将生成式 AI整合到OpenUSD工作流中,通过大模型理解物理世界和构建高精度虚拟世界。用户还可以通过全新USD 连接器,将海量 NVIDIA RTX全光线追踪数据集传输到 Apple Vision Pro。基于OpenUSD的全新生成式AI,以及在 NVIDIA Omniverse 平台构建的 NVIDIA 加速开发框架,将赋能更多行业开发用于可视化工业设计和工程项目的应用程序,以及构建新一代物理 AI 和机器人的环境仿真应用。公司表示,重工业的生成式 AI 潮已经到来,NVIDIA NIM为 OpenUSD 带来了增强功能和可访问性,各个行业都可以创建基于物理学的虚拟世界和数字孪生。 三种NIM微服务加快USD拓宽新工业领域的3D 世界。Nvidia API目录现提供三种NIM微服务:1)USD Code——回答常识性 OpenUSD 问题并自动生成 OpenUSD-Python 代码,然后将代码输入 OpenUSD 查看应用程序或基于 NVIDIA Omniverse Kit 的应用,实现相应3D数据的可视化;2)USD Search——允许开发者使用自然语言或图像输入,搜索海量OpenUSD、3D和图像数据库;3)USD Validate——检查上传文件与 OpenUSD 发布版本的兼容性,并生成完全由 NVIDIA Omniverse Cloud AP驱动的 RTX 渲染路径追踪图像。 大会上英伟达发布了五个Demo,分别展现 NVIDIA Omniverse和 NVIDIA NIM在数字内容创作、物理AI、人形机器人、影像智能方面的应用。 NVIDIA NIM微服务助力WPP可口可乐的定制化全球营销。在SIGGRAPH 2024大会上,WPP推出专门为可口可乐打造的自定义创意制作服务Prod X。Prod X利用NVIDIA Omniverse开发平台并集成了全新NVIDIA NIM微服务,使多语言文本、图像和视频的创建精简化与自动化。Prod X的具体工作方式为:USD Search NIM通过书面提示快速提供WPP的海量视觉资产库;USD Code NIM帮助开发人员仅通过输入提示就可以获得构建新3D世界的 Python 代码。借助NVIDIA NIM微服务,WPP在全球100+市场中定制个性化的包含文化元素的3D广告资产,助力可口可乐更好地针对本地市场宣传产品。 深度学习框架fVDB加速物理AI的空间智能训练。物理 AI 在 3D 空间中运作,必须具备空间智能,即理解和推理现实世界的能力。实现空间智能需要将周围的现实世界转换为 AI 可以理解的虚拟表示。在SIGGRAPH 2024上,NVIDIA推出全新深度学习框架fVDB,基于OpenVDB构建了NVIDIA加速的AI算子,并通过复杂的神经网络,将现实环境的原始数据转化为实时渲染、规模庞大的AI就绪型环境,以实现空间智能。fVDB的空间规模是以往框架的 4 倍,速度是以往框架的 3.5 倍,能够运行的算子是以往框架的 10 倍,并能够根据 VDB 数据集打造全尺寸的3D环境。fVDB很快将以三种全新的NVIDIA NIM推理微服务形式推出:1)fVDB Mesh Generation NIM——生成现实世界的数字化 3D 环境;2)fVDB NeRF-XL NIM——利用 Omniverse Cloud API 和 OpenUSD 生成大规模 NeRF;3)fVDB Physics Super-Res NIM——执行超分辨率技术,以便生成基于 OpenUSD 的高分辨率物理仿真。 发布三个计算平台,助力机器人制造商打造AI机器人。英伟达在SIGGRAPH 2024上宣布,为全球领先的机器人制造商、AI 模型开发者和软件制造商提供一套服务、模型以及计算平台,以开发、训练和构建下一代人形机器人。整套产品包括1)全新NVIDIA NIM微服务和框架——用于机器人仿真和学习;2)NVIDIA OSMO 编排服务——用于运行多阶段机器人工作负载;3)远程操作工作流——允许开发者用少量远程捕捉的人类演示数据来训练机器人。英伟达还提供了三个计算平台来简化人形机器人的开发:1)NVIDIA AI 超级计算机——用于训练基础模型;2)NVIDIA Isaac Sim——基于 Omniverse 构建,使机器人在基于物理标准的虚拟环境中模拟和增强技能;3)NVIDIA Jetson Thor人形机器人计算机——用于运行模型。 英伟达为边缘构建由生成式 AI 赋能的视觉AI智能体。在SIGGRAPH 2024上,英伟达展示了基于Jetson平台服务的视觉语言模型VLM如何使用户通过自然语言与图像和视频进行交互。Jetson平台服务是一套预构建微服务,为在NVIDIA Jetson Orin上构建计算机视觉解决方案提供了“开箱即用”的基本功能。通过Jetson平台服务与NVIDIA NIM微服务,VLM将大语言模型与视觉 transformer 相结合,对输入文本和视觉图形进行复杂推理,并生成视觉 AI 智能体。借助这些视觉 AI 智能体,VLM从视频中获取信息,并基于上下文回答用户提出的自然语言问题。 5 盈利预测和估值 我们认为CoWoS、HBM新增产能释放将驱动供给端持续改善,叠加Blackwell生产问题基本解决、将于FY25Q4生产出货,预计需求强劲且高价值量的Blackwell平台能带动英伟达业绩在FY25Q4和FY2026期间持续高速增长。我们上调英伟达FY2025 GAAP净利润至679.6亿美元,同时新增FY2026~FY2027 GAAP净利润预测1072.3/1544.9亿美元,对应同比增速128%/58%/44%,对应FY2025~FY2027 GAAP EPS为2.77/4.37/6.30美元。8月29日收盘价117.59美元对应FY2025/FY2026 42x/27x PE,考虑到FY25Q4 Blackwell预计加速出货,英伟达业绩有望进入新增长阶段,维持“买入”评级。 6 风险提示 1)下游应用程序开发和场景拓展较慢,导致AI商业化进度不及预期的风险。AI算力行业的市场规模持续高增长,需要出现数量更多、覆盖人群更广、应用领域更多元的AI应用,若持续缺乏爆款应用、或应用的用户流失率较高,则不利于长期生成式AI浪潮的持续性; 2)CoWoS和HBM产能扩张受限的风险。24年甚至25年,AI算力供给仍难以满足需求,CoWoS先进封装和HBM的扩产进度直接决定AI算力供给能力,若扩产计划延迟,则会影响近两年AI算力市场规模的增速; 3)AI算力行业竞争加剧的风险。AMD、英特尔等其他芯片厂商积极布局AI芯片,同时云服务商联合博通、迈威尔科技等厂商开展定制化AI芯片研发,增加了整体AI算力行业的竞争。 免责声明 本订阅号是光大证券股份有限公司研究所(以下简称“光大证券研究所”)海外研究团队依法设立、独立运营的官方唯一订阅号。其他任何以光大证券研究所XX研究团队名义注册的、或含有“光大证券研究”、与光大证券研究所品牌名称等相关信息的订阅号均不是光大证券研究所海外研究团队的官方订阅号。 本订阅号所刊载的信息均基于光大证券研究所已正式发布的研究报告,仅供在新媒体形势下研究信息、研究观点的及时沟通交流,其中的资料、意见、预测等,均反映相关研究报告初次发布当日光大证券研究所的判断,可能需随时进行调整,本订阅号不承担更新推送信息或另行通知的义务。如需了解详细的证券研究信息,请具体参见光大证券研究所发布的完整报告。 在任何情况下,本订阅号所载内容不构成任何投资建议,任何投资者不应将本订阅号所载内容作为投资决策依据,本公司也不对任何人因使用本订阅号所载任何内容所引致的任何损失负任何责任。 本订阅号所载内容版权仅归光大证券股份有限公司所有。任何机构和个人未经书面许可不得以任何形式翻版、复制、转载、刊登、发表、篡改或者引用。如因侵权行为给光大证券造成任何直接或间接的损失,光大证券保留追究一切法律责任的权利。
大部分微信公众号研报本站已有pdf详细完整版:https://www.wkzk.com/report/(可搜索研报标题关键词或机构名称查询原报告)
郑重声明:悟空智库网发布此信息的目的在于传播更多信息,与本站立场无关,不构成任何投资建议。