盘古大模型全新版本即将发布,建议关注华为产业链标的 | 【东方证券通信】
(以下内容从东方证券《盘古大模型全新版本即将发布,建议关注华为产业链标的 | 【东方证券通信】》研报附件原文摘录)
核心观点 华为云盘古大模型全新版本即将发布。目前,华为云已推出五大水平领域的基础大模型(L0),分别为:NLP(中文语言)大模型、CV(视觉)大模型、科学计算大模型、多模态大模型和Graph(图网络)大模型。其中,NLP大模型是业界首个千亿参数的中文预训练大模型,且首次使用Encoder-Decoder架构,兼顾NLP理解与生成的能力;CV大模型为30亿参数的模型,是业界首次实现按需抽取的模型;科学计算大模型主要解决各种科学问题,旨在用AI促进基础科学的发展;多模态大模型具备图像和文本的跨模态理解、检索与生成能力;图网络大模型首创图网络融合技术,在工艺优化、时序预测、智能分析等场景有广泛应用。 华为云盘古大模型自身不断迭代,已实现诸多领域的应用。盘古大模型进化路径可分为L0-L1-L2三个阶段。L0指基础大模型,L1指行业大模型,L2则是指面向更加细分场景的推理模型。1)基础大模型方面,以图网络大模型为例,一个大模型可以适配工艺优化、时序预测、智能分析等多个场景,同时应用在金融、煤矿、制造等多个行业。2)行业大模型方面,华为云推出了如盘古金融大模型、盘古矿山大模型、盘古电力大模型、盘古制造质检大模型、盘古药物分子大模型等行业大模型。3)推理模型方面,以在电力行业为例,华为云基于盘古电力大模型,针对无人机电力巡检细分场景,通过一次预训练+下游任务的微调,推出盘古电力巡检大模型,解决了无人机智能巡检系统(缺陷检测)中的小样本学习、主动学习、增量学习等问题,解决了海量数据标注工作量大和缺陷种类繁多的问题。此外,在华为部署的物联网、智能座舱、智能驾驶等领域,盘古大模型也有望得到应用,为这些领域提供更加智能化的技术支持。 “一平台双驱动”,华为盘古打造生态型产业链。华为盘古大模型基于昇腾计算产业生态。关于AI生态型产业链,华为提出“一平台双驱动”的模式,其中“一平台”指基础软件平台,包括AI处理器、服务器硬件以及芯片使能软件、AI框架。“双驱动”指平台要支撑的两大生态,一是技术生态,二是商业生态,包括ISV(独立软件开发商)、IHV(独立硬件开发商)、整机、一体机合作伙伴等。 投资建议与投资标的 建议关注华为大模型产业链相关的硬件供应商、服务提供商及行业应用合作伙伴: 硬件供应商:1)算力硬件:广电运通(002152,未评级);2)连接器:意华股份(002897,未评级);3)桌面云终端:星网锐捷(002396,未评级);4)光器件:光迅科技(002281,未评级)、华工科技(000988,未评级) 服务提供商:1)网络规划建设:特发信息(000070,未评级);2)网络管维:润建股份(002929,未评级);3)IDC建设:光环新网(300383,未评级) 行业应用合作伙伴:1)AI应用:创维数字(000810,未评级);2)华为生态:初灵信息(300250,未评级)、天源迪科(300047,未评级);3)云通信:彩讯股份(300634,未评级)、梦网科技(002123,未评级);4)云计算:光环新网(300383,未评级) 风险提示 宏观经济下行风险、配套算力基础设施发展较慢、盘古大模型能力不及预期、伦理风险。 报告目录 报告正文 一、华为云盘古大模型全新版本即将发布 盘古初显锋芒。2021年4月,在华为开发者大会上,华为云发布了盘古系列超大规模预训练模型,包括NLP大模型以及CV大模型。目前,华为云已推出五大水平领域的基础大模型(L0),分别为:NLP(中文语言)大模型、CV(视觉)大模型、科学计算大模型、多模态大模型和Graph(图网络)大模型。时隔两年,华为云即将再次上线盘古大模型的全新版本。 1) NLP大模型:由华为云、循环智能与鹏城实验室联合开发,是业界首个千亿参数的中文预训练大模型,并使用了40TB的文本数据用于训练。盘古NLP大模型首次使用Encoder-Decoder架构,兼顾NLP理解与生成的能力,在CLUE榜单上中文理解能力接近人类水平。 2) CV大模型:为30亿参数的模型。盘古CV大模型在业界首次实现了模型的按需抽取,根据不同部署环境的运行要求可以自动抽取出的适合的模型,模型差异动态范围可达三个数量级;提出基于样本相似度的对比学习,在ImageNet数据集上小样本学习能力业界第一。 3) 科学计算大模型:主要解决各种科学问题,如气象预报、海浪预测、分子动力学预测、微分方程求解等,旨在用AI促进基础科学的发展。 4) 多模态大模型:具备图像和文本的跨模态理解、检索与生成能力,通过跨模态语义关联实现视觉-文本-语音多模态统一表示,采用一个大模型即可灵活支撑图-文-音全场景AI应用,可用于产品设计、艺术创作、语音播报、海报创作等领域。 5)Graph(图网络)大模型:首创图网络融合技术,在工艺优化、时序预测、智能分析等场景有广泛应用,比如预测企业财务风险、制造企业优化工艺等等。 盘古NLP模型——兼顾生成和理解能力。基于大量的参数,模型能够学会数据之间的关系,抽象出逻辑能力,更加智能化,然而模型的能力并不完全由参数量决定。首先,千亿参数的大模型每优化一次就会耗费巨大的成本,单一的参数量堆积可以帮助大模型更好地理解表征和语义之间的关联性,但所耗费的算力、时间成本也会随之增加,对训练过程中出错的敏感程度亦会上升,牵一发而动全身。因此盘古NLP模型在预训练阶段加入基于prompt的任务,降低微调难度,解决以往大模型为不同行业场景进行微调的困难。在下游数据充足时,微调难度的降低使得模型可以随着数据变多而持续优化;在下游数据稀缺时,微调难度的降低使得模型的少样本学习效果得到显著提升。其次,在模型结构上,跟传统其他企业训练的NLP大模型的方式不同,盘古看重的不仅是大模型有生成能力,还要有更强的理解能力。华为采用了Encode和Decode的架构,来保证盘古大模型的在生成和理解上面的两个性能。 盘古CV大模型——兼顾图像判别与生成能力。首先,为了解决模型大、数据多带来的学习效率低、表征性能弱的问题,盘古CV大模型在预训练阶段主要集中在数据处理、架构设计和模型优化三个阶段进行优化。以区分白色猫和白色狗的图片为例,显然白色不是最重要的信息,动物才是。基于此,华为进行了算法自研,比如在视觉中强行给模型注入一些层次化信息,让模型在训练过程中了解样例之间真正强关联性的东西。 除模型本身的优化外,盘古的优异性能还有赖于基础算力设施、AI专用框架与平台的搭建。 1)算力:鲲鹏CPU+昇腾GPU提供底层算力支撑,同时还基于华为CANN采用了算子量化、算子融合优化等技术,将单算子性能提升30%以上。 2)全场景AI框架:华为MindSpore创新性地采用了“流水线并行、模型并行和数据并行”的多维自动混合并行技术,大幅降低了手动编码的工作量,并提升集群线性度20%。 3)AI平台:ModelArts平台提供E级算力调度,同时结合物理网络拓扑,提供动态路由规划能力,为大模型训练提供了最优的网络通信能力。 1.1 鲲鹏+昇腾搭建基础AI算力 华为以鲲鹏和昇腾作为根基,打造“一云两翼双引擎”的计算产业布局,持续构建开放生态。其中,双引擎指围绕“鲲鹏”与“昇腾”打造的两个基础芯片族,构筑异构的计算架构。华为已成为同时拥有“CPU、NPU、存储控制、网络互连、智能管理”5大关键芯片的厂商。 鲲鹏包括服务器和PC机芯片。鲲鹏920是业界首颗64核的数据中心处理器,性能比业界主流处理器高25%、内存带宽高60%;同时把CPU、桥片、网络和磁盘控制器“4合1”。鲲鹏处理器从2007年走到现在已历时16年,鲲鹏920是第三代芯片。华为认为,最强算力的通用服务器需要具备至少64核、8个内存通道、PCIe 4.0、多合一SoC、xPU高速互联、100GE高速I/O等六个特征。 昇腾,基于华为自研DaVinci架构的AI处理器,可应用于训练和推理场景;昇腾910训练芯片与英伟达A100算力基本相当,昇腾310推理芯片,功耗仅8W。昇腾计算基于昇腾系列处理器构建的全栈AI计算基础设施及应用,包括昇腾系列芯片、系列硬件、芯片使能、AI框架、应用使能等。华为Atlas人工智能计算解决方案基于昇腾系列AI处理器,通过模块、板块、小站、服务器、集群等丰富的产品形态,打造面向“端、边、云”的全场景AI基础设施方案,涵盖数据中心解决方案、智能边缘解决方案。 1.2 全场景AI框架:MindSpore 超大规模AI对AI框架提出新的挑战。即使单卡算力实现突破,对于大规模模型及训练数据,仅依靠单卡的内存与算力,不但训练时间过长,不确定性也会随之加大,因此大规模模型的训练通常需要使用多机多卡来实现,同时也衍生出算力单元之间的通信问题。超大规模AI对AI框架提出的挑战可以概括为如下六堵墙: 内存墙:以鹏程·盘古大模型为例,参数量200B,模型训练过程中需要存储参数、激活、梯度、优化器状态,一个模型的训练就需要占用近4TB的内存。业界主流训练卡,如昇腾910,一张卡的内存是32GB,也就是说需要100多张卡才能跑一个模型。 计算墙:鹏程·盘古200B参数量的大模型,需要3.6E23 FLOPS算力,即使能把昇腾910 256T的理论算力发挥出来,也需要44年才能训练完。 通信墙:大模型并行切分到集群后,模型切片之间会产生大量通信,从而产生通信瓶颈。只有综合考虑参数量、计算量、计算类型、集群网络带宽拓扑等,才能设计出性能较优的并行切分策略。 效率墙:算法的分布式并行开发一直是并行计算领域的一大难题,如何让用户高效编写分布式并行的代码,也是各种AI框架研究的重点和难点;在HPC时代是MPI编程范式,大数据时代是MapReduce编程范式,而超大规模AI时代需要建立新的编程范式。 调优墙:昇腾E级算力集群有4096个节点,在E级算力集群上训练一个千亿参数规模的模型,节点之间的通信关系非常复杂,要保证计算的正确性、性能和可用性,手动调试难以全面兼顾,需要一个自动化及可视化的集群分析工具。 部署墙:超大规模AI从训练到部署需要一个转换,同样以鹏程·盘古大模型为例,训练时用了千卡,云上推理部署需要64卡,中间需要把千卡的训练无缝地转接到64卡的推理。同时,为了进一步降低推理成本,需要把模型进行压缩,实现一张卡就能运行。 分布式并行实现算力增强、数据处理加速和模型训练。业界主流的分布式并行类型包括数据并行、模型并行和混合并行三种,围绕切分的内容(数据切分、模型切分)来划分。 MindSpore支持多维度混合并行。MindSpore是业界首个支持全自动并行的框架,MindSpore多维度自动并行,通过数据并行、算子级模型并行、Pipeline模型并行、优化器模型并行、异构并行、重计算、高效内存复用,及拓扑感知调度,实现整体迭代时间最小(计算时间+通信时间)。编程接口高效易用,实现了算法逻辑和并行逻辑解耦,串行代码自动分布式并行。此外,MindSpore通过多维度混合并行,解决了模型及集群的Scale Out问题,实现了训练到推理模式的快速切换。以鹏程·盘古为例,鹏程·盘古是最大的稠密形式的中文预训练语言模型,拥有200B参数,训练时使用了2048卡,推理时需要64卡。并行训练模式采用了数据并行、模型并行、优化器并行、流水并行、重计算等,而推理时只需采用模型并行和流水并行。基于MindSpore的分布式并行能力,鹏程·盘古可自动从分布式训练模式转换成分布式推理模式,并实现服务化封装,可以对外提供RESTful接口,支持快速上线大模型服务。 根据Omdia发布的《中国人工智能框架市场调研报告》显示,,PyTorch、TensorFlow、MindSpore等人工智能框架在知名度与市场份额上处于第一梯队。在AI框架使用率的排名中,TensorFlow(2015年开源)和PyTorch(2017年推出)的先发优势依然存在,但MindSpore(2019年8月推出,2020年3月开源)以11%的份额进入第一梯队。 1.3 AI开发平台:ModelArts ModelArts便于用户快速创建和部署模型。ModelArts是面向AI开发者的一站式开发平台,提供海量数据预处理及半自动化标注、大规模分布式训练、自动化模型生成及端-边-云模型按需部署能力,帮助用户快速创建和部署模型,管理全周期AI工作流。“一站式”是指AI开发的各个环节,包括数据处理、算法开发、模型训练、模型部署都可以在ModelArts上完成。从技术上看,ModelArts底层支持各种异构计算资源,开发者可以根据需要灵活选择使用,而不需要关心底层的技术。同时,ModelArts支持Tensorflow、PyTorch、MindSpore等主流开源的AI开发框架,也支持开发者使用自研的算法框架。 二、从L0到L2,从基础模型到具体场景 华为云盘古大模型自身不断迭代,其进化路径可以分为L0-L1-L2三大阶段。L0指基础大模型,L1指行业大模型,L2则是指面向更加细分场景的推理模型。 基础大模型方面,以图网络大模型为例,一个大模型可以适配工艺优化、时序预测、智能分析等多个场景,同时应用在金融、煤矿、制造等多个行业。比如,在智能分析场景下,图网络大模型帮助广发证券将企业异常财务识别准确率提高到90%,相对于原来的小模型方法提升了20%,实现了行业领先。在时序预测场景下,图网络大模型帮助中央空调系统进行可挥发气体浓度的预测、智能监测空气质量,同时也在帮助零售企业进行销量预测。在工艺优化场景下,图网络大模型则可以帮助制造行业优化工艺、降本增效。 行业大模型方面,华为云推出了如盘古金融大模型、盘古矿山大模型、盘古电力大模型、盘古制造质检大模型、盘古药物分子大模型等行业大模型。 推理模型方面,以在电力行业为例,华为云基于盘古电力大模型,针对无人机电力巡检细分场景,通过一次预训练+下游任务的微调,推出盘古电力巡检大模型,解决了无人机智能巡检系统(缺陷检测)中的小样本学习、主动学习、增量学习等问题,解决了海量数据标注工作量大和缺陷种类繁多的问题。 此外,在华为部署的物联网、智能座舱、智能驾驶等领域,盘古大模型也有望得到应用,为这些领域提供更加智能化的技术支持。比如,华为终端总裁何刚在MWC19期间宣布,华为终端将实施1+8+N全场景战略,“1个太阳”指的是手机,“8个行星”指的是平板、TV、音响、眼镜、手表、车机、耳机、PC八大业务,而“N个卫星”指的是移动办公、智能家居、运动健康、影音娱乐及智能出行各大板块的延伸业务。提高手机这一入口的智能化水平,提供语音识别、人机交互,有助于丰富用户的“全家桶”设备体验。比如在智能驾驶中,大模型可用于提升自动驾驶系统的智能控制和决策能力,优化车辆的智能驾驶功能。 与科研院所合作,以盘古为基础打造多个专用大模型。2020 年 3 月 28 日,随着华为将全场景 AI 计算框架昇思 MindSpore 正式开源,越来越多的知名高校和科研机构联合昇思 MindSpore 先后打造出了覆盖 NLP、CV 和多模态融合以及特定于某个领域的专用大模型,逐渐形成了基础大模型 + 行业大模型的整体布局。 鹏程·盘古:2021 年 5 月,鹏城实验室基于昇思 MindSpore 推出了全球首个 2000 亿参数中文 NLP 大模型鹏程·盘古,它在预训练阶段学习了 40TB 的中文文本数据。在性能方面,鹏程·盘古在 16 个下游任务中性能指标优于业界 SOTA 模型;在应用方面,鹏程·盘古在知识问答、知识检索、知识推理等丰富的文本生成领域表现突出。 紫东·太初:中科院自动化所基于昇思 MindSpore 打造了全球首个千亿参数三模态大模型紫东·太初,通过跨模态语义关联达成了视觉-文本-语音三模态的统一表达和高效协同。紫东·太初多模态大模型具有超强的图文音跨模态理解与生成能力,与单模态相比,只需要一个大模型就能支撑图文音全场景 AI 应用。 鹏程·神农:在华为全联接 2021 上,鹏城实验室发布面向生物医学领域的AI平台——鹏程·神农大模型,包含蛋白质结构预测、小分子生成、靶点与小分子相互作用预测以及新抗菌多肽设计与效果评价等模块,深度赋能生物制药。借助鹏程·神农的能力,制药企业和医学研究机构将大大加速新型药物的筛选与创制。比如,在抗菌肽(下一代抗菌素)的探索中,借助鹏程·神农大模型强大的氨基酸序列生成能力,并结合现有抗菌肽数据集,人们可以在很短时间内产生数万种候选肽的氨基酸序列。传统方法在长达四十年的时间里仅仅生成 4000 多种候选多肽,而鹏程·神农 + 抗菌肽分类器的组合在数月内产生 30 万种候选多肽。 武汉·LuoJia:2021 年 7 月,武汉大学正式推出武汉·LuoJia,包含全球首个遥感影像智能解译专用框架武汉·LuoJiaNET 和业界最大遥感影像样本数据集武汉·LuoJiaSET,为遥感应用开发提供便利,让智能遥感技术在自然资源、海洋、农业、森林、应急等行业得到广泛应用。武汉·LuoJiaNET 针对遥感数据存在的像幅尺寸大、数据通道多、尺度变化大等特点,兼具内存可扩展、尺度通道灵活创建、数据通道自主优选、框架与数据协同处理等特性。武汉·LuoJiaSET 则是遥感领域满足 OGC 标准的大规模遥感影像样本库,制定了支持全球范围的遥感影像样本分类标准、标注规范,建立涵盖不同遥感任务的统一分类体系,形成样本要素的采集要求、内容和流程规范,支持多级别、多类型遥感影像样本库的采集、制作、管理、共享和应用。 空天·灵眸:空天·灵眸是中科院空天信息创新研究院与MindSpore社区联手打造的国际首个面向多模态遥感数据的生成式自监督预训练模型,已成功应用于多模态遥感地物要素提取、遥感场景分类、细粒度目标精细化识别、像素级变化检测、三维重建等重要任务中,在12个国际标准数据集中取得世界领先水平。其不仅具备“数据多源异构、遥感特性驱动、应用任务泛化”的特点,还填补了多模态生成式预训练模型在遥感专业领域的空白,可面向遥感学术研究、行业应用等产学研领域推广使用。 三、投资建议 “一平台双驱动”,华为盘古打造生态型产业链。华为盘古大模型基于昇腾计算产业生态。关于AI生态型产业链,华为提出“一平台双驱动”的模式,其中“一平台”指基础软件平台,包括AI处理器、服务器硬件以及芯片使能软件、AI框架。“双驱动”指平台要支撑的两大生态,一是技术生态,二是商业生态,包括ISV(独立软件开发商)、IHV(独立硬件开发商)、整机、一体机合作伙伴等。 建议关注华为大模型产业链相关的硬件供应商、服务提供商及行业应用合作伙伴: 硬件供应商:1)算力硬件:广电运通;2)连接器:意华股份;3)桌面云终端:星网锐捷;4)光器件:光迅科技、华工科技 服务提供商:1)网络规划建设:特发信息;2)网络管维:润建股份;3)IDC建设:光环新网 行业应用合作伙伴:1)AI应用:创维数字;2)华为生态:初灵信息(鸿蒙)、天源迪科(鲲鹏);3)云通信:彩讯股份、梦网科技;4)云计算:光环新网 3.1 创维数字 机顶盒及宽带接入领域龙头。创维数字成立于2002年,于2014年深圳A股上市,是国内机顶盒及宽带接入领域行业龙头。公司主营业务为全球用户提供全面系统的超高清终端呈现、宽带网络连接和超高清行业应用综合解决方案,主要产品有智能盒子终端、宽带网络通讯连接设备、汽车电子及车联网、物联网等系列产品及运营与服务,基于国内外运营商客户的定制化需求,提供对应解决方案、系统集成及终端产品,其中数字机顶盒终端为公司核心产品。公司与华为云合作紧密,目前公司与华为在AI技术的一些垂直领域有相关的交流和应用。 营收净利双增长。2022年,公司实现营收120.09亿元,同比增长10.71%,实现归母净利润8.23亿元,同比增长95.13%。从主营产品构成来看,2022年公司主营的智能终端业务实现营业收入95.78亿元,同比增长25%;专业显示业务及运营服务分别实现营收21.34亿元和2.35亿元,同比下降25%/7.2%。 “双千兆”带动宽带连接业务营收增长。在宽带网络“双千兆”趋势下,国内宽带连接设备已开始升级换代,公司宽带连接产品多次中标运营商集采招标项目,份额显著提升。近年来公司宽带业务增速亮眼,中标情况喜人,在中国移动2022-2023年智能家庭网关产品集中采购(第一批次)的五个采购包均有中标。 3.2 初灵信息 产业数智化解决方案及运营服务提供者。公司聚焦产业数智化应用市场,提供“智能连接(F5G/5G/WIFI6)+数据感知(DPI)+智能应用(AI)”等产品,组成安全的边缘计算万物互联能力;边缘计算的数据采集感知能力;边缘计算的智能应用能力,推进企业工业互联网的建设,促进新一代信息技术为设备赋智、为企业赋值、为产业赋能。公司主要服务于以下三块市场:第一,为运营商行业提供智能连接、数据感知、智能运维、智能视频等解决方案;第二,助力政企行业“DICT”为其提供大数据应用以及数据信息安全服务;第三,为行业/大众企业提供数智化方案及SAAS产品。 子公司妙联物联网与华为鸿蒙在多领域建立深度合作。妙联物联网由初灵创投控股(持股57.15%),初灵信息持股6.31%,主要从事基于鸿蒙的多个细分行业SaaS云服务的软硬件产品的研发和推广,是基于鸿蒙大生态物联网整体解决方案的提供者。妙联物联网与华为在多领域保持深度合作:1)妙联是华为在物联网场景方面的核心供应商,是华为认证的精英合作伙伴、沃土云数字平台合作伙伴;2)代理销售华为鸿蒙的基础物联网组件、生态单品、云资源等;3)妙联帮助设备和品牌厂商上鸿蒙,从连云到设备整机认证一条龙服务;4)基于鸿蒙的多个物联网SAAS云服务的软硬件产品已经上架,成为华为销售联运产品。2022年上半年,华为已经推给妙联至少10家上市公司客户。 3.3 星网锐捷 国内领先的ICT基础设施及AI应用方案提供商。星网锐捷成立于2000年,并于2010年在A股上市。公司致力于在智慧网络、智慧云、智慧金融、智慧通讯、智慧物联、智慧娱乐、智慧社区等领域扎根,为企业级客户提供信息化解决方案。2022年,公司实现营收157.41亿元,同比增长16.18%;实现归母净利润5.76亿元,同比增长6.37%。公司主营业务分为智慧网络、智慧云、智慧通讯、视频信息应用、智慧社区、车联网及通讯模组等六大业务板块,其中智慧网络板块主要由锐捷网络(2022年上市)负责。根据IDC数据,2022年锐捷网络在中国以太网交换机市占率排名第三;在中国数据中心交换机市占率排名第三;在中国企业级WLAN市占率排名第三,其中Wi-Fi6产品出货量排名第一。 子公司升腾资讯推出R2232A鲲鹏服务器,打造鲲鹏桌面云方案。升腾资讯成立于2002年,为公司全资子公司,主要经营桌面云、智慧营业厅解决方案和云支付三大业务,具有全系列桌面云产品,包括云方案、云终端、云服务器、存储器和交换机。在华为全连接大会(2019)上,升腾资讯发布了首款鲲鹏桌面云方案,该方案基于鲲鹏处理器的终端整机和服务器,以及威讯云平台,构建最新一代的鲲鹏桌面云方案,方案能够实现弹性调配云端和终端资源,敏锐感知用户需求,同时具备数据不落地的特性,为客户提供安全、易用的桌面云2.0解决方案,全面满足政务办公等各类场景的云上办公体验。根据IDC报告,2021年升腾威讯桌面云终端出货量市占率达20.3%,连续4年位列第一。 3.4 广电运通 金融机具龙头。公司包括金融科技和城市智能两大主营业务,(1)金融科技方面,公司连续14年位居国内金融机具市占率第一,是国内金融机具的龙头企业,提供ATM、清分机、智能业务库等一系列产品;(2)城市智能方面,公司提供“智能终端+大数据”提供对应解决方案,构建智能安防、智能交通、智慧民生等多项业务场景。 公司旗下广电五舟具备研发和生产服务器、PC等多种算力产品的能力。公司旗下广电五舟提供国内高性能计算产品及解决方案、云服务器全系列产品、边缘计算和软硬一体化产品、智能计算产品、自主研发的存储产品和行业解决方案,目前产品广泛应用于政府、教育、网络安全、科研、人工智能、互联网等行业及领域。作为华为鲲鹏整机合作伙伴和昇腾AI战略伙伴,依托华为鲲鹏和昇腾AI等软硬件技术支持,广电五舟目前已推出华为鲲鹏、昇腾系列服务器、信创有为系列产品、自主研发的存储产品、PC、云终端和行业解决方案等,深度融入昇腾AI生态体系。 3.5 特发信息 特发信息主营光纤光缆、通信设备、军工信息化及智慧服务四大业务板块。其中,通信设备板块主要由三大子公司负责,光网科技从事光器件研发,特发东智主要通过ODM模式进行路由器、机顶盒等网络终端的生产制造,四川华拓重点负责光模块的研发与制造。军工信息化板块主要由成都傅里叶和神州飞航两大子公司负责,从事军工智能终端、软件、大数据平台等业务,为各军兵种提供先进的装备信息化产品。智慧服务板块聚焦5G时代的基建,提供智慧网络工程及数据中心的规划设计、建设施工及运营维护。 承接鹏城云脑等多个AI项目建设。公司曾承接鹏城云脑二期建设集成项目和许昌市中原人工智能计算中心项目工程项目。鹏城云脑主要用于AI大模型领域,约70%的机时服务于鹏城实验室以外的企业、高校、科研院,已支撑近千个国产AI模型的训练,包括全球首个全开源的两千亿参数中文预训练语言大模型“鹏程·盘古”、全球首个知识增强千亿大模型“鹏城-百度·文心”、性能达国际先进水平的十亿参数视觉大模型“鹏程·大圣”等。 3.6 意华股份 连接器+光伏支架,两大业务并驾齐驱。意华股份成立于1995年,并于2017年上市。通过内生外延,公司目前已拥有连接器和光伏支架两大核心业务,其中连接器具体包括通讯连接器、消费电子连接器和汽车连接器。公司深耕连接器领域,重要客户包括华为、中兴、比亚迪、吉利等等。公司是国内少数实现高速连接器量产的企业之一,优势产品以SFP、SFP+光电连接器为代表,综合体现了公司的产品设计能力、模具开发能力、精密制造能力及检验验证能力。公司基于通信领域与华为的合作,逐渐向汽车领域扩展,目前深度配套华为车载智能网联相关业务,在车载ADAS、MDC、5GT-BOX等相关模块定制开发了多系列连接器。 3.7 光迅科技 光迅科技是国内少有的布局芯片-模块-系统全产业链的光通信厂商。公司产品主要包括无源光器件、光纤放大器、光模块等,涵盖固网接入和无线接入,广泛应用于数据中心和电信市场。公司作为国内少有的自主研发光芯片的企业,可以有效改善自身光器件、光模块等产品的生产成本,扩大盈利空间。近年来,公司营收与利润表现稳健,营收由2016年的40.59亿元增张至2021年的64.86亿元,CAGR为9.8%,归母净利润由2.85亿元增长至5.67亿元,CAGR为14.8%。 公司布局硅光领域光芯片及光模块,已可提供100G、400G硅光芯片方案。公司拥有PLC(平面光波导)、III-V、SiP(硅光)三大光电芯片平台,其中硅光芯片平台支持直接调制和相干调制方案。2018年,由公司依托国家信息光电子创新中心、光纤通信技术和网络国家重点实验室、中国信息通信科技集团联合研制的“100G硅光收发芯片”成功投产,可实现100G/200G全集成硅基相干光收发集成芯片和器件的量产。目前,公司100G硅光模块已实现量产,并可提供400G的硅光芯片方案,公司400G客户包括BAT和华为。2021年12月,公司联合国家信息光电子创新中心、鹏城实验室等宣布完成1.6T/s硅基芯片的联合研制和功能验证,实现了我国硅光芯片向Tb/s级的首次跨越。2021年上半年,来自华为的收入占公司总收入比30%。 3.8 华工科技 三大业务协同发展,光通信领域行业领先。公司形成了智能制造业务、联接业务、感知业务三大业务格局,在联接业务中的光通信领域,公司具备从芯片到器件、模块、子系统全系列产品的垂直整合能力,产品包括有源光器件、智能终端,光学零部件等,公司围绕5G、F5G、数据中心、智能汽车、5G to B五大应用场景,为客户提供智能“光联接+无线联接”解决方案,产品市场占有率处于行业领先地位。 华为5G光模块金牌供应商。早在2018年,公司首个5G光模块订单成功交付,成为国内首家获得华为5G光模块订单的企业,荣膺华为技术2018年度全球金牌供应商奖。子公司华工正源总经理曾表示,根据市场测算,华工正源有希望在华为的5G光模块供应中占据40%-50%的份额,在行业整体市场份额有望达到30%。 3.9 润建股份 信息网络管维与能源网络管维服务提供商。润建股份是通信网络管维领域规模最大的民营企业,是中国移动A级优秀供应商。公司信息网络管维业务分为数字化业务与IDC业务,数字化业务方面,公司已在“社会综合治理与防控防疫”、“国家教育数字化战略转型”、“数字乡村助力乡村振兴”、“XR应用”等领域推出了一系列数字化产品;IDC业务方面,公司规划建设五象云谷云计算中心,项目共包含6000个机架,是目前为止广西最高等级、最大规模云计算数据中心。在能源网络领域,公司已签订多项新能源发电项目开发协议,公司的光伏运维业务可帮助客户提升约3%-5%的发电效率。 公司与华为合作范围不断扩展。华为是公司管维业务的重要合作伙伴,随着业务发展,目前公司与华为的合作已由通信网络管维拓展至IDC数据网络、信息网络、能源网络领域,主要合作内容包括相关产品的销售、实施、运维,以及基于产品的解决方案开发和推广等,公司的部分技术、数字化平台和解决方案可以在鸿蒙平台上应用。 3.10 天源迪科 产业云和大数据综合解决方案提供商。公司在通信行业 BOSS 领域具有 20 余年的发展经验和先发优势;在金融行业软件开发及服务、IT 外包及智能运营服务领域客户数量和收入发展迅速;作为华为总分销商,为政企客户提供ICT产品增值分销和专业服务业务稳定增长。公司聚焦产业数智化转型,主营业务收入来源于通信、金融和政企行业,2022年占收比分别为43%、40%、17%,金融行业业务已成为公司主要利润来源。 与华为展开多方面合作,子公司金华威是华为ICT产品中国区六家总经销商之一。公司与华为在公安、政府、通信运营商等行业进行软硬件合作,如公安行业中警务云大数据平台、国内和海外电信运营商主要运营支撑核心系统建设等;鸿蒙方面,公司开发了适配鸿蒙OS系统的华为视频电视端和手机端应用;鲲鹏方面,公司是华为鲲鹏生态合作伙伴,与华为在通信、政府等多个领域实现了产品相互认证,金融方面公司数字银行核心技术平台与鲲鹏云服务也完成兼容性测试。子公司金华威是华为IT及云软件的总经销商,及华为云视频产品中国总代理,与华为在警务云平台、ICT企业分销、电信软硬件等有多方面合作。 3.11 彩讯股份 产业互联网解决方案和技术服务提供商。公司致力于为电信、金融、能源、交通等行业的大中型企业级政府部门等客户提供基于统一办公平台、企业邮件系统、大数据智能分析平台、一体化营销资源管理平台、终端管理平台、统一认证平台等产品的互联网应用平台的产品开发、系统建设、运维及运营支撑服务,助力各行业的数字化转型和产业升级,推动传统产业链的降本增效。 公司是华为首百家鲲鹏+昇腾ISV合作伙伴之一;是华为智能计算的安全邮件系统合作伙伴,公司Richmail邮件产品同时获得了华为鲲鹏、华为昇腾技术认证。同时彩讯股份与华为是信创领域的合作伙伴,是华为计算的银牌经销商,与华为在云通信方面有业务合作。 3.12 梦网科技 国内领先的云通信服务商。梦网科技已建立为客户提供多格式、跨平台、低延时、广覆盖的综合云通信平台服务能力。公司软硬件产品广泛应用于金融、政务、互联网、交通运输、物流、电商、教育等多个行业领域。公司的云通信业务主要包含“消息云、终端云、视讯云、物联云”,公司基于用户需求,可提供多种部署模式,推出了SaaS及PaaS平台产品,为企业客户提供稳定的云通信服务。 与华为云合作KooMessage。华为云的高阶大数据和AI 能力正在赋能KooMessage进一步全面升级。如智能内容生产引擎,利用AI推荐算法、RPA、低代码等技术,通过用户行为数据和素材模板库内容的人群定位等分析,自动化组装生成个性化内容,为企业用户提供千人千面的内容&创意。再如智能流量分发引擎,通过全局流量分发的数据汇聚及治理分析,以时间、地点、客群为核心因素,智能分析高价值管道,结合AI、RPA等技术进行全渠道流量自动化分发编排,满足用户与企业的双向需求。 3.13 光环新网 深耕通信行业多年,IDC与云计算业务双轮驱动。公司专注互联网数据中心服务领域已超过20年,积累了丰富的设计、建设与运营管理经验,目前已成长为国内头部的IDC服务提供商。公司数据中心业务形成了以北京为中心辐射京津冀,以上海为中心辐射长三角及以长沙为中心盘活华中及西部地区发展的战略,数据中心覆盖北京、上海、天津、河北燕郊、湖南长沙、新疆乌鲁木齐、浙江杭州等七个城市及地区,投产机柜达4.7万个。云计算业务方面,公司是亚马逊云科技中国(北京)区域运营商,目前已运营近6年时间,公司持续完善其本地化业务服务体系,为广大企业客户提供领先的、适合中国市场需求的基于亚马逊云科技的云服务产品。 多个数据中心仍在建,云计算业务保持扩张。公司持续响应国家算力网络建设号召,在全国各地进行数据中心建设。目前公司在全国范围内在建及储备项目规划机柜数量超过11万个,截止2022年上半年,在建工程金额总计10.6亿元,主要用于数据中心建设;此外,云计算方面,为顺应算力网络的发展趋势,公司凭借自身在数据中心、云计算以网络上的优势,着手进行“云电脑”与“云手机”的研发,并于2022年下半年起,逐步向市场推出云电脑与云手机服务。 公司与华为于2022年6月签署了战略合作协议,双方未来在低碳数据中心、智能光伏储能、智慧网络、鲲鹏、昇腾AI计算产业、新型云计算业务等领域开展产品、服务及商业模式创新等方面的全面合作。 四、风险提示 宏观经济下行风险:大模型需要大量资金投入用于服务器、交换机等设备的购买以及超算中心的建设,企业资本开支投入一定程度上受到宏观经济影响。 配套算力基础设施发展较慢:大模型的预训练及推理需要大量算力支撑,若算力基础设施发展不及预期,可能影响整个大模型的训练效率和效果,进而影响产业链下游的发展。 盘古大模型能力不及预期:市场对于华为即将发布的新一代盘古大模型赋予较高期待,若大模型推出后的实际效果或对于应用的赋能不及预期,可能会对产业链公司带来影响。 伦理风险:大模型可能衍生出一定的推理能力,产生难以预料的结果,可能带来一定的伦理风险。 声明 本内容系对我司已发布研报的解读,报告标题《盘古大模型全新版本即将发布,建议关注华为产业链标的》,发布日期:2023年4月4日。分析师:张颖 执业证书编号:S0860514090001 香港证监会牌照:BRW773 联系人:王婉婷、周天恩 提醒客户阅读我司报告发布平台统一发布的完整的证券研究报告,仔细阅读其所附风险提示、各项声明及信息披露。 长期关注:互金/Fintech/通信 不定期发布:研报/随笔/点评/调研
核心观点 华为云盘古大模型全新版本即将发布。目前,华为云已推出五大水平领域的基础大模型(L0),分别为:NLP(中文语言)大模型、CV(视觉)大模型、科学计算大模型、多模态大模型和Graph(图网络)大模型。其中,NLP大模型是业界首个千亿参数的中文预训练大模型,且首次使用Encoder-Decoder架构,兼顾NLP理解与生成的能力;CV大模型为30亿参数的模型,是业界首次实现按需抽取的模型;科学计算大模型主要解决各种科学问题,旨在用AI促进基础科学的发展;多模态大模型具备图像和文本的跨模态理解、检索与生成能力;图网络大模型首创图网络融合技术,在工艺优化、时序预测、智能分析等场景有广泛应用。 华为云盘古大模型自身不断迭代,已实现诸多领域的应用。盘古大模型进化路径可分为L0-L1-L2三个阶段。L0指基础大模型,L1指行业大模型,L2则是指面向更加细分场景的推理模型。1)基础大模型方面,以图网络大模型为例,一个大模型可以适配工艺优化、时序预测、智能分析等多个场景,同时应用在金融、煤矿、制造等多个行业。2)行业大模型方面,华为云推出了如盘古金融大模型、盘古矿山大模型、盘古电力大模型、盘古制造质检大模型、盘古药物分子大模型等行业大模型。3)推理模型方面,以在电力行业为例,华为云基于盘古电力大模型,针对无人机电力巡检细分场景,通过一次预训练+下游任务的微调,推出盘古电力巡检大模型,解决了无人机智能巡检系统(缺陷检测)中的小样本学习、主动学习、增量学习等问题,解决了海量数据标注工作量大和缺陷种类繁多的问题。此外,在华为部署的物联网、智能座舱、智能驾驶等领域,盘古大模型也有望得到应用,为这些领域提供更加智能化的技术支持。 “一平台双驱动”,华为盘古打造生态型产业链。华为盘古大模型基于昇腾计算产业生态。关于AI生态型产业链,华为提出“一平台双驱动”的模式,其中“一平台”指基础软件平台,包括AI处理器、服务器硬件以及芯片使能软件、AI框架。“双驱动”指平台要支撑的两大生态,一是技术生态,二是商业生态,包括ISV(独立软件开发商)、IHV(独立硬件开发商)、整机、一体机合作伙伴等。 投资建议与投资标的 建议关注华为大模型产业链相关的硬件供应商、服务提供商及行业应用合作伙伴: 硬件供应商:1)算力硬件:广电运通(002152,未评级);2)连接器:意华股份(002897,未评级);3)桌面云终端:星网锐捷(002396,未评级);4)光器件:光迅科技(002281,未评级)、华工科技(000988,未评级) 服务提供商:1)网络规划建设:特发信息(000070,未评级);2)网络管维:润建股份(002929,未评级);3)IDC建设:光环新网(300383,未评级) 行业应用合作伙伴:1)AI应用:创维数字(000810,未评级);2)华为生态:初灵信息(300250,未评级)、天源迪科(300047,未评级);3)云通信:彩讯股份(300634,未评级)、梦网科技(002123,未评级);4)云计算:光环新网(300383,未评级) 风险提示 宏观经济下行风险、配套算力基础设施发展较慢、盘古大模型能力不及预期、伦理风险。 报告目录 报告正文 一、华为云盘古大模型全新版本即将发布 盘古初显锋芒。2021年4月,在华为开发者大会上,华为云发布了盘古系列超大规模预训练模型,包括NLP大模型以及CV大模型。目前,华为云已推出五大水平领域的基础大模型(L0),分别为:NLP(中文语言)大模型、CV(视觉)大模型、科学计算大模型、多模态大模型和Graph(图网络)大模型。时隔两年,华为云即将再次上线盘古大模型的全新版本。 1) NLP大模型:由华为云、循环智能与鹏城实验室联合开发,是业界首个千亿参数的中文预训练大模型,并使用了40TB的文本数据用于训练。盘古NLP大模型首次使用Encoder-Decoder架构,兼顾NLP理解与生成的能力,在CLUE榜单上中文理解能力接近人类水平。 2) CV大模型:为30亿参数的模型。盘古CV大模型在业界首次实现了模型的按需抽取,根据不同部署环境的运行要求可以自动抽取出的适合的模型,模型差异动态范围可达三个数量级;提出基于样本相似度的对比学习,在ImageNet数据集上小样本学习能力业界第一。 3) 科学计算大模型:主要解决各种科学问题,如气象预报、海浪预测、分子动力学预测、微分方程求解等,旨在用AI促进基础科学的发展。 4) 多模态大模型:具备图像和文本的跨模态理解、检索与生成能力,通过跨模态语义关联实现视觉-文本-语音多模态统一表示,采用一个大模型即可灵活支撑图-文-音全场景AI应用,可用于产品设计、艺术创作、语音播报、海报创作等领域。 5)Graph(图网络)大模型:首创图网络融合技术,在工艺优化、时序预测、智能分析等场景有广泛应用,比如预测企业财务风险、制造企业优化工艺等等。 盘古NLP模型——兼顾生成和理解能力。基于大量的参数,模型能够学会数据之间的关系,抽象出逻辑能力,更加智能化,然而模型的能力并不完全由参数量决定。首先,千亿参数的大模型每优化一次就会耗费巨大的成本,单一的参数量堆积可以帮助大模型更好地理解表征和语义之间的关联性,但所耗费的算力、时间成本也会随之增加,对训练过程中出错的敏感程度亦会上升,牵一发而动全身。因此盘古NLP模型在预训练阶段加入基于prompt的任务,降低微调难度,解决以往大模型为不同行业场景进行微调的困难。在下游数据充足时,微调难度的降低使得模型可以随着数据变多而持续优化;在下游数据稀缺时,微调难度的降低使得模型的少样本学习效果得到显著提升。其次,在模型结构上,跟传统其他企业训练的NLP大模型的方式不同,盘古看重的不仅是大模型有生成能力,还要有更强的理解能力。华为采用了Encode和Decode的架构,来保证盘古大模型的在生成和理解上面的两个性能。 盘古CV大模型——兼顾图像判别与生成能力。首先,为了解决模型大、数据多带来的学习效率低、表征性能弱的问题,盘古CV大模型在预训练阶段主要集中在数据处理、架构设计和模型优化三个阶段进行优化。以区分白色猫和白色狗的图片为例,显然白色不是最重要的信息,动物才是。基于此,华为进行了算法自研,比如在视觉中强行给模型注入一些层次化信息,让模型在训练过程中了解样例之间真正强关联性的东西。 除模型本身的优化外,盘古的优异性能还有赖于基础算力设施、AI专用框架与平台的搭建。 1)算力:鲲鹏CPU+昇腾GPU提供底层算力支撑,同时还基于华为CANN采用了算子量化、算子融合优化等技术,将单算子性能提升30%以上。 2)全场景AI框架:华为MindSpore创新性地采用了“流水线并行、模型并行和数据并行”的多维自动混合并行技术,大幅降低了手动编码的工作量,并提升集群线性度20%。 3)AI平台:ModelArts平台提供E级算力调度,同时结合物理网络拓扑,提供动态路由规划能力,为大模型训练提供了最优的网络通信能力。 1.1 鲲鹏+昇腾搭建基础AI算力 华为以鲲鹏和昇腾作为根基,打造“一云两翼双引擎”的计算产业布局,持续构建开放生态。其中,双引擎指围绕“鲲鹏”与“昇腾”打造的两个基础芯片族,构筑异构的计算架构。华为已成为同时拥有“CPU、NPU、存储控制、网络互连、智能管理”5大关键芯片的厂商。 鲲鹏包括服务器和PC机芯片。鲲鹏920是业界首颗64核的数据中心处理器,性能比业界主流处理器高25%、内存带宽高60%;同时把CPU、桥片、网络和磁盘控制器“4合1”。鲲鹏处理器从2007年走到现在已历时16年,鲲鹏920是第三代芯片。华为认为,最强算力的通用服务器需要具备至少64核、8个内存通道、PCIe 4.0、多合一SoC、xPU高速互联、100GE高速I/O等六个特征。 昇腾,基于华为自研DaVinci架构的AI处理器,可应用于训练和推理场景;昇腾910训练芯片与英伟达A100算力基本相当,昇腾310推理芯片,功耗仅8W。昇腾计算基于昇腾系列处理器构建的全栈AI计算基础设施及应用,包括昇腾系列芯片、系列硬件、芯片使能、AI框架、应用使能等。华为Atlas人工智能计算解决方案基于昇腾系列AI处理器,通过模块、板块、小站、服务器、集群等丰富的产品形态,打造面向“端、边、云”的全场景AI基础设施方案,涵盖数据中心解决方案、智能边缘解决方案。 1.2 全场景AI框架:MindSpore 超大规模AI对AI框架提出新的挑战。即使单卡算力实现突破,对于大规模模型及训练数据,仅依靠单卡的内存与算力,不但训练时间过长,不确定性也会随之加大,因此大规模模型的训练通常需要使用多机多卡来实现,同时也衍生出算力单元之间的通信问题。超大规模AI对AI框架提出的挑战可以概括为如下六堵墙: 内存墙:以鹏程·盘古大模型为例,参数量200B,模型训练过程中需要存储参数、激活、梯度、优化器状态,一个模型的训练就需要占用近4TB的内存。业界主流训练卡,如昇腾910,一张卡的内存是32GB,也就是说需要100多张卡才能跑一个模型。 计算墙:鹏程·盘古200B参数量的大模型,需要3.6E23 FLOPS算力,即使能把昇腾910 256T的理论算力发挥出来,也需要44年才能训练完。 通信墙:大模型并行切分到集群后,模型切片之间会产生大量通信,从而产生通信瓶颈。只有综合考虑参数量、计算量、计算类型、集群网络带宽拓扑等,才能设计出性能较优的并行切分策略。 效率墙:算法的分布式并行开发一直是并行计算领域的一大难题,如何让用户高效编写分布式并行的代码,也是各种AI框架研究的重点和难点;在HPC时代是MPI编程范式,大数据时代是MapReduce编程范式,而超大规模AI时代需要建立新的编程范式。 调优墙:昇腾E级算力集群有4096个节点,在E级算力集群上训练一个千亿参数规模的模型,节点之间的通信关系非常复杂,要保证计算的正确性、性能和可用性,手动调试难以全面兼顾,需要一个自动化及可视化的集群分析工具。 部署墙:超大规模AI从训练到部署需要一个转换,同样以鹏程·盘古大模型为例,训练时用了千卡,云上推理部署需要64卡,中间需要把千卡的训练无缝地转接到64卡的推理。同时,为了进一步降低推理成本,需要把模型进行压缩,实现一张卡就能运行。 分布式并行实现算力增强、数据处理加速和模型训练。业界主流的分布式并行类型包括数据并行、模型并行和混合并行三种,围绕切分的内容(数据切分、模型切分)来划分。 MindSpore支持多维度混合并行。MindSpore是业界首个支持全自动并行的框架,MindSpore多维度自动并行,通过数据并行、算子级模型并行、Pipeline模型并行、优化器模型并行、异构并行、重计算、高效内存复用,及拓扑感知调度,实现整体迭代时间最小(计算时间+通信时间)。编程接口高效易用,实现了算法逻辑和并行逻辑解耦,串行代码自动分布式并行。此外,MindSpore通过多维度混合并行,解决了模型及集群的Scale Out问题,实现了训练到推理模式的快速切换。以鹏程·盘古为例,鹏程·盘古是最大的稠密形式的中文预训练语言模型,拥有200B参数,训练时使用了2048卡,推理时需要64卡。并行训练模式采用了数据并行、模型并行、优化器并行、流水并行、重计算等,而推理时只需采用模型并行和流水并行。基于MindSpore的分布式并行能力,鹏程·盘古可自动从分布式训练模式转换成分布式推理模式,并实现服务化封装,可以对外提供RESTful接口,支持快速上线大模型服务。 根据Omdia发布的《中国人工智能框架市场调研报告》显示,,PyTorch、TensorFlow、MindSpore等人工智能框架在知名度与市场份额上处于第一梯队。在AI框架使用率的排名中,TensorFlow(2015年开源)和PyTorch(2017年推出)的先发优势依然存在,但MindSpore(2019年8月推出,2020年3月开源)以11%的份额进入第一梯队。 1.3 AI开发平台:ModelArts ModelArts便于用户快速创建和部署模型。ModelArts是面向AI开发者的一站式开发平台,提供海量数据预处理及半自动化标注、大规模分布式训练、自动化模型生成及端-边-云模型按需部署能力,帮助用户快速创建和部署模型,管理全周期AI工作流。“一站式”是指AI开发的各个环节,包括数据处理、算法开发、模型训练、模型部署都可以在ModelArts上完成。从技术上看,ModelArts底层支持各种异构计算资源,开发者可以根据需要灵活选择使用,而不需要关心底层的技术。同时,ModelArts支持Tensorflow、PyTorch、MindSpore等主流开源的AI开发框架,也支持开发者使用自研的算法框架。 二、从L0到L2,从基础模型到具体场景 华为云盘古大模型自身不断迭代,其进化路径可以分为L0-L1-L2三大阶段。L0指基础大模型,L1指行业大模型,L2则是指面向更加细分场景的推理模型。 基础大模型方面,以图网络大模型为例,一个大模型可以适配工艺优化、时序预测、智能分析等多个场景,同时应用在金融、煤矿、制造等多个行业。比如,在智能分析场景下,图网络大模型帮助广发证券将企业异常财务识别准确率提高到90%,相对于原来的小模型方法提升了20%,实现了行业领先。在时序预测场景下,图网络大模型帮助中央空调系统进行可挥发气体浓度的预测、智能监测空气质量,同时也在帮助零售企业进行销量预测。在工艺优化场景下,图网络大模型则可以帮助制造行业优化工艺、降本增效。 行业大模型方面,华为云推出了如盘古金融大模型、盘古矿山大模型、盘古电力大模型、盘古制造质检大模型、盘古药物分子大模型等行业大模型。 推理模型方面,以在电力行业为例,华为云基于盘古电力大模型,针对无人机电力巡检细分场景,通过一次预训练+下游任务的微调,推出盘古电力巡检大模型,解决了无人机智能巡检系统(缺陷检测)中的小样本学习、主动学习、增量学习等问题,解决了海量数据标注工作量大和缺陷种类繁多的问题。 此外,在华为部署的物联网、智能座舱、智能驾驶等领域,盘古大模型也有望得到应用,为这些领域提供更加智能化的技术支持。比如,华为终端总裁何刚在MWC19期间宣布,华为终端将实施1+8+N全场景战略,“1个太阳”指的是手机,“8个行星”指的是平板、TV、音响、眼镜、手表、车机、耳机、PC八大业务,而“N个卫星”指的是移动办公、智能家居、运动健康、影音娱乐及智能出行各大板块的延伸业务。提高手机这一入口的智能化水平,提供语音识别、人机交互,有助于丰富用户的“全家桶”设备体验。比如在智能驾驶中,大模型可用于提升自动驾驶系统的智能控制和决策能力,优化车辆的智能驾驶功能。 与科研院所合作,以盘古为基础打造多个专用大模型。2020 年 3 月 28 日,随着华为将全场景 AI 计算框架昇思 MindSpore 正式开源,越来越多的知名高校和科研机构联合昇思 MindSpore 先后打造出了覆盖 NLP、CV 和多模态融合以及特定于某个领域的专用大模型,逐渐形成了基础大模型 + 行业大模型的整体布局。 鹏程·盘古:2021 年 5 月,鹏城实验室基于昇思 MindSpore 推出了全球首个 2000 亿参数中文 NLP 大模型鹏程·盘古,它在预训练阶段学习了 40TB 的中文文本数据。在性能方面,鹏程·盘古在 16 个下游任务中性能指标优于业界 SOTA 模型;在应用方面,鹏程·盘古在知识问答、知识检索、知识推理等丰富的文本生成领域表现突出。 紫东·太初:中科院自动化所基于昇思 MindSpore 打造了全球首个千亿参数三模态大模型紫东·太初,通过跨模态语义关联达成了视觉-文本-语音三模态的统一表达和高效协同。紫东·太初多模态大模型具有超强的图文音跨模态理解与生成能力,与单模态相比,只需要一个大模型就能支撑图文音全场景 AI 应用。 鹏程·神农:在华为全联接 2021 上,鹏城实验室发布面向生物医学领域的AI平台——鹏程·神农大模型,包含蛋白质结构预测、小分子生成、靶点与小分子相互作用预测以及新抗菌多肽设计与效果评价等模块,深度赋能生物制药。借助鹏程·神农的能力,制药企业和医学研究机构将大大加速新型药物的筛选与创制。比如,在抗菌肽(下一代抗菌素)的探索中,借助鹏程·神农大模型强大的氨基酸序列生成能力,并结合现有抗菌肽数据集,人们可以在很短时间内产生数万种候选肽的氨基酸序列。传统方法在长达四十年的时间里仅仅生成 4000 多种候选多肽,而鹏程·神农 + 抗菌肽分类器的组合在数月内产生 30 万种候选多肽。 武汉·LuoJia:2021 年 7 月,武汉大学正式推出武汉·LuoJia,包含全球首个遥感影像智能解译专用框架武汉·LuoJiaNET 和业界最大遥感影像样本数据集武汉·LuoJiaSET,为遥感应用开发提供便利,让智能遥感技术在自然资源、海洋、农业、森林、应急等行业得到广泛应用。武汉·LuoJiaNET 针对遥感数据存在的像幅尺寸大、数据通道多、尺度变化大等特点,兼具内存可扩展、尺度通道灵活创建、数据通道自主优选、框架与数据协同处理等特性。武汉·LuoJiaSET 则是遥感领域满足 OGC 标准的大规模遥感影像样本库,制定了支持全球范围的遥感影像样本分类标准、标注规范,建立涵盖不同遥感任务的统一分类体系,形成样本要素的采集要求、内容和流程规范,支持多级别、多类型遥感影像样本库的采集、制作、管理、共享和应用。 空天·灵眸:空天·灵眸是中科院空天信息创新研究院与MindSpore社区联手打造的国际首个面向多模态遥感数据的生成式自监督预训练模型,已成功应用于多模态遥感地物要素提取、遥感场景分类、细粒度目标精细化识别、像素级变化检测、三维重建等重要任务中,在12个国际标准数据集中取得世界领先水平。其不仅具备“数据多源异构、遥感特性驱动、应用任务泛化”的特点,还填补了多模态生成式预训练模型在遥感专业领域的空白,可面向遥感学术研究、行业应用等产学研领域推广使用。 三、投资建议 “一平台双驱动”,华为盘古打造生态型产业链。华为盘古大模型基于昇腾计算产业生态。关于AI生态型产业链,华为提出“一平台双驱动”的模式,其中“一平台”指基础软件平台,包括AI处理器、服务器硬件以及芯片使能软件、AI框架。“双驱动”指平台要支撑的两大生态,一是技术生态,二是商业生态,包括ISV(独立软件开发商)、IHV(独立硬件开发商)、整机、一体机合作伙伴等。 建议关注华为大模型产业链相关的硬件供应商、服务提供商及行业应用合作伙伴: 硬件供应商:1)算力硬件:广电运通;2)连接器:意华股份;3)桌面云终端:星网锐捷;4)光器件:光迅科技、华工科技 服务提供商:1)网络规划建设:特发信息;2)网络管维:润建股份;3)IDC建设:光环新网 行业应用合作伙伴:1)AI应用:创维数字;2)华为生态:初灵信息(鸿蒙)、天源迪科(鲲鹏);3)云通信:彩讯股份、梦网科技;4)云计算:光环新网 3.1 创维数字 机顶盒及宽带接入领域龙头。创维数字成立于2002年,于2014年深圳A股上市,是国内机顶盒及宽带接入领域行业龙头。公司主营业务为全球用户提供全面系统的超高清终端呈现、宽带网络连接和超高清行业应用综合解决方案,主要产品有智能盒子终端、宽带网络通讯连接设备、汽车电子及车联网、物联网等系列产品及运营与服务,基于国内外运营商客户的定制化需求,提供对应解决方案、系统集成及终端产品,其中数字机顶盒终端为公司核心产品。公司与华为云合作紧密,目前公司与华为在AI技术的一些垂直领域有相关的交流和应用。 营收净利双增长。2022年,公司实现营收120.09亿元,同比增长10.71%,实现归母净利润8.23亿元,同比增长95.13%。从主营产品构成来看,2022年公司主营的智能终端业务实现营业收入95.78亿元,同比增长25%;专业显示业务及运营服务分别实现营收21.34亿元和2.35亿元,同比下降25%/7.2%。 “双千兆”带动宽带连接业务营收增长。在宽带网络“双千兆”趋势下,国内宽带连接设备已开始升级换代,公司宽带连接产品多次中标运营商集采招标项目,份额显著提升。近年来公司宽带业务增速亮眼,中标情况喜人,在中国移动2022-2023年智能家庭网关产品集中采购(第一批次)的五个采购包均有中标。 3.2 初灵信息 产业数智化解决方案及运营服务提供者。公司聚焦产业数智化应用市场,提供“智能连接(F5G/5G/WIFI6)+数据感知(DPI)+智能应用(AI)”等产品,组成安全的边缘计算万物互联能力;边缘计算的数据采集感知能力;边缘计算的智能应用能力,推进企业工业互联网的建设,促进新一代信息技术为设备赋智、为企业赋值、为产业赋能。公司主要服务于以下三块市场:第一,为运营商行业提供智能连接、数据感知、智能运维、智能视频等解决方案;第二,助力政企行业“DICT”为其提供大数据应用以及数据信息安全服务;第三,为行业/大众企业提供数智化方案及SAAS产品。 子公司妙联物联网与华为鸿蒙在多领域建立深度合作。妙联物联网由初灵创投控股(持股57.15%),初灵信息持股6.31%,主要从事基于鸿蒙的多个细分行业SaaS云服务的软硬件产品的研发和推广,是基于鸿蒙大生态物联网整体解决方案的提供者。妙联物联网与华为在多领域保持深度合作:1)妙联是华为在物联网场景方面的核心供应商,是华为认证的精英合作伙伴、沃土云数字平台合作伙伴;2)代理销售华为鸿蒙的基础物联网组件、生态单品、云资源等;3)妙联帮助设备和品牌厂商上鸿蒙,从连云到设备整机认证一条龙服务;4)基于鸿蒙的多个物联网SAAS云服务的软硬件产品已经上架,成为华为销售联运产品。2022年上半年,华为已经推给妙联至少10家上市公司客户。 3.3 星网锐捷 国内领先的ICT基础设施及AI应用方案提供商。星网锐捷成立于2000年,并于2010年在A股上市。公司致力于在智慧网络、智慧云、智慧金融、智慧通讯、智慧物联、智慧娱乐、智慧社区等领域扎根,为企业级客户提供信息化解决方案。2022年,公司实现营收157.41亿元,同比增长16.18%;实现归母净利润5.76亿元,同比增长6.37%。公司主营业务分为智慧网络、智慧云、智慧通讯、视频信息应用、智慧社区、车联网及通讯模组等六大业务板块,其中智慧网络板块主要由锐捷网络(2022年上市)负责。根据IDC数据,2022年锐捷网络在中国以太网交换机市占率排名第三;在中国数据中心交换机市占率排名第三;在中国企业级WLAN市占率排名第三,其中Wi-Fi6产品出货量排名第一。 子公司升腾资讯推出R2232A鲲鹏服务器,打造鲲鹏桌面云方案。升腾资讯成立于2002年,为公司全资子公司,主要经营桌面云、智慧营业厅解决方案和云支付三大业务,具有全系列桌面云产品,包括云方案、云终端、云服务器、存储器和交换机。在华为全连接大会(2019)上,升腾资讯发布了首款鲲鹏桌面云方案,该方案基于鲲鹏处理器的终端整机和服务器,以及威讯云平台,构建最新一代的鲲鹏桌面云方案,方案能够实现弹性调配云端和终端资源,敏锐感知用户需求,同时具备数据不落地的特性,为客户提供安全、易用的桌面云2.0解决方案,全面满足政务办公等各类场景的云上办公体验。根据IDC报告,2021年升腾威讯桌面云终端出货量市占率达20.3%,连续4年位列第一。 3.4 广电运通 金融机具龙头。公司包括金融科技和城市智能两大主营业务,(1)金融科技方面,公司连续14年位居国内金融机具市占率第一,是国内金融机具的龙头企业,提供ATM、清分机、智能业务库等一系列产品;(2)城市智能方面,公司提供“智能终端+大数据”提供对应解决方案,构建智能安防、智能交通、智慧民生等多项业务场景。 公司旗下广电五舟具备研发和生产服务器、PC等多种算力产品的能力。公司旗下广电五舟提供国内高性能计算产品及解决方案、云服务器全系列产品、边缘计算和软硬一体化产品、智能计算产品、自主研发的存储产品和行业解决方案,目前产品广泛应用于政府、教育、网络安全、科研、人工智能、互联网等行业及领域。作为华为鲲鹏整机合作伙伴和昇腾AI战略伙伴,依托华为鲲鹏和昇腾AI等软硬件技术支持,广电五舟目前已推出华为鲲鹏、昇腾系列服务器、信创有为系列产品、自主研发的存储产品、PC、云终端和行业解决方案等,深度融入昇腾AI生态体系。 3.5 特发信息 特发信息主营光纤光缆、通信设备、军工信息化及智慧服务四大业务板块。其中,通信设备板块主要由三大子公司负责,光网科技从事光器件研发,特发东智主要通过ODM模式进行路由器、机顶盒等网络终端的生产制造,四川华拓重点负责光模块的研发与制造。军工信息化板块主要由成都傅里叶和神州飞航两大子公司负责,从事军工智能终端、软件、大数据平台等业务,为各军兵种提供先进的装备信息化产品。智慧服务板块聚焦5G时代的基建,提供智慧网络工程及数据中心的规划设计、建设施工及运营维护。 承接鹏城云脑等多个AI项目建设。公司曾承接鹏城云脑二期建设集成项目和许昌市中原人工智能计算中心项目工程项目。鹏城云脑主要用于AI大模型领域,约70%的机时服务于鹏城实验室以外的企业、高校、科研院,已支撑近千个国产AI模型的训练,包括全球首个全开源的两千亿参数中文预训练语言大模型“鹏程·盘古”、全球首个知识增强千亿大模型“鹏城-百度·文心”、性能达国际先进水平的十亿参数视觉大模型“鹏程·大圣”等。 3.6 意华股份 连接器+光伏支架,两大业务并驾齐驱。意华股份成立于1995年,并于2017年上市。通过内生外延,公司目前已拥有连接器和光伏支架两大核心业务,其中连接器具体包括通讯连接器、消费电子连接器和汽车连接器。公司深耕连接器领域,重要客户包括华为、中兴、比亚迪、吉利等等。公司是国内少数实现高速连接器量产的企业之一,优势产品以SFP、SFP+光电连接器为代表,综合体现了公司的产品设计能力、模具开发能力、精密制造能力及检验验证能力。公司基于通信领域与华为的合作,逐渐向汽车领域扩展,目前深度配套华为车载智能网联相关业务,在车载ADAS、MDC、5GT-BOX等相关模块定制开发了多系列连接器。 3.7 光迅科技 光迅科技是国内少有的布局芯片-模块-系统全产业链的光通信厂商。公司产品主要包括无源光器件、光纤放大器、光模块等,涵盖固网接入和无线接入,广泛应用于数据中心和电信市场。公司作为国内少有的自主研发光芯片的企业,可以有效改善自身光器件、光模块等产品的生产成本,扩大盈利空间。近年来,公司营收与利润表现稳健,营收由2016年的40.59亿元增张至2021年的64.86亿元,CAGR为9.8%,归母净利润由2.85亿元增长至5.67亿元,CAGR为14.8%。 公司布局硅光领域光芯片及光模块,已可提供100G、400G硅光芯片方案。公司拥有PLC(平面光波导)、III-V、SiP(硅光)三大光电芯片平台,其中硅光芯片平台支持直接调制和相干调制方案。2018年,由公司依托国家信息光电子创新中心、光纤通信技术和网络国家重点实验室、中国信息通信科技集团联合研制的“100G硅光收发芯片”成功投产,可实现100G/200G全集成硅基相干光收发集成芯片和器件的量产。目前,公司100G硅光模块已实现量产,并可提供400G的硅光芯片方案,公司400G客户包括BAT和华为。2021年12月,公司联合国家信息光电子创新中心、鹏城实验室等宣布完成1.6T/s硅基芯片的联合研制和功能验证,实现了我国硅光芯片向Tb/s级的首次跨越。2021年上半年,来自华为的收入占公司总收入比30%。 3.8 华工科技 三大业务协同发展,光通信领域行业领先。公司形成了智能制造业务、联接业务、感知业务三大业务格局,在联接业务中的光通信领域,公司具备从芯片到器件、模块、子系统全系列产品的垂直整合能力,产品包括有源光器件、智能终端,光学零部件等,公司围绕5G、F5G、数据中心、智能汽车、5G to B五大应用场景,为客户提供智能“光联接+无线联接”解决方案,产品市场占有率处于行业领先地位。 华为5G光模块金牌供应商。早在2018年,公司首个5G光模块订单成功交付,成为国内首家获得华为5G光模块订单的企业,荣膺华为技术2018年度全球金牌供应商奖。子公司华工正源总经理曾表示,根据市场测算,华工正源有希望在华为的5G光模块供应中占据40%-50%的份额,在行业整体市场份额有望达到30%。 3.9 润建股份 信息网络管维与能源网络管维服务提供商。润建股份是通信网络管维领域规模最大的民营企业,是中国移动A级优秀供应商。公司信息网络管维业务分为数字化业务与IDC业务,数字化业务方面,公司已在“社会综合治理与防控防疫”、“国家教育数字化战略转型”、“数字乡村助力乡村振兴”、“XR应用”等领域推出了一系列数字化产品;IDC业务方面,公司规划建设五象云谷云计算中心,项目共包含6000个机架,是目前为止广西最高等级、最大规模云计算数据中心。在能源网络领域,公司已签订多项新能源发电项目开发协议,公司的光伏运维业务可帮助客户提升约3%-5%的发电效率。 公司与华为合作范围不断扩展。华为是公司管维业务的重要合作伙伴,随着业务发展,目前公司与华为的合作已由通信网络管维拓展至IDC数据网络、信息网络、能源网络领域,主要合作内容包括相关产品的销售、实施、运维,以及基于产品的解决方案开发和推广等,公司的部分技术、数字化平台和解决方案可以在鸿蒙平台上应用。 3.10 天源迪科 产业云和大数据综合解决方案提供商。公司在通信行业 BOSS 领域具有 20 余年的发展经验和先发优势;在金融行业软件开发及服务、IT 外包及智能运营服务领域客户数量和收入发展迅速;作为华为总分销商,为政企客户提供ICT产品增值分销和专业服务业务稳定增长。公司聚焦产业数智化转型,主营业务收入来源于通信、金融和政企行业,2022年占收比分别为43%、40%、17%,金融行业业务已成为公司主要利润来源。 与华为展开多方面合作,子公司金华威是华为ICT产品中国区六家总经销商之一。公司与华为在公安、政府、通信运营商等行业进行软硬件合作,如公安行业中警务云大数据平台、国内和海外电信运营商主要运营支撑核心系统建设等;鸿蒙方面,公司开发了适配鸿蒙OS系统的华为视频电视端和手机端应用;鲲鹏方面,公司是华为鲲鹏生态合作伙伴,与华为在通信、政府等多个领域实现了产品相互认证,金融方面公司数字银行核心技术平台与鲲鹏云服务也完成兼容性测试。子公司金华威是华为IT及云软件的总经销商,及华为云视频产品中国总代理,与华为在警务云平台、ICT企业分销、电信软硬件等有多方面合作。 3.11 彩讯股份 产业互联网解决方案和技术服务提供商。公司致力于为电信、金融、能源、交通等行业的大中型企业级政府部门等客户提供基于统一办公平台、企业邮件系统、大数据智能分析平台、一体化营销资源管理平台、终端管理平台、统一认证平台等产品的互联网应用平台的产品开发、系统建设、运维及运营支撑服务,助力各行业的数字化转型和产业升级,推动传统产业链的降本增效。 公司是华为首百家鲲鹏+昇腾ISV合作伙伴之一;是华为智能计算的安全邮件系统合作伙伴,公司Richmail邮件产品同时获得了华为鲲鹏、华为昇腾技术认证。同时彩讯股份与华为是信创领域的合作伙伴,是华为计算的银牌经销商,与华为在云通信方面有业务合作。 3.12 梦网科技 国内领先的云通信服务商。梦网科技已建立为客户提供多格式、跨平台、低延时、广覆盖的综合云通信平台服务能力。公司软硬件产品广泛应用于金融、政务、互联网、交通运输、物流、电商、教育等多个行业领域。公司的云通信业务主要包含“消息云、终端云、视讯云、物联云”,公司基于用户需求,可提供多种部署模式,推出了SaaS及PaaS平台产品,为企业客户提供稳定的云通信服务。 与华为云合作KooMessage。华为云的高阶大数据和AI 能力正在赋能KooMessage进一步全面升级。如智能内容生产引擎,利用AI推荐算法、RPA、低代码等技术,通过用户行为数据和素材模板库内容的人群定位等分析,自动化组装生成个性化内容,为企业用户提供千人千面的内容&创意。再如智能流量分发引擎,通过全局流量分发的数据汇聚及治理分析,以时间、地点、客群为核心因素,智能分析高价值管道,结合AI、RPA等技术进行全渠道流量自动化分发编排,满足用户与企业的双向需求。 3.13 光环新网 深耕通信行业多年,IDC与云计算业务双轮驱动。公司专注互联网数据中心服务领域已超过20年,积累了丰富的设计、建设与运营管理经验,目前已成长为国内头部的IDC服务提供商。公司数据中心业务形成了以北京为中心辐射京津冀,以上海为中心辐射长三角及以长沙为中心盘活华中及西部地区发展的战略,数据中心覆盖北京、上海、天津、河北燕郊、湖南长沙、新疆乌鲁木齐、浙江杭州等七个城市及地区,投产机柜达4.7万个。云计算业务方面,公司是亚马逊云科技中国(北京)区域运营商,目前已运营近6年时间,公司持续完善其本地化业务服务体系,为广大企业客户提供领先的、适合中国市场需求的基于亚马逊云科技的云服务产品。 多个数据中心仍在建,云计算业务保持扩张。公司持续响应国家算力网络建设号召,在全国各地进行数据中心建设。目前公司在全国范围内在建及储备项目规划机柜数量超过11万个,截止2022年上半年,在建工程金额总计10.6亿元,主要用于数据中心建设;此外,云计算方面,为顺应算力网络的发展趋势,公司凭借自身在数据中心、云计算以网络上的优势,着手进行“云电脑”与“云手机”的研发,并于2022年下半年起,逐步向市场推出云电脑与云手机服务。 公司与华为于2022年6月签署了战略合作协议,双方未来在低碳数据中心、智能光伏储能、智慧网络、鲲鹏、昇腾AI计算产业、新型云计算业务等领域开展产品、服务及商业模式创新等方面的全面合作。 四、风险提示 宏观经济下行风险:大模型需要大量资金投入用于服务器、交换机等设备的购买以及超算中心的建设,企业资本开支投入一定程度上受到宏观经济影响。 配套算力基础设施发展较慢:大模型的预训练及推理需要大量算力支撑,若算力基础设施发展不及预期,可能影响整个大模型的训练效率和效果,进而影响产业链下游的发展。 盘古大模型能力不及预期:市场对于华为即将发布的新一代盘古大模型赋予较高期待,若大模型推出后的实际效果或对于应用的赋能不及预期,可能会对产业链公司带来影响。 伦理风险:大模型可能衍生出一定的推理能力,产生难以预料的结果,可能带来一定的伦理风险。 声明 本内容系对我司已发布研报的解读,报告标题《盘古大模型全新版本即将发布,建议关注华为产业链标的》,发布日期:2023年4月4日。分析师:张颖 执业证书编号:S0860514090001 香港证监会牌照:BRW773 联系人:王婉婷、周天恩 提醒客户阅读我司报告发布平台统一发布的完整的证券研究报告,仔细阅读其所附风险提示、各项声明及信息披露。 长期关注:互金/Fintech/通信 不定期发布:研报/随笔/点评/调研
大部分微信公众号研报本站已有pdf详细完整版:https://www.wkzk.com/report/(可搜索研报标题关键词或机构名称查询原报告)
郑重声明:悟空智库网发布此信息的目的在于传播更多信息,与本站立场无关,不构成任何投资建议。