首页 > 公众号研报 > 华泰 | 海外科技:乘AI PC大潮英特尔发布Meteor Lake

华泰 | 海外科技:乘AI PC大潮英特尔发布Meteor Lake

作者:微信公众号【华泰睿思】/ 发布时间:2023-12-17 / 悟空智库整理
(以下内容从华泰证券《华泰 | 海外科技:乘AI PC大潮英特尔发布Meteor Lake》研报附件原文摘录)
  12月14日英特尔发布首款基于Intel 4制程的AI PC Meteor Lake,标志着“四年五节点”计划再下一城。该芯片采用chiplet架构,以提升性能、灵活性、良率及降低成本,已获多家PC OEMs 搭载。AI PC对芯片的功耗、成本和效率提出了更高要求,而面对ARM架构更看重“每瓦性能”,英特尔也不甘示弱,产品主打低功耗e-core架构,欲与ARM一战。同场加映新一代服务器AI芯片Gaudi 3。 核心观点 英特尔发布其首款AI PC产品,同场发布AI芯片Gaudi 3 在12月14日举办的“AI Everywhere”新品发布会上,英特尔正式发布了首款基于Intel 4制程(四年五节点的第2节点)的酷睿Ultra系列处理器第一代产品Meteor Lake,采用Chiplet架构并首次集成NPU实现端侧AI计算能力,开创了英特尔的AI PC新纪元。公司同场发布了新一代AI芯片Gaudi3,该芯片将与Nvidia的H100和AMD的MI300X展开正面竞争。英特尔加速建立其端侧AI生态圈,在软件领域与100多家厂商密切协作,计划推出数百款AI增强型应用,并预计于2024年为全球PC制造商的230多款机型提供端侧AI特性,计划于2025年内交付1亿颗客户端处理器。伴随PC市场的复苏,端侧AI芯片的加速部署将持续推动AI PC渗透率提升。 “四年五节点”计划再下一城,采用Chiplet架构,并主打低功耗 Meteor Lake使用Intel 3D Foveros封装及采用分离式模块(Chiplet)架构,并首次集成了NPU实现端侧AI推理能力。Chiplet架构处理器分为计算模块(Intel4)、I/O模块(N6)、SoC模块(N6)、图形模块(N5),并将后三者外包给台积电。该架构的优势在于各模块能采用不同制程设计以提升性能和良率,从而降低成本。和上一代Raptor Lake相比,Meteor Lake的制程从Intel 7升级至Intel 4,晶体管密度翻倍,每瓦性能提升20%,带来2.5倍的能效表现。酷睿Ultra系列的高性能和低功耗不仅可提升英特尔端侧产品的竞争力,更标志着“四年五节点”计划再下一城。英特尔AI PC产品管线完善,Arrow Lake(Intel 20A)和Lunar Lake(Intel 18A)计划于2024H2推出,Panther Lake(Intel 18A)计划于2025年推出。 AI PC浪潮已至,随着PC行业复苏,全球PC OEM将稳步迈进 如今AI PC发展如火如荼,我们认为,2024年将是AI PC的元年。英特尔在10月宣布“AI PC加速计划”并在本次大会里推出其首款AI PC芯片;AMD于2023年12月6日推出Ryzen 8040 “Hawk Point”芯片,NPU算力达16TOPS;联想于23年10月提出“All For AI”战略,首次展示AI PC、AI大模型等创新技术,打响其PC端人工智能化第一枪。此外,宏碁、华硕、戴尔、惠普、小米等众多厂商宣布加码AI研发,将携手打造AI PC生态。PC行业层面上,AMD和英特尔的2和3季报及指引均显示,随着库存逐渐出清,全球PC出货量环比和同比下滑幅度收窄,PC市场正逐步回暖。 多方入局百花齐放,ARM和x86谁能在AI PC更胜一筹? 英特尔Meteor Lake采用e-core架构,注重AI端侧计算需要的低功耗,展现了与ARM架构竞争的潜力。AI PC时代已至,异构方案或成为主流,在其他芯片的辅助下,CPU的工作负载和性能要求也有所降低,各家芯片厂商均将GPU、CPU与NPU集成至同一SoC中。高通于2023年10月推出AI PC芯片X Elite,兼具低功耗、高性能、高AI算力优势,其Hexagon NPU最高算力达45TOPS,为行业领先,搭载该芯片的PC计划于2024年中出货。苹果也于今年10月推出M3芯片,较前代进行了全线优化,NPU算力达18TOPS,搭载M3芯片的PC已于11月7日出货。此外,英伟达和AMD也宣布进军ARM PC CPU,计划于2025年推出AI PC产品。 风险提示:AI技术落地和推进不及预期,行业竞争激烈,中美贸易摩擦等。 正文 英特尔召开AI Everywhere大会,展示全面AI版图 英特尔于2023年12月14日召开AI Everywhere大会,更新了一系列AI产品的最新进展,展示了其数据中心、云和PC等多个领域的全面AI解决方案。会议的亮点包括: 1)发布首个内置AI加速引擎NPU的酷睿Ultra移动处理器Meteor Lake,它采用颠覆性分离式模块设计并首次集成了神经网络处理器(NPU)作AI计算,在PC上实现高能效的AI加速和本地推理,为AI PC 和新应用提供动力。早在今年10月份,英特尔就已启动AI PC加速计划,此次公司重磅发布首款Meteor Lake系列处理器,开创了其AI PC新纪元,也标志着英特尔四年五节点的第2个节点Intel 4进展顺利。英特尔正与 100 多家软件厂商紧密合作,为PC 市场带来数百款AI增强型应用。华硕、微星、宏碁、联想等合作伙伴均已推出搭载Meteor Lake处理器的AI PC产品,英特尔预计酷睿 Ultra 处理器明年将为全球笔记本电脑和PC制造商的 230 多款机型带来AI特性,并计划在未来2 年内交付 1 亿个客户端处理器。 2)推出了第五代英特尔至强可扩展处理器Emerald Rapids,每个核心内置AI加速器,提高了AI和整体性能,同时降低了总体拥有成本(TCO),加速数据中心、云、网络和边缘AI。英特尔表示,最新的至强处理器尤其适用于推理,即部署人工智能模型的过程,其功耗低于训练过程。 第五代英特尔至强可扩展处理器性能和能效双升级。Emerald Rapids与今年1月推出的Sapphire Rapids同样基于Intel 7节点,核心架构升级至Raptor Cove,并将最大核心数提升至64核,最大三级缓存提升至320MB,HPC性能提升至1.3倍。此外,Emerald Rapids还重点提升了AI性能,沿用Sapphire Rapids中使用的AMX技术加强AI任务中的矩阵运算能力,并内置AI加速器,使得AI推荐系统和自然语言处理性能提升至1.4倍,大数据吞吐量提升至1.7倍。与上一代产品相比,在相同的热设计功率范围内,第五代英特尔至强可扩展处理器平均性能提升21%,并在一系列工作负载中将每瓦性能提升高达36%。对于遵循典型的五年更新周期并从更前一代处理器进行升级的客户,总体拥有成本最多可降低77%。 第五代至强处理器为数据中心、云、网络和边缘AI加速。第五代英特尔至强可扩展处理器能微调参数量多达200亿的大语言模型,并将其推理性能提高42%。现阶段,英特尔至强可扩展处理器也是唯一一款拥有MLPerf训练和推理基准测试结果并持续提升性能的 CPU。IBM表示,与上一代英特尔至强可扩展处理器的测试数据相比,第五代英特尔至强可扩展处理器在其watsonx.data平台上的网络查询吞吐量提高了2.7倍。将于明年部署第五代英特尔至强可扩展处理器的谷歌云指出,得益于谷歌云中第四代英特尔至强可扩展处理器内置的加速器,Palo Alto Networks在其基于深度学习模型的威胁检测的性能得到两倍提升。 1) 首次展示了即将于明年推出的英特尔Gaudi3加速器。Habana Gaudi是由英特尔在2019年12月宣布以20亿美元收购的Habana Labs设计的ASIC芯片,第一款Gaudi(16nm)于2019年6月推出,目前已迭代至Habana Gaudi2(7nm),2022年末已推出。Gaudi 2采用台积电7nm制程,可用于AI训练和推理任务加速,其中在AI推理任务上表现尤其出色,在最新的MLPerf v3.1基准测试中,英特尔FP8精确量化使Gaudi 2性能提升了1倍以上,Gaudi 2运行速度高达英伟达A100 的2.4 倍,几乎与 H100 Hopper GPU 齐平。在AI训练端,Gaudi 2同样介于英伟达A100与H100之间,英特尔期望应用FP8后Gaudi 2可以超越H100。英特尔预计下一代Gaudi 3将于2024年推出,采用台积电5nm制程,性能提升显著。其BF16工作负载性能是 Gaudi 2 的4倍,网络性能是 Gaudi 2 的2倍,HBM容量是Gaudi 2的1.5倍。 英特尔Meteor Lake正式发布,开创公司AI PC新纪元 英特尔首款AI PC处理器Meteor Lake已于23年10月上市,并在此次“AI Everywhere”发布会上正式发布,该处理器标志着英特尔40年来最大的PC芯片架构转变,集成GPU、NPU和CPU,兼具低功耗和AI加速功能等优势。Meteor Lake首次采用分离式模块化(Tile-based)设计,封装技术采用3D Foveros,将处理器划分为计算模块(Intel 4)、I/O模块(N6)、SoC模块(N6)、图形模块(N5),不同的单元可以利用三种不同的制程技术。借助台积电的成熟工艺和低成本,使得英特尔得以实现成本效益的突破。 1)制程:CPU采用Intel 4制程,Intel 4是英特尔首个采用EUV光刻技术的节点,能效相比Intel 7提升了20%,GPU单元首次采用了台积电5nm制程,SoC和IOE采用了台积电6nm制程; 2)CPU模块:集成新一代Redwood Cove P核和Crestmont E核,Redwood Cove P核相比上一代将进一步提升性能功耗比,而Crestmont E核能将时钟速度提高4%~6%; 3)GPU模块:引入Xe-LPG架构,即目前Arc A系列独立显卡架构中Xe-HPG的低功耗版本,支持DX12 Ultimate、AV1编解码等先进特性,每瓦性能高达Alder Lake的2倍; 4)SoC模块:首次集成了带有AI推理引擎的NPU,该NPU可与tGPU协同运行AI负载,使得生成式AI大模型得以在端侧高效运行。此外,SoC模块也集成了2颗低能耗E 核,将优先负责大部分负载,这意味着执行轻度工作负载时(轻度工作负载往往占据大部分时间)Meteor Lake可让CPU模块休眠,从而大幅降低能耗; 5)L4四级缓存:Meteor Lake的另一个特点在于其支持L4四级缓存(Adamantine,架构图中简称为ADM),可提供比L3缓存更快的访问速度,缩短加载时间。 Meteor Lake采用四个性能核(P-Core),八个能效核(E-Core)和两个位于SoC模块的低功耗能效核(LP E-Core)构建的3D混合架构,通过仅用低功耗能效核执行低负载任务降低了整体功耗,同时保证了CPU较高的峰值性能。图形模块将升级为全新Xe LPG微架构集成显卡,基于Arc独立显卡的Xe HPG微架构改进而来。图形模块的空间增大,Meteor Lake将拥有8个Xe核心,即128EU,较Alder Lake的96EU有了较大提升,能耗比有了两倍的提升。 Al算力高达34TOPS。英特尔称Meteor Lake 的关键特性之一是其AI加速能力,最高可提供 34 TOPS。但 Al加速支持只有在 Windows 12 发布后才会开始显现其价值,公司预计Windows 12将于明年推出。 这些芯片采用该公司的 7 纳米工艺制造,比早期芯片更省电。此外,Core Ultra 芯片还包括更强大的游戏功能,新增的图形处理能力可帮助 Adobe Premier 等程序的运行速度提高 40% 以上。该产品于本周四在笔记本电脑商店上市。 会上,英特尔还展示了在Meteor Lake 笔记本电脑本地运行 Llama 2 LLM(大型语言模型)。Zoom 在其芯片上运行背景模糊功能,图中可以看到一个视频窗口显示的是由 GPU 生成的背景模糊,而另一个视频窗口显示的是由 NPU 生成的模糊。英特尔所承诺的这项进步表现在:新的Meteor Lake芯片将能够比当前笔记本电脑中的英特尔芯片更高效地执行“AI”任务。这意味着除了通过本地运行AI应用节省金钱和保护隐私外,用户还可以在视频通话期间获得更多的系统资源。这是因为NPU(神经处理单元)能够处理相机效果,从而释放GPU以处理其他任务。 英特尔与台积电在Meteor Lake的合作或是重要看点,符合英特尔IDM2.0扩大第三方代工产能的战略,或将能使公司更有效抗衡早早借助台积电东风的AMD。除此之外,Meteor Lake标志着英特尔“AI PC”战略已经打响第一枪,其NPU可使PC在本地高效运行AI推理任务,同时其tGPU具备高性能,可与NPU协同运行AI工作负载,第三方mooreslawisdead官网认为Meteor Lake中的tGPU单元(核显)使用的Iris Xe或将足以替代笔记本显卡。 Meteor Lake和苹果M系列芯片均采用分离式模块化设计、E核和P核分离的设计和台积电制程,同时重点关注了能耗优化。英特尔从Meteor Lake到Panther Lake的产品线迭代重点着眼于CPU、GPU和NPU三方面“每瓦性能”上的提升。鉴于Meteor Lake的设计技术革新使其在能耗方面展现出提升,而能耗正是基于ARM架构的苹果M系列芯片的优势所在。 下一代Arrow Lake将于2024下半年推出,基于Intel 20A节点,GPU单元升级显著。与Meteor Lake主要适用笔记本端不同,Arrow Lake将同时覆盖笔记本端和桌面端。Arrow Lake的一大重要升级在于GPU架构将升级至Xe-LPG+,即Meteor Lake 中GPU的增强版本,主要改进在于引入XMX计算单元,即eXtended Matrix eXtensions(扩展矩阵),该技术专为 FP64、FP32、FP16 和 bfloat16 格式的矩阵乘法运算设计,可执行DPAS(点积累加收缩)这一特殊运算指令,从而更高效地支持XeSS超分技术。XeSS超分技术是英特尔的升频技术,可利用AI技术提高帧率,将游戏从1080P提升至4K,与目前较为成熟的英伟达的DLSS和AMD的FSR类似。目前已经上市的Meteor Lake也可支持XeSS超分技术,但由于硬件支持不足,只能使用DP4a指令,对运行效率有一定削弱。根据wccftech官网报道,Arrow Lake-H已有样片流出,“H”表示该芯片适用于笔记本端高性能游戏本,Arrow Lake-H的CPU单元由6个P核和8个E核组成,CPU核微架构有较大优化,引入了新一代Lion Cove和Skymont;GPU单元将继续采用台积电代工,将基于台积电3nm制程。 Lunar Lake将于2024年在Arrow Lake之后推出,重点布局低功耗,旨在实现每瓦性能的突破性提升。英特尔在2023年Innovation大会上展示了在Lunar Lake上运行Riffusion和Stable Diffusion生成式AI大模型的突出效果。外媒Tom’s Hardware的报道则披露了关于Lunar Lake MX的更多细节,Lunar Lake MX将采用全新Lion Cove和Skymont微架构,NPU单元包含多达6层NPU 4.0 AI加速器,封装技术将沿用3D Foveros技术,能实现每瓦性能的突破性提升。在制程方面,该芯片在英特尔 PC CPU路线图上显示将基于 Intel 18A 节点,不过根据外媒 Tom‘s Hardware 在11月的报道,英特尔Lunar Lake MX的计算单元可能将采用台积电N3B节点。考虑到英特尔计划将Lunar Lake的CPU和GPU单元放在同一块硅片上,若此报道信息属实,此举或可省去基于Intel 18A重新设计Xe2 GPU的步骤,为英特尔节省成本。 在AI PC应用端方面,英特尔于23年10月19日的Intel Innovation Day上推出“AI PC加速计划”,不仅将持续为其PC CPU搭载内置AI加速器,目标在2025年实现1亿台个人电脑的AI赋能,英特尔和超过100家企业合作,全面改善未来PC在游戏、视频、安全性能等环节的AI性能,推动AI端侧应用落地。会上公司也展现了丰富的端侧AI应用场景的落地,其中Lunar Lake运用其内置AI加速器在几秒内就可生成一首Taylor Swift风格的歌曲和一张戴着牛仔帽的长颈鹿图片。这些生成式AI负载完全在端侧进行,无需与云端互联,从而缩短了运行时间。为了加强AI算力,英特尔将和CyberLink在NPU应用方面进行紧密合作,以达到更理想的推理加速效果,并和Blackmagic Design DaVinci 合作,优化Core Ultra的媒体引擎。 Panther Lake将于2025年推出,最快于2024Q1投产,旨在基于Lunar Lake将所有芯片单元用Intel 18A节点制造。Panther Lake将采用全新Cougar Cove P核和Darkmont E核,iGPU由Lunar Lake的Xe2升级至Xe3 "Celestial"微架构。 AI PC发展浪潮已至,全球PC产业将稳步迈入AI时代 AI芯片、PC企业合作共同打造AI PC生态 PC厂商正在积极探索从Smart PC向AI PC的转变,需要从软硬件协同发展开始。此前对PC进行AI智能化仅限于Smart PC阶段,即从应用场景出发(Always on Always),例如:人机交互,包括语音智能唤醒、免接触式场景和开盖开机等功能。然而,受限于成本和算力,推进速度相对缓慢。目前,随着生成式AI(AIGC)的迅速发展,将通过云端+本地端协作。利用云端算力丰富本地端的PC使用场景,从而助力Smart PC 向着AI PC的方向持续转化。 联想提出“All For AI”战略,全栈智能布局全面升级。2023年10月24日,联想在Lenovo Tech World 2023上首次展示了AI PC、大模型压缩技术、人工智能双胞胎(AI Twin)等丰富创新产品。联想AI PC计划于2024年9月后正式上市。AI Twin是可在多平台、多环境上运行的对话个人AI助手。联想全栈智能全新升级之后,AI Twin可通过压缩模型在大模型终端设备上离线运行,譬如参考用户的旅行日记和笔记,为用户提供更个性化的旅行计划。混合AI大模型框架包括私域大模型的微调、个人大模型的压缩以及数据管理+隐私保护技术等3项技术。混合AI框架采用了模型微调与企业知识向量数据库相结合的方式,让企业可通过特定数据进行额外的训练和微调,在端侧再加入企业知识矢量数据库中的特定知识,从而有效处理特定任务,并得到精确的结果。同时,可根据模型参数的重要程度,对大模型进行适当压缩,这既显著缩小了大模型,同时还保持了性能,可让大模型直接在个人终端设备上运行。AI Twin和大模型压缩技术可跨终端、跨平台、跨架构,让个人在终端体验到AI,而升级的基础设施和应用服务,则能让企业使用AI。 各大AI高管亮相,推进AI应用规模化落地。在Lenovo Tech World 2023上,微软、英特尔、AMD、NVIDIA、高通等企业高管纷纷亮相,并宣布与联想持续深化多层次战略合作,共同推进AI应用规模化落地。英伟达CEO黄仁勋表示联想与NVIDIA合作推出新的混合人工智能计划,加速将下一代云人工智能技术落地。联想将提供基于NVIDIA MGX架构的新的企业级AI解决方案、联想混合人工智能服务。高通总裁兼CEO Cristiano Amon表示下一代骁龙计算平台采用了Oryon CPU、先进的GPU和NPU,意图推动Windows笔记本电脑的性能实现质的飞跃。英特尔CEO Pat Gelsinger表示将与联想携手推动AI在客户端、边缘、网络和云端的所有工作负载上的规模化应用。英特尔则推出代号 "Meteor Lake" 的英特尔酷睿Ultra处理器,为PC带来AI加速和本地推理体验。AMD CEO苏姿丰表示AMD与联想的合作包括从数据中心的ThinkSystem到ThinkStation工作站和ThinkPad笔记本电脑。 各大芯片、PC厂商进军AI领域, AI PC商业化落地节奏加速。微软预计Copilot等AI应用将在Windows使用中日益重要,并鼓励相关芯片制造商将AI功能构建到CPU中。联想目前AI已扩展到各类中高端产品系列,如消费Yoga、游戏本Legion、中小企业用户ThinkBook和商用ThinkPad等产品系列。ThinkPadX1系列和YOGA系列中的第一代产品都符合联想提出的智能PC理念。苹果(Apple)则考虑每年花费10亿美元开发其生成式人工智能产品,满足未来混合式发展的需求,此外积极推进5G芯片在MacBook Pro产品线上的落地,以促进AI PC时刻在线的需求,发布时间公司预计在2025年。惠普、宏碁等品牌也进一步加大与关键软件服务商和芯片供应商合作,将重新设计PC架构。公司计划将AIGC或其他AI应用导入到终端设备上,相关AI笔记本方案会在2024、2025年陆续推出。 全球PC出货量触底反弹,AI PC渗透空间有望加大 2023年二季度开始,全球PC出货量的同比跌幅不断收窄,并开始出现环比增长,行业开启上行周期。疫情期间居家办公使得PC需求大幅增加,22年达到高基数,然而23年以来全球PC市场持续疲软。根据IDC发布的数据,2023Q1全球PC出货量5690万台,同比下滑29.3%,环比下滑15.3%,出货量达到了行业底部,同比连续5个季度呈持续下滑趋势;然而,2023Q2全球PC出货量出现回暖,升至6160万台,尽管同比仍下滑13.4%,但下滑幅度已经大幅收窄,且实现了环比8.26%的增长;2023Q3全球PC出货量同比下滑幅度继续收窄至7.6%,环比增长10.7%,并实现出货6820万台。至此全球PC出货量虽然同比仍负,但连续两个季度环比增长,PC市场已触底并出现反弹迹象。目前PC市场出货量和激活量的走势越来越趋于一致,Gartner预计随着行业去库存接近尾声,PC市场有望在2023Q4结束持续8个季度的同比下滑,再次出现增长。2024年随着各品牌的AI PC产品陆续上市,2024年有望成为AI PC的元年,并使PC出货量迎来全面增长。 2024年有望成为AI PC的元年,未来五年内全球PC产业将稳步迈入AI时代。在经历多个季度低迷后,全球PC行业有回暖态势。AI PC的出现也有望为PC行业注入新的成长动力,未来五年内全球PC产业将稳步迈入AI时代,AI PC整机出货量将保持两位数以上的年增长率,并在2027年成为主流化的PC产品类型。Canalys预计从2024H1开始,支持AI的PC型号将大幅增加。随着最新版本Windows计划于2024年底发布人工智能增强功能,以及人工智能工具在商业和生产力软件中的广泛集成,Canalys预计到2024Q4出货量将增至2000万台左右,占全球PC出货量份额的25%以上。到2027年,预计AI PC出货量将超过1.75亿台,占PC总出货量的60%。2024-2027行业复合年增长率(CAGR)达64%。Sigmaintell认为2024-2027年全球AI PC整机出货量将达到约0.13亿、0.53亿、1.1亿、1.5亿台,相较于Canalys稍显保守。 多方入局百花齐放,ARM和x86谁能在AI PC更胜一筹? CPU主流架构分为x86与ARM两类,前者使用复杂指令集(CISC),后者使用精简指令集(RISC)。X86架构具有1)丰富先进的指令集,性能卓越,能在短时间内完成大量复杂的计算;2)广泛的软件支持与安全技术,兼容性与通用性高,产业化规模大等优势。然而x86存在寄存器较少,寻址范围小等缺点;此外多模态等AI 应用趋势推进,节能需求凸显,而x86芯片面积大、晶体管数量多,导致能耗较高。ARM具有1)体积小,能耗、成本低;2) 通用寄存器多,指令执行速度快;3) 寻址方式灵活简单,执行效率高等优势,因此在数据中心与AI应用中,逐渐受到青睐。目前AMD与英特尔的桌面级与服务器级CPU主要采用x86架构;高通、苹果、三星等移动端和嵌入式系统中通常采用ARM架构。 由于独立GPU运行AI运载功耗较高,因此未来CPU+xPU的异构方案或成为AI PC场景标配。分类来看AI芯片将使用1)CPU+NPU;2)CPU+独立GPU;3)CPU+NPU+独立GPU组合作为处理AI负载主力的算力架构方案。目前AMD 7040系列处理器、英特尔Meteor Lake处理器、苹果M3系列处理器与高通最新X Elite处理器都搭载了CPU+NPU,NPU能针对AI部署需求加速神经网络的运算,未来将随着产品更新换代逐年升级。 AMD:推出首个x86架构AI PC芯片,占据一定先发优势 AMD于2023年初率先推出AI PC处理器Ryzen 7040,又于2023年12月推出新一代Ryzen 8040 “Hawk Point”处理器,AI性能较强且产品代际更迭迅速。AMD已于2023年初推出集成NPU的Ryzen 7040系列PC处理器,基于TSMC 4nm制程,内置AMD Ryzen AI引擎,NPU最高算力可达10TOPS,可在本地以较低功耗执行AI工作负载;Ryzen 7040系列合作商目前已覆盖宏碁、华硕、戴尔、联想、惠普、小米等各大品牌厂商。2023年12月7日AMD Advancing AI大会上公司又推出了Ryzen 8040 “Hawk Point”处理器,该处理器相比Ryzen 7040 “Phoenix”主要改进了NPU运行速度,整体算力达39TOPS,NPU算力提升至16TOPS,AI大模型运行性能最高可提升40%,游戏性能最高提升80%。截至发布日,AMD已向合作商发出Ryzen 8040 “Hawk Point”处理器,而其正式上市时间公司预计为2024Q1。紧随Hawk Point之后,集成下一代XDNA2 NPU的Ryzen 8050 “Strix Point”也将于2024年下半年发布,生成式AI性能将高达Hawk Point的3倍;高配版Strix Point Halo集成40个RDNA 3+ GPU计算单元,AI算力高达40 TOPS。 AMD Ryzen AI已与众多应用厂商合作,应用场景多样,或可为AMD AI PC处理器的推广提供较大助力,结合AMD在iGPU领域的领先地位,AMD或将成为英特尔AI PC产品推进过程中的一大劲敌。Ryzen AI应用不断拓展,已与Adobe、微软、Zoom以及国内的字节跳动、爱奇艺等应用厂商合作,并已在超过100个应用中实现了AI加速,在Adobe Photoshop、Premiere Pro、After Effect、Lightroom等创意设计软件中实现了显著的运行效率提升;Ryzen AI也与Windows Studio Effects适配,能实现自动取景对焦、眼神矫正、高级背景特效等多种AI功能。此外,AMD还面向大模型开发者推出Ryzen AI软件平台,支持TensorFlow、PyTorch、ONNX等AI模型编程包。 ARM PC CPU则相对x86具有灵活性、低能耗、AI运行高效性的优势。1)x86 CPU 被设计为通用处理器,而基于 ARM 的 SoC 则不同,可根据特定用例进行高度定制,具有较强的灵活性。这意味着 ARM SoC 在设计上可采用更多的高性能 CPU 内核和高度集成的内存,从而实现更高效的内存访问,使其能与 x86 CPU 在性能层面竞争;2)由于ARM架构基于RISC,因此天然具有能耗和热效率的优势,电池续航能力得以提升;此外,将GPU集成至ARM SoC可进一步提升每瓦性能,使得端侧AI更高效地运行;3)随着基于 Arm 的 SoC 的推出,个人电脑的尺寸和重量有望减少,便携性有望提升,笔电和平板融合的趋势可加强。 英伟达:或可发挥AI技术优势弄潮AI PC时代 英伟达入局ARM架构PC CPU,PC端ARM架构竞争渐趋激烈。根据路透社在 2023年 10月 24日的报道,随着微软与高通的排他性协议即将在明年到期,AMD 和英伟达或将在 2024年加入高通行列,为微软设计基于 ARM 的处理器,预计均将于2025年推出自研ARM PC CPU。该计划瞄准了苹果公司的自研ARM芯片,目前PC端ARM CPU几乎被苹果垄断。 回顾历史,英伟达进军ARM CPU市场的战略早已可见。2020年9月,英伟达曾提出以400亿美元收购ARM。ARM在2020年的营收约为20亿美元,该收购价格对应PS为20x,显著高于9x的行业平均,再对比2016年软银私有化ARM的320亿美元,虽然英伟达的收购计划在2022年2月8日正式宣告告终,但我们认为英伟达愿意付出约两倍于行业平均PS溢价收购ARM,体现了其看准ARM在移动端的低能耗优势,希望将其有效融合到公司擅长的GPU和DPU领域的战略规划。此外,英伟达数据中心产品GH200中的 Grace CPU 就已采用 ARM 架构,拥有一定ARM CPU设计经验。 早在2008年,英伟达就曾入局ARM架构PC和移动端CPU,但尝试未果,此次重新入局能否获得成功亦有不确定性。2008年,英伟达预判PC轻薄化将成为大趋势,在同年6月推出基于ARM且内置GeForce GPU的Tegra 移动处理器,应用于手机和平板等移动设备,其后又与微软Windows 8合作将Tegra扩展至PC端。2011年11月,英伟达发布了Tegra 3处理器,该处理器具备明显性能和功耗优势,但却最终由于基带的落后及设计、发热、续航能力等方面的劣势不敌高通,逐渐被市场淘汰。 英伟达在Tegra处理器上的失败或将为此次英伟达重新入局能否成功带来启示,其在AI芯片领域的技术优势或助其弄潮AI PC时代。与12年前类似,英伟达再度与微软合作,而如今高通和微软已在WOA(Windows On ARM)生态深耕多年,ARM架构几经迭代已达成与Windows操作系统更强的协同性,且随着AI PC浪潮席卷整个PC CPU领域,英伟达或有望凭借AI芯片技术优势推动PC CPU市场重新洗牌,英伟达在此时入场或相比12年前更具优势,不过英伟达最早也要到2025年才能推出其自研ARM PC处理器,或增加其入局后的不确定性。 高通:深耕移动端功耗优势突出,推出骁龙 X Elite进军AI PC芯片 从2016年就开始研发ARM PC CPU的高通在10月的2023 骁龙峰会上也发布了最新一代AI PC芯片骁龙 X Elite,该芯片基于高通自研ARM架构内核“Oryon”,集成AI功能,采用台积电4nm制程工艺,兼具高性能和低功耗优势。X Elite集成CPU、GPU和NPU,重点优化了AI性能,最高算力可达75TOPS,其独立的Hexagon NPU最高算力达45TOPS,为行业领先,支持在端侧运行超过 130 亿参数的生成式 AI 模型;其Adreno GPU较 Ryzen9-7940HS GPU 性能达到90%的提升,而功耗降低 80%。搭载骁龙 X Elite 的 PC 公司预计将于 2024 年中面市,首发厂商包括微软、联想、戴尔和惠普等。 高通官方发布了X Elite与竞争对手上一代产品的基准测试,虽在测试高通中X Elite优势显著,但需注意其对比对象均为竞争对手上一代的产品(英特尔Raptor Lake、AMD Ryzen 9和苹果M2芯片),因此其竞争力仍有待进一步验证。此外,高通也致力于提高AI落地能力,其与微软和Meta合作开发Llama 2生成式大模型,并于2024年将Llama 2应用于搭载其芯片的手机和PC。高通凭借其在低能耗移动端芯片制造领域的长期积淀,未来或可缩小Windows系统PC与苹果Mac系列PC的能耗差距,同时其在AI大模型开发和端侧应用上的推动或将进一步提升其在AI PC时代的竞争力,从而在PC市场占据重要席位。 苹果:垄断地位不断巩固,NPU算力为18TOPS 除了基于Windows操作系统的PC端ARM处理器,苹果M系列芯片兼具能耗及NPU优势,最新M3系列芯片进一步提升了AI性能并降低功耗。根据 IDC 2023Q3的数据,自苹果为 Mac 电脑发布自研ARM芯片以来,该公司的市场份额在三年内几乎翻倍,苹果M系列芯片占ARM PC处理器市场份额的90%以上,占据垄断地位。低功耗是苹果M系列芯片的一大核心优势,而苹果公司于今年10月推出的M3芯片更是重点关注了每瓦性能的提升,该芯片为业界首款采用台积电3nm制程的个人电脑芯片,同时改进了内置GPU、NPU的设计以提供更优的图形处理和AI任务性能,GPU增加了硬件加速网格着色、光线追踪等渲染功能和动态缓存等功能,NPU算力达18TOPS。苹果官方表示M3在AI任务上相比M1有60%的性能提升,总体运行速度较M1有35%的提升。 根据Counterpoint数据,截至2023年4月,ARM架构PC市场份额为14%,其中苹果份额为93%,占绝大多数,高通占3%左右。Counterpoint预测ARM架构占PC市场份额将迅速提升,且该份额于2027年近乎翻倍至25%。 风险提示 AI技术落地和推进不及预期。自ChatGPT落地应用并取得一定成功,各科技巨头均加快和加大力度布局AIGC领域,如Meta于23年年初建立AIGC团队、微软也在其Azure、Bing等多项自有业务进一步整合AI技术。由于人工智能属于高新技术,需投入较大前期研发成本和时间,后续AI技术落地可能会受企业投入、宏观经济、政策和舆论等多方面影响,致使研发进度不及预期。 行业竞争激烈。目前生成式AI技术仍处行业发展前期,文字、图片、视频等单一及多模态大模型不断推出,赋能聊天、搜索引擎、编辑代码等多类应用,行业暂未形成较为稳定的竞争格局,竞争激烈。若后续市场竞争进一步加剧,部分企业未能及时推出相关产品或技术研发不及预期,可能会受激烈竞争影响而导致市场出清。 中美贸易摩擦增加。中美两国作为人工智能领域发展较为领先的两个国家,其本土多家企业均积极部署AI领域相关技术和产品,推动AIGC、LLM等尖端技术落地应用。若后续中美两国间摩擦加剧,可能会阻碍AI产业相关应用的进一步推广。 文中提及未覆盖个股相关信息数据来自于公开渠道,不代表对相关公司的研究覆盖和推荐。 相关研报 研报:《AI PC风起,英特尔发布Meteor Lake》2023年12月16日 何翩翩 S0570523020002 | ASI353 关注我们 华泰证券研究所国内站(研究Portal) https://inst.htsc.com/research 访问权限:国内机构客户 华泰证券研究所海外站 https://intl.inst.htsc.com/research 访问权限:美国及香港金控机构客户 添加权限请联系您的华泰对口客户经理 免责声明 ▲向上滑动阅览 本公众号不是华泰证券股份有限公司(以下简称“华泰证券”)研究报告的发布平台,本公众号仅供华泰证券中国内地研究服务客户参考使用。其他任何读者在订阅本公众号前,请自行评估接收相关推送内容的适当性,且若使用本公众号所载内容,务必寻求专业投资顾问的指导及解读。华泰证券不因任何订阅本公众号的行为而将订阅者视为华泰证券的客户。 本公众号转发、摘编华泰证券向其客户已发布研究报告的部分内容及观点,完整的投资意见分析应以报告发布当日的完整研究报告内容为准。订阅者仅使用本公众号内容,可能会因缺乏对完整报告的了解或缺乏相关的解读而产生理解上的歧义。如需了解完整内容,请具体参见华泰证券所发布的完整报告。 本公众号内容基于华泰证券认为可靠的信息编制,但华泰证券对该等信息的准确性、完整性及时效性不作任何保证,也不对证券价格的涨跌或市场走势作确定性判断。本公众号所载的意见、评估及预测仅反映发布当日的观点和判断。在不同时期,华泰证券可能会发出与本公众号所载意见、评估及预测不一致的研究报告。 在任何情况下,本公众号中的信息或所表述的意见均不构成对任何人的投资建议。订阅者不应单独依靠本订阅号中的内容而取代自身独立的判断,应自主做出投资决策并自行承担投资风险。订阅者若使用本资料,有可能会因缺乏解读服务而对内容产生理解上的歧义,进而造成投资损失。对依据或者使用本公众号内容所造成的一切后果,华泰证券及作者均不承担任何法律责任。 本公众号版权仅为华泰证券所有,未经华泰证券书面许可,任何机构或个人不得以翻版、复制、发表、引用或再次分发他人等任何形式侵犯本公众号发布的所有内容的版权。如因侵权行为给华泰证券造成任何直接或间接的损失,华泰证券保留追究一切法律责任的权利。华泰证券具有中国证监会核准的“证券投资咨询”业务资格,经营许可证编号为:91320000704041011J。

大部分微信公众号研报本站已有pdf详细完整版:https://www.wkzk.com/report/(可搜索研报标题关键词或机构名称查询原报告)

郑重声明:悟空智库网发布此信息的目的在于传播更多信息,与本站立场无关,不构成任何投资建议。