稳增长政策预期升温,AI板块再迎密集催化期
(以下内容从中银证券《稳增长政策预期升温,AI板块再迎密集催化期》研报附件原文摘录)
核心结论 政治局会议定调2024年经济工作“稳中求进、以进促稳、先立后破”,明年经济稳增长政策预期升温;谷歌 Gemini大模型问世,“AI+视频”软件pika1.0上市,AI领域再度进入密集海外映射催化期。 观点回顾 01大势与风格 先立后破,强化信心。本周A股市场在对年末重要会议关于经济政策定调的期待中震荡走弱。周末政治局会议的召开与表态为市场注入了一剂定心丸。本次会议对经济工作的增量信息较为有限,但其中“稳中求进、以进促稳、先立后破”的提法引发市场广泛关注。一方面,“以进促稳”的定调相较2022年末“稳中求进”的表态明显更为积极,同时再提“积极的财政政策要适度加力、提质增效”,“稳健的货币政策要灵活适度、精准有效”,强化了此前市场对于明年宽财政稳货币的预期。而针对新旧产业的动能切换,明年国内宏观政策将会更多着眼于将科技、制造等新产业方向率先拉动起来,而对于传统产业废旧立新的趋势依然不改,只不过短期“废旧”的程度会更多让位于经济增长。“先立后破”的表述旗帜鲜明地阐述了当前对于新旧产业动能转换的短期及长期政策态度,同时也进一步强化市场对于明年国内经济修复的预期。 内需复苏动能偏弱,稳增长政策预期升温。11月国内通胀再度超预期回落,CPI及PPI同比分别下降0.5%和3%,相较前值降幅分别扩大了0.3、0.4个百分点。CPI方面,食品分项大幅回落,非食品分项也由平转降,原油价格走低、国内服务及消费需求偏弱是主要拖累因素。PPI方面也呈现同样的特征,煤炭、原油等资源品价格回落成为11月PPI走弱的主因。11月通胀数据的超预期回落存在国际油价走弱的拖累,但也再次印证了当前国内需求修复过程波折,内生动能略显不足的特征。超预期回落的通胀数据增加了市场对于后续货币宽松的预期。岁末年初,对于明年的政策预期升温,市场有望从此前疲弱的情绪中修复。 02中观行业与景气 本周市场调整幅度加深,仅四个一级行业录得正收益,地产、消费链跌幅较大。本周行业表现与结构与上周类似,农林牧渔行业受益于年末需求预期回暖叠加淘汰母猪价格大幅下行,供需改善预期带动行业底部反弹,本周涨幅第一。大类领涨方向仍为TMT行业,在AMD发布全新芯片与谷歌公司发布全新大模型Gemini的催化下,叠加“Pika”余温,传媒、计算机、通信延续领涨。本周公布的11月出口数据偏弱、穆迪下调中国主权信用评级展望,叠加本周处于重要会议前夕的政策发布真空期,消费端和投资端行业如消费者服务、食品饮料、建材、建筑、轻工、地产等行业跌幅较深。 近期AI领域再度进入密集海外映射催化期,软件大模型方面,谷歌多模态大模型Gemini问世,多项性能数值超GPT-4,硬件端谷歌发布云端AI芯片TPU v5p,性能较TPU v4明显提升,单位服务器组芯片用量和带宽的大幅提升有望相应拉动光连接和芯片需求的增长。应用端“AI+视频”软件pika1.0上市后市场反响热烈,pika之外,Adobe、Meta等也均在AI生成视频领域有所布局。此前,11月版号迟迟未发放引起市场担忧,12月4日11月游戏版号发放,数量正常,市场担忧情绪有所缓解。海外映射再度加速,全球算力周期趋于上行,前期市场情绪扰动因素缓解,TMT板块有望受到催化。 谷歌多模态大模型Gemini问世,多项性能数值超GPT-4。北京时间12月7日,谷歌宣布推出多模态大模型Gemini 1.0,分为Ultra,Pro和Nano三个版本,Gemini-Ultra是最大规模参数版本,可用于大型数据中心等,属于处理高复杂度任务的模型;Gemini-Pro参数规模小于Ultra版本,用于各种扩展任务,属于日常使用模型,且已搭载于谷歌的对话机器人Bard中;Nano版本参数规模最小,主要应用于智能手机等移动设备终端,更注重于端侧的处理能力。根据谷歌发布的技术报告,Gemini Ultra版本在大规模多任务语言理解、推理和编码等一系列基准测试中表现出先进性能,大部分基准测试性能指标超过GPT-4,其中Gemini Ultra在MMLU(大规模多任务语言理解数据集)中的得分率高达90.0%,首次超越了人类专家。据悉,谷歌将在多项产品中导入Gemini,包括软件方面的Google Bard、以及Pixel 8 Pro手机设备。从12月13日起,开发者和企业客户可以透过Google AI Studio或Google Cloud Vertex AI的Gemini API使用Gemini Pro。Android开发者也能透过AICore,在开发作业中运用Gemini Nano。在海外利好的催化下,12月7日,多个AI概念股涨幅居前,包括当虹科技、浩瀚深度、格灵深瞳、荣信文化、众诚科技等。多模态是生成式AI下一步重点发展方向,未来可能在教育、办公、娱乐、医疗等应用领域百花齐放,相关布局公司值得重点关注。 算力侧提升,谷歌发布云端AI芯片TPU v5p。12月7日,谷歌还推出了全新的面向云端AI加速的TPU v5p ,这也是谷歌迄今为止功能最强大且最具成本效益的TPU(云张量处理单元)。每个TPU v5p Pod(服务器组)由多达8960个芯片组成。在AI性能方面,TPU v5p支持95GB的高带宽内存,能够以2.76 TB/s的速度传输数据;与TPU v4相比,具有两倍的FLOPS(每秒浮点运算)和三倍的高内存带宽提升,在LLM(大语言模型)训练速度上显示出2.8倍的代际提升。目前,谷歌已经在YouTube、Gmail、Google Maps、Google Play和Android等产品服务中使用TPU芯片。值得注意的是,单位服务器组芯片用量和带宽的大幅提升,也将相应拉动光连接和芯片需求的增长。 文生视频Pika 1.0推出,市场反响热烈。11月29日,美国AI初创公司Pika labs发布第一个文生视频产品Pika 1.0,在其官方宣传视频上,只需要输入“马斯克穿着太空服,3D动画”,一个动画版本、穿着太空服准备乘坐火箭上太空的马斯克即可生成,外形、动作、背景等元素均十分逼真。Pika 成立于2023年4月,由两位斯坦福大学前博士生郭文景和孟晨琳共同创立,目前全职员工仅4人。7月,公司在 Discord 上发布内测版本,并于11月29日正式发布第一代产品 Pika 1.0。Pika 1.0的核心功能包括:文本和图像生成视频、编辑更改视频元素、切换视频风格以及调整视频宽高比等,用户只需要输入一句话,就可以生成想要的各种风格的视频。Pika 1.0目前主要目标群体为日常消费者,而不是专业电影制作团队,截至11月30日,Pika Labs已在社交程序Discord上开放服务,并拥有超54万用户,每周生成近百万个新视频。目前Pika 1.0仍处于免费试用阶段,郭文景表示公司可能最终会推出分层订阅模式,让付费用户享用更多功能。 Pika 1.0火爆出圈,将进一步点燃AI视频领域热度。此前,Runway 在今年先后推出了具有AI功能的视频编辑工具Gen-1、Gen-2,Adobe收购AI视频合成公司Rephrase.ai布局AIGC,Meta于11月17日推出Emu Video文生视频应用。国内方面,阿里达摩院也在今年放出 “文本生成视频大模型”,并在开源模型平台对外测试。 11月游戏版号恢复常态化发放,前期市场担忧情绪有所缓解。12月4日,国家新闻出版署下发11月份国产游戏版号,共计87款国产游戏获批,发放数量与10月持平,且87款游戏产品均有移动端版号。其中,77款为移动游戏(包含25款移动-休闲益智类游戏),7款为移动兼客户端游戏,2款为移动兼网页游戏,1款为移动兼客户端兼Switch游戏。截至目前,今年累计下发872款国产游戏版号,数量已超过2022年的468款。游戏版号常态化发放将持续优化行业供给,有望助推游戏行业进一步发展。 03一周市场总览、组合表现及热点追踪 谷歌推出全新多模态 AI 模型 Gemini,正式开启大模型多模态时代。北京 12 月 7 日凌晨,谷歌 DeepMind 宣布推出全新多模态 AI 模型 Gemini,并称其为“最大、最强和最通用”的人工智能系统。Gemini大模型在设计时原生地支持多模态,从一开始便在不同模态上进行了预训练,然后利用额外的多模态数据进行微调以提升有效性。谷歌声称,Gemini 能够无缝地理解和推理各种输入,远远优于现有多模态模型,它的能力在几乎每个领域都是最强的。 跑分结果显示Gemini表现领先GPT-4。在大型语言模型研究和开发中常用的学术基准中,谷歌对 Gemini 模型进行了严格的测试,并评估了它们在各种任务中的表现。从自然图像、音频和视频理解,到数学推理等任务,Gemini Ultra 在大型语言模型研发被广泛使用的 32 个学术基准测试集中,在其中 30 个测试集的性能超过越了OpenAI 的大模型 GPT-4。 支持多种输入类型,Gemini可处理文本、代码、图像甚至音频等输入,能够从日常生活到科学研究等多个领域准确解决问题并提供建议和答案。谷歌表示,Gemini 还具备复杂的推理和规划能力。根据官方发布的一段宣传视频,Gemini 能够根据提示,在一个午休的时间内阅读 20 万篇论文,从中筛选出 250 篇与一个特定生物学数据库有关的论文、提取出更新数据,进而将其绘制成表格或图片提供给使用者。特别在编程语言领域,Gemini 具有在理解、解释和生成各种编程语言中正确且编写良好代码的熟练度。谷歌称Gemini在首次尝试中就解决了一个包含 200 个 Python 编程功能的基准测试中约 75% 的问题,并在自我修正后解决了超过 90% 的问题。此外,Gemini 的一个特殊版本AlphaCode2,在竞技编程中成功处理了一项只有不到 0.2% 的参赛者才能解决的高难度问题,将 AI 编程能力推向新的高度。 Genimi提供了多尺寸版本,满足不同场景需要。未来Gemini 将推出三种不同大小的版本,包括面向高度复杂任务的 Gemini Ultra、覆盖广泛任务的 Gemini Pro,以及用于消费者设备的Gemini Nano。这三个版本在参数数量和复杂性上有所区别,以满足不同的计算需求和应用场景。更多的参数意味着更大的神经网络,通常更有能力执行更复杂的任务,但需要更多的计算能力才能运行。这意味着最小的 Nano 被设计为在消费类设备上本地运行,Pro将适用于最广泛的场景如作为谷歌 Bard 聊天机器人的底层支持,而 Ultra 只能在数据中心硬件上运行。 自研TPU开发,硬件方面摆脱英伟达依赖。算力方面,Gemini采用自研的TPUs v4 和 v5e芯片上进行大规模 AI 训练。谷歌称,在TPUs上,Gemini的运行速度明显快于早期规模更小、性能更弱的模型。同日谷歌还发布了迄今为止功能最强大、效率最高且可扩展性最强的TPU系统 Cloud TPU v5p,TPU v5p芯片更多是针对生成式 AI 所研发的训练芯片,旨在为训练前沿 AI 模型提供支持,从而将加速 Gemini 的开发。 大模型多模态时代开启,关注潜在多模态应用场景落地。ChatGPT问世1年以来,国内外均是“百模大战”,而本次谷歌Gemini 的发布向世界展示了多模态大模型的能力以及潜在多种应用场景。多模态应用代表了大模型的新趋势,通过融合多种交互方式,实现更智能、自然和高效的用户体验,目前来看在智能助理、VR AR、AI+办公、AI+医疗和AI+教育等领域,多模态应用有广阔的应用场景。虽然短期仍有技术整合、用户适应和隐私安全等难题,但随着技术的持续迭代发展,多模态应用有望实现更加广泛和深入的应用,助力AI大模型真正落地在日常社会经济活动里。 风险提示 逆周期政策力度不及预期;科技产业革命进度不达预期。 会议预告 END 欢迎关注 微信号 : PBSSTR 太平桥策略随笔 免责声明: 本报告由中银国际证券股份有限公司证券分析师撰写并向特定客户发布。 本报告发布的特定客户包括:1) 基金、保险、QFII、QDII 等能够充分理解证券研究报告,具备专业信息处理能力的中银国际证券股份有限公司的机构客户;2) 中银国际证券股份有限公司的证券投资顾问服务团队,其可参考使用本报告。中银国际证券股份有限公司的证券投资顾问服务团队可能以本报告为基础,整合形成证券投资顾问服务建议或产品,提供给接受其证券投资顾问服务的客户。 中银国际证券股份有限公司不以任何方式或渠道向除上述特定客户外的公司个人客户提供本报告。中银国际证券股份有限公司的个人客户从任何外部渠道获得本报告的,亦不应直接依据所获得的研究报告作出投资决策;需充分咨询证券投资顾问意见,独立作出投资决策。中银国际证券股份有限公司不承担由此产生的任何责任及损失等。 本报告内含保密信息,仅供收件人使用。阁下作为收件人,不得出于任何目的直接或间接复制、派发或转发此报告全部或部分内容予任何其他人,或将此报告全部或部分内容发表。如发现本研究报告被私自刊载或转发的,中银国际证券股份有限公司将及时采取维权措施,追究有关媒体或者机构的责任。所有本报告内使用的商标、服务标记及标记均为中银国际证券股份有限公司或其附属及关联公司(统称“中银国际集团”)的商标、服务标记、注册商标或注册服务标记。 本报告及其所载的任何信息、材料或内容只提供给阁下作参考之用,并未考虑到任何特别的投资目的、财务状况或特殊需要,不能成为或被视为出售或购买或认购证券或其它金融票据的要约或邀请,亦不构成任何合约或承诺的基础。中银国际证券股份有限公司不能确保本报告中提及的投资产品适合任何特定投资者。本报告的内容不构成对任何人的投资建议,阁下不会因为收到本报告而成为中银国际集团的客户。阁下收到或阅读本报告须在承诺购买任何报告中所指之投资产品之前,就该投资产品的适合性,包括阁下的特殊投资目的、财务状况及其特别需要寻求阁下相关投资顾问的意见。 尽管本报告所载资料的来源及观点都是中银国际证券股份有限公司及其证券分析师从相信可靠的来源取得或达到,但撰写本报告的证券分析师或中银国际集团的任何成员及其董事、高管、员工或其他任何个人(包括其关联方)都不能保证它们的准确性或完整性。除非法律或规则规定必须承担的责任外,中银国际集团任何成员不对使用本报告的材料而引致的损失负任何责任。本报告对其中所包含的或讨论的信息或意见的准确性、完整性或公平性不作任何明示或暗示的声明或保证。阁下不应单纯依靠本报告而取代个人的独立判断。本报告仅反映证券分析师在撰写本报告时的设想、见解及分析方法。中银国际集团成员可发布其它与本报告所载资料不一致及有不同结论的报告,亦有可能采取与本报告观点不同的投资策略。为免生疑问,本报告所载的观点并不代表中银国际集团成员的立场。 本报告可能附载其它网站的地址或超级链接。对于本报告可能涉及到中银国际集团本身网站以外的资料,中银国际集团未有参阅有关网站,也不对它们的内容负责。提供这些地址或超级链接(包括连接到中银国际集团网站的地址及超级链接)的目的,纯粹为了阁下的方便及参考,连接网站的内容不构成本报告的任何部分。阁下须承担浏览这些网站的风险。 本报告所载的资料、意见及推测仅基于现状,不构成任何保证,可随时更改,毋须提前通知。本 报告不构成投资、法律、会计或税务建议或保证任何投资或策略适用于阁下个别情况。本报告不能作为阁下私人投资的建议。 过往的表现不能被视作将来表现的指示或保证,也不能代表或对将来表现做出任何明示或暗示的保障。本报告所载的资料、意见及预测只是反映证券分析师在本报告所载日期的判断,可随时更改。本报告中涉及证券或金融工具的价格、价值及收入可能出现上升或下跌。 部分投资可能不会轻易变现,可能在出售或变现投资时存在难度。同样,阁下获得有关投资的价值或风险的可靠信息也存在困难。本报告中包含或涉及的投资及服务可能未必适合阁下。如上所述,阁下须在做出任何投资决策之前,包括买卖本报告涉及的任何证券,寻求阁下相关投资顾问的意见。 中银国际证券股份有限公司及其附属及关联公司版权所有。保留一切权利。
核心结论 政治局会议定调2024年经济工作“稳中求进、以进促稳、先立后破”,明年经济稳增长政策预期升温;谷歌 Gemini大模型问世,“AI+视频”软件pika1.0上市,AI领域再度进入密集海外映射催化期。 观点回顾 01大势与风格 先立后破,强化信心。本周A股市场在对年末重要会议关于经济政策定调的期待中震荡走弱。周末政治局会议的召开与表态为市场注入了一剂定心丸。本次会议对经济工作的增量信息较为有限,但其中“稳中求进、以进促稳、先立后破”的提法引发市场广泛关注。一方面,“以进促稳”的定调相较2022年末“稳中求进”的表态明显更为积极,同时再提“积极的财政政策要适度加力、提质增效”,“稳健的货币政策要灵活适度、精准有效”,强化了此前市场对于明年宽财政稳货币的预期。而针对新旧产业的动能切换,明年国内宏观政策将会更多着眼于将科技、制造等新产业方向率先拉动起来,而对于传统产业废旧立新的趋势依然不改,只不过短期“废旧”的程度会更多让位于经济增长。“先立后破”的表述旗帜鲜明地阐述了当前对于新旧产业动能转换的短期及长期政策态度,同时也进一步强化市场对于明年国内经济修复的预期。 内需复苏动能偏弱,稳增长政策预期升温。11月国内通胀再度超预期回落,CPI及PPI同比分别下降0.5%和3%,相较前值降幅分别扩大了0.3、0.4个百分点。CPI方面,食品分项大幅回落,非食品分项也由平转降,原油价格走低、国内服务及消费需求偏弱是主要拖累因素。PPI方面也呈现同样的特征,煤炭、原油等资源品价格回落成为11月PPI走弱的主因。11月通胀数据的超预期回落存在国际油价走弱的拖累,但也再次印证了当前国内需求修复过程波折,内生动能略显不足的特征。超预期回落的通胀数据增加了市场对于后续货币宽松的预期。岁末年初,对于明年的政策预期升温,市场有望从此前疲弱的情绪中修复。 02中观行业与景气 本周市场调整幅度加深,仅四个一级行业录得正收益,地产、消费链跌幅较大。本周行业表现与结构与上周类似,农林牧渔行业受益于年末需求预期回暖叠加淘汰母猪价格大幅下行,供需改善预期带动行业底部反弹,本周涨幅第一。大类领涨方向仍为TMT行业,在AMD发布全新芯片与谷歌公司发布全新大模型Gemini的催化下,叠加“Pika”余温,传媒、计算机、通信延续领涨。本周公布的11月出口数据偏弱、穆迪下调中国主权信用评级展望,叠加本周处于重要会议前夕的政策发布真空期,消费端和投资端行业如消费者服务、食品饮料、建材、建筑、轻工、地产等行业跌幅较深。 近期AI领域再度进入密集海外映射催化期,软件大模型方面,谷歌多模态大模型Gemini问世,多项性能数值超GPT-4,硬件端谷歌发布云端AI芯片TPU v5p,性能较TPU v4明显提升,单位服务器组芯片用量和带宽的大幅提升有望相应拉动光连接和芯片需求的增长。应用端“AI+视频”软件pika1.0上市后市场反响热烈,pika之外,Adobe、Meta等也均在AI生成视频领域有所布局。此前,11月版号迟迟未发放引起市场担忧,12月4日11月游戏版号发放,数量正常,市场担忧情绪有所缓解。海外映射再度加速,全球算力周期趋于上行,前期市场情绪扰动因素缓解,TMT板块有望受到催化。 谷歌多模态大模型Gemini问世,多项性能数值超GPT-4。北京时间12月7日,谷歌宣布推出多模态大模型Gemini 1.0,分为Ultra,Pro和Nano三个版本,Gemini-Ultra是最大规模参数版本,可用于大型数据中心等,属于处理高复杂度任务的模型;Gemini-Pro参数规模小于Ultra版本,用于各种扩展任务,属于日常使用模型,且已搭载于谷歌的对话机器人Bard中;Nano版本参数规模最小,主要应用于智能手机等移动设备终端,更注重于端侧的处理能力。根据谷歌发布的技术报告,Gemini Ultra版本在大规模多任务语言理解、推理和编码等一系列基准测试中表现出先进性能,大部分基准测试性能指标超过GPT-4,其中Gemini Ultra在MMLU(大规模多任务语言理解数据集)中的得分率高达90.0%,首次超越了人类专家。据悉,谷歌将在多项产品中导入Gemini,包括软件方面的Google Bard、以及Pixel 8 Pro手机设备。从12月13日起,开发者和企业客户可以透过Google AI Studio或Google Cloud Vertex AI的Gemini API使用Gemini Pro。Android开发者也能透过AICore,在开发作业中运用Gemini Nano。在海外利好的催化下,12月7日,多个AI概念股涨幅居前,包括当虹科技、浩瀚深度、格灵深瞳、荣信文化、众诚科技等。多模态是生成式AI下一步重点发展方向,未来可能在教育、办公、娱乐、医疗等应用领域百花齐放,相关布局公司值得重点关注。 算力侧提升,谷歌发布云端AI芯片TPU v5p。12月7日,谷歌还推出了全新的面向云端AI加速的TPU v5p ,这也是谷歌迄今为止功能最强大且最具成本效益的TPU(云张量处理单元)。每个TPU v5p Pod(服务器组)由多达8960个芯片组成。在AI性能方面,TPU v5p支持95GB的高带宽内存,能够以2.76 TB/s的速度传输数据;与TPU v4相比,具有两倍的FLOPS(每秒浮点运算)和三倍的高内存带宽提升,在LLM(大语言模型)训练速度上显示出2.8倍的代际提升。目前,谷歌已经在YouTube、Gmail、Google Maps、Google Play和Android等产品服务中使用TPU芯片。值得注意的是,单位服务器组芯片用量和带宽的大幅提升,也将相应拉动光连接和芯片需求的增长。 文生视频Pika 1.0推出,市场反响热烈。11月29日,美国AI初创公司Pika labs发布第一个文生视频产品Pika 1.0,在其官方宣传视频上,只需要输入“马斯克穿着太空服,3D动画”,一个动画版本、穿着太空服准备乘坐火箭上太空的马斯克即可生成,外形、动作、背景等元素均十分逼真。Pika 成立于2023年4月,由两位斯坦福大学前博士生郭文景和孟晨琳共同创立,目前全职员工仅4人。7月,公司在 Discord 上发布内测版本,并于11月29日正式发布第一代产品 Pika 1.0。Pika 1.0的核心功能包括:文本和图像生成视频、编辑更改视频元素、切换视频风格以及调整视频宽高比等,用户只需要输入一句话,就可以生成想要的各种风格的视频。Pika 1.0目前主要目标群体为日常消费者,而不是专业电影制作团队,截至11月30日,Pika Labs已在社交程序Discord上开放服务,并拥有超54万用户,每周生成近百万个新视频。目前Pika 1.0仍处于免费试用阶段,郭文景表示公司可能最终会推出分层订阅模式,让付费用户享用更多功能。 Pika 1.0火爆出圈,将进一步点燃AI视频领域热度。此前,Runway 在今年先后推出了具有AI功能的视频编辑工具Gen-1、Gen-2,Adobe收购AI视频合成公司Rephrase.ai布局AIGC,Meta于11月17日推出Emu Video文生视频应用。国内方面,阿里达摩院也在今年放出 “文本生成视频大模型”,并在开源模型平台对外测试。 11月游戏版号恢复常态化发放,前期市场担忧情绪有所缓解。12月4日,国家新闻出版署下发11月份国产游戏版号,共计87款国产游戏获批,发放数量与10月持平,且87款游戏产品均有移动端版号。其中,77款为移动游戏(包含25款移动-休闲益智类游戏),7款为移动兼客户端游戏,2款为移动兼网页游戏,1款为移动兼客户端兼Switch游戏。截至目前,今年累计下发872款国产游戏版号,数量已超过2022年的468款。游戏版号常态化发放将持续优化行业供给,有望助推游戏行业进一步发展。 03一周市场总览、组合表现及热点追踪 谷歌推出全新多模态 AI 模型 Gemini,正式开启大模型多模态时代。北京 12 月 7 日凌晨,谷歌 DeepMind 宣布推出全新多模态 AI 模型 Gemini,并称其为“最大、最强和最通用”的人工智能系统。Gemini大模型在设计时原生地支持多模态,从一开始便在不同模态上进行了预训练,然后利用额外的多模态数据进行微调以提升有效性。谷歌声称,Gemini 能够无缝地理解和推理各种输入,远远优于现有多模态模型,它的能力在几乎每个领域都是最强的。 跑分结果显示Gemini表现领先GPT-4。在大型语言模型研究和开发中常用的学术基准中,谷歌对 Gemini 模型进行了严格的测试,并评估了它们在各种任务中的表现。从自然图像、音频和视频理解,到数学推理等任务,Gemini Ultra 在大型语言模型研发被广泛使用的 32 个学术基准测试集中,在其中 30 个测试集的性能超过越了OpenAI 的大模型 GPT-4。 支持多种输入类型,Gemini可处理文本、代码、图像甚至音频等输入,能够从日常生活到科学研究等多个领域准确解决问题并提供建议和答案。谷歌表示,Gemini 还具备复杂的推理和规划能力。根据官方发布的一段宣传视频,Gemini 能够根据提示,在一个午休的时间内阅读 20 万篇论文,从中筛选出 250 篇与一个特定生物学数据库有关的论文、提取出更新数据,进而将其绘制成表格或图片提供给使用者。特别在编程语言领域,Gemini 具有在理解、解释和生成各种编程语言中正确且编写良好代码的熟练度。谷歌称Gemini在首次尝试中就解决了一个包含 200 个 Python 编程功能的基准测试中约 75% 的问题,并在自我修正后解决了超过 90% 的问题。此外,Gemini 的一个特殊版本AlphaCode2,在竞技编程中成功处理了一项只有不到 0.2% 的参赛者才能解决的高难度问题,将 AI 编程能力推向新的高度。 Genimi提供了多尺寸版本,满足不同场景需要。未来Gemini 将推出三种不同大小的版本,包括面向高度复杂任务的 Gemini Ultra、覆盖广泛任务的 Gemini Pro,以及用于消费者设备的Gemini Nano。这三个版本在参数数量和复杂性上有所区别,以满足不同的计算需求和应用场景。更多的参数意味着更大的神经网络,通常更有能力执行更复杂的任务,但需要更多的计算能力才能运行。这意味着最小的 Nano 被设计为在消费类设备上本地运行,Pro将适用于最广泛的场景如作为谷歌 Bard 聊天机器人的底层支持,而 Ultra 只能在数据中心硬件上运行。 自研TPU开发,硬件方面摆脱英伟达依赖。算力方面,Gemini采用自研的TPUs v4 和 v5e芯片上进行大规模 AI 训练。谷歌称,在TPUs上,Gemini的运行速度明显快于早期规模更小、性能更弱的模型。同日谷歌还发布了迄今为止功能最强大、效率最高且可扩展性最强的TPU系统 Cloud TPU v5p,TPU v5p芯片更多是针对生成式 AI 所研发的训练芯片,旨在为训练前沿 AI 模型提供支持,从而将加速 Gemini 的开发。 大模型多模态时代开启,关注潜在多模态应用场景落地。ChatGPT问世1年以来,国内外均是“百模大战”,而本次谷歌Gemini 的发布向世界展示了多模态大模型的能力以及潜在多种应用场景。多模态应用代表了大模型的新趋势,通过融合多种交互方式,实现更智能、自然和高效的用户体验,目前来看在智能助理、VR AR、AI+办公、AI+医疗和AI+教育等领域,多模态应用有广阔的应用场景。虽然短期仍有技术整合、用户适应和隐私安全等难题,但随着技术的持续迭代发展,多模态应用有望实现更加广泛和深入的应用,助力AI大模型真正落地在日常社会经济活动里。 风险提示 逆周期政策力度不及预期;科技产业革命进度不达预期。 会议预告 END 欢迎关注 微信号 : PBSSTR 太平桥策略随笔 免责声明: 本报告由中银国际证券股份有限公司证券分析师撰写并向特定客户发布。 本报告发布的特定客户包括:1) 基金、保险、QFII、QDII 等能够充分理解证券研究报告,具备专业信息处理能力的中银国际证券股份有限公司的机构客户;2) 中银国际证券股份有限公司的证券投资顾问服务团队,其可参考使用本报告。中银国际证券股份有限公司的证券投资顾问服务团队可能以本报告为基础,整合形成证券投资顾问服务建议或产品,提供给接受其证券投资顾问服务的客户。 中银国际证券股份有限公司不以任何方式或渠道向除上述特定客户外的公司个人客户提供本报告。中银国际证券股份有限公司的个人客户从任何外部渠道获得本报告的,亦不应直接依据所获得的研究报告作出投资决策;需充分咨询证券投资顾问意见,独立作出投资决策。中银国际证券股份有限公司不承担由此产生的任何责任及损失等。 本报告内含保密信息,仅供收件人使用。阁下作为收件人,不得出于任何目的直接或间接复制、派发或转发此报告全部或部分内容予任何其他人,或将此报告全部或部分内容发表。如发现本研究报告被私自刊载或转发的,中银国际证券股份有限公司将及时采取维权措施,追究有关媒体或者机构的责任。所有本报告内使用的商标、服务标记及标记均为中银国际证券股份有限公司或其附属及关联公司(统称“中银国际集团”)的商标、服务标记、注册商标或注册服务标记。 本报告及其所载的任何信息、材料或内容只提供给阁下作参考之用,并未考虑到任何特别的投资目的、财务状况或特殊需要,不能成为或被视为出售或购买或认购证券或其它金融票据的要约或邀请,亦不构成任何合约或承诺的基础。中银国际证券股份有限公司不能确保本报告中提及的投资产品适合任何特定投资者。本报告的内容不构成对任何人的投资建议,阁下不会因为收到本报告而成为中银国际集团的客户。阁下收到或阅读本报告须在承诺购买任何报告中所指之投资产品之前,就该投资产品的适合性,包括阁下的特殊投资目的、财务状况及其特别需要寻求阁下相关投资顾问的意见。 尽管本报告所载资料的来源及观点都是中银国际证券股份有限公司及其证券分析师从相信可靠的来源取得或达到,但撰写本报告的证券分析师或中银国际集团的任何成员及其董事、高管、员工或其他任何个人(包括其关联方)都不能保证它们的准确性或完整性。除非法律或规则规定必须承担的责任外,中银国际集团任何成员不对使用本报告的材料而引致的损失负任何责任。本报告对其中所包含的或讨论的信息或意见的准确性、完整性或公平性不作任何明示或暗示的声明或保证。阁下不应单纯依靠本报告而取代个人的独立判断。本报告仅反映证券分析师在撰写本报告时的设想、见解及分析方法。中银国际集团成员可发布其它与本报告所载资料不一致及有不同结论的报告,亦有可能采取与本报告观点不同的投资策略。为免生疑问,本报告所载的观点并不代表中银国际集团成员的立场。 本报告可能附载其它网站的地址或超级链接。对于本报告可能涉及到中银国际集团本身网站以外的资料,中银国际集团未有参阅有关网站,也不对它们的内容负责。提供这些地址或超级链接(包括连接到中银国际集团网站的地址及超级链接)的目的,纯粹为了阁下的方便及参考,连接网站的内容不构成本报告的任何部分。阁下须承担浏览这些网站的风险。 本报告所载的资料、意见及推测仅基于现状,不构成任何保证,可随时更改,毋须提前通知。本 报告不构成投资、法律、会计或税务建议或保证任何投资或策略适用于阁下个别情况。本报告不能作为阁下私人投资的建议。 过往的表现不能被视作将来表现的指示或保证,也不能代表或对将来表现做出任何明示或暗示的保障。本报告所载的资料、意见及预测只是反映证券分析师在本报告所载日期的判断,可随时更改。本报告中涉及证券或金融工具的价格、价值及收入可能出现上升或下跌。 部分投资可能不会轻易变现,可能在出售或变现投资时存在难度。同样,阁下获得有关投资的价值或风险的可靠信息也存在困难。本报告中包含或涉及的投资及服务可能未必适合阁下。如上所述,阁下须在做出任何投资决策之前,包括买卖本报告涉及的任何证券,寻求阁下相关投资顾问的意见。 中银国际证券股份有限公司及其附属及关联公司版权所有。保留一切权利。
大部分微信公众号研报本站已有pdf详细完整版:https://www.wkzk.com/report/(可搜索研报标题关键词或机构名称查询原报告)
郑重声明:悟空智库网发布此信息的目的在于传播更多信息,与本站立场无关,不构成任何投资建议。