【华泰科技】Gemini能扭转谷歌在大模型竞争中的劣势吗
(以下内容从华泰证券《》研报附件原文摘录)
如果您希望第一时间收到推送,别忘了加“星标”! 核心观点 华泰观点:Gemini能扭转谷歌在大模型竞争中的劣势吗 12/6,谷歌发布大模型Gemini,在Gemini Technical Report中声称Ultra版在绝大部分测试中优于GPT-4,但目前只向用户开放性能较弱的Pro(性能介于GPT-3.5和GPT-4之间)和Nano(手机用)。当前北美大模型竞争格局逐渐明朗,微软+OpenAI在商业化和用户认知度上领先一步,Meta通过开源模型LlaMa-2吸引大量开发者,在大模型投入最早的谷歌却在模型能力、商业化、生态上都缺乏特色,谷歌采取逐步方式(Phased approach)提早发布Gemini或部分反映了公司面临的竞争压力。建议关注后续Gemini和搜索、手机、云等主要业务如何结合,以及Ultra的发布进度。 Gemini:原生多模态模型,三个不同规模的模型适用不同场景 目前创建多模态模型时,往往分别训练不同模态的模型并加以拼接,Gemini 是原生多模态模型(文本、代码、音频、图像和视频),一开始就在不同模态上进行预训练,因此能够对输入的各模态内容顺畅地理解和推理,效果较优。Gemini包括三个不同规模的模型:1)Ultra是规模最大且功能最强大的模型,适用于高度复杂的任务。2)Pro适用于各种任务的最佳模型。3)Nano是端侧设备上最高效的模型。谷歌未公开Gemini Ultra及Pro的参数规模,仅公开了Nano拥有1.8B、3.25B参数的两个版本。 Gemini生态:C端落地Bard、Pixel手机、搜索等产品,B端将推出API 谷歌将在聊天机器人、手机等产品和服务中落地Gemini:1)Bard将使用Gemini Pro的微调版本来进行更高级的推理、规划和理解等。2)Pixel 8 Pro是首款搭载Gemini Nano的智能手机,它可以支持录音应用中的“总结”等新功能,并在Gboard中推出“智能回复”功能,从WhatsApp开始,明年还将推出更多信息应用。3)未来几个月,Gemini将应用于谷歌更多的产品和服务,如搜索、广告、Chrome和Duet AI。4)从12月13日开始,开发者和企业客户可以通过Google AI Studio或Google Cloud Vertex AI中的Gemini API获取Gemini Pro。 Gemini Ultra:文本和推理能力略胜于GPT-4,图像理解能力略胜于GPT-4V 根据Gemini Technical Report,Gemini Ultra在32个基准中的30个基准中实现SOTA,包括12个流行的文本和推理基准测试中的10个、全部9个图像理解基准测试、全部6个视频理解基准测试以及全部5个语音识别和语音翻译基准测试。与其他领先的大模型相比,Gemini Ultra在绝大部分文本和推理测试中略胜于GPT-4,在几乎所有多模态(图像、视频、音频)任务中略胜于GPT-4V。Gemini Ultra是第一个在MMLU(大规模多任务语言理解)上超过人类专家表现的模型,MMLU 综合使用了数学、物理、历史、法律、医学和伦理等 57 个科目,可用于测试模型对于人类世界的知识储备和解决问题的能力。 谷歌发布下一代TPU v5p Gemini使用TPU v5e和TPU v4训练,谷歌此次同时发布下一代TPU v5p。与TPU v4相比,TPU v5p训练大语言模型快2.8倍,HBM增加约2倍(95GB vs 32GB),单个pod芯片翻倍以上(8960颗 vs 4096颗)。我们认为基础大模型是少数玩家竞争的领域,算力、数据、算法缺一不可。 风险提示: AI 技术落地不及预期。虽然 AI 技术加速发展,但由于成本、落地效果等限制,相关技术落地节奏可能不及我们预期。 本研报中涉及到未上市公司或未覆盖个股内容,均系对其客观公开信息的整理,并不代表本研究团队对该公司、该股票的推荐或覆盖。 相关研报 点击查看报告原文 研报:《Gemini能扭转谷歌在大模型竞争中的劣势吗》2023年12月8日 黄乐平 S0570521050001 | AUZ066 余 熠 S0570520090002 | BNC535 权鹤阳 S0570122070045 | BTV779 关注我们 华泰证券研究所国内站(研究Portal) https://inst.htsc.com/research 访问权限:国内机构客户 华泰证券研究所海外站 https://intl.inst.htsc.com/research 访问权限:美国及香港金控机构客户 添加权限请联系您的华泰对口客户经理 免责声明 ▲向下滑动阅览 本公众号不是华泰证券股份有限公司(以下简称“华泰证券”)研究报告的发布平台,本公众号仅供华泰证券中国内地研究服务客户参考使用。其他任何读者在订阅本公众号前,请自行评估接收相关推送内容的适当性,且若使用本公众号所载内容,务必寻求专业投资顾问的指导及解读。华泰证券不因任何订阅本公众号的行为而将订阅者视为华泰证券的客户。 本公众号转发、摘编华泰证券向其客户已发布研究报告的部分内容及观点,完整的投资意见分析应以报告发布当日的完整研究报告内容为准。订阅者仅使用本公众号内容,可能会因缺乏对完整报告的了解或缺乏相关的解读而产生理解上的歧义。如需了解完整内容,请具体参见华泰证券所发布的完整报告。 本公众号内容基于华泰证券认为可靠的信息编制,但华泰证券对该等信息的准确性、完整性及时效性不作任何保证,也不对证券价格的涨跌或市场走势作确定性判断。本公众号所载的意见、评估及预测仅反映发布当日的观点和判断。在不同时期,华泰证券可能会发出与本公众号所载意见、评估及预测不一致的研究报告。 在任何情况下,本公众号中的信息或所表述的意见均不构成对任何人的投资建议。订阅者不应单独依靠本订阅号中的内容而取代自身独立的判断,应自主做出投资决策并自行承担投资风险。订阅者若使用本资料,有可能会因缺乏解读服务而对内容产生理解上的歧义,进而造成投资损失。对依据或者使用本公众号内容所造成的一切后果,华泰证券及作者均不承担任何法律责任。 本公众号版权仅为华泰证券所有,未经华泰证券书面许可,任何机构或个人不得以翻版、复制、发表、引用或再次分发他人等任何形式侵犯本公众号发布的所有内容的版权。如因侵权行为给华泰证券造成任何直接或间接的损失,华泰证券保留追究一切法律责任的权利。华泰证券具有中国证监会核准的“证券投资咨询”业务资格,经营许可证编号为:91320000704041011J。 个人观点,仅供参考
如果您希望第一时间收到推送,别忘了加“星标”! 核心观点 华泰观点:Gemini能扭转谷歌在大模型竞争中的劣势吗 12/6,谷歌发布大模型Gemini,在Gemini Technical Report中声称Ultra版在绝大部分测试中优于GPT-4,但目前只向用户开放性能较弱的Pro(性能介于GPT-3.5和GPT-4之间)和Nano(手机用)。当前北美大模型竞争格局逐渐明朗,微软+OpenAI在商业化和用户认知度上领先一步,Meta通过开源模型LlaMa-2吸引大量开发者,在大模型投入最早的谷歌却在模型能力、商业化、生态上都缺乏特色,谷歌采取逐步方式(Phased approach)提早发布Gemini或部分反映了公司面临的竞争压力。建议关注后续Gemini和搜索、手机、云等主要业务如何结合,以及Ultra的发布进度。 Gemini:原生多模态模型,三个不同规模的模型适用不同场景 目前创建多模态模型时,往往分别训练不同模态的模型并加以拼接,Gemini 是原生多模态模型(文本、代码、音频、图像和视频),一开始就在不同模态上进行预训练,因此能够对输入的各模态内容顺畅地理解和推理,效果较优。Gemini包括三个不同规模的模型:1)Ultra是规模最大且功能最强大的模型,适用于高度复杂的任务。2)Pro适用于各种任务的最佳模型。3)Nano是端侧设备上最高效的模型。谷歌未公开Gemini Ultra及Pro的参数规模,仅公开了Nano拥有1.8B、3.25B参数的两个版本。 Gemini生态:C端落地Bard、Pixel手机、搜索等产品,B端将推出API 谷歌将在聊天机器人、手机等产品和服务中落地Gemini:1)Bard将使用Gemini Pro的微调版本来进行更高级的推理、规划和理解等。2)Pixel 8 Pro是首款搭载Gemini Nano的智能手机,它可以支持录音应用中的“总结”等新功能,并在Gboard中推出“智能回复”功能,从WhatsApp开始,明年还将推出更多信息应用。3)未来几个月,Gemini将应用于谷歌更多的产品和服务,如搜索、广告、Chrome和Duet AI。4)从12月13日开始,开发者和企业客户可以通过Google AI Studio或Google Cloud Vertex AI中的Gemini API获取Gemini Pro。 Gemini Ultra:文本和推理能力略胜于GPT-4,图像理解能力略胜于GPT-4V 根据Gemini Technical Report,Gemini Ultra在32个基准中的30个基准中实现SOTA,包括12个流行的文本和推理基准测试中的10个、全部9个图像理解基准测试、全部6个视频理解基准测试以及全部5个语音识别和语音翻译基准测试。与其他领先的大模型相比,Gemini Ultra在绝大部分文本和推理测试中略胜于GPT-4,在几乎所有多模态(图像、视频、音频)任务中略胜于GPT-4V。Gemini Ultra是第一个在MMLU(大规模多任务语言理解)上超过人类专家表现的模型,MMLU 综合使用了数学、物理、历史、法律、医学和伦理等 57 个科目,可用于测试模型对于人类世界的知识储备和解决问题的能力。 谷歌发布下一代TPU v5p Gemini使用TPU v5e和TPU v4训练,谷歌此次同时发布下一代TPU v5p。与TPU v4相比,TPU v5p训练大语言模型快2.8倍,HBM增加约2倍(95GB vs 32GB),单个pod芯片翻倍以上(8960颗 vs 4096颗)。我们认为基础大模型是少数玩家竞争的领域,算力、数据、算法缺一不可。 风险提示: AI 技术落地不及预期。虽然 AI 技术加速发展,但由于成本、落地效果等限制,相关技术落地节奏可能不及我们预期。 本研报中涉及到未上市公司或未覆盖个股内容,均系对其客观公开信息的整理,并不代表本研究团队对该公司、该股票的推荐或覆盖。 相关研报 点击查看报告原文 研报:《Gemini能扭转谷歌在大模型竞争中的劣势吗》2023年12月8日 黄乐平 S0570521050001 | AUZ066 余 熠 S0570520090002 | BNC535 权鹤阳 S0570122070045 | BTV779 关注我们 华泰证券研究所国内站(研究Portal) https://inst.htsc.com/research 访问权限:国内机构客户 华泰证券研究所海外站 https://intl.inst.htsc.com/research 访问权限:美国及香港金控机构客户 添加权限请联系您的华泰对口客户经理 免责声明 ▲向下滑动阅览 本公众号不是华泰证券股份有限公司(以下简称“华泰证券”)研究报告的发布平台,本公众号仅供华泰证券中国内地研究服务客户参考使用。其他任何读者在订阅本公众号前,请自行评估接收相关推送内容的适当性,且若使用本公众号所载内容,务必寻求专业投资顾问的指导及解读。华泰证券不因任何订阅本公众号的行为而将订阅者视为华泰证券的客户。 本公众号转发、摘编华泰证券向其客户已发布研究报告的部分内容及观点,完整的投资意见分析应以报告发布当日的完整研究报告内容为准。订阅者仅使用本公众号内容,可能会因缺乏对完整报告的了解或缺乏相关的解读而产生理解上的歧义。如需了解完整内容,请具体参见华泰证券所发布的完整报告。 本公众号内容基于华泰证券认为可靠的信息编制,但华泰证券对该等信息的准确性、完整性及时效性不作任何保证,也不对证券价格的涨跌或市场走势作确定性判断。本公众号所载的意见、评估及预测仅反映发布当日的观点和判断。在不同时期,华泰证券可能会发出与本公众号所载意见、评估及预测不一致的研究报告。 在任何情况下,本公众号中的信息或所表述的意见均不构成对任何人的投资建议。订阅者不应单独依靠本订阅号中的内容而取代自身独立的判断,应自主做出投资决策并自行承担投资风险。订阅者若使用本资料,有可能会因缺乏解读服务而对内容产生理解上的歧义,进而造成投资损失。对依据或者使用本公众号内容所造成的一切后果,华泰证券及作者均不承担任何法律责任。 本公众号版权仅为华泰证券所有,未经华泰证券书面许可,任何机构或个人不得以翻版、复制、发表、引用或再次分发他人等任何形式侵犯本公众号发布的所有内容的版权。如因侵权行为给华泰证券造成任何直接或间接的损失,华泰证券保留追究一切法律责任的权利。华泰证券具有中国证监会核准的“证券投资咨询”业务资格,经营许可证编号为:91320000704041011J。 个人观点,仅供参考
大部分微信公众号研报本站已有pdf详细完整版:https://www.wkzk.com/report/(可搜索研报标题关键词或机构名称查询原报告)
郑重声明:悟空智库网发布此信息的目的在于传播更多信息,与本站立场无关,不构成任何投资建议。