国金证券-计算机行业研究:彭博金融GPT发布,行业大模型落地加速-230402

文本预览:
事件简评 Bloomberg于2023年3月30日发布金融行业大模型BloombergGPT,该模型采用与ChatGPT相同的主流架构Only-DecoderTransformer,基于海量金融行业数据和通用领域开源数据集训练,模型参数规模为500亿。BloombergGPT的训练数据总量约为5,300亿词,其中金融行业数据约为2,720亿词,约占所有训练数据的54.2%,来源包括网络、新闻、公司公告与财务报表以及彭博自己的新闻库。出于数据安全和模型滥用风险考虑,BloombergGPT尚未以任何形式对外开放访问。 目前,以ChatGPT和百度文心等为代表的生成式AI在通用任务上取得了不亚于人类的表现。然而,这类AI在行业任务上的表现相对一般,主要受限于以下原因:第一,行业知识在训练数据中的比例相对较低,模型中的行业知识相对匮乏,导致行业任务表现较差;第二,行业任务与通用任务的思维逻辑存在显著差异,金融行业语境下对某些信息的解读与通用语境下存在显著不同,例如“某公司裁员5000人”在通用语境下常被理解为负面消息,但在金融行业语境下有时可以被理解为推升公司业绩的积极信号。基于海量金融行业数据训练得到的BloombergGPT能够更好地完成金融新闻正负面判别、Bloomberg查询语言生成、金融信息抽取总结、投资机会挖掘等金融领域相关任务。 投资逻辑 1、金融行业可能成为垂直GPT率先落地的场景。未来,彭博有计划将他们训练BloombergGPT的细节方法披露出来,这可能对我国头部科技公司如同花顺、恒生电子等公司的行业大模型训练带来启发,其他垂直行业也可以借鉴相关经验。我们发现来自Bloomberg自己资料库的数据仅占比0.7%,在数据层面并没有断层明显的优势,其他公司也可以搭建类似数据库来进行模型训练。 2、多个应用场景可能受益于金融GPT的落地。BloombergGPT主要在情感倾向分析、是非题、主体提取及股票代码匹配、问答题等方面进行了测评,未来可能应用的场景包括:1)新闻情感倾向分析及内容生成。可以辅助金融机构判断市场对某一事件的观点,辅助量化策略和投资决策;2)金融领域知识问答及股票代码匹配。可以辅助金融机构进行信用评估、辅助投资人筛选新闻相关概念股、辅助分析师进行领域知识学习及提升资料阅读效率等;3)财务报表分析及会计审计辅助。可以辅助金融机构生成基础的财务分析报告和招股书、辅助投研人员报表配平、辅助会计和审计方面的工作。 投资建议 我们认为金融行业可能成为垂直GPT率先落地的场景,且金融行业应用场景相对较为丰富。看好拥有研发实力、海量数据及流量入口的公司,建议关注同花顺、恒生电子、财富趋势、顶点软件和凌志软件。 风险提示 金融大模型研发不及预期;行业应用落地不及预期;软硬件资源使用受限
展开>>
收起<<
《国金证券-计算机行业研究:彭博金融GPT发布,行业大模型落地加速-230402(3页).pdf》由会员分享,可在线阅读,更多相关《国金证券-计算机行业研究:彭博金融GPT发布,行业大模型落地加速-230402(3页).pdf(3页精品完整版)》请在悟空智库报告文库上搜索。
(以下内容从国金证券《计算机行业研究:彭博金融GPT发布,行业大模型落地加速》研报附件原文摘录)事件简评 Bloomberg于2023年3月30日发布金融行业大模型BloombergGPT,该模型采用与ChatGPT相同的主流架构Only-DecoderTransformer,基于海量金融行业数据和通用领域开源数据集训练,模型参数规模为500亿。BloombergGPT的训练数据总量约为5,300亿词,其中金融行业数据约为2,720亿词,约占所有训练数据的54.2%,来源包括网络、新闻、公司公告与财务报表以及彭博自己的新闻库。出于数据安全和模型滥用风险考虑,BloombergGPT尚未以任何形式对外开放访问。 目前,以ChatGPT和百度文心等为代表的生成式AI在通用任务上取得了不亚于人类的表现。然而,这类AI在行业任务上的表现相对一般,主要受限于以下原因:第一,行业知识在训练数据中的比例相对较低,模型中的行业知识相对匮乏,导致行业任务表现较差;第二,行业任务与通用任务的思维逻辑存在显著差异,金融行业语境下对某些信息的解读与通用语境下存在显著不同,例如“某公司裁员5000人”在通用语境下常被理解为负面消息,但在金融行业语境下有时可以被理解为推升公司业绩的积极信号。基于海量金融行业数据训练得到的BloombergGPT能够更好地完成金融新闻正负面判别、Bloomberg查询语言生成、金融信息抽取总结、投资机会挖掘等金融领域相关任务。 投资逻辑 1、金融行业可能成为垂直GPT率先落地的场景。未来,彭博有计划将他们训练BloombergGPT的细节方法披露出来,这可能对我国头部科技公司如同花顺、恒生电子等公司的行业大模型训练带来启发,其他垂直行业也可以借鉴相关经验。我们发现来自Bloomberg自己资料库的数据仅占比0.7%,在数据层面并没有断层明显的优势,其他公司也可以搭建类似数据库来进行模型训练。 2、多个应用场景可能受益于金融GPT的落地。BloombergGPT主要在情感倾向分析、是非题、主体提取及股票代码匹配、问答题等方面进行了测评,未来可能应用的场景包括:1)新闻情感倾向分析及内容生成。可以辅助金融机构判断市场对某一事件的观点,辅助量化策略和投资决策;2)金融领域知识问答及股票代码匹配。可以辅助金融机构进行信用评估、辅助投资人筛选新闻相关概念股、辅助分析师进行领域知识学习及提升资料阅读效率等;3)财务报表分析及会计审计辅助。可以辅助金融机构生成基础的财务分析报告和招股书、辅助投研人员报表配平、辅助会计和审计方面的工作。 投资建议 我们认为金融行业可能成为垂直GPT率先落地的场景,且金融行业应用场景相对较为丰富。看好拥有研发实力、海量数据及流量入口的公司,建议关注同花顺、恒生电子、财富趋势、顶点软件和凌志软件。 风险提示 金融大模型研发不及预期;行业应用落地不及预期;软硬件资源使用受限