机器学习选股在海外公募量化发展如何?——申万宏源金工海外量化研究系列之六
(以下内容从申万宏源《机器学习选股在海外公募量化发展如何?——申万宏源金工海外量化研究系列之六》研报附件原文摘录)
1. 机器学习在海外公募平台的应用概览 在过去的两年中,机器学习已经在国内投资领域得到了广泛的应用,机器学习挖因子、使用机器学习算法进行因子合成以及端到端的选股模型训练都是应用的方向;而随着大模型推出,基于Transformer等架构对大量文本进行训练后生成新的内容的生成式AI也为机器学习选股带来了新的信息。 随着年初小市值因子的回撤,加上机器学习方法的“黑箱”属性,机器学习选股能否持续有效的争议也在增加。本报告中,我们主要对海外公募平台在应用机器学习上的案例进行梳理总结,为未来国内可能的发展方向提供启发。 在海外量化系列此前的报告中我们提到,在美国全部共同基金、ETF中,简介内容提到量化、多因子或增强等可被认为是量化管理的产品合计规模仅在千亿美元左右,在整个公募市场上占比较低,但贝莱德、富达等头部金融机构仍然高度重视量化发展,设置独立部门管理产品,景顺、智慧树等机构则使用被动管理为主的方式将量化策略固定化,规模也较为可观。下面我们仍然关注产品简介中提到机器学习、人工智能等关键词的产品,在全球1亿美元以上的共同基金、ETF中,我们根据“人工智能”、“AI”、“机器学习”、“深度学习”等关键词在产品名称和简介中进行查找,合计找到39只产品,规模约260亿美元,但其中绝大部分为投资于AI相关公司的产品,使用AI策略进行投资的产品仅5只,规模17亿美元,具体如下: 其中,除Amplify的产品AIEQ是被动管理,其他产品都为主动产品;而Wisdomtree的产品虽然成立时间较早,但实际在最近几年才改为AI策略。 如果我们在整个美国市场关注使用AI策略进行投资的股票ETF产品,则全部产品如下,除了前面2只超过1亿美元,还有4只相对较小的产品: 另外,还有三只2020年后成立的产品已经于2023年末、2024年初清盘。 可以看到,在全球公募基金市场中直接强调产品以AI选股策略运作的产品较少,即使已发行的产品也呈现出生命力不强的特点。 但与此前的情况类似,贝莱德等头部机构依然将AI技术的应用放在了相当的高度。根据Invesco在2023年进行的全球量化投资调查(调查对象为130家从事量化或因子投资的机构,包括养老金、保险、投顾机构等,合计管理或顾问资产超过20万亿美元),被调查的机构90%以上都使用了因子投资的方法,而使用AI方法的机构也达到30%,其中亚太地区的比例更高: Invesco将AI在投资中可能的应用场景进行划分,根据被调查机构的观点,这些场景未来在投资中的作用从高到低依次为: 1) 识别市场行为中的趋势和结构; 2) 组合优化、风险管理; 3) 直接开发投资策略; 4) 实时监控交易头寸; 5) 新闻、研报、社交媒体文本分析; 6) 交易择时。 对于以上6个部分,目前各地区被调查机构的使用比例如下: 机构投资者当前的使用情况和对未来重要性的判断基本一致,使用最多的实际都是通过机器学习来识别交易数据中所体现出的交易结构,也即是我们所说的“机器学习挖因子”,且在亚太市场使用的比例尤其高;直接开发投资策略的情况在北美的使用反而更高,而文本分析虽然此前使用有限,但随着大模型的推出,投资者对其未来的应用更加看好。 结合来看,虽然公募市场完全使用AI策略运作的产品不多,但机构对加入AI策略的热情较高且认为其重要性将不断增长。下面部分中,我们一方面介绍头部公募量化平台在AI应用上的探索,另一方面也关注上述公募AI选股产品的具体策略与实际运作情况。 2. 头部公募量化平台对AI的应用 2.1 贝莱德:文本是最大的应用方向 作为全球管理规模最大的资产管理公司,贝莱德认为机器学习主要在用户交互界面、运营效率和投资三个环节中起到作用。其中,用户交互界面主要指在其阿拉丁机构财富平台、iRetire智能养老平台以及其他智能投顾平台中加入AI方法,使得投顾服务可以个性化地触达更多客户;而运营效率上,贝莱德在数据清洗、检查中加入AI来提高效率。 在投资中,贝莱德认为虽然AI有较大的应用空间,但所有的模型设计、跟踪都需要专业投资人员的密切跟踪。在此前的海外量化系列研究中,我们介绍了贝莱德的主动量化团队(Systematic Active Equity)主要通过偏向基本面量化的研究方式来构建信号,虽然使用了各种不同的数据来源,包括宏观数据、基本面数据、卫星等另类数据,但如何符合逻辑地使用、何时使用、用什么模型都需要研究员基于基本面逻辑和测试结果仔细分析。在这样的投资理念驱动下,其较少使用机器学习挖因子的模式,也不直接使用AI来构建价量的选股模型,而是更多用在文本分析的领域,具体的使用场景如下: 1) 根据业绩电话会议纪要、分析师报告来分析文字中的情绪偏向; 2) 通过大量文本识别投资主题并形成策略; 3) 直接通过大语言模型方法来构建基于文本的股价预测模型。 其中第三点可以认为是第一点的进化版本。 2.1.1 基于文本的股价预测大模型 通过文本来分析情绪偏向的自然语言处理策略早在十多年前就已经开始被贝莱德使用,当时的策略更多使用简单的词频来统计,而随着大语言模型的发展,目前贝莱德处理的文本量已经越来越大,平均每月仅阅读的分析师报告数量就超过10万篇: 贝莱德认为,随着信息的增加,未被广泛使用的信息处理技术也是alpha的重要来源,因此现在更需要抓住机会,提高大语言模型等技术的使用频率。 在早期,贝莱德利用情绪分析作为投资信号,通过统计文档中的正面与负面词汇数量,并基于此得到个股的情绪因子,这也是此前国内在自然语言处理中的常用方法。虽然这种方法证明是有效的,但它并未充分考虑到句子结构和语义等细微差别,此后贝莱德也进行了一定的文本处理技术上的改进,例如先识别关键词后再表征情绪等。 而目前,贝莱德的分析方法已经进化到采用基于Transformer架构的大型语言模型来直接通过文本生成收益预测,相当于训练了自己的ChatGPT,区别是ChatGPT输入、输出都是文本,而贝莱德的大模型输入的是文本、输出的是收益预测。相比于直接使用GPT来预测股票收益,贝莱德自己的大模型有着明显更高的胜率,超过60%: 贝莱德大模型使用的Transformer架构与传统词频模型的区别主要在于不仅考虑每个单词与其他单词的关系,而且能够识别出最重要的联系点,非线性的模式避免了过分强调相邻词汇而忽略更远距离单词间重要联系的问题。贝莱德模型的构建和使用过程大致如下: 1) 准备基础的预训练语言模型,该模型能够对文本有基本理解,一般是在大规模无标注数据上通过自监督学习得到的; 2) Fine Tuning微调:加入带标签的数据进行训练,输入数据为研报、电话会议纪要、新闻等信息,而标签可以是股票未来一段时间的收益,该过程中贝莱德基于改进的交替方向乘子法(ADMM)优化算法来使得模型目标为最大化收益、同时最小化风险和交易成本; 3) 使用训练的模型,根据新输入的文本信息更新对股票的收益预测并用于最后的投资中。 可以看到,贝莱德实际上将国内常用的基于价量数据的端到端股价预测模型变化成了基于文本数据的端到端模型,通过自主训练使其具备更强的资本市场适应能力,也通过输入信息的差异化、微调标签中贝莱德的偏好来形成属于贝莱德的准确度更高的预测模型。 2.1.2 主题投资 除了大模型,主题投资也是贝莱德机器学习应用于文本的尝试,类似于我们此前在《“热点追踪”:基于研报文本的主题选股策略》中探讨的方向,贝莱德使用更复杂的机器学习模型来通过文本识别不相关的主题篮子。贝莱德认为,主题投资的核心在于捕捉投资者关注的重点,这些重点可能体现在新闻报道、公司电话会议纪要、社交媒体讨论、网络搜索以及各种另类数据中。通过自然语言处理技术,贝莱德从这些不同的数据源中识别出共同的主题,而这些主题的发展、重要性以及持续时间也需要不断加入新的文本信息来识别跟踪。此外,资金流向和券商推荐的股票组合也可以作为主题的辅助内容,确定主题之后可以进一步利用资金流等信息来评估主题的吸引力,进而选择股票。目前,贝莱德在主题识别的部分已经开始使用大语言模型,希望在输入的信息更复杂的情况下,将主题识别得更精准,并根据不同主题的不同持续时间来进行差异化的组合构建。 此外,贝莱德目前也将其文本主题识别策略封装成了“主题机器人”,可供其主动基金经理来使用,在该模式下,基金经理可以输入一段文字来提示其关注的主题,然后由机器人基于大量数据库中的文本来输出该主题下相关联的具体股票以及相应的可投资的股票组合: 基金经理输入的信息可以是一段主题描述,并可以给出少量股票供机器人参考: 模型会给出最终的组合并进行一定的回测及主题逻辑分析。这一工具给主动基金经理提供了很好的分析工具,在投资中基金经理对主题的筛选仍然起到了重要的作用,机器学习方法只起到辅助功能,也体现了贝莱德在量化投资中对人的作用的重视。 2.1.3 私募股权等其他领域 除了传统的股票资产,贝莱德也将AI拓展到私募股权等另类资产上,虽然私募股权流动性偏弱、数据标准性差,但相关的非标准化的数据仍然较多,例如公司的招聘情况、公司的市场评论和新闻等,AI可以利用这些繁杂的数据来进行预测。而在具体的预测模型上,未必需要预测收益,而是可以预测未来几年内IPO或收购的概率等,贝莱德目前的模型可以将预测的准确率做到接近80%,而全市场平均的IPO、收购概率在40%左右。 2.2 高盛量化团队:借助公司算力资源应用大模型分析文本情绪 高盛对机器学习的使用情况和贝莱德较为相似,主要使用大模型来分析文本,公司认为AI技术的革新主要在文本分析的准确性上对其提供帮助,而可以利用高盛的算力资源也是其团队相比于其他资产管理平台的优势。高盛在量化投资上的方法进化如下: 前面的系列报告中我们已经提到高盛在另类数据上投入了较多的精力,其有近30人的团队来通过学术文献研究、与基本面团队交流、与不同数据商沟通等方法来寻找可能有效的数据并分析适用逻辑,在团队领导确认逻辑合理后,他们再通过历史数据来测试其有效性,一般而言数据到股价的传到在6-9个月之间的被认为是可用性较强的数据。 而在文本上,公司也在较早时就已经通过传统的NLP方法开始进行分析师报告、公司财报文本的分析,通过一些关键词的出现次数、顺序来判断乐观、悲观的情绪偏向;而随着基于Transformer的大模型的成熟,高盛也开始训练自己的模型来进行语义的识别,希望更准确地得到其中体现的情绪。未来,高盛希望把这种情绪分析方法向电话会议等音频进行拓展,相比于文本,音频中还可以包含更多语调等情绪信息,通过大模型识别这些未被利用的信息可能能够有更多收益贡献。 根据Lipper的数据,高盛在日本地区发行的Big Data Investment Strategy基金实际投资于高盛在欧洲发行的Global Core Equity Portfolio,该产品结合机器学习和其他量化选股方法在全球股票中进行选股,今年上半年跑赢MSCI World指数超过3%,但此前的三年均未跑赢: 除了大模型的应用,高盛也在更低频的应用上与其他管理人进行了合作,与Quant Insight合作开发了宏观量化分析工具并在其机构客户平台Marquee上线供客户使用。通过机器学习方法,Quant Insight的工具可以通过对个股个券的宏观暴露分析来形成对客户投资组合的宏观风险分析,并根据目前的宏观环境、市场情绪等来形成投资组合建议。 2.3 WisdomTree:基本面数据为主的选股模型 WisdomTree也是全球市场突出的量化管理人,其产品多数以ETF的形式呈现,但策略复杂度并不低。其在美国市场发行的WisdomTree U.S. AI Enhanced Value Fund是目前规模相对较大的AI策略产品,该产品从2022年1月18日开始从此前的红利策略转为AI策略,实际的策略管理人为Voya的Equity Machine Intelligence团队,采用基本面驱动的机器学习策略,构建具备价值风格但有别于传统价值Smart Beta的组合。 Voya量化团队共13名成员,从2012年就开始构建基本面机器学习策略,该价值风格产品的选股流程主要如下: 1) 数据处理:获取各公司的基本面、股东、分析师预期等数据以及宏观数据并进行预处理; 2) 特征工程:将原始数据构建成有一定预测效果的因子,如将PE转化成在同类公司中的分位数、时序分位数等,最终得到约250个特征; 3) AI选股:构建AI选股模型,输入特征、输出400-500只优选股票,同时根据交易成本、近期事件等来进行调整,例如根据近期的负面新闻来降低个股权重; 4) 组合构建:对第三步得到的组合,在一定的约束下进行组合优化,同时基金经理对股票进行最终确认和调整; 5) 交易执行:基金经理、交易员确认交易。 可以看到,该策略实际核心是经过特征筛选后的AI选股策略,输入的特征主要为基本面特征,且更强调PE、PB等价值类因子,因此定义为价值风格产品。 该产品在2022年以来确实呈现出了和罗素1000价值更接近的特征,但并未体现出相对指数的优势,2023年小幅跑输,其他阶段相对接近: 我们关注该产品相对罗素 1000 价值的因子暴露情况,并和同基准、近两年表现出色的资本集团的红利价值 ETF CGDV 进行对比,CGDV 2023 年以来跑赢基准超过 20%: AIVL体现了很明显的价值属性,在价值暴露上和基准接近,在成长上暴露更低,说明当输入变量以价值相关指标为主时,产品确实体现了较明显的价值属性,但整体偏小市值、反转的特征也并没有适应美股的市场环境,相比偏大市值、高动量及成长的CGDV处于劣势。根据晨星的风格统计,该产品在价量相关因子上的波动相对较大,而在基本面因子上的暴露在同类中较为稳定。 除了该产品,WisdomTree还有一只同类产品,选股池从美国大盘股转向了全球股票,但同样没有跑赢基准MSCI EAFE价值指数。由此可见,基于基本面数据来构建的AI选股模型未必能够获得比简单的基本面因子选股更好的收益,这可能也是海外头部公募平台较少使用这类方法的原因。 2.4 Invesco:仅将AI作为辅助分析工具 第一部分中我们提到,Invesco 2023年的全球量化投资调查对AI给予了较高的关注度,调查中也发现多数管理人已经开始将机器学习方法应用于投资,并认为未来相关方法的重要性将进一步提升。但Invesco CEO 在2024年初的访谈中提到,公司正在考虑使用生成式AI来提高工作效率,包括在客户宣传、材料整理等方面,但目前暂时不会使用AI来直接进行选股。 对于Invesco的量化团队,其大部分产品是以被动指数产品的形式来呈现,而有一定主动管理成分的“动态多因子”系列采用自上而下的宏观分析框架来决定因子配置,底层的因子构建方式仍然是较为传统的模式。虽然量化基金经理在数年前就开始使用一些机器学习工具来辅助分析,但在短时间内管理人并不倾向于将其结果直接用于投资。 3.其他AI选股产品的策略与表现 在前面的部分中,我们介绍了部分海外头部量化管理人在机器学习方法上的应用方式以及相应观点,而以上机构中除了WisdomTree有专门的AI策略产品、高盛在欧洲有提到使用AI策略的产品,其他机构主要将机器学习作为一种方法加入策略中,未单独设立产品。而在第一部分中,我们提及了境外市场应用AI直接进行选股的产品,本部分中我们对除了WisdomTree、高盛以外的其他产品进行介绍。 3.1 AM-One World Eq Fund with Artificial Intelligence 该产品是日本的一只AI基金,管理人为Asset Management One,采用其深度学习模型进行选股。模型主要使用全球超过10000家上市公司近20 年的财务数据来训练得到股票的收益预测,然后以MSCI Kokusai指数(MSCI世界除日本以外指数)为基准进行组合优化。该产品也未能持续跑赢基准,仅在2021年和今年跑赢了指数,但在多数年份跑赢了Lipper的同类基金池: 3.2 AIEQ:AI Powered Equity ETF 该产品作为美国市场第一只使用AI选股策略的ETF产品成立于2017年,曾经获得了较高的关注,但由于后续未有突出表现,目前规模仅略超1亿美元。产品跟踪AI Powered Equity Index,该指数使用IBM Watson平台进行开发,该平台于2011年就已经推出,是较早期的人工智能平台。 AI Powered Equity Index由EquBot进行开发,实际构建了端到端的选股模型,从iShares Core S&P Total US Stock Market ETF的持仓中进行选股,使用过去10年的基本面、价量、文本等各方面的数据训练模型,并通过最近的宏观数据、过去1个多月的新闻和数据来预测未来一个月的收益,每天运算的数据量超过100万条。随着数据的增多、市场环境的多变,该产品的换手率也在逐年提高,2023年9月结束的2023财年换手率已经高达27倍。我们计算各财年的超额收益以及对应的换手率如下,随着换手率的大幅提升,产品的表现反而有明显的下降: 根据MorningStar计算的近5年相比于同类(美国大盘成长基金)产品在各风格因子上暴露的分位数,发现产品呈现出明显的风格波动较大的情况,基本面因子的5年跨度区间都超过了80%,说明产品对基本面、成长价值风格的偏好不稳定,这一点和AIVL有较大的不同,而在低波、低流动性上的偏好相对稳定,产品也较偏向小市值: 整体来看,产品的风格波动较大、换手较高,呈现出与传统量化、Smart Beta产品不同的特点,但从近两年的表现来看,高换手、风格的灵活性并未能适应美国市场转换成收益,同样也说明AI选股策略仍然面临着较大的挑战。 3.3 QRAFT系列 QRAFT发行的AI选股产品是前面我们列举的所有产品中近两年表现最为出色的。其旗下目前共3只ETF产品,两只为自主开发的19年发行的产品,另一只为和LG合作的2023年新发产品。3只产品的历史半年度相比标普500的超额表现如下: QRFT和AMOM的超额方向整体一致,两只产品近5年的累计超额收益都约为28%,但AMOM更加激进,在2020及2022年下半年至今的时间段表现出色,但2021年到2022年上半年超额回撤明显。 Qraft AI-Enhanced U.S. Large Cap ETF(QRFT)实际更加强调AI在因子配置中的作用,仍然会将因子分为质量、市值、价值、动量和低波五个大类因子,大类因子中同时包含传统因子和机器学习得到的因子,然后通过AI动态学习因子的相关性和预期收益,最终得到组合配置方案。而另一只产品AMOM则主要聚焦动量因子,使用不同计算方法、不同时间区间的动量类因子来训练模型并进行股票的收益预测,两只产品在相对标普500的因子暴露上也体现了较明显的差异: QRFT 目前相对大盘指数的风格偏离程度较低,但历史上的风格波动类似于AIEQ,也较为明显,与其本身在因子配置上动态调整的特征一致: 而AMOM明显更加激进,偏向动量、高波动和成长。从结果表现我们也看到,AMOM近阶段的风格更能适应美国市场的特点,因此近两年表现也较为出色。 而QRAFT与LG合作的LQAI使用的方法论和前面我们看到的高盛、AIEQ等使用的端到端选股模型更相似,通过输入宏观、基本面、价量、文本等不同类型的数据来进行收益预测,每四周计算一次,然后再使用AI优化模型构建100个左右股票的组合。其中文本的部分借助了LG的大语言模型EXAONE。 4.总结 上面部分中,我们分别介绍了头部公募平台对机器学习技术的使用方式、看法以及全球主要的AI选股产品。不同公募平台对AI使用的尺度存在一定分歧,但无论是否使用,都非常强调其中基金经理的主导作用,在如何构建特征、如何进行模型的训练微调等部分都需要人的高度参与,最后如何使用其结果也取决于基金经理的观点。贝莱德、高盛等头部平台目前主要强调AI对文本信息的处理,通过训练自己的大模型,形成输入文本-输出预期收益的预测框架并应用于投资。该方向的延伸方向包括主题挖掘、音频选股等,是目前头部平台最关注的方向。 而对于其他将AI选股直接应用于开发产品的机构来说,其使用的方式也存在差异,主要包括: 1) 基于不同维度数据的端到端模型:输入变量包括宏观、基本面、价量、文本等各维度数据,直接输出股票组合,但从结果来看未能体现持续超额收益能力,近两年对美国市场的适应情况较差; 2) 输入人工处理的特征后构建选股模型,且输入的特征带有一定风格偏向,这类产品中目前偏基本面的表现偏弱,偏价量(动量)的进攻性相对更强但超额波动也较大,说明在美国市场同样具备机器学习方法用于价量信息更有效的特点; 3) 使用机器学习模型对可解释的大类因子进行配置,实际更像一个风格轮动产品,代表产品QRFT近5年累计超额约28%,在同类产品中较为领先。 总结来看,目前综合型的端到端产品结果不佳,这可能也是头部公募量化团队更多在其中一类数据的应用上重点发力的原因;而在不同输入数据构建的模型中,价量优于基本面,尚未有单独的基于文本数据的产品出现;此外,使用机器学习进行传统大类因子配置的框架表现较为出色。 5.风险提示与声明 本报告对于海外产品的研究分析基于公司、Bloomberg、Refinitiv公开信息,本报告不涉及证券投资基金评价业务,不涉及对基金产品的推荐。
1. 机器学习在海外公募平台的应用概览 在过去的两年中,机器学习已经在国内投资领域得到了广泛的应用,机器学习挖因子、使用机器学习算法进行因子合成以及端到端的选股模型训练都是应用的方向;而随着大模型推出,基于Transformer等架构对大量文本进行训练后生成新的内容的生成式AI也为机器学习选股带来了新的信息。 随着年初小市值因子的回撤,加上机器学习方法的“黑箱”属性,机器学习选股能否持续有效的争议也在增加。本报告中,我们主要对海外公募平台在应用机器学习上的案例进行梳理总结,为未来国内可能的发展方向提供启发。 在海外量化系列此前的报告中我们提到,在美国全部共同基金、ETF中,简介内容提到量化、多因子或增强等可被认为是量化管理的产品合计规模仅在千亿美元左右,在整个公募市场上占比较低,但贝莱德、富达等头部金融机构仍然高度重视量化发展,设置独立部门管理产品,景顺、智慧树等机构则使用被动管理为主的方式将量化策略固定化,规模也较为可观。下面我们仍然关注产品简介中提到机器学习、人工智能等关键词的产品,在全球1亿美元以上的共同基金、ETF中,我们根据“人工智能”、“AI”、“机器学习”、“深度学习”等关键词在产品名称和简介中进行查找,合计找到39只产品,规模约260亿美元,但其中绝大部分为投资于AI相关公司的产品,使用AI策略进行投资的产品仅5只,规模17亿美元,具体如下: 其中,除Amplify的产品AIEQ是被动管理,其他产品都为主动产品;而Wisdomtree的产品虽然成立时间较早,但实际在最近几年才改为AI策略。 如果我们在整个美国市场关注使用AI策略进行投资的股票ETF产品,则全部产品如下,除了前面2只超过1亿美元,还有4只相对较小的产品: 另外,还有三只2020年后成立的产品已经于2023年末、2024年初清盘。 可以看到,在全球公募基金市场中直接强调产品以AI选股策略运作的产品较少,即使已发行的产品也呈现出生命力不强的特点。 但与此前的情况类似,贝莱德等头部机构依然将AI技术的应用放在了相当的高度。根据Invesco在2023年进行的全球量化投资调查(调查对象为130家从事量化或因子投资的机构,包括养老金、保险、投顾机构等,合计管理或顾问资产超过20万亿美元),被调查的机构90%以上都使用了因子投资的方法,而使用AI方法的机构也达到30%,其中亚太地区的比例更高: Invesco将AI在投资中可能的应用场景进行划分,根据被调查机构的观点,这些场景未来在投资中的作用从高到低依次为: 1) 识别市场行为中的趋势和结构; 2) 组合优化、风险管理; 3) 直接开发投资策略; 4) 实时监控交易头寸; 5) 新闻、研报、社交媒体文本分析; 6) 交易择时。 对于以上6个部分,目前各地区被调查机构的使用比例如下: 机构投资者当前的使用情况和对未来重要性的判断基本一致,使用最多的实际都是通过机器学习来识别交易数据中所体现出的交易结构,也即是我们所说的“机器学习挖因子”,且在亚太市场使用的比例尤其高;直接开发投资策略的情况在北美的使用反而更高,而文本分析虽然此前使用有限,但随着大模型的推出,投资者对其未来的应用更加看好。 结合来看,虽然公募市场完全使用AI策略运作的产品不多,但机构对加入AI策略的热情较高且认为其重要性将不断增长。下面部分中,我们一方面介绍头部公募量化平台在AI应用上的探索,另一方面也关注上述公募AI选股产品的具体策略与实际运作情况。 2. 头部公募量化平台对AI的应用 2.1 贝莱德:文本是最大的应用方向 作为全球管理规模最大的资产管理公司,贝莱德认为机器学习主要在用户交互界面、运营效率和投资三个环节中起到作用。其中,用户交互界面主要指在其阿拉丁机构财富平台、iRetire智能养老平台以及其他智能投顾平台中加入AI方法,使得投顾服务可以个性化地触达更多客户;而运营效率上,贝莱德在数据清洗、检查中加入AI来提高效率。 在投资中,贝莱德认为虽然AI有较大的应用空间,但所有的模型设计、跟踪都需要专业投资人员的密切跟踪。在此前的海外量化系列研究中,我们介绍了贝莱德的主动量化团队(Systematic Active Equity)主要通过偏向基本面量化的研究方式来构建信号,虽然使用了各种不同的数据来源,包括宏观数据、基本面数据、卫星等另类数据,但如何符合逻辑地使用、何时使用、用什么模型都需要研究员基于基本面逻辑和测试结果仔细分析。在这样的投资理念驱动下,其较少使用机器学习挖因子的模式,也不直接使用AI来构建价量的选股模型,而是更多用在文本分析的领域,具体的使用场景如下: 1) 根据业绩电话会议纪要、分析师报告来分析文字中的情绪偏向; 2) 通过大量文本识别投资主题并形成策略; 3) 直接通过大语言模型方法来构建基于文本的股价预测模型。 其中第三点可以认为是第一点的进化版本。 2.1.1 基于文本的股价预测大模型 通过文本来分析情绪偏向的自然语言处理策略早在十多年前就已经开始被贝莱德使用,当时的策略更多使用简单的词频来统计,而随着大语言模型的发展,目前贝莱德处理的文本量已经越来越大,平均每月仅阅读的分析师报告数量就超过10万篇: 贝莱德认为,随着信息的增加,未被广泛使用的信息处理技术也是alpha的重要来源,因此现在更需要抓住机会,提高大语言模型等技术的使用频率。 在早期,贝莱德利用情绪分析作为投资信号,通过统计文档中的正面与负面词汇数量,并基于此得到个股的情绪因子,这也是此前国内在自然语言处理中的常用方法。虽然这种方法证明是有效的,但它并未充分考虑到句子结构和语义等细微差别,此后贝莱德也进行了一定的文本处理技术上的改进,例如先识别关键词后再表征情绪等。 而目前,贝莱德的分析方法已经进化到采用基于Transformer架构的大型语言模型来直接通过文本生成收益预测,相当于训练了自己的ChatGPT,区别是ChatGPT输入、输出都是文本,而贝莱德的大模型输入的是文本、输出的是收益预测。相比于直接使用GPT来预测股票收益,贝莱德自己的大模型有着明显更高的胜率,超过60%: 贝莱德大模型使用的Transformer架构与传统词频模型的区别主要在于不仅考虑每个单词与其他单词的关系,而且能够识别出最重要的联系点,非线性的模式避免了过分强调相邻词汇而忽略更远距离单词间重要联系的问题。贝莱德模型的构建和使用过程大致如下: 1) 准备基础的预训练语言模型,该模型能够对文本有基本理解,一般是在大规模无标注数据上通过自监督学习得到的; 2) Fine Tuning微调:加入带标签的数据进行训练,输入数据为研报、电话会议纪要、新闻等信息,而标签可以是股票未来一段时间的收益,该过程中贝莱德基于改进的交替方向乘子法(ADMM)优化算法来使得模型目标为最大化收益、同时最小化风险和交易成本; 3) 使用训练的模型,根据新输入的文本信息更新对股票的收益预测并用于最后的投资中。 可以看到,贝莱德实际上将国内常用的基于价量数据的端到端股价预测模型变化成了基于文本数据的端到端模型,通过自主训练使其具备更强的资本市场适应能力,也通过输入信息的差异化、微调标签中贝莱德的偏好来形成属于贝莱德的准确度更高的预测模型。 2.1.2 主题投资 除了大模型,主题投资也是贝莱德机器学习应用于文本的尝试,类似于我们此前在《“热点追踪”:基于研报文本的主题选股策略》中探讨的方向,贝莱德使用更复杂的机器学习模型来通过文本识别不相关的主题篮子。贝莱德认为,主题投资的核心在于捕捉投资者关注的重点,这些重点可能体现在新闻报道、公司电话会议纪要、社交媒体讨论、网络搜索以及各种另类数据中。通过自然语言处理技术,贝莱德从这些不同的数据源中识别出共同的主题,而这些主题的发展、重要性以及持续时间也需要不断加入新的文本信息来识别跟踪。此外,资金流向和券商推荐的股票组合也可以作为主题的辅助内容,确定主题之后可以进一步利用资金流等信息来评估主题的吸引力,进而选择股票。目前,贝莱德在主题识别的部分已经开始使用大语言模型,希望在输入的信息更复杂的情况下,将主题识别得更精准,并根据不同主题的不同持续时间来进行差异化的组合构建。 此外,贝莱德目前也将其文本主题识别策略封装成了“主题机器人”,可供其主动基金经理来使用,在该模式下,基金经理可以输入一段文字来提示其关注的主题,然后由机器人基于大量数据库中的文本来输出该主题下相关联的具体股票以及相应的可投资的股票组合: 基金经理输入的信息可以是一段主题描述,并可以给出少量股票供机器人参考: 模型会给出最终的组合并进行一定的回测及主题逻辑分析。这一工具给主动基金经理提供了很好的分析工具,在投资中基金经理对主题的筛选仍然起到了重要的作用,机器学习方法只起到辅助功能,也体现了贝莱德在量化投资中对人的作用的重视。 2.1.3 私募股权等其他领域 除了传统的股票资产,贝莱德也将AI拓展到私募股权等另类资产上,虽然私募股权流动性偏弱、数据标准性差,但相关的非标准化的数据仍然较多,例如公司的招聘情况、公司的市场评论和新闻等,AI可以利用这些繁杂的数据来进行预测。而在具体的预测模型上,未必需要预测收益,而是可以预测未来几年内IPO或收购的概率等,贝莱德目前的模型可以将预测的准确率做到接近80%,而全市场平均的IPO、收购概率在40%左右。 2.2 高盛量化团队:借助公司算力资源应用大模型分析文本情绪 高盛对机器学习的使用情况和贝莱德较为相似,主要使用大模型来分析文本,公司认为AI技术的革新主要在文本分析的准确性上对其提供帮助,而可以利用高盛的算力资源也是其团队相比于其他资产管理平台的优势。高盛在量化投资上的方法进化如下: 前面的系列报告中我们已经提到高盛在另类数据上投入了较多的精力,其有近30人的团队来通过学术文献研究、与基本面团队交流、与不同数据商沟通等方法来寻找可能有效的数据并分析适用逻辑,在团队领导确认逻辑合理后,他们再通过历史数据来测试其有效性,一般而言数据到股价的传到在6-9个月之间的被认为是可用性较强的数据。 而在文本上,公司也在较早时就已经通过传统的NLP方法开始进行分析师报告、公司财报文本的分析,通过一些关键词的出现次数、顺序来判断乐观、悲观的情绪偏向;而随着基于Transformer的大模型的成熟,高盛也开始训练自己的模型来进行语义的识别,希望更准确地得到其中体现的情绪。未来,高盛希望把这种情绪分析方法向电话会议等音频进行拓展,相比于文本,音频中还可以包含更多语调等情绪信息,通过大模型识别这些未被利用的信息可能能够有更多收益贡献。 根据Lipper的数据,高盛在日本地区发行的Big Data Investment Strategy基金实际投资于高盛在欧洲发行的Global Core Equity Portfolio,该产品结合机器学习和其他量化选股方法在全球股票中进行选股,今年上半年跑赢MSCI World指数超过3%,但此前的三年均未跑赢: 除了大模型的应用,高盛也在更低频的应用上与其他管理人进行了合作,与Quant Insight合作开发了宏观量化分析工具并在其机构客户平台Marquee上线供客户使用。通过机器学习方法,Quant Insight的工具可以通过对个股个券的宏观暴露分析来形成对客户投资组合的宏观风险分析,并根据目前的宏观环境、市场情绪等来形成投资组合建议。 2.3 WisdomTree:基本面数据为主的选股模型 WisdomTree也是全球市场突出的量化管理人,其产品多数以ETF的形式呈现,但策略复杂度并不低。其在美国市场发行的WisdomTree U.S. AI Enhanced Value Fund是目前规模相对较大的AI策略产品,该产品从2022年1月18日开始从此前的红利策略转为AI策略,实际的策略管理人为Voya的Equity Machine Intelligence团队,采用基本面驱动的机器学习策略,构建具备价值风格但有别于传统价值Smart Beta的组合。 Voya量化团队共13名成员,从2012年就开始构建基本面机器学习策略,该价值风格产品的选股流程主要如下: 1) 数据处理:获取各公司的基本面、股东、分析师预期等数据以及宏观数据并进行预处理; 2) 特征工程:将原始数据构建成有一定预测效果的因子,如将PE转化成在同类公司中的分位数、时序分位数等,最终得到约250个特征; 3) AI选股:构建AI选股模型,输入特征、输出400-500只优选股票,同时根据交易成本、近期事件等来进行调整,例如根据近期的负面新闻来降低个股权重; 4) 组合构建:对第三步得到的组合,在一定的约束下进行组合优化,同时基金经理对股票进行最终确认和调整; 5) 交易执行:基金经理、交易员确认交易。 可以看到,该策略实际核心是经过特征筛选后的AI选股策略,输入的特征主要为基本面特征,且更强调PE、PB等价值类因子,因此定义为价值风格产品。 该产品在2022年以来确实呈现出了和罗素1000价值更接近的特征,但并未体现出相对指数的优势,2023年小幅跑输,其他阶段相对接近: 我们关注该产品相对罗素 1000 价值的因子暴露情况,并和同基准、近两年表现出色的资本集团的红利价值 ETF CGDV 进行对比,CGDV 2023 年以来跑赢基准超过 20%: AIVL体现了很明显的价值属性,在价值暴露上和基准接近,在成长上暴露更低,说明当输入变量以价值相关指标为主时,产品确实体现了较明显的价值属性,但整体偏小市值、反转的特征也并没有适应美股的市场环境,相比偏大市值、高动量及成长的CGDV处于劣势。根据晨星的风格统计,该产品在价量相关因子上的波动相对较大,而在基本面因子上的暴露在同类中较为稳定。 除了该产品,WisdomTree还有一只同类产品,选股池从美国大盘股转向了全球股票,但同样没有跑赢基准MSCI EAFE价值指数。由此可见,基于基本面数据来构建的AI选股模型未必能够获得比简单的基本面因子选股更好的收益,这可能也是海外头部公募平台较少使用这类方法的原因。 2.4 Invesco:仅将AI作为辅助分析工具 第一部分中我们提到,Invesco 2023年的全球量化投资调查对AI给予了较高的关注度,调查中也发现多数管理人已经开始将机器学习方法应用于投资,并认为未来相关方法的重要性将进一步提升。但Invesco CEO 在2024年初的访谈中提到,公司正在考虑使用生成式AI来提高工作效率,包括在客户宣传、材料整理等方面,但目前暂时不会使用AI来直接进行选股。 对于Invesco的量化团队,其大部分产品是以被动指数产品的形式来呈现,而有一定主动管理成分的“动态多因子”系列采用自上而下的宏观分析框架来决定因子配置,底层的因子构建方式仍然是较为传统的模式。虽然量化基金经理在数年前就开始使用一些机器学习工具来辅助分析,但在短时间内管理人并不倾向于将其结果直接用于投资。 3.其他AI选股产品的策略与表现 在前面的部分中,我们介绍了部分海外头部量化管理人在机器学习方法上的应用方式以及相应观点,而以上机构中除了WisdomTree有专门的AI策略产品、高盛在欧洲有提到使用AI策略的产品,其他机构主要将机器学习作为一种方法加入策略中,未单独设立产品。而在第一部分中,我们提及了境外市场应用AI直接进行选股的产品,本部分中我们对除了WisdomTree、高盛以外的其他产品进行介绍。 3.1 AM-One World Eq Fund with Artificial Intelligence 该产品是日本的一只AI基金,管理人为Asset Management One,采用其深度学习模型进行选股。模型主要使用全球超过10000家上市公司近20 年的财务数据来训练得到股票的收益预测,然后以MSCI Kokusai指数(MSCI世界除日本以外指数)为基准进行组合优化。该产品也未能持续跑赢基准,仅在2021年和今年跑赢了指数,但在多数年份跑赢了Lipper的同类基金池: 3.2 AIEQ:AI Powered Equity ETF 该产品作为美国市场第一只使用AI选股策略的ETF产品成立于2017年,曾经获得了较高的关注,但由于后续未有突出表现,目前规模仅略超1亿美元。产品跟踪AI Powered Equity Index,该指数使用IBM Watson平台进行开发,该平台于2011年就已经推出,是较早期的人工智能平台。 AI Powered Equity Index由EquBot进行开发,实际构建了端到端的选股模型,从iShares Core S&P Total US Stock Market ETF的持仓中进行选股,使用过去10年的基本面、价量、文本等各方面的数据训练模型,并通过最近的宏观数据、过去1个多月的新闻和数据来预测未来一个月的收益,每天运算的数据量超过100万条。随着数据的增多、市场环境的多变,该产品的换手率也在逐年提高,2023年9月结束的2023财年换手率已经高达27倍。我们计算各财年的超额收益以及对应的换手率如下,随着换手率的大幅提升,产品的表现反而有明显的下降: 根据MorningStar计算的近5年相比于同类(美国大盘成长基金)产品在各风格因子上暴露的分位数,发现产品呈现出明显的风格波动较大的情况,基本面因子的5年跨度区间都超过了80%,说明产品对基本面、成长价值风格的偏好不稳定,这一点和AIVL有较大的不同,而在低波、低流动性上的偏好相对稳定,产品也较偏向小市值: 整体来看,产品的风格波动较大、换手较高,呈现出与传统量化、Smart Beta产品不同的特点,但从近两年的表现来看,高换手、风格的灵活性并未能适应美国市场转换成收益,同样也说明AI选股策略仍然面临着较大的挑战。 3.3 QRAFT系列 QRAFT发行的AI选股产品是前面我们列举的所有产品中近两年表现最为出色的。其旗下目前共3只ETF产品,两只为自主开发的19年发行的产品,另一只为和LG合作的2023年新发产品。3只产品的历史半年度相比标普500的超额表现如下: QRFT和AMOM的超额方向整体一致,两只产品近5年的累计超额收益都约为28%,但AMOM更加激进,在2020及2022年下半年至今的时间段表现出色,但2021年到2022年上半年超额回撤明显。 Qraft AI-Enhanced U.S. Large Cap ETF(QRFT)实际更加强调AI在因子配置中的作用,仍然会将因子分为质量、市值、价值、动量和低波五个大类因子,大类因子中同时包含传统因子和机器学习得到的因子,然后通过AI动态学习因子的相关性和预期收益,最终得到组合配置方案。而另一只产品AMOM则主要聚焦动量因子,使用不同计算方法、不同时间区间的动量类因子来训练模型并进行股票的收益预测,两只产品在相对标普500的因子暴露上也体现了较明显的差异: QRFT 目前相对大盘指数的风格偏离程度较低,但历史上的风格波动类似于AIEQ,也较为明显,与其本身在因子配置上动态调整的特征一致: 而AMOM明显更加激进,偏向动量、高波动和成长。从结果表现我们也看到,AMOM近阶段的风格更能适应美国市场的特点,因此近两年表现也较为出色。 而QRAFT与LG合作的LQAI使用的方法论和前面我们看到的高盛、AIEQ等使用的端到端选股模型更相似,通过输入宏观、基本面、价量、文本等不同类型的数据来进行收益预测,每四周计算一次,然后再使用AI优化模型构建100个左右股票的组合。其中文本的部分借助了LG的大语言模型EXAONE。 4.总结 上面部分中,我们分别介绍了头部公募平台对机器学习技术的使用方式、看法以及全球主要的AI选股产品。不同公募平台对AI使用的尺度存在一定分歧,但无论是否使用,都非常强调其中基金经理的主导作用,在如何构建特征、如何进行模型的训练微调等部分都需要人的高度参与,最后如何使用其结果也取决于基金经理的观点。贝莱德、高盛等头部平台目前主要强调AI对文本信息的处理,通过训练自己的大模型,形成输入文本-输出预期收益的预测框架并应用于投资。该方向的延伸方向包括主题挖掘、音频选股等,是目前头部平台最关注的方向。 而对于其他将AI选股直接应用于开发产品的机构来说,其使用的方式也存在差异,主要包括: 1) 基于不同维度数据的端到端模型:输入变量包括宏观、基本面、价量、文本等各维度数据,直接输出股票组合,但从结果来看未能体现持续超额收益能力,近两年对美国市场的适应情况较差; 2) 输入人工处理的特征后构建选股模型,且输入的特征带有一定风格偏向,这类产品中目前偏基本面的表现偏弱,偏价量(动量)的进攻性相对更强但超额波动也较大,说明在美国市场同样具备机器学习方法用于价量信息更有效的特点; 3) 使用机器学习模型对可解释的大类因子进行配置,实际更像一个风格轮动产品,代表产品QRFT近5年累计超额约28%,在同类产品中较为领先。 总结来看,目前综合型的端到端产品结果不佳,这可能也是头部公募量化团队更多在其中一类数据的应用上重点发力的原因;而在不同输入数据构建的模型中,价量优于基本面,尚未有单独的基于文本数据的产品出现;此外,使用机器学习进行传统大类因子配置的框架表现较为出色。 5.风险提示与声明 本报告对于海外产品的研究分析基于公司、Bloomberg、Refinitiv公开信息,本报告不涉及证券投资基金评价业务,不涉及对基金产品的推荐。
大部分微信公众号研报本站已有pdf详细完整版:https://www.wkzk.com/report/(可搜索研报标题关键词或机构名称查询原报告)
郑重声明:悟空智库网发布此信息的目的在于传播更多信息,与本站立场无关,不构成任何投资建议。