首页 > 公众号研报 > 机器能否在股票投资上全面取代人类? ——申万宏源金工对AI选股策略的探索

机器能否在股票投资上全面取代人类? ——申万宏源金工对AI选股策略的探索

作者:微信公众号【申万宏源金工】/ 发布时间:2023-09-06 / 悟空智库整理
(以下内容从申万宏源《机器能否在股票投资上全面取代人类? ——申万宏源金工对AI选股策略的探索》研报附件原文摘录)
  1. 今年以来,量化和AI策略表现出色,主动基本面投资“失灵”了? 2019年至2021年间,得益于消费、新能源等基本面行情的驱动,主动权益基金迎来了一波发展大潮。以同花顺偏股混合型基金指数[701013.TI]为例,2019年至2022年累计收益率98.63%,最高达164%,表现远超宽基指数。特别是2020年,该指数当年收益率达56.17%,相比之下,当年上证指数、中证500、沪深300的收益率分别为12.57%、18.65%、25.50%。这几年间指数增强基金相对指数获得了不错的超额收益,却仍不及主动权益基金,以同花顺增强指数型基金指数[701006.TI]为例,其2020年收益率36.88%,2019年至2022年累计收益率72.57%。 然而,自2022年底开始,随着小股票行情的兴起,传统的主动权益基金表现出现颓势,基本面投资有失灵的趋势。今年以来,A股整体呈现小幅震荡下跌格局,截至2023年8月18日,各宽基指数均有不同程度下跌,上证50、中证500、沪深300分别下跌5.07%,2.99%和2.67%。而偏股基金指数的表现弱于大部分宽基指数,同期跌幅达9.41%。 与主动权益相比,量化与指数增强产品一扫前几年的颓势,在年震荡行情下表现出更好的市场适应性。截至2023年8月18日,指增基金收跌3.29%,整体上优于主动权益基金。 尤其值得关注的是,一批完全依赖人工智能(AI)进行选股的量化策略在此期间脱颖而出,颠覆了传统的投资框架,在投资业绩上也取得了不错的表现。我们这里选取了中证500指增产品中部分可能以AI策略为主的代表性产品为例,几只产品相较标的指数都有较高的超额表现,截至2023年8月18日,如下图所示,这些产品都大幅超越基准,并领先整体指数增强产品。 在2023年Chat GPT横空出世、人工智能技术大规模爆发的背景下,这些具有先进算法的投资策略不仅引发了市场关注,其较为出色业绩也让人不禁质疑:是否我们正处于一个即将由机器在投资领域全面取代人类的时代? 接下来,我们在本文里以一个自建的AI选股策略为例,尝试去解答这个问题,本文的目的并不在于构建一个优异的策略为投资者所参考,而是通过构建策略和对其解析,我们想要以清晰易懂的文字向投资者解答:AI策略如何运作,门槛如何,赚的是什么钱,AI策略的优异之处体现在哪里,最终回到本文的标题,AI能否在投资领域取代人类。 需要说明的是,本文的自建AI选股策略在算法、技术细节上不能代表当前行业的最前沿水平,我们更多是借助这个自建策略为例,去了解AI策略的一些特征,为投资者提供一些参考,对以上问题的回答也建立在我们这个不够先进的模型基础之上,或许对AI的策略认识有所偏颇,也敬请各位读者批评指正。 2. AI是如何选股的? 在本文的第二部分,我们尝试构建一个我们的自有AI策略,并在构建的过程中,去观测AI策略的一些特点,重点解答:AI策略的输入数据和输出数据是什么?构建一个AI模型的门槛高吗?AI策略赚的是什么钱?我们不去展示模型的复杂数学公式和调参细节,而是强调逻辑和一些直观的结论,希望提供给读者一个清晰易懂的框架来理解AI策略。 2.1 AI为什么能够学会选股? 本小节介绍了AI模型强大学习能力的基础——神经网络以及其非线性拟合的特点。本小节涉及AI的一些基础原理,如读者觉得繁琐可跳过该部分,并不影响本文的后续阅读。 在经典的市场分析框架中,如资本资产定价模型(CAPM)或Fama-French三因素模型,都是假设各个变量之间的关系是简单而线性的。 然而,股票市场是一个高度复杂和动态的系统,不只是线性关系影响着股价。事实上,市场上有数不清的宏观和微观因素,这些因素以复杂和多变的非线性方式影响着股价。这种非线性关系难以捉摸,因为它们往往没有一个清晰定义的数学表达式。尤其是当涉及到缺乏明确表达式的非线性关系时,传统的线性模型在捕捉这种复杂性方面具有明显的局限性。 这就是神经网络和其他AI策略发挥作用的地方。与传统的线性模型相比,神经网络能够通过其内部结构来模拟复杂的非线性关系。这主要是通过多层神经元和非线性激活函数的组合来实现的。这样,神经网络可以“学习”未知或难以表达的非线性关系,并据此进行预测。 在神经网络的学习过程中,神经网络会不断调整参数来实现目标,如下图所示,图中的小圆圈可以理解为一个个神经元,红色曲线相当于最终要拟合的函数,从左图一开始只能大致组合成一个自左下到右上的趋势,到图二能有一些弧度,再到图三几乎已经完全拟合了红色权重。这样的一个过程可以作为神经网络拟合的示意图。 正如上面这个例子所示,神经网络在理论上可以拟合任何函数,这是由神经网络的多层结构和激活函数的非线性特性所决定的。只要神经网络具备足够多的神经元和适当的激活函数,它就可以以任何精度拟合任何连续函数。这意味着,神经网络可以表达出任何复杂的函数关系,而不需要事先对函数进行明确的建模或假设特定的函数形式。 2.2 AI可以当基金经理吗? 本小节我们来介绍构建AI策略的框架,这里涉及到一个核心问题,AI策略的基金经理,是管理策略的人,还是AI本身是基金经理? 我们认为,由于AI策略本身具有一定的“黑箱”属性,策略具有一定的不透明性,使得其投资决策过程更接近于AI在担任基金经理,但不完全是。在AI策略中,AI策略最终输出的结果就是预测未来收益率更高的一批股票,而算法如何做出选到这些股票的决策通常是不可解释或难以解释的。在复杂的深度学习策略中,所用到的模型可能包含数百万个参数,即使是专业人员往往也难以准确地解释模型如何到达某个特定决策。 这种黑箱特征使得AI策略与主动投资、PBROE框架以及经典的量化多因子框架都区别开来,在传统的投资框架中,基金经理能清楚的知道这些股票被选入组合的原因,或是经过基本面研究后业绩倍受认可的行业龙头,或是PB够低ROE又足够高的数值,甚或是在估值、动量、成长因子的得分足够高使得综合得分靠前,但只有AI策略,目前选出来的股票是难以被解释的。 AI策略与传统投资框架相比,尤其与同在量化领域的多因子策略相比,选择哪些因子、因子的经济逻辑都是由基金经理决定的,这也使得多传统的量化因子策略是体现基金经理投资理念的工具,而AI策略中基金经理的工作更多体现在算法框架、调参、防止过拟合、换手与敞口限制、跟踪管理等工作,具体选出股票的逻辑不由基金经理体现。 这种黑箱特征可能会在模型表现失效时出现投资者的不信任问题。这一度是量化基金普遍面临的现象,投资者往往只能依据业绩表现选择产品。这个问题在AI策略上被进一步放大了。 但我们说AI并不完全在担任基金经理,离开优秀的投资团队,AI策略从一开始就难以搭建。正如前文所述,投资团队在AI策略担任算法、调参、维护模型等工作,如果缺少框架上的设计和精心调试,模型难以表现出适应市场的特征,也有可能出现过拟合等情况。第二,AI策略选出来的股票仍然要以基金经理为最终决策人。AI策略的股票池最终是否落地投资,是否部分公司有基本面上的瑕疵或者模型与当前风格是否已经出现不匹配,这都赋予基金经理职责进行最终投资决策,并要为最终投资决策负责。第三,即使是策略已经开始运行,投资团队对于后续产品的运作也非常关键。如算法更新带来的框架上的更新,市场结构变化导致模型出现失效后的调试,对于模型运行的跟踪以及对策略收益的理解,这些都是不可或缺的。只是相比传统投资,基金经理的角色以及与AI的关系发生了较大的变化。 接下来,我们用一张简易图展示本文所构建AI策略的过程,尽可能简化其中的繁琐步骤,该架构的建立往往在实盘运行之前需要花费大量时间去构建、测算运行、调整参数等,并不是一蹴而就的。而在实际投资中,大量的细节工作需要去不断的打磨和优化,也是该图所无法体现的。 2.3 搭建AI策略的门槛高吗? 在进一步介绍本文搭建的AI策略特点之前,本小节介绍本文构建AI策略的核心——算法,并进一步解答:搭建AI策略对投资团队人工智能数学模型知识的要求高吗?换言之,不懂原理只会运用的团队能否开发出一个完整的AI选股模型?我们的答案是可以的,即搭建AI策略的门槛可能没有想象中那么高。 人工智能的发展历史可以浓缩为算法的发展史。几十年来从早期的神经网络开始,数学模型上的更新和发展奠定了当代人工智能运用的基础,从早期解决计算问题和进行模拟,到Chat GPT的横空出世,这一切的进步背后都是算法的进步。算法的先进性某种程度上决定了该AI策略的先进性。最先进的人工智能算法成为各大公司的商业机密,不由使人觉得,AI策略的门槛高度依赖于算法的先进性,一定会成为各大头部公司甚至只有互联网公司才能掌握的金钥匙。 但有趣的是,我们发现在证券市场进行选股运用,可能目前而言并不需要最为前沿的技术,本文的所选用的算法核心在1997年就已问世,其算法代码也可以轻易获得互联网开源的代码。但并不妨碍本文构建策略的有效性。我们认为,一方面是因为证券市场的特殊性,其大量时间序列数字数据的特征可能由更匹配的算法来适应更为合适,最新的算法未必最为匹配。另外一方面,虽然算法在1997年就已问世,但过去算力的发展才真正支撑这样的运算常规化完成。 在本文的研究中,我们选用了双向长短时记忆网络(BiLSTM)作为主要的分析工具。接下来我们对该算法以及特征进行简单介绍,如投资者认为这部分内容较为难懂,可跳过该部分,不影响本文后续内容的阅读。 BiLSTM的基础来自长短时记忆网络LSTM,在整个AI算法的发展历程中,LSTM占据了了重要的地位,尤其适合自然语言处理(NLP)和时间序列分析等领域。这一模型是循环神经网络(RNN)的一种扩展,这种拓展使得LSTM和BiLSTM等模型具有特别的结构,允许它们在更长的时间范围内保留和传递信息。这对于捕捉复杂的市场趋势和模式至关重要。 BiLSTM是LSTM的一种变体,双向的LSTM使得前瞻和回顾相结合,让模型更能准确地捕捉市场的复杂模式和趋势。例如,一个股票的涨跌可能不仅受到几天前的市场情况的影响,还可能受到更久远的趋势或周期性影响。BiLSTM在时序预测中的主要优势在于其能够捕获更加复杂和深入的时间序列模式。当面对涨跌多变、信息量大且关系错综复杂的股票市场时,这种能力尤为宝贵。 本文基于BiLSTM 的神经网络的结构如图所示: BiLSTM及LSTM在处理序列数据问题方面曾是一个重要的创新,有效地解决了传统RNN(递归神经网络)的一些局限性,一度成为该领域的主流选择。然而,随着更先进的架构如Transformer的出现,LSTM的使用逐渐被这些高效且功能更强大的模型替代。尽管如此,在某些特定场景和应用中,LSTM仍然展示出其独特和有效的性能。 在AI发展的大背景下,尽管LSTM可能已经相对落后,但它仍然占有重要的地位,尤其在处理时序数据和自然语言处理方面具有不可替代的作用,在本文使用的结果来看,即使不是最新的AI模型,甚至已经在人工智能的理论层面已经有二十余年历史,但模型也足以在后文的测算中提供出色的表现,加之常见神经网络的模型都可以获得开源代码,现阶段AI策略的使用门槛实际已并不高。 当然必须承认的是,本文的纸面测算距离实际投资还有着较大的距离,也不代表业界的最前沿水平,更多的是说明构建起一个可以运行的AI选股策略的门槛不高。 AI策略使用的低门槛可能会导致未来AI策略的广泛使用,而这种广泛使用会反过来提升AI策略的门槛。从目前的算法开源互联网可获得、数据低要求来看,目前使用成熟算法进行AI策略开发不太需要投资策略完全了解其算法的数学模型,仅仅会使用也能开发策略,在当前市场环境下AI策略的有效性必然会激发更多团队尝试开发AI策略,最终相对简单的框架可能会失效,在细节的进一步打磨以及对更先进算法的掌握可能会成为投资团队的必备武器,最终在整体上提升了使用AI策略的门槛。 此外,本文测算过程中LSTM的够用,不代表这种低门槛状态会一直持续下去。且不论本文的回溯与实际投资存在着的较大差距,随着人工智能算法的进步,更先进更强大的算法或许能够对现有的算法实现全方位的替代,也会对AI策略的门槛进一步提升。如未来人工智能如能够对文本识别、新闻识别等拥有更大的能力时,其能力圈或许会超出拥有时间序列特征的LSTM,这些方向也是当前的AI策略团队在不断努力尝试的方向。 2.4 AI策略赚的什么钱? 接下来,本小节通过不同输入信息的策略比较,来看探讨一个主动权益投资人员最为感兴趣的话题:在基本面投资不易获取收益的2023年,AI策略到底赚的是什么钱?对于主动基本面权益投资来说,其收益主要来源于企业的盈利。基金经理和研究员的工作是选出具有持续或增长盈利能力的公司。因此,收益主要是企业盈利能力和市场估值的结果。 传统量化多因子策略采用更为综合的方法,不仅侧重于企业的基本面信息,如财报,还会考虑量价信息。它综合运用多种因子,包括但不限于动量、价值、质量和规模等,以预测股票的未来表现。因此,其收益来自财报和分析师预测的基本面数据,同时也包括部分的量价关系。 而与之相比,基于AI的量化策略收益来源又是如何? 在我们的模型开发过程中,我们一开始选择了将更多信息放进输入信息,包括估值、财报业绩等数据,但最终发现包含了基本面信息生成策略的效果不如只保留量价相关的数据,尤其是近几年量化因子有效性提升后,只对纯量价信息进行学习的策略表现开始显著跑赢,并成为我们最终选取的策略。 以上纯量价的模型是从中证500指数成分股内选股进行指数增强为目标的模型。采用未来21个交易日的累计涨跌幅作为标签,以过去21个交易日的日的数据序列进行拟合,在调仓周期上月度进行调仓。训练验证上,以过去2年作为训练集,抽取20%的样本作为验证集进行训练。流程图如下图所示: 从该策略的输入信息角度来看,可以给出这样的一个结论:AI选股策略主要赚的是量价的钱。这就一方面解释了AI策略近年来表现的强势,策略的优异表现有自身的优势,也与量价有效的市场环境密不可分。也有助于理解AI策略在能力圈上的边界。吸纳了基本面信息的AI策略反而表现更差,这说明至少在本文使用的AI算法里,其对包含了更多文字的基本面信息学习能力并不算强。而且这种能力范围与传统的主动基本面投资几乎完全没有重叠。 下表展示了本文策略最终的输入数据信息,可见几乎全部都是开盘价、收盘价最高价最低价之类的信息,没有任何基本面信息的输入: 当策略构建到这里,似乎可以一定程度上解答本文的标题提问,机器能否在投资上全部取代人类?目前来看如果只做量价的AI是显然不能的,至少不能做到全面替代人类。但我们仍然需要进一步去观察:AI策略在量价上是否展现出了独特的优势?甚至我们需要考虑,未来随着算法的升级迭代,当AI策略对文本、基本面信息的学习能力增强后,能否进一步,真正实现对人类的替代呢? 3. 机器VS人类,谁能胜出? 3.1 AI做投资表现如何? 本文不花篇幅赘述复杂的调参过程,我们直接以上一章构建的组合来看AI选股策略的结果。下图展示了本文构建AI选股策略的效果:从2015年末开始进行分析预测,这些股票被从低到高分为五个不同的组别,最上面的第五组实现了明显大幅超于中证500指数的收益,作为本文构建的AI选股策略的自有组合。 具体来看,2015年末至今,自有组合累计超额收益率达101%,平均年度超额收益率13.38%,在2021年底组合的超额收益有一定幅度的回撤,总体上较为稳定。 右下图展示了AI策略自有组合相对预测收益最低组(空头组合)的超额收益。由于对空头较好的预测能力,分组的多空收益上表现要更好,回测区间累计多空收益142%,平均年度多空收益率18.77%,但也在2021年底出现一定幅度回撤。 具体到各个年份上,在整体行情较好的2019至2021年,组合基准与第五档自有组合本身都有不错的年度收益,并且在行情上行时,自有组合有着更高的超额收益。2023年以来,自有组合表现强劲,本年度至今累计收益率10.78%,超基准收益率7.73%。 我们将自有组合与其他市场上规模较大的中证500指数增强产品比较。从2015年末以来,自有组合累计收益率64.34%,在主动权益表现较强的大年收益有所落后,进入2022年下半年后,量价因子表现开始提升,自有组合表现开始领先,在2023年有着较为突出的表现。 因此可以看到,虽然输入信息仅仅包含了量价信息,但策略仍然表现优异,从模拟回溯的数据上超越了传统指数增强产品。即使只做量价,AI策略也展现出了优异的业绩和独特的优势。 3.2 机器的行为特征分析:AI做起投资来是像人还是像机器? AI策略的独特和优异的业绩来自于哪里?本小节我们从归因的角度去探索AI策略在一些风格敞口上是否有规律可循,从而进一步探讨:AI做起投资来是像人还是更像一个纪律化的投资体系? 3.2.1 市值特征:最佳的观察窗口 我们这里以组合的市值特征为例,通过组合在市场上是偏大市值、还是小市值,以及后市市值风格对组合带来的贡献,去观察AI策略本身行为特征。其他角度的分析内容由于篇幅关系放在附录中,在结论上总体是一致的。 每个投资组合都天然具有的市值属性,市值也往往具有明显的阶段性趋势,在历史上也发生过几次大的风格切换,这也便于我们进行观察。我们将自有组合的市值大小与中证500指数的平均市值大小进行对比,并结合未来的收益表现情况:当市值收益表现为正时,说明大市值个股在未来一期中表现相对更好,为负时说明小市值表现更好。 从月度数据来看,自2015年末开始,AI自有组合的市值大小上与中证500指数的平均市值大小走势变化基本相似,但是在市值收益表现持续为正或为负的周期中,组合的市值水平相较中证500均值会表现得更高或更低。 从下图可知,2016年时AI策略的持仓市值要大幅小于指数水平,而此时也是小市值更有效的时间(大小市值收益表现在零轴以下),而随着2017年至2020年整体大市值表现更好时,AI策略持仓市值又快速上升超过了指数的市值水平,可见AI策略十分有效且幅度较大的坚决跟随市值风格的收益表现进行及时调整。2021年以来,市值风格再次反转,小市值开始变得更好,而从2021年开始,自有组合的市值也迅速下降至小于500成份股的市值水平。 那么,AI策略是不是在市值特征上只是简单的追逐当前更好的市场风格呢?为了进一步验证,我们选取了市值收益表现的显著转向期区间内进行了日度分析。 总体上,我们选择了两个较为明显的反转区间,第一个区间为2016年末起市值的收益表现开始由负转正,及由小市值转向大市值;第二个区间为2021年起市值收益表现降低,小市值因子开始转暖。 我们分别考察了这两个不同的时间区间,在第一个区间里,市值收益的表现在2017年初经过一定的波动后从小市值更优转换到了大市值更优,从整体这段区间来看,AI策略的持仓市值随着市场风格的切换从小市值风格切换到了大市值,整体一路上行,但中间也有一些来回反复的调整,尤其是2017年年中还经历了一些反复的切换。在这些时间更短的切换中,我们发现AI策略的持仓市值并不完全跟着市场走,在2016年9月底发生了小市值表现变强而组合调整持仓市值大幅度上升的情况,在2017年1月也发生了大市值略占优势但组合持仓市值提前快速下降的情况,从AI策略持仓市值的特征来看,也会经常做出一些提前判断拐点的行为,反向调整持仓市值风格,这些拐点的判断往往具有领先性而贡献一定幅度的收益,但并不能总是判断对。 第二个区间为2021年小市值因子开始转暖。在第二个时间区间中,特别是在2021年,大小市值的收益表现经历了初期的震荡,并最终转向小市值。这一阶段我们也观察到模型的市值大小经历了显著波动,与2017年相似,AI策略的持仓市值在波动中最终市值风格一路变小。 类似的,AI策略持仓市值风格也经常发生突然性的大幅度变化,在部分阶段展现出了对拐点的提前判断能力。这种频繁、大幅度的市值风格变化也一定程度上展示了AI策略的行为特征:AI策略不仅整体在趋势上跟随市场风格,短期有提前判断拐点的能力,还在调整时非常坚决,风格调整幅度剧烈。那么,AI策略在趋势行情里是否会因为短期的频繁调整而造成损失呢? 接下来,我们特别关注了自2019年第二季度以来大市值表现持续占优的时期。在初期市值表现暂时性从大市值转向中性时,模型在初期大幅下调了持仓市值风格,延续了AI策略风格大幅度频繁调整的特点,不过在随后下一期进行了及时更正。模型在后续时期内持续保持了相对于500指数的更高的市值,也充分享受了大市值占优时期的市值收益。也就是说,AI也能够在风格趋势持续的时候维持市值风格,充分获得风格趋势的收益。 基本上,在以上三个区间的观察中,我们对于AI策略的行为不断提出一个延续性的动作,但每次都被接下来的观察否定。一开始我们关注到AI策略的持仓市值风格跟随市场而变,我们会简单的以为AI只是追逐市场风格的趋势,但随后我们发现AI策略在短期经常去做市值风格的大幅度反转,并有一定的提前预测拐点能力,接下来我们猜测AI总是在尝试预测拐点的话在趋势行情会不会受损,结果AI策略又在趋势行情中保持了持仓市值的风格,AI策略在风格上的多变性没有明显的规律,使得整个AI策略的行为特征并不像一套纪律化的风格动量-拥挤度二维框架,而是更像人一样跟随市场而变化。 还有一个很有意思的视角是:实际上本文的AI策略在构建时输入信息没有包含市值信息,AI策略在市值上的暴露更多是通过股价、成交量等因素得到的结果。但并不妨碍AI策略在持仓市值上整体做出正确的判断,并持续获得市值风格带来的收益。我们在附录里放了其他更接近AI原始输入信息的量价敞口变化特征,基本结论是一致的。未来AI策略对数据信息的利用是否会进一步进化,以及展示出的风格特征值得关注。 3.2.2 AI更像人是优势还是劣势? 在前文对模型表现在各个因子上的暴露关系、今年以来收益表现来看,AI策略在历史区间内基本表现出以下几个重要特征: 1. AI做起投资来更像是人,有时候坚决大幅度调整持仓风格,甚至去尝试提前预测拐点,有时候能够在趋势行情里维持风格,没有明显的规律特征:与一个纪律化、规则固定的投资系统相比,AI策略更多变,更像实际的一个人在因子敞口的暴露上进行调整,有时会进行频繁的反转,有时也会长期跟随因子的动量。它能够像一个经验丰富的投资者那样,根据市场条件和因子动态地调整敞口,这种灵活性使AI策略能够迅速应对市场变化,及时调整组合。 2. AI组合的灵活性同样也是双刃剑:AI策略的灵活性不禁让人期待未来更强大的算法更新迭代之后,其策略的特征是否会进一步完善和强大。但这种更像人的灵活性也同样是双刃剑,如果单纯从市值风格来看,AI策略的收益来源既有市值风格的趋势,也有尝试提前预测拐点并预测正确的风格反转,如果AI策略发生回撤,对于理解回撤可能会有难度。 3. AI策略在量价上的处理有独特优势,其符号方向可变、大幅度调整、灵活跟随市场使用趋势和反转都是传统线性量价因子难以做到的:虽然前面我们提到AI策略由于能力圈更多体现在量价方面,对人的替代性有限,但仅就量价这个领域而言,AI策略相比传统多因子的量价使用有着独特的优势。如上文所述,以市值风格为例,传统市值因子的使用往往只是单个方向暴露小市值,经常会遭遇市场波动,使得很多量化团队会追求市值风格的中性化,但AI策略在市值风格上符号方向可变,小市值好的时候持仓市值偏小,大市值强的时候持仓市值偏大,还经常进行幅度较大的调整,尝试去预测拐点,这种预测拐点的行为也是传统偏因子动量的多因子框架难以实现的,目前在量价领域,AI策略确实有独特的优势。 3.3 AI vs人类,各自优势何在? 3.3.1 AI策略能跑赢今年最强的传统量价因子吗? 从前文所致,AI策略在量价上有一些独特优势,且今年以来的优异表现与量价在今年本身表现较好有很大关系。这里我们以今年表现最好的低波为例。我们将过去一个月波动率按自有组合相同的调仓周期进行分组、并计算累计收益。可以看出,波动率最低的第一组,即低波分组,在今年4月后表现突出,进入7月后更是有较大涨幅。截止至2023年7月28日,累计收益率达14.71%,传统量价因子在今年的表现也非常出色。 相比而言,尽管AI策略在量价方面显示出明显的强项,如能在风格的方向和敞口进行灵活的调整,但这并不意味着它总能胜过表现最优秀的传统量价因子。从历史表现来看,即便是最先进的AI策略也可能无法超越 “正确答案”的单因子:单一但表现出色的传统量化因子。 当然了,这样的比较并不公平,波动率的有效性属于后视镜,即使AI策略也无法预测,我们只是想借此说明,AI策略在量价非线性以及灵活性上的优势,并不意味着它可以完全取代传统的线性量价因子。两者在不同的市场环境和投资目标下可能各有所长,也可能会互为补充,共同构成更为全面和高效的投资策略。 3.3.2 人类相较AI策略存在优势 通过之前的分析,我们对AI擅长什么,不擅长什么有了一定的了解。对主动权益基金经理来说,对上市公司基本面的深入分析、调研获得的信息、对宏观经济环境变化后的判断短期都是AI策略仍然难以复制的。AI策略在处理量化数据方面有明显优势,可以在高速和大规模的情境下处理数值和统计信息,但目前在文本识别、在基本面的分析上相对有限。未来随着AI算法的更新迭代这个方向会出现怎样的变化值得跟踪和期待。 从目前而言,AI策略和主动权益基本面投资各自的优势领域基本上是和量化与主动基本面投资的优势领域相似的,AI策略更擅长量价,以及与量价关系紧密的小股票,主动基本面投资更擅长关注基本面,以及与基本面关系紧密的大股票。 这种关系具体到了量化领域内部,AI策略与传统多因子首先并不相互排斥,AI策略在量价上的非线性和灵活性可以成为部分量价因子的替代,在门槛不算高的情况下,如果我们把AI策略视作一个大号的复合量价因子,也能够成为量化基金经理的有力工具。 事实上,如果把AI策略视作一个大号的复合量价因子,在对AI策略的使用上还可以一定程度降低其黑箱属性带来的影响,在通常的多因子框架里,因子的选取和权重往往是根据因子前期的表现,即本质上是在做因子的动量。当AI策略成为一个因子后,不论本身的表现可解释性如何,组合只根据因子的表现来选择配或者不配,以及配多少的AI策略,或许能成为传统多因子框架使用AI策略的合适方式。 上面这种思路也可以进一步拓展到完全以AI进行选股的策略上,比如同时使用不同的算法构建各自独立的AI因子,只要预测目标是股票收益率,这些子策略都可以成为一个个独立的因子,最终通过因子动量的方式组合起来。从而减少单一策略失效可能带来的影响。 4. 没有永远的成长,只有永远的周期 4.1 未来AI可能的演变路径 近年来随着技术的进步,基于Transformer架构的大模型,如ChatGPT,已在各种任务中展现出卓越的通用性能力,像ChatGPT这样的生成式AI算法正在为我们揭示了一个新时代的前景。这些模型的成功背后是强大的算法与大规模的参数结合所带来的巨大能力。这类大模型,被誉为未来的"超级模型",其是“大算力+强算法”相结合的产物,代表了人工智能领域未来的发展方向。 未来在新的架构、更强算力的支持下,更多参数的模型可以被开发出来,以及AI策略本身对文本、新闻等目前不擅长的领域都有可能带来长足的进步,这种进步会如何影响到AI选股策略与主动基本面投资的优劣势关系是一个有趣的话题,值得未来跟踪和关注。 此外,一些有意思的未来发展方向包括: 预训练和通用数据集:预训练模型,即在大规模通用数据集上训练完成的模型,通常更容易迁移到其他任务或领域。这样的训练模式使得模型能在短时间内适应不同类型的任务,提高了模型的灵活性和广泛适用性。 迁移学习和少样本学习:随着迁移学习技术逐渐成熟,在少样本或无样本的条件下,先进的迁移学习算法能让模型快速适应并表现出良好的性能。 云计算:由于AI模型,特别是大型模型,通常需要巨大的计算力,云计算不仅提供了几乎无限的计算能力,还允许模型在分布式环境下更高效地训练。 4.2 算力会如何影响AI策略 近年来,算力的快速提升也在影响着人工智能的发展。如我们在之前所说,神经网络的相关经典理论基础实际已提出很长一段时间,但随着算力的提升,相关应用的实现开始纷纷涌现。 我们认为算力对AI策略有如下影响: 1,算力的提升使得AI策略的使用门槛降低,才使得AI选股有了可行性 如前文所述,当前AI策略的门槛降低也依赖于算力的提升。才使得早就提出的神经网络模型得以实现,AI策略才有了可行性。 2. 算力的提升可以满足参数需求的增加 目前ChatGPT之所以表现出高度的智能和泛化能力,是因为它具有上百亿的模型参数。未来更复杂、更先进的AI算法可能都需要更多的参数计算,算力的提升才能支持AI策略在未来拓展能力边界。 3. 算力的提升可以加快AI选股模型的更新频率 当前市场环境下,算力对AI策略最为直接的影响是:算力的提升可以加速AI选股模型的更新频率,从而拥有更新的信息优势,将算力优势转化为收益优势。如将每日更新的AI选股模型未来拓展为半天更新,甚至进一步缩短为每个小时更新,这种与时间赛跑的模式高度依赖强大的算力,这种状态的极限为:AI实时学习实时行情。当然,在公募平台由于风控和集中交易的要求,这种“军备竞赛“将是有极限的。 4.3 给主动权益的建议:静待基本面归来 在本篇报告的最后,我们来谈谈我们对于主动权益投资人员,面对AI选股策略的发展,是积极吸收量化策略,还是利用AI为我所用?还是静待基本面归来?我们给整个第四章起的题目为:没有永远的成长,只有永远的周期,代表了我们的观点,虽然未来AI策略可能在文本识别、基本面方向上有长足的进步,但目前而言,AI策略更突出的优势还是在2023年这种中小市值风格、量价为主的市场环境,但在AI策略没有进一步的进化之前,这种市场风格都是周期性而非持续的,也使得AI更适合的环境也是周期性的。 在这种基本面投资相对弱势的环境下,主动权益投资是否需要吸收量化的一些思路,如使用量化进行初筛,主动再进一步进行个股优选呢?实际上,量化的股票池能够体现出量价等因子上的优势,必须依赖大数定理,必须要求大量股票和反复尝试才能在统计上实现统计规律,而基本面投资集中持股的特征失去了统计规律的特点,两者往往很难兼容。 另外一种结合的方式是:在基本面持仓的基础之上,量化或AI策略通过短期量价判断,给出一些短期的交易性观点,即基本面投资在维持对上市公司基本面观点不变的情况下,可以通过一些交易来进行增厚,这种模式的优点是可以不改变主动权益的基本框架,缺点是增加了大量的交易成本,而且这些交易依然缺乏必胜的概率,只能通过大量重复来提供超额,对于主动基本面投资来说可能是难以坚持的。 因此,当前而言,我们对主动权益投资人员的建议仍然是,坚守基本面投资,静待基本面行情归来。从历史上来看,基本面行情下量价指标的有效性会迅速降低,甚至连技术指标的有效性都会有所下降。两者存在着此消彼长的关系,当前有效的量价可能会在未来周期性效果减弱,而那时候正是基本面投资最适合的时候。 其次,主动基本面投资不可能通过在量化的领域通过吸收量化来战胜量化,反而由于两者在框架上的差异、收益来源的差异有着根本的不同,正如不同基金经理在成长风格、价值风格上的能力圈差异一样,我们更建议只要基本面的判断没有问题,仍然应该在能力圈内坚守。 在本文的最后,我们仍然回避不了本文之中反复提到的一个问题,虽然AI策略当前更多依赖量价行情,但是当AI选股策略进一步进化,主动权益基本面投资未来是否在基本面领域上遭遇AI的挑战?我们不足以成为观点的设想是:一方面,AI挑战基本面投资意味着对文本、新闻,甚至视频音频等全网信息都有着较好的学习能力,还需要比较长的时间,另一方面,量价投资是零和游戏,而基本面投资不是。AI策略在量价的普遍使用将会使得量价收益衰减归零,而AI在基本面投资领域的普遍使用,通过全网公开信息的整理,使得基本面投资业绩以外的收益加速归零,极限状态下将使得全市场的基本面投资都只赚企业盈利的收益,或许反而使得基本面投资变得更加纯粹,当然了,以上设想仅供参考。 5. 附录:对3.2.1其他因子份额表现分析 估值因子 在估值因子方面,特别关注了市盈率(PE)和市净率(PB)这两个关键指标。模型在面对正向的估值因子IC时,更倾向于增大其估值因子暴露,其中PB因子的影响尤为显著。在2019至2021年期间,当PB因子IC持续为正时,我们的自有组合在PB暴露上大幅度超过了中证500的平均水平。然而,自2023年以来,随着估值因子IC的持续下滑,低估值股票开始表现出色,这也导致自有组合在估值因子暴露上出现显著下调,大部分时间段低于中证500的平均水平。 波动率、流动性 在波动率和流动性方面,模型的表现与市值因子有相似之处。相对于中证500的平均因子暴露,模型在这两个因子上展示出更大的波动性和更为敏捷、剧烈的调整,对市场行情的转变表现出高度敏感性。当中证500的相关因子的信息系数(IC)由正转负或由负转正时,自有组合的因子暴露通常会明显地跟随变化,表现出对IC正负双向变化的灵敏反应。 自2023年初以来,中证500在波动率和流动性方面先是呈现出上升的IC趋势,但近期开始出现下滑。与此相应,自有组合的波动率和流动性因子暴露在IC转为正面时迅速增加,并在6月份的最新期间快速调整,显著降低了因子暴露水平。 动量因子 动量因子也表现出类似的特征,不过总体上与中证500的平均因子暴露贴合的更紧密,在差距上表现较小。仅在2019年末至2021年初,动量因子持续表现出持续的正向IC时,组合才给予了较高的动量因子暴露。 动量因子方面,我们重点考察21年至22年“看起来做反,实际有道理”的区间,模型似乎表现出和市值类似的结果,对动量因子IC缓慢的下降表现出一定的超前反应,但处于因子反转的时期,学习上出现一定的困难,但震荡中依然选择提前降低动量因子的暴露,在因子暴露的趋势走势上与500表现出明显差异。 对于动量因子,我们重点考察了2021年至2022年这一段时间。在此期间,动量因子在中证500成份股上的IC有一段较为明显的增长,但结合未来的趋势来看,IC是将要降低并在总体上转向负向的。在这一时期,模型做出了相对提前的反应,在短期里表现出了反向的操作,但实际上具有一定的选择意义。拆解到日度数据来看,从2021年初至202382年的一季度,自有组合的动量因子暴露在2021年前几个季度持续震荡下降,并在2021年末动量因子开始转为负向IC关系时,提前布局到相比中证500更低的动量因子暴露水平,反映出了一定的布局的提前性。 6. 风险提示及声明 模型根据股票历史数据、Wind和同花顺等第三方数据构建,历史表现不代表未来,市场环境发生巨大变化时模型可能失效。本报告不涉及对未来走势的预测。阅读本报告时,投资者需结合自身风险偏好及风险承受能力,充分理解产品的波动、风格、历史表现、风险等因素。本报告不涉及基金评价业务,不涉及对基金公司、基金经理、基金产品的推荐。

大部分微信公众号研报本站已有pdf详细完整版:https://www.wkzk.com/report/(可搜索研报标题关键词或机构名称查询原报告)

郑重声明:悟空智库网发布此信息的目的在于传播更多信息,与本站立场无关,不构成任何投资建议。