首页 > 公众号研报 > “海量”专题(221)——高频因子在量化选股策略中已不可或缺?以中证1000增强为例

“海量”专题(221)——高频因子在量化选股策略中已不可或缺?以中证1000增强为例

作者:微信公众号【海通量化团队】/ 发布时间:2023-01-10 / 悟空智库整理
(以下内容从海通证券《“海量”专题(221)——高频因子在量化选股策略中已不可或缺?以中证1000增强为例》研报附件原文摘录)
  重要提示:《证券期货投资者适当性管理办法》于2017年7月1日起正式实施,通过本微信订阅号发布的观点和信息仅供海通证券的专业投资者参考,完整的投资观点应以海通证券研究所发布的完整报告为准。若您并非海通证券客户中的专业投资者,为控制投资风险,请取消订阅、接收或使用本订阅号中的任何信息。本订阅号难以设置访问权限,若给您造成不便,敬请谅解。我司不会因为关注、收到或阅读本订阅号推送内容而视相关人员为客户;市场有风险,投资需谨慎。 简介 近年来,随着国内量化私募的蓬勃发展,量化策略的迭代和更新不断加速。即使是对于公募量化而言,仅依赖传统的低频量价或基本面因子,在愈发激烈的竞争环境中已很难获得持续的领先优势。根据我们最近一年的同业交流和调研分析,新的信息来源是当前所有量化从业人员颇为关注的话题之一。而这其中又以高频信号和Alpha捕捉系统(Alpha Capture System,ACS)最受认可,并广为应用。 本文通过分析高频因子在不同空间内的选股表现,并以1000增强为例,初步探讨高频信号对当前量化选股策略的意义。 01 引言 2018年至今,海通量化团队已陆续开发了一系列高频因子。根据因子的特性,我们大致可将这些高频因子划分为反转型、动量型和深度学习类。反转型高频因子着重刻画投资者过度反应的行为特征,往往偏向于选择前期跌幅较大或换手率较低的股票;动量型高频因子更多刻画投资者的买入意愿、盘口的资金流向或具有信息优势投资者的交易行为;深度学习类高频因子以过去一段时间的高频特征作为输入,动态拟合近期有效的交易模式,通常适用于未来较短的时间窗口。 下表展示了我们持续跟踪且长期有效性较好的高频因子,具体的因子定义及计算方式可参考对应的专题报告。 测试过程中的设定包括,(1)使用2014年以来的高频数据;(2)统一计算过去20个交易日的均值作为因子值;(3)同时测试原始因子和剔除行业、市值、换手与反转的正交因子;(4)深度学习类高频因子只测试周度选股能力,其余因子分别测试月度和周度;(5)测试范围为中证800指数内/外、中证1000指数内、中证800与中证1000外;(6)单因子测试时,不考虑交易费用。 02 高频因子选股能力测试 2.1 高频因子月度选股能力测试 2.1.1 反转型高频因子 以下两图分别展示了正交前后,反转型高频因子在不同选股空间中月均IC的绝对值。(本文中的IC均为取绝对值后的数值。)改进反转因子正交前后的IC差异较小,而尾盘成交占比因子正交后的IC有明显提升;其余4个因子在正交后,IC均出现了较为明显的下降。 若从不同选股空间内的表现来看,正交前,除尾盘成交占比外,其余因子均是在中证800与中证1000外的小盘股中,IC更高;但正交后,除改进反转以外,其他因子的IC对选股空间并不十分敏感。 对于选股因子而言,除了IC,很多时候我们更关注它的多头超额收益(视因子选股方向而定,选股范围内因子值最高或最低的10%股票形成多头组合,等权重加权后相对所有股票等权组合的超额收益,下同)。由以下两图可见,和IC的结果较为类似,正交前,尾盘成交占比表现不佳,其余5个因子的年化多头超额收益大体在8%-14%之间。相对而言,在市值偏小的股票中(中证800外或中证800与中证1000外),这5个因子的表现都更好。 正交对尾盘成交占比、高频偏度、下行波动占比和大单推动涨幅的多头超额收益都有明显的影响,但影响结果大相径庭。尾盘成交占比因子正交后的有效性和稳定性均大幅提升,中证1000内的年化多头超额收益达到8%。而后三个因子的表现则显著下滑,大单推动涨幅更是直接失效。 改进反转和平均单笔流出金额占比受到正交的影响较小,年化多头超额收益变化不大。正交后,这两个因子在中证800与中证1000外的多头超额收益最高。 结合正交后的因子IC与年化多头超额收益,我们认为,在反转型高频因子中,改进反转、尾盘成交占比和平均单笔流出金额占比三个因子在不同的选股空间内,都具备较强的选股有效性。而在中证1000内,它们的多头超额收益更是达到8%或以上。因此,仅从单因子的角度,我们有理由期待这三个因子加入多因子模型会有较为积极的贡献。 2.1.2 动量型高频因子 如以下两图所示,动量型高频因子和反转型高频因子的表现差异明显。首先,正交前,动量型高频因子的月均IC在0.03-0.05之间,不及反转型高频因子;其次,反转型高频因子通常在中证800以外的选股空间内表现更好,而动量型因子对选股空间的敏感性较低,后两个大单类因子更是在中证800内的IC最高;第三,正交并未显著影响动量型高频因子的有效性,IC的变化较小,且正交后的因子在各选股空间内的表现接近。 从多头年化超额收益的角度来看,正交前,动量型高频因子的表现相对一般,在不同选股空间内的差异也较小。正交后,年化多头超额收益普遍提升至10%左右,改善较为明显。结合因子IC,我们认为,因子在中证800外或中证1000内的表现较为出色。 2.1.3 正交因子多头超额收益对比 由前两节的结论可知,高频因子在中证800外或中证1000内的表现相对更好,因此在构建中小盘策略或中证1000指数增强组合时,引入高频因子应是较为理想的选择。不过,考虑到因子表现的差异,适当的筛选也是必要的。为此,我们将所有反转型和动量型高频因子的年化多头超额收益进行了对比,结果如以下两图所示。 在中证800外,平均单笔流出金额占比、开盘后买入意愿占比和开盘后大单净买入占比的年化多头超额收益均在10%以上。在中证1000内,这3个因子的表现同样突出。同时,改进反转和尾盘成交占比因子也与它们较为接近。平均单笔流出金额占比因子的年化多头超额收益虽不逊于动量型高频因子,但IC仅为0.02(图2),对多因子模型的贡献存疑。 综上所述,我们认为,仅就过去9年的历史回测而言,高频因子的月度选股表现还是比较优异而稳定的,对传统的因子选股策略是一个十分有力的补充。进一步,若是构建中证1000增强策略,4个动量型高频因子及反转型高频因子中的改进反转和尾盘成交占比都可考虑纳入收益预测模型。 2.2 高频因子周度选股能力测试 2.2.1 反转型高频因子 当交易频率从月度提升至周度后,除尾盘成交占比外,其他反转型高频因子正交前的年化多头超额收益都有了显著提升,并且在中证800与中证1000外的表现最优。正交改变了部分因子的有效性,如尾盘成交占比,不同范围内的年化多头超额收益达到了10%或以上;而高频偏度、下行波动占比和大单推动涨幅几近失效。和月度下的结果类似,改进反转和平均单笔流出金额占比正交前后的表现较为接近。 2.2.2 动量型高频因子 正交前,两类因子在不同选股空间内的年化多头超额收益并无显著差异,但大单类高频因子的表现显著优于买入意愿类。正交后,动量型高频因子在中证800内的年化多头超额收益没有明显变化,而在其余选股空间内则进一步提升;除中证800内,买入类高频因子的年化多头超额收益约为10%-15%,大单类高频因子约为15%-20%。 2.2.3 深度学习类高频因子 和前文介绍的反转型和动量型(下简称“人工逻辑”)高频因子相比,在周度这样较快的调仓频率下,深度学习高频因子的选股能力大幅领先。年化多头超额收益在中证800内为15%;在中证1000内,提升1倍至30%;在市值更小的中证800与中证1000外,更是达到40%。由此可见,深度学习高频因子较为适用于中小盘股票。 由于我们在深度学习模型中已添加正交层,因此训练得到的因子在与低频风格和技术类因子正交后,年化多头超额收益并未受到明显的影响。有关正交层添加的详细介绍,请参考报告《选股因子系列研究(七十七)——改进深度学习高频因子的9个尝试》。 2.2.4 正交因子多头超额收益对比 和月度类似,我们同样横向对比了中证800外及中证1000内,各高频因子的周度选股表现。如以下两图所示,反转型高频因子中的改进反转、尾盘成交占比、平均单笔流出金额占比和动量类高频因子的年化多头超额收益在15%-20%之间,而深度学习高频因子则可进一步达到25%以上。 至此,本文已详细测试了所有高频因子。尽管该领域当前的竞争尤为激烈,但从我们定期跟踪的《高频因子选股周报》来看,其中的部分依然具备较强的生命力,因此,随着alpha来源的逐渐稀缺以及整个公募量化对高频数据和信号的接受与应用程度越来越高,我们认为,高频因子已经成为量化选股策略中不可或缺的一种因子类型。 下文将以中证1000增强为例,展示引入高频因子前后,收益风险特征的变化。 03 引入高频因子的中证1000指数增强组合 本文在构建中证1000指数增强组合时,收益预测模型中所使用的基础因子包括:市值、中盘(市值三次方)、估值、换手、反转、波动,并分有无基本面因子(盈利与SUE)两种情况讨论。随后,我们逐步引入反转型、动量型和改进深度学习三类高频因子,考察组合收益的变化。 在预测个股收益时,我们首先采用回归法得到因子溢价,再计算最近12个月的因子溢价均值估计下期的因子溢价,最后乘以最新一期的因子值。 风险控制模型包括以下几个方面的约束: 1) 个股偏离:相对基准的偏离幅度不超过0.5%/1%/2%; 2) 因子敞口:市值、估值中性、常规低频因子≤ ±0.5,高频因子≤ ±2.0; 3) 行业偏离:严格中性/行业偏离上限2%/行业偏离上限4%; 4) 换仓频率:周度; 5) 换手率限制:单次单边换手不超过30%。 组合的优化目标为最大化预期收益,目标函数如下所示: 其中,wi为组合中股票i的权重,μi为股票i的预期超额收益。为使本文的结论贴近实践,如无特别说明,下文的测算均假定以次日均价成交,同时扣除3‰的交易成本。 我们先不考虑改进深度学习高频因子,对比引入高频因子前后组合的年化超额收益。 由上表可见,首先,即使是周度调仓,加入基本面因子依然是更好的选择,尽管其权重在较短的收益预测周期内必然较低;其次,引入(反转型或动量型)高频因子,均可显著提升年化超额收益,幅度最高可达10%;第三,同时引入反转型和动量型高频因子,并不一定能带来超额收益的进一步提升。这表明,和低频因子一样,有必要对高频因子进行挑选。 如下表所示,继续引入改进深度学习高频因子后,年化超额收益再度稳定提升。2016年以来,各种假设下都可达到20%(有基本面因子)。如果根据前文的单因子分析结果精简人工逻辑高频因子(只保留:尾盘成交占比、开盘后买入意愿强度和开盘后大单净买入占比,下同),年化超额收益则可稳定在24%以上(有基本面因子)。在较为宽松的约束下,甚至可以达到28%,与私募的平均水平相当。 和不引入任何高频因子的原始组合相比,年化超额收益的提升幅度在9.6%-16.2%之间。足见,对于最传统的、以线性加权为基础的中证1000增强策略,高频因子可谓是较为强有力的信息源补充。 下表展示了约束条件为行业中性+个股基准偏离1%的组合的分年度收益风险特征。 2016年以来,组合年化超额收益24.3%;2022年,累计超额收益10.4%。全区间最大相对回撤4.6%,年化跟踪误差5.3%,月胜率87%。 若可以容忍更大的跟踪误差,也可进一步放松组合的风险约束,换取更高的收益。例如,保持个股偏离仍为1%,但行业偏离的上限增加至4%,分年度的收益风险特征如下表所示。 放松行业约束后,组合的年化超额收益上升至26.4%;尤其是2022年,收益改善较为明显,从行业中性时的10.4%提高到18.2%。但与此同时,风险也不可避免地增加,全区间最大相对回撤从4.6%升至7.5%,跟踪误差从5.3%升至6.3%。 对于公募而言,标准的指数增强还有80%成分股权重的约束。但从下表的对比来看,是否添加这一约束,对中证1000增强组合收益表现的影响并不是那么大。在较为宽松的行业和个股偏离约束下,年化超额收益约为25%-27%。 在和表5及图20同约束的基础上,再引入80%成分股权重的约束,组合的分年度收益风险特征如下表所示。 2016年以来,组合年化超额收益27.7%,2022年为17.6%。全区间最大相对回撤和跟踪误差分别为5.2%和5.9%,对比没有成分股约束时,有一定幅度的下降。 综上所述,对于公募和私募近一年着力布局的中小盘量化策略及中证1000增强,高频因子能够在不明显增加风险的条件下,显著提升收益表现,已成为当前一类非常重要的alpha来源。 04 总结 寻找新的alpha源,是量化投资最基础的命题之一,而高频恰好是最近3-5年国内发展极为迅速的一个新兴领域。那么,对于交易和换手都有较为严格限制的公募量化而言,是否有必要研究乃至应用高频数据生成的相关信号?本文尝试给出我们的答案。 2018年至今,海通量化团队已陆续开发了一系列高频因子。根据因子的特性,我们大致可将这些高频因子划分为反转型、动量型和深度学习类。反转型高频因子着重刻画投资者过度反应的行为特征,往往偏向于选择前期跌幅较大或换手率较低的股票;动量型高频因子更多刻画投资者的买入意愿、盘口的资金流向或具有信息优势投资者的交易行为;深度学习类高频因子以过去一段时间的高频特征作为输入,动态拟合近期有效的交易模式,通常适用于未来较短的时间窗口。 仅就过去9年的历史回测而言,高频因子的整体表现还是比较优异而稳定的,对传统的因子选股策略是一个十分有力的补充。周度调仓假设下,在中证800外及中证1000内这两个选股空间,反转型高频因子中的改进反转、尾盘成交占比、平均单笔流出金额占比和动量类高频因子的年化多头超额收益在15%-20%之间,而深度学习高频因子则可进一步达到25%以上。 高频因子已经成为量化选股策略中不可或缺的一种因子类型。以最传统的线性加权为基础的中证1000增强策略为例,2016年以来,引入精简后的人工逻辑高频因子和深度学习高频因子,各种约束条件下的年化超额收益都可稳定在24%以上。在较为宽松的约束下,甚至可以达到28%,和私募的平均水平接近。相对未引入任何高频因子的原始策略,年化超额收益的提升幅度在9.6%-16.2%之间。 05 风险提示 市场系统性风险、资产流动性风险、政策变动风险、因子失效风险。 联系人 袁林青 021-23212230 法律声明: 本公众订阅号(微信号:海通量化团队)为海通证券研究所金融工程运营的唯一官方订阅号,本订阅号所载内容仅供海通证券的专业投资者参考使用,仅供在新媒体背景下的研究观点交流;普通个人投资者由于缺乏对研究观点或报告的解读能力,使用订阅号相关信息或造成投资损失,请务必取消订阅本订阅号,海通证券不会因任何接收人收到本订阅号内容而视其为客户。 本订阅号不是海通研究报告的发布平台,客户仍需以海通研究所通过研究报告发布平台正式发布的完整报告为准。 市场有风险,投资需谨慎。在任何情况下,本订阅号所载信息或所表述的意见并不构成对任何人的投资建议,对任何因直接或间接使用本订阅号刊载的信息和内容或者据此进行投资所造成的一切后果或损失,海通证券不承担任何法律责任。 本订阅号所载的资料、意见及推测有可能因发布日后的各种因素变化而不再准确或失效,海通证券不承担更新不准确或过时的资料、意见及推测的义务,在对相关信息进行更新时亦不会另行通知。 本订阅号的版权归海通证券研究所拥有,任何订阅人如欲引用或转载本订阅号所载内容,务必联络海通证券研究所并获得许可,并必注明出处为海通证券研究所,且不得对内容进行有悖原意的引用和删改。 海通证券研究所金融工程对本订阅号(微信号:海通量化团队)保留一切法律权利。其它机构或个人在微信平台以海通证券研究所金融工程名义注册的、或含有“海通证券研究所金融工程团队或小组”及相关信息的其它订阅号均不是海通证券研究所金融工程官方订阅号。

大部分微信公众号研报本站已有pdf详细完整版:https://www.wkzk.com/report/(可搜索研报标题关键词或机构名称查询原报告)

郑重声明:悟空智库网发布此信息的目的在于传播更多信息,与本站立场无关,不构成任何投资建议。