东方证券-因子选股系列之八十三:多模型学习量价时序特征-220612

《东方证券-因子选股系列之八十三:多模型学习量价时序特征-220612(19页).pdf》由会员分享,可在线阅读,更多相关《东方证券-因子选股系列之八十三:多模型学习量价时序特征-220612(19页).pdf(19页精品完整版)》请在悟空智库报告文库上搜索。
研究结论前期报告中我们提出了包括输入数据、因子单元和加权模型的AI量价模型架构,并将之应用于周频调仓的选股策略,样本内和样本外均有十分显著的选股效果,本文借鉴深度学习领域的方法,对因子单元部分的时间序列模型进行扩展,以期能够提取更丰富和差异化的alpha因子,增强模型整体表现。 深度学习近年来快速发展,日新月异,各种新的时序网络模型不断涌现,除了GRU、LSTM等RNN模型,一维CNN、Transformer等广泛应用于时序任务中,本文借鉴相关成果,分别构建了以CNN和Transformer为基础的因子单元。 BaiShaojie(2018)采用因果卷积、空洞卷积等技术对时间卷积网络TCN做出了规范化的设计,本文提出的RESTCN因子单元在TCN基础上嵌入了一维残差网络以增强模型对局部量价特征的学习能力。 本文以采用time2vec时间编码的transformerencoder为骨干构建因子单元,并在输出端做了特殊设计以充分利用各时间步输出的学习能力。 实验表明RESTCN和Transformer提取alpha因子的能力并不弱于RNN系列模型,单模型下10日RankIC均值分别达到15.7%和16.1%,top组合对冲收益(20分组、周度调仓、次日vwap成交、费前)分别达到43.0%、42.2%。 不同模型学习的alpha信息高度重叠,但是由于RESTCN、Transformer与RNN系列模型结构差异较大,模型打分相关性显著低于同RNN系列模型。 本文比较了两种整合多个模型学习能力的方式,一是从因子层面将不同模型学得的alpha因子合并一起作为加权模型输入,二是各个模型学得的alpha因子各自加权生成zscore之后再汇集,前者对加权模型处理冗余信息的能力要求更高。 实验表明zscore层面整合多模型的选股效果优于因子层面整合,引入RESTCN、Transformer后综合打分的RankIC和top组合收益均有一定提升,10日RankIC均值16.5%,top组合年化45.7%。 在合适的换手下,多模型构建的top100组合各个年度费后绝对收益均为正,周单边5%换手时也有20%以上的超额,另外适当增加top组合持股数量并不会显著降低组合收益。 风险提示量化模型失效风险市场极端环境的冲击。