东方证券-因子选股系列之八十一:周频量价指增模型-220328

《东方证券-因子选股系列之八十一:周频量价指增模型-220328(19页).pdf》由会员分享,可在线阅读,更多相关《东方证券-因子选股系列之八十一:周频量价指增模型-220328(19页).pdf(19页精品完整版)》请在悟空智库报告文库上搜索。
研究结论近年来以神经网络、决策树为代表的机器学习模型在日间高频量价选股模型中大放异彩,然而公募、保险等量化机构由于交易成本高、合规风控严等原因很难直接大规模采用高频策略,短期内借鉴高频量价中的一些方法应用在周频等相对低频的领域更有现实意义。 传统的alpha模型一般分为alpha因子构建和因子加权两个步骤,前者我们基于循环神经网络设计多元因子单元从量价特征序列中学习长期有效且低相关的alpha因子,后者我们采用动态加权方法给予近期表现较好的因子更高的重要性,以此兼顾更多学习样本和alpha时变性的平衡。 本文采用原始日线数据rawbar、分钟特征序列mschars、L2特征序列l2chars共三个数据集,每个数据集构建3个因子单元,从每个数据集汇总打分的选股表现来看,同时生成多个alpha因子的多元因子单元明显优于生成唯一预测的神经网络,另外简单直接的rawbar并没有明显弱于精心设计的mschars也说明因子单元强大的特征提取能力。 近年来量价因子由于因子拥挤多头收益不断回落而空头保持稳定,根据长周期数据训练的因子单元难以捕捉这种近期才出现的非线性,我们采用LightGBM实现的GBDT动态加权因子在一定程度上缓解了这种非线性,模型得分相对maxic在分组的多头端收益有所改善,这种改善在容易出现因子拥挤的情形下更加明显。 损失函数直接决定了模型学习的方向,损失函数中预测收益率label的选择应该充分到可交易性,同时在组合存在换手控制的情形下应该适当拉长预测收益率使得组合收益和损失函数更加匹配。 本文构建的模型得分和常见非量价大类因子的因子值相关性极低,模型完全根据量价信号生成,和基本面信号信息重叠较少,两者互补优势明显,通过回归剔除其他大类因子后模型得分RankIC小幅回落但IC_IR提升,top组合2017年以来年化收益(次日vwap成交,未扣费)从42.7%小幅回落至38.7%。 模型得分可以作为一个大类因子用于指数增强,也可以单独用来构建指数增强组合,在不考虑成分股限制、周单边换手30%的情况下,纯量价模型中证500增强2017年以来费后年化对冲收益21.3%,沪深300增强11.2%,考虑成分股80%约束后上述收益回落至19.1%和11.1%。 风险提示量化模型失效风险市场极端环境的冲击。