中信证券-多因子量化选股系列专题研究:结合日内分时特征的量价增强模型研究-201231

《中信证券-多因子量化选股系列专题研究:结合日内分时特征的量价增强模型研究-201231(22页).pdf》由会员分享,可在线阅读,更多相关《中信证券-多因子量化选股系列专题研究:结合日内分时特征的量价增强模型研究-201231(22页).pdf(22页精品完整版)》请在悟空智库报告文库上搜索。
本文基于日内分时特征,通过遗传规划算法挖掘股票的日频Alpha因子。 因子的交易逻辑以价格反转为主。 从因子结构看,由于尾盘的“交易属性”更强,尾盘换手率、尾盘收益率更适于定位出“投资者行为偏差”导致的下跌,这类下跌的反转概率或较高。 基于挖掘出的量价因子构建中证500指数增强策略,策略2013年以来年化超额收益41.4%,信息比率6.8。 高频数据低频化,精细化探寻投资者短期行为模式。 (1)投资者不同周期的行为模式决定不同周期的市场风格。 投资者短期交易行为一定程度由技术面信息驱动,本文聚焦于通过量价因子刻画微观市场结构、博弈投资者短期交易行为以获取超额收益。 (2)传统基于日频行情数据挖掘量价因子易陷入“基础变量匮乏―因子结构冗长―因子容易失效”的恶性循环,日内分时数据相比日频行情数据蕴含更多信息,有助于精细化刻画投资者行为模式,为短周期Alpha预测提供更加丰富的基础变量。 遗传规划算法的基本原理:物竞天择,优胜劣汰。 遗传规划算法是一种基于自然进化理论的启发式算法,能够通过不断进化生成更适应环境的种群。 应用于选股因子挖掘时,也能为投资者提供启发式的因子构建方式。 基于遗传规划算法的量价因子挖掘。 (1)因子评价:以2017年因子对次日收益的预测效果评价因子,综合IC均值、多头组合信息比率构建适应度函数。 (2)因子生成:因子的生成需要基础数据和算子。 本文对日内分钟行情数据进行“基础降频+分域降频”操作,构建了84个日频基础变量、以及21个基础算子。 (3)因子过拟合的应对:选取市场风格、投资者结构与2017年差异较大的2015年进行交叉验证。 挖掘出的量价因子结构及其交易逻辑。 (1)挖掘出的因子交易逻辑以价格反转为主。 (2)从典型因子结构看,隔夜基本面信息在日中已被充分反映至股价,尾盘的“交易属性”更强。 尾盘换手率、尾盘收益率更适于定位“投资者行为偏差”导致的下跌,这类下跌未来反转的概率或较高。 (3)进一步,股价对隔夜信息的反映、日内价格高位分歧程度等指标可作为股价在短期内实现反转的胜率增强信号。 基于短周期量价因子的指数增强策略:(1)以近3个月因子多头组合信息比率为权重合成量价复合因子。 T+2日开盘价相对T+1日开盘价的收益计算口径下,2013年以来,因子IC均值为0.068,10分组下多头相对空头组合年化收益为102.86%(未扣费)。 (2)双边交易费率千分之3、年化60倍单边换手率约束下,2013年以来,基于短周期量价因子的中证500指数增强策略年化超额收益41.4%,信息比率6.8。 (3)如使用中证500股指期货进行对冲,对冲组合2015年4月16日以来年化收益率为12.6%,年化波动率为9.3%,夏普比率为1.4。 风险因素:因子失效风险、模型失效风险。