东方证券-因子选股系列之九十六:基于残差网络的端到端因子挖掘模型-230824

文本预览:
本文我们提出了一个基于残差网络的两阶段因子挖掘模型,通过构造数据图片并使用残差网络进行时间截面特征提取,之后再输入循环神经网络进行时序特征提取,这样能有效的捕捉长周期信息且不会付出较大的计算代价。 本文将原始日内分钟线和周度内日k线构造的数据图片集分别称之为msnew和week数据集,并将这两个数据集分别直接输入模型采用将原始数据直接作为输入来获取该数据集打分。这种做法完全实现端到端的模式可以有效的缓解信息丢失问题,并且也解决了人工筛选特征带来的过拟合问题。 数据集msnew与数据集ms生成的因子之间信息重叠度较高但仍然存在差异。主要原因在于数据集msnew使用的是半小时k线数据作为输入,而数据集ms则是根据五分钟k线人工构建的日频特征,二者原始数据信息天然存在差异; 数据集msnew生成打分的选股能力整体略高于数据集ms。通过将数据集msnew生成的弱因子替代数据集ms参与非线性加权得到的打分在四个股票池上表现并没有发生较大改变,这说明数据集msnew对数据集ms有较好的替代性。 数据集week上生成因子选股能力显著好于数据集day,说明更长时序作为输入对未来收益率的预测能力更强。并且通过引入week数据集,非线性加权打分在各股票池上的各项选股指标均有显著的提升,说明数据集week能够对整体模型起到一个较大的增量作用。 我们提出的两种不同数据集组合Model3和Model4非线性加权打分在中证全指、沪深300、中证500、中证1000四个指数上十日RankIC均值分别为14.97%、9.57%、11.29%、14.63%和14.99%、9.36%、11.98%、14.57%,top组年化超额分别为41.48%、26.02%、21.28%、35.02%和41.76%、25.58%、21.67%、34.56%,打分市值偏向性较低。 以上两个打分也可直接应用于指数增强策略,各宽基指数上均能获得显著的超额收益,在成分股不低于80%限制、周单边换手率约束为20%约束下,2018年以来,Model3打分在沪深300、中证500和中证1000增强策略上年化超额收益率分别为14.49%、19.76%和29.41%,Model4打分在沪深300、中证500和中证1000增强策略上年化超额收益率分别为14.76%、20.15%和28.72%。 风险提示 量化模型失效 极端市场造成冲击,导致亏损
展开>>
收起<<
《东方证券-因子选股系列之九十六:基于残差网络的端到端因子挖掘模型-230824(20页).pdf》由会员分享,可在线阅读,更多相关《东方证券-因子选股系列之九十六:基于残差网络的端到端因子挖掘模型-230824(20页).pdf(20页精品完整版)》请在悟空智库报告文库上搜索。
(以下内容从东方证券《因子选股系列之九十六:基于残差网络的端到端因子挖掘模型》研报附件原文摘录)本文我们提出了一个基于残差网络的两阶段因子挖掘模型,通过构造数据图片并使用残差网络进行时间截面特征提取,之后再输入循环神经网络进行时序特征提取,这样能有效的捕捉长周期信息且不会付出较大的计算代价。 本文将原始日内分钟线和周度内日k线构造的数据图片集分别称之为msnew和week数据集,并将这两个数据集分别直接输入模型采用将原始数据直接作为输入来获取该数据集打分。这种做法完全实现端到端的模式可以有效的缓解信息丢失问题,并且也解决了人工筛选特征带来的过拟合问题。 数据集msnew与数据集ms生成的因子之间信息重叠度较高但仍然存在差异。主要原因在于数据集msnew使用的是半小时k线数据作为输入,而数据集ms则是根据五分钟k线人工构建的日频特征,二者原始数据信息天然存在差异; 数据集msnew生成打分的选股能力整体略高于数据集ms。通过将数据集msnew生成的弱因子替代数据集ms参与非线性加权得到的打分在四个股票池上表现并没有发生较大改变,这说明数据集msnew对数据集ms有较好的替代性。 数据集week上生成因子选股能力显著好于数据集day,说明更长时序作为输入对未来收益率的预测能力更强。并且通过引入week数据集,非线性加权打分在各股票池上的各项选股指标均有显著的提升,说明数据集week能够对整体模型起到一个较大的增量作用。 我们提出的两种不同数据集组合Model3和Model4非线性加权打分在中证全指、沪深300、中证500、中证1000四个指数上十日RankIC均值分别为14.97%、9.57%、11.29%、14.63%和14.99%、9.36%、11.98%、14.57%,top组年化超额分别为41.48%、26.02%、21.28%、35.02%和41.76%、25.58%、21.67%、34.56%,打分市值偏向性较低。 以上两个打分也可直接应用于指数增强策略,各宽基指数上均能获得显著的超额收益,在成分股不低于80%限制、周单边换手率约束为20%约束下,2018年以来,Model3打分在沪深300、中证500和中证1000增强策略上年化超额收益率分别为14.49%、19.76%和29.41%,Model4打分在沪深300、中证500和中证1000增强策略上年化超额收益率分别为14.76%、20.15%和28.72%。 风险提示 量化模型失效 极端市场造成冲击,导致亏损