中信建投-深度学习因子库:多数据源、多网络因子合成-221215

《中信建投-深度学习因子库:多数据源、多网络因子合成-221215(19页).pdf》由会员分享,可在线阅读,更多相关《中信建投-深度学习因子库:多数据源、多网络因子合成-221215(19页).pdf(19页精品完整版)》请在悟空智库报告文库上搜索。
量化投研模式的转变
由于因子数量有限、技术手段以线性为主等原因,早期的量化投研的主要模式为独立子策略合成,在各子策略下构建因子库和模型,最后进行多策略融合,而随着数据源日益丰富,资产定价进入了高维度和非线性时代,因子-模型-组合优化的模块化投研模式逐渐形成,各子策略下的因子合并形成共同的因子库,在此基础上平行构建模型并集成。
深度学习模型
深度学习基于神经网络结构,通过多层非线性转换,从数据中更加自动地学习有效的特征表示。与线性模型、机器学习模型相比,深度学习模型包含更丰富的算法结构,支持更灵活的样本形式和处理技巧,可以在更高层次更加精细地挖掘非线性信息。
本报告介绍了并使用了胶囊网络模型、VIT模型、深度残差网络模型、注意力集中网络模型、以及时空卷积神经网络模型,利用这些网络结构作为基础模块所合成的深度网络进行因子合成。
基于深度学习的因子合成
本期报告利用量价、基本面、一致预期和高频数据所挖掘的因子,进行模型训练和合成。在特征工程上,形成多周期、多标签、多Channel的样本形式;在网络结构上,综合应用多个深度学习模型,结合各种样本输入形式,进行模型的变种组合;在模型训练上,采用滚动训练的方式,并进一步将子模型的预测结果进行模型合成。
从实验结果来看,各模型之间的相关性大多低于0.5,各模型的输出与风格因子的相关性低于0.4。在IC方面,集成模型模型比单模型有所提升。回测结果表明,在头部组合上,各模型在超额等不同指标和不同年份的效果强弱不一,模型集成后对头部组合的收益和夏普起到稳定作用,而PortfolioIntegration方式的超额夏普为4.55,多组合的合成在最大程度降低了组合整体的风险,来提升夏普比率;在多空组合上,集成模型的年化收益比各单模型均有提升。
风险提示:模型计算可能存在偏误,业绩不代表未来;因子测试、机器学习建模是对历史经验的总结,模型学习到的市场规律在未来存在失效的可能。