华泰证券-金工深度研究: 图神经网络选股的进阶之路-220411

《华泰证券-金工深度研究: 图神经网络选股的进阶之路-220411(29页).pdf》由会员分享,可在线阅读,更多相关《华泰证券-金工深度研究: 图神经网络选股的进阶之路-220411(29页).pdf(29页精品完整版)》请在悟空智库报告文库上搜索。
人工智能55:多角度改进图神经网络选股模型本文从多角度改进图神经网络选股模型,构建周频换仓中证500指数增强策略。 图神经网络能够学习资产间的相互影响,为预测提供增量信息。 核心改进方向是引入残差网络结构,将预测收益拆解为股票间行业板块关联解释的收益、股票间因子关联解释的收益、特异性收益。 以2011年1月至2022年3月为回测期,分别以加权和等权mse为损失函数,500指增策略年化超额收益率为16.17%和14.19%,信息比率为2.14和2.43,年化双边换手率约16倍。 图神经网络和XGBoost模型日度超额收益率相关度仅为0.12,等权配置策略年化超额收益率为16.60%,信息比率提升至2.94。 图神经网络是近年来深度学习热点,业界陆续应用于量化投资研究图神经网络是近年来深度学习的研究热点,同时受到量化投资领域的广泛关注。 在预测资产收益时,传统量化策略大多将各资产视作互不相关的个体,图神经网络能够学习资产间的相互影响,为预测提供增量信息。 图卷积、图注意力等经典的图神经网络方法于2016至2017年提出,此后IBM日本研究院、Bloomberg、微软亚洲研究院、Amundi等机构陆续将其应用于量化投资研究。 华泰金工团队于2021年2月21日发布研报《图神经网络选股与Qlib实践》,证实图注意力网络在日频选股场景下表现优于传统机器学习。 设计残差图注意力网络结构GAT+redisual,将股票收益拆解成三部分本文是对前序研究的深入,借鉴微软亚研院Xu等(2021)设计残差图注意力网络结构,将股票收益拆解成三部分,分别采用不同组件学习:原始因子编码后送入掩码自注意力层,学习股票间板块或行业关联解释的收益;上一层残差送入全局自注意力层,学习股票间因子关联解释的收益;上一层残差代表因子解释自身的特异性收益。 股票池为全A股日均总市值和成交额排名前60%个股,选取投资逻辑明确的42个基本面和量价因子,以wmse(根据收益排序加权)为损失函数,构建中证500增强策略的年化超额收益率为16.17%,信息比率为2.14(回测期2011-01-04至2022-03-31)。 考察网络结构、建图方式、损失函数、网络复杂度对选股模型的影响考察网络结构、建图方式、损失函数、网络复杂度对选股模型的影响。 引入残差结构有显著改进效果,从股票间板块、因子的关联中挖掘出有效信息。 板块建图表现优于行业建图,产业链上下游股票即使分属不同行业,也存在相互影响。 对比mse和wmse损失函数,2011~2013年两者接近,2014~2016年mse占优,2017年至今wmse占优,随着因子多头端日趋拥挤,wmse优势逐步体现。 对比隐状态为64/32/16的三组模型,hidden64>hidden32>hidden16,提升网络复杂度有改进效果,但也需与样本量、特征数相匹配。 图神经网络和XGBoost相关度低,两者结合可以进一步降低风险深度学习和传统机器学习的方法论具有一定差异,将低相关性的策略结合可以进一步降低风险。 GAT+residual(wmse)和XGBoost模型日度超额收益率两者相关系数仅为0.12。 将两个策略等权配置,每60个交易日进行再平衡,组合策略年化超额收益率为16.60%,信息比率从2.14和2.19(GAT和XGBoost,下同)提升至2.94,超额收益Calmar比率从1.84和1.26提升至2.36,改进效果显著。 风险提示:人工智能挖掘市场规律是对历史的总结,市场规律在未来可能失效。 人工智能技术存在过拟合风险。 深度学习模型受随机数影响较大,本文未进行随机数敏感性测试。 本文测试的选股模型调仓频率较高,假定以vwap价格成交,忽略其他交易层面因素影响。