华泰证券-华泰人工智能系列三十二: AlphaNet,因子挖掘神经网络-200614

《华泰证券-华泰人工智能系列三十二: AlphaNet,因子挖掘神经网络-200614(24页).pdf》由会员分享,可在线阅读,更多相关《华泰证券-华泰人工智能系列三十二: AlphaNet,因子挖掘神经网络-200614(24页).pdf(24页精品完整版)》请在悟空智库报告文库上搜索。
本文构建了端到端的因子挖掘神经网络AlphaNet,并测华泰证券试了其有效性过去10年,基于神经网络的深度学习模型引领了人工智能的发展。 与传统的机器学习不同,华泰人工智能系列三十二深度学习模型通过端到端(endtoend)的方式,直接从原始数据中提取特征并针对目标做出预测,从而避免了多步骤学习的人工干预和信息损失。 然而将 AlphaNet深度学习运用于多因子选股时,套用现有模型可能效果会不达预期,需要量身定制合适的网络结构。 本文为了整合多因子选股中的因子生因子挖掘神经网络成和多因子合成步骤,设计了一种全新的网络结构:AlphaNet。 在测试中,AlphaNet能有效提取股票原始量价数据中的特华泰证券征,其合成因子相比传统因子具有显著的增量信息。 深华泰人工智能系列三十二度学习的端到端特征学习能力使得借助神经网络挖掘因子成为可能深度学习中的代表模型有卷积神经网络CNN和循环神经网络RNN。 CNN通 AlphaNet过引入卷积层和池化层,能有效提取图像中的特征,成为计算机视觉领域中的优秀模型。 RNN通过引入序列网络结构,能因子挖掘神经网络有效提取序列数据中的特征,成为语音识别、自然语言处理等领域中的优秀模型。 通过巧妙的网络结构构建,深度学华泰证券习能展现出强大的特征学习能力,实现端到端的学习和预测。 要达华泰人工智能系列三十二到优秀的端到端学习效果,需要结合神经网络的灵活性和待解决问题的领域知识,有针对性地设计出网络结构。 本文针对量化投资中选股因子的自动挖掘和合成问题,设计了一种全 AlphaNet新的网络结构:AlphaNet。 本文介绍了因子挖掘神经网络AlphaNet的结构和技术细节为了有效提取股票原始量价数据中的特征,AlphaNet借鉴了遗传规划中特征因子挖掘神经网络构建的思想,将多种运算符函数作为自定义网络层用于特征提取。 AlphaNet包含四部分:(1)数据输入:仿照CNN的方式,将个股原始量价数华泰证券据整理为二维“数据图片”的形式输入网络。 (2)特征提取层:AlphaNet中最关键的组成部分,实现了多种自定义运算网络层提取特征,并利用批标准化层(BatchNormalization)进行华泰人工智能系列三十二特征标准化。 (3)池化层:与CNN中池化层基本一致,对上一层的特征进行“ AlphaNet模糊化”操作。 (4)全连接层:对接预测目标,作用是对因子挖掘神经网络提取的特征进行加权合成。 本文基于量价数据,测试华泰证券了AlphaNet在不同调仓周期下的选股策略表现基于全A股的量价数据,本文介绍了AlphaNet的第一个版本:AlphaNet-v1的构建细节,并展示了AlphaNet-v1输出的合成因子在调仓周期为10天和5天的策略回测表现。 合成因子在进行了行业、市值、动量、波动率、换手率五因子中性化后华泰人工智能系列三十二,RankIC均值为9.54%(10天调仓)和8.19%(5天调仓)。 分5层测试中TOP组合年化超额收益率为12.42 AlphaNet%(10天调仓)和11.36%(5天调仓)。 合成因子的增量因子挖掘神经网络信息显著。 最后华泰证券,我们使用SHAP值对AlphaNet-v1进行可解释性分析。 风险提示:通过人工智能模型构建的选股策略是历史经验的华泰人工智能系列三十二总结,存在失效的可能。 神经网络受随机性影 AlphaNet响较大,使用需谨慎。 机器因子挖掘神经网络学习模型解释方法存在过度简化的风险。