欢迎访问悟空智库——专业行业公司研究报告文档大数据平台!

华泰证券-金工深度研究: 量化如何追求模糊的正确,有序回归-221011

研报附件
华泰证券-金工深度研究: 量化如何追求模糊的正确,有序回归-221011.pdf
大小:1335K
立即下载 在线阅读

华泰证券-金工深度研究: 量化如何追求模糊的正确,有序回归-221011

华泰证券-金工深度研究: 量化如何追求模糊的正确,有序回归-221011
文本预览:

《华泰证券-金工深度研究: 量化如何追求模糊的正确,有序回归-221011(24页).pdf》由会员分享,可在线阅读,更多相关《华泰证券-金工深度研究: 量化如何追求模糊的正确,有序回归-221011(24页).pdf(24页精品完整版)》请在悟空智库报告文库上搜索。

  人工智能系列之60:有序回归损失函数应用于选股
  本研究介绍有序回归原理,测试该方法在周频中证500指增模型中的表现,结果表明有序回归损失函数整体优于传统mse损失函数。分类会损失顺序和距离信息;回归可能欠缺实际投资含义,并且对异常值敏感;有序回归将分类和回归特点结合,追求“模糊的正确”。选股测试中,以全连接神经网络或残差图注意力网络为基模型,logistic有序回归可以提升模型Rank IC和多空收益;将加权mse和有序回归预测结果集成,集成后年化超额收益、信息比率显著提升。
  分类和回归的缺陷
  分类和回归是两类常见的机器学习任务。选股场景中,既可设计为预测“涨”“跌”的分类问题,也可设计为预测收益率的回归问题。然而这两种任务类型各有缺陷。分类问题将预测目标由连续、稠密的收益率简化为离散、稀疏的类别,损失原始数据中的顺序和距离信息。回归问题的预测可能欠缺实际投资含义,如预测误差小但方向判断错误。另外,回归问题对异常值敏感。回归追求对目标的精确拟合,但金融数据信噪比低,有时“精确的错误”反而不如“模糊的正确”。
  有序回归将分类和回归特点结合,追求“模糊的正确” 
  有序回归对分类损失函数加以改造,将分类和回归的特点结合,使得模型在保留信息同时,兼顾实际投资含义,追求“模糊的正确”。有序回归可基于二分类推导,将K分类问题转换为K-1个二分类问题,对这K-1个二分类损失函数求和,得到K分类有序回归损失函数。常用的二分类损失函数如logistic、exponential、hinge损失都可以改造成有序回归形式。
  有序回归损失函数相比基线加权mse在Rank IC等指标上有提升
  在周频中证500指增模型中,测试有序回归损失函数超额收益表现,以加权mse损失函数为基线。当基模型为全连接神经网络,logistic有序回归损失函数可以提升模型Rank IC、多空收益、年化超额收益和信息比率。当基模型为残差图注意力网络,logistic有序回归损失函数可以提升模型Rank IC和多空收益,但指增组合表现无显著改善。将wmse和有序回归预测结果进行集成,集成模型的年化超额收益、信息比率相比基线显著提升。
  参数敏感性测试:损失函数、加权方式、分类数量、模型集成方式
  考察损失函数、加权方式、分类数量、模型集成方式对模型表现的影响。Logistic损失总体优于exponential和hinge损失;对截面收益高的股票赋予更高权重,样本加权、类别加权和样本-类别加权差异不大;对于全A股总市值和流动性前60%股票池,分类数量为10时效果较好;预测值集成方法将子模型的预测值求均值再进行组合优化,效果总体优于子模型组合等权配置季度再平衡的组合集成方法。
  风险提示:人工智能挖掘市场规律是对历史的总结,市场规律在未来可能失效。人工智能技术存在过拟合风险。深度学习模型受随机数影响较大,本文未进行随机数敏感性测试。本文测试的选股模型调仓频率较高,假定以vwap价格成交,忽略其他交易层面因素影响。

展开>> 收起<<

#免责声明#

本站页面所示及下载的一切研究报告、文档和内容信息皆为本站用户上传分享,仅限用于个人学习、收藏和研究目的;不得将上述内容用于商业或者非法用途,否则,一切后果请用户自负。如若内容侵犯了您的权利,请参见底部免责申明联系我们及时删除处理。