首页 > 公众号研报 > 【华泰金工林晓明团队】人工智能58:分析师共同覆盖因子和图神经网络

【华泰金工林晓明团队】人工智能58:分析师共同覆盖因子和图神经网络

作者:微信公众号【华泰金融工程】/ 发布时间:2022-07-07 / 悟空智库整理
(以下内容从华泰证券《【华泰金工林晓明团队】人工智能58:分析师共同覆盖因子和图神经网络》研报附件原文摘录)
  林晓明 S0570516010001 SFC No.BPY421 研究员 李子钰 S0570519110003 SFC No.BRV743 研究员 何 康 S0570520080004 SFC No.BRB318 研究员 报告发布时间:2022年7月7日 摘要 人工智能58:构建基于分析师共同覆盖的因子,并融入图神经网络测试 由于金融市场中存在各种公司间关联,上市公司的股价并非完全独立地各自运行,而是呈现出领先滞后的现象,刻画上市公司的关联对于市场研究有积极意义。本文参考已有的研究,认为分析师共同覆盖可以从最根本的层面刻画上市公司的基本面关联,并进行了定性和定量的说明。实证层面,本文构建了基于分析师共同覆盖的关联动量因子,因子能表示股票间的短期领先滞后现象。同时,分析师共同覆盖能改进传统的反转、换手率、波动率因子,其背后的机制是均值回复现象。最后,本文将分析师共同覆盖融入图神经网络中,可提升对三类量价因子的合成效果。 分析师共同覆盖可以从最根本的层面刻画上市公司的基本面关联 近20多年来,学界对于上市公司间的股价关联动量效应进行了大量研究,Ali and Hirshleifer (2019) 提出了基于分析师共同覆盖的关联动量,并认为分析师共同覆盖能从最根本的层面刻画出上市公司的基本面关联,可以解释前人研究中的各类上市公司间关联动量现象。本文基于A股市场数据,构建了基于分析师共同覆盖的上市公司间关联,并通过社区发现Louvain算法,论证了分析师共同覆盖的上市公司具有基本面上的关联性,且这种关联性涉及多种基本面的角度,如同行业、同供应链、相似业务等。 基于分析师共同覆盖的关联动量因子能表示股票间的短期领先滞后现象 本文参照Ali and Hirshleifer (2019)中的因子构建方法,构建了基于分析师共同覆盖的关联动量因子CF_RET,该因子认为与某只股票关联的其他股票过去一段时间的收益率可以预测该股票未来的收益率,即体现出股票涨跌的领先滞后效应,本文还构建了行业关联动量因子和板块关联动量因子进行对比。在多种测试条件下,CF_RET因子TOP组合都表现最好,侧面说明了分析师共同覆盖确实是刻画股票间关系的有效方式。此外,股票间的关联动量效应可能偏短期,持续时间在一周左右。 分析师共同覆盖能改进反转、换手率、波动率因子,机制是均值回复现象 基于金融市场均值回复的现象,本文进一步构建了基于分析师共同覆盖的改进反转因子CF_REV、改进换手率因子CF_TURN、改进波动率因子CF_STD。对于CF_REV,其含义是前期自身跌幅较大,但关联股票涨幅较大的股票因子取值较大,是均值回复现象的表现(CF_TURN和CF_STD的含义类似)。本文还构建了相应的行业改进因子和板块改进因子进行对比。在多种测试条件下,基于分析师共同覆盖的改进因子均能获得更好的表现,进一步说明了分析师共同覆盖确实是刻画股票间关系的有效方式。 将分析师共同覆盖融入图神经网络中,可提升对三类量价因子的合成效果 本文将分析师共同覆盖关系输入图神经网络GAT,作为一种显式建图的方式来测试其在因子合成中的效果。针对反转、换手率、波动率因子的合成,相比全连接网络,GAT的RankIC从6.87%提升到7.29%,IC_IR从0.46提升到0.55,分5层测试TOP组合年化超额收益率提升了3.17%,分析师共同覆盖确实为三个因子的合成贡献了增量信息。本文还从注意力权重矩阵的角度对GAT做可解释性分析,结论有:(1)相比关联股票,股票自身的特征对于收益预测贡献最显著,关联股票的特征能提供一定信息补充;(2)股票之间的相互影响程度是不对称的。 风险提示:因子测试是历史经验的总结,存在失效可能。本文测试的股票池仅包含有分析师覆盖的A股,测试结论不能推广到全A股。神经网络受随机性影响较大,可解释性较低,使用需谨慎。高频调仓受交易费用影响较大。 分析师共同覆盖:从最根本的层面刻画上市公司的基本面关联 文献综述:上市公司间关联动量相关研究 金融市场中,由于各种各样的公司间关联,上市公司的股价并非完全独立地各自运行,而是呈现出领先滞后的现象,即动量溢出效应(momentum spillover effects)。学界普遍认为,这主要是投资者的有限关注(limited attention)导致信息在公司间的扩散较为缓慢所致。近年来,关于上市公司间关联动量涌现出较多研究成果,主要从不同的角度来定义上市公司之间的关联关系。 1. 行业动量:Moskowitz and Grinblat (1999) 论证了美股存在显著的行业动量,过去的行业收益可以预测未来的股票回报。 2. 供应链动量:Menzly and Ozbas (2010) 指出供应链的上下游公司股票收益存在关联性,他们使用进出行业的货物流动数据,发现过去的客户和供应商商业收益来预测未来股票的收益有较好的效果。 3. 地理动量:Parsons et al. (2018) 指出同一城市公司股票之间存在领先-滞后关系,即同城但不同行业和其他城市同行业的股价波动对公司未来收益有显著的影响。 4. 文本关联动量:Hoberg and Phillips (2018) 提出对上市公司10-K年度报告的“公司业务和产品”章节进行文本分析构建新的行业分类,新行业分类中存在显著的行业动量。 5. 科技动量:Lee et al. (2018) 提出了科技关联度的新视角,通过专利之间的相关系数表示公司之间科技关联度的强弱,研究了科技关联度和公司股票预期收益率的关系,最后指出该因子的内在机制是投资者对于科技信息的反应不足。 6. 分析师共同覆盖动量:Ali and Hirshleifer (2019) 提出了基于分析师共同覆盖的关联动量,并认为分析师共同覆盖能从最根本的层面刻画出上市公司的基本面关联,可以解释以上研究中的各类上市公司间关联动量现象。 分析师共同覆盖的内在逻辑 如下图所示,我们按照分析师共同覆盖的逻辑,计算出当前与宁德时代最相关的14家上市公司,这些公司分属三个不同的一级行业。分析师共同覆盖的研究认为,分析师共同覆盖的上市公司具有基本面上的关联性,且这种关联性涉及多种基本面的角度,如同行业、同供应链、同地理位置、相似业务等。 Ali and Hirshleifer (2019) 从三个方面论证了分析师共同覆盖能从最根本的层面刻画出上市公司的基本面关联。 1. 分析师的工作是收集并分析与上市公司基本面相关的各种信息,如客户、供应商、竞争对手等等,这说明分析师通常会共同覆盖有基本面关联的公司。 2. 如果使用同行业或同地理位置来代表上市公司的关联,会把上市公司聚合成多类,但类内公司的关系是无法精细刻画的。与之相比,分析师共同覆盖则可直接构建两个公司之间的联系。 3. 上市公司之间的共享分析师数量是不断变化的,可以用定量方式明确计算出公司之间的关联强弱,这是其他关联动量研究所不具备的。 基于分析师共同覆盖的上市公司间关联构建 我们将使用邻接矩阵来表示上市公司间的关联关系,邻接矩阵的构建步骤如下: 1. 每个季度末,选取过去6个月的所有分析师报告,列出全部撰写报告的分析师。 2. 对于每个分析师,找到其在过去6个月覆盖的全部上市公司,认为这些上市公司间有关联,即在邻接矩阵的相应位置加1。 3. 针对所有分析师,重复步骤2,即可构建每个季度末的上市公司邻接矩阵。考虑到分析师共同覆盖的数量变化不大,我们每个季度更新一次邻接矩阵。 下图为邻接矩阵的一部分取值,邻接矩阵中的数值代表共同覆盖这两只上市公司的分析师数量。为了避免极端值的影响,我们对邻接矩阵中的数值+1再取对数log得到新的邻接矩阵。 基于社区发现算法的分析师共同覆盖分析 表示上市公司间关联的邻接矩阵构建好之后,可以进一步使用社区发现算法对邻接矩阵进行分析,得到更为直观的信息。社区发现算法是一种研究复杂网络内部结构的工具。在复杂网络中,社区是一种局部性结构,该局部性结构内部连接紧密,而不同的局部性结构之间连接稀疏。将社区发现算法运用于上市公司间关联的邻接矩阵后,主要可以分析以下两个内容:(1)上市公司可以分为哪些社区。(2)每个社区的内部构成情况。 在Python中可以使用networkx工具包中的Louvain算法来进行社区发现分析。我们使用截止到2022年3月底的分析师共同覆盖数据构建邻接矩阵,对邻接矩阵进行社区发现分析,可得到13个大的社区,同一社区内的股票具有较高的基本面相似性。如下图所示,我们选取社区1~社区3的部分股票进行简要说明。 社区1主要包含医药行业的上市公司。尽管该组中纳微科技(688690 CH)和泰林生物(300813 CH)所属中信一级行业分别为基础化工和机械行业,但二者均在产业链上与医药行业密切相关。纳微科技主营业务包括纳米微球及医药色谱填料的生产,而色谱填料与层析介质微球均是医药生产中分离纯化的核心材料。通过Wind关系网也可以发现,公司下游主要客户为圣诺医药(688117 CH),是一家主要从事多肽类药物生产开发的公司。泰林生物主营业务为微生物检测与控制技术系统产品、有机物分析仪器等制药装备的研发、制造和销售,同时公司在今年3月份研制出的NC膜是新冠检测试剂盒的重要材料之一。 社区2主要包含传媒行业的上市公司。但同样可以发现姚记科技(002605 CH)、风语筑(603466 CH)和值得买(300785 CH)分属中信一级行业的轻工制造、建筑和商贸零售。其中姚记科技主要采取的是“大娱乐”发展战略,主营业务包括扑克牌、移动游戏与互联网创新营销。根据公司2021年年报,其控股子公司包括上海渡鸟翔游网络科技有限公司、大鱼竞技(北京)网络科技,均为游戏内容与短视频营销相关公司。风语筑是中国数字科技应用领域龙头企业,主要在高科技数字化展示应用、内容创意设计等领域有较多专利成果。根据公司2021年报,其有近52%的收入来自于文化及品牌数字化体验空间设计与建设,近47%来自于城市数字化体验空间设计与建设。值得买是一家消费领域门户型网站服务平台,主营业务是运营内容类导购平台“什么值得买”及相应移动客户端。“什么值得买”作为电商导购平台,主要依靠用户贡献内容与消费内容社区作为核心增长点。 社区3主要包含汽车行业的上市公司。其中可以发现中自科技(688737 CH)、巨一科技(688162 CH)、双环传动(002472 CH)分别归类为中信一级行业的基础化工、机械、机械行业,但从整车生产链上可以发现,三家公司与下游汽车制造生产存在紧密关系。其中中自科技是一家专注于我国移动污染源(机动车、非道路机械、船舶等)尾气处理催化剂领域研发的公司。根据公司2021年年报,其针对重卡的尾气催化剂产品对其总收入的占比达74%。同时根据Wind关系网也可以发现,其下游主要客户包括动力新科(600841 CH,中信一级分类:汽车)与中国重汽集团济南橡塑件有限公司。巨一科技主营业务主要集中于智能装备整体解决方案与电驱动系统。在产业链上属于整车生产链的中游,下游客户涵盖大众、一汽等多家汽车生产商。双环传动主要业务集中于汽车齿轮零部件的生产制造。根据2021年年报,汽车齿轮零部件生产业务占公司总营收的比重达83.6%。 基于分析师共同覆盖的关联动量因子 前文中我们构建了基于分析师共同覆盖的上市公司间关联关系,如何将这种关系运用于实际投资将是本文重点关注的内容。本章中,我们将参考Ali and Hirshleifer (2019) 提到的方法构建基于分析师共同覆盖的关联动量因子。 CS_RET的计算方式与CI_RET完全一致,区别在于使用相同板块来描述股票之间的关系。下图为中信一级行业和5个板块的对应关系。 另外需要说明的是,为了在后续的测试中进行公平的对比,计算CF_RET、CI_RET和CS_RET三个因子的样本空间都是全A股中有分析师覆盖的股票。因子覆盖度如下图所示,整个区间内全A股平均覆盖度为70%左右。 基于分析师共同覆盖的关联动量因子测试 本节将测试以下三个因子: 1. CF_RET_n:基于分析师共同覆盖的关联动量因子,使用股票过去n天的收益率计算关联动量。 2. CS_RET_n:板块关联动量因子,使用股票过去n天的收益率计算关联动量。 3. CI_RET_n:行业关联动量因子,使用股票过去n天的收益率计算关联动量。 单因子测试方法 1. 股票池:具有分析师覆盖的全部A股,剔除ST、PT股票,剔除每个截面期下一交易日停牌的股票。 2. 回测区间:2012/1/5~2022/6/30。 3. 调仓周期:测试调仓周期为日频、周频、月频调仓下因子的表现,即调仓周期分别为1个、5个、20个交易日。由于日频、周频调仓时组合换手率较高,交易费用对回测影响很大,因此我们将展示因子在有无交易费用情况下的测试结果。 4. 因子预处理:因子进行去极值、中性化、标准化。 5. 测试方法:IC值分析,因子分5层测试,分层测试中交易费用为单边千分之二。进行因子相关性分析。 日频调仓的单因子测试结果 从图表7~图表11可知,日频调仓时各因子的RankIC较小,都在1%以下,但因子的分层回测区分度较好,且在相同参数下,基于分析师共同覆盖的关联动量因子TOP组合表现最好。 周频调仓的单因子测试结果 从图表12~图表16可知,周频调仓时各因子的RankIC较小,都在1%以下,但因子的分层回测区分度较好,且在相同参数下,基于分析师共同覆盖的关联动量因子TOP组合表现最好。 月频调仓的单因子测试结果 从图表17~图表21可知,月频调仓时各因子的RankIC依然不显著,因子的分层回测区分度相比日频和周频调仓明显下降。在相同参数下,基于分析师共同覆盖的关联动量因子TOP组合表现最好。 因子相关性分析 各因子的相关性矩阵如下图所示,可知在相同的回溯周期下,CF_RET_n因子与n日动量因子相关性较低,与CI_RET_n相关性较高。 小结 1. 本章我们测试了基于分析师共同覆盖的关联动量因子、板块关联动量因子和行业关联动量因子,在多种测试条件下,基于分析师共同覆盖的关联动量因子TOP组合都表现最好,侧面说明了分析师共同覆盖确实是刻画股票间关系的有效方式。 2. 如下图所示,在不计交易费用的情况下, CF_RET_20因子在日频和周频调仓时的TOP组合超额收益,表现都优于月频调仓,说明股票间的关联动量效应可能偏短期,持续时间在一周左右。 3. 日频和周频调仓时,关联动量因子的TOP组合受交易费用影响很大,无法作为单因子来直接选股,可将因子加入组合并控制组合换手率来缓解这个问题。 基于分析师共同覆盖的改进反转因子 CS_REV的计算方式与CI_REV完全一致,区别在于使用相同板块来描述股票之间的关系。 基于分析师共同覆盖的改进反转因子测试 本节将测试以下三个因子: 1. CF_REV_n:基于分析师共同覆盖的改进反转因子,使用股票过去n天的收益率计算自身反转和关联动量。 2. CS_REV_n:基于板块的改进反转因子,使用股票过去n天的收益率计算自身反转和关联动量。 3. CI_REV_n:基于行业的改进反转因子,使用股票过去n天的收益率计算自身反转和关联动量。 单因子测试方法 1. 股票池:具有分析师覆盖的全部A股,剔除ST、PT股票,剔除每个截面期下一交易日停牌的股票。 2. 回测区间:2012/1/5~2022/6/30。 3. 调仓周期:测试调仓周期为日频、周频、月频调仓下因子的表现,即调仓周期分别为1个、5个、20个交易日。由于日频、周频调仓时组合换手率较高,交易费用对回测影响很大,因此我们将展示因子在有无交易费用情况下的测试结果。 4. 因子预处理:因子进行去极值、中性化、标准化。 5. 测试方法:IC值分析,因子分5层测试,分层测试中交易费用为单边千分之二。进行因子相关性分析。 日频调仓的单因子测试结果 从图表24~图表28可知,日频调仓时,在RankIC均值、IC_IR、TOP组合年化超额收益率等多项指标上,基于分析师共同覆盖的改进反转因子表现最好。 周频调仓的单因子测试结果 从图表29~图表33可知,周频调仓时,在RankIC均值、IC_IR、TOP组合年化超额收益率等多项指标上,基于分析师共同覆盖的改进反转因子表现最好。 月频调仓的单因子测试结果 从图表34~图表38可知,月频调仓时,在RankIC均值、IC_IR、TOP组合年化超额收益率等多项指标上,基于分析师共同覆盖的改进反转因子表现最好。此时交易费用对回测绩效的影响已不太显著。 因子相关性分析 各因子的相关性矩阵如下图所示,可知在相同的回溯周期下,n日反转因子和其三个改进因子相关性都较高,与CS_RET_n的相关性最高。 小结 1. 本章我们测试了基于分析师共同覆盖的改进反转因子、板块改进反转因子和行业改进反转因子,在多种测试条件下,基于分析师共同覆盖的改进反转因子都表现最好,侧面说明了分析师共同覆盖确实是刻画股票间关系的有效方式。 2. 日频和周频调仓时,改进反转因子的TOP组合受交易费用影响很大,无法作为单因子来直接选股,可将因子加入组合并控制组合换手率来缓解这个问题。 基于分析师共同覆盖的改进换手率、波动率因子 经过前文的测试可知,分析师共同覆盖可以对传统反转因子进行改进,且改进效果最好,体现了金融市场中的均值回复现象。由于反转因子是经典的负向因子,这令我们联想到:使用相似的因子构建逻辑,分析师共同覆盖是否可以对其他负向因子(如波动率、换手率因子)进行改进? 同样的,我们也可以构建基于行业和板块的改进因子来进行对比。分别得到行业改进换手率因子CI_TURN,板块改进换手率因子CS_TURN,行业改进波动率因子CI_STD,板块改进波动率因子CS_STD。 基于分析师共同覆盖的改进换手率、波动率因子测试 本节将测试以下六个因子: 1. CF_TURN_n:基于分析师共同覆盖的改进换手率因子,使用股票过去n天的换手率计算。 2. CS_TURN_n:基于板块的改进换手率因子,使用股票过去n天的换手率计算。 3. CI_TURN_n:基于行业的改进换手率因子,使用股票过去n天的换手率计算。 4. CF_STD_n:基于分析师共同覆盖的改进波动率因子,使用股票过去n天的波动率计算。 5. CS_STD_n:基于板块的改进波动率因子,使用股票过去n天的波动率计算。 6. CI_STD_n:基于行业的改进波动率因子,使用股票过去n天的波动率计算。 单因子测试方法 1. 股票池:具有分析师覆盖的全部A股,剔除ST、PT股票,剔除每个截面期下一交易日停牌的股票。 2. 回测区间:2012/1/5~2022/6/30。 3. 调仓周期:月频调仓,即20个交易日。 4. 因子预处理:因子进行去极值、中性化、标准化。 5. 测试方法:IC值分析,因子分5层测试,分层测试中交易费用为单边千分之二。进行因子相关性分析。 月频调仓的改进换手率因子测试结果 从图表40~图表44可知,月频调仓时,在RankIC均值、IC_IR、TOP组合年化超额收益率等多项指标上,基于分析师共同覆盖的改进换手率因子表现都较好。 改进换手率因子相关性分析 各因子的相关性矩阵如下图所示,因子间相关性较高。 月频调仓的改进波动率因子测试结果 从图表46~图表50可知,月频调仓时,在RankIC均值、IC_IR、TOP组合年化超额收益率等多项指标上,基于分析师共同覆盖的改进波动率因子表现都较好。 改进波动率因子相关性分析 各因子的相关性矩阵如下图所示,因子间相关性较高。 小结 本章我们测试了基于分析师共同覆盖的改进换手率因子、板块改进换手率因子和行业改进换手率因子,以及基于分析师共同覆盖的改进波动率因子、板块改进波动率因子和行业改进波动率因子。在多种测试条件下,基于分析师共同覆盖的改进因子都有较优表现,侧面说明了分析师共同覆盖确实是刻画股票间关系的有效方式,且这种改进因子的方式在多类负向因子中具有普适性。 分析师共同覆盖运用于图神经网络GAT 分析师共同覆盖构建了股票之间的关系,图神经网络则可以融入股票之间的关系。本章我们将会把分析师共同覆盖关系输入图神经网络GAT,作为一种显式建图的方式,来测试其在因子合成中的效果。关于GAT的具体原理可参考华泰金工人工智能系列报告《图神经网络选股与Qlib实践》(2021.2.21),《图神经网络选股的进阶之路》(2022.4.11),本文不再赘述。 模型构建和参数说明 图表52~图表53为本文测试GAT模型和对照组模型的说明,输入的三个因子即为前文测试的反转、换手率、波动率因子。需要注意的是,输入GAT模型的邻接矩阵,目前仅包含股票之间是否有连接的信息(即有连接则邻接矩阵对应位置为1,没有连接则为0),并没有输入邻接矩阵的权重(即连接的强弱信息),也就是说GAT模型并没有充分利用到分析师共同覆盖邻接矩阵的信息。 下图为GAT模型的细节和参数量说明,GAT模型总参数数量为51个。单层全连接神经网络的参数数量很少,为4(3+1)个。 模型训练和测试 1. 股票池:具有分析师覆盖的全部A股,剔除ST、PT股票,剔除每个截面期下一交易日停牌的股票。 2. 因子和标签:3个因子:40日反转、40日换手率、40日波动率,标签为未来20日收益率。 3. 滚动训练:从2015/2/27开始,每次训练取过去750个交易日的数据,前500个交易日为训练集、后230个交易日为验证集。每隔120个交易日滚动训练一次。回测区间:2015/4/1~2022/6/30。 4. 调仓周期:月频调仓,即20个交易日。 5. 测试方法:考虑到神经网络的随机性,两个模型都会训练5次,并将5次的预测结果等权集成。进行IC值分析,因子分5层测试,分层测试中交易费用为单边千分之二。 从图表54~图表56可知,在各项指标上,分析师共同覆盖GAT模型表现都比全连接网络更好,分析师共同覆盖确实为三个因子的合成贡献了增量信息。 GAT模型可解释性分析 本节我们将从注意力权重矩阵的角度来对GAT模型进行可解释性分析。如下表所示,我们选取最近一期训练的GAT模型,对宁德时代、东方环宇、中国神华和郑州煤电的关联股票进行分析。 分析上表,可得以下结论: 1. 对于宁德时代、东方环宇和郑州煤电,关联最强的股票就是其自身,实际上77.24%的股票都呈现出该现象,即股票自身的特征对于收益预测贡献最显著。 2. 注意力权重矩阵是非对称的,东方环宇对宁德时代的注意力权重为4.63%,宁德时代对东方环宇的注意力权重为0.02%,郑州煤电对中国神华的注意力权重为1.99%,中国神华则不是郑州煤电关联最强的6只股票之一,说明股票之间的相互影响程度是不对称的。 总结和讨论 近年来,投资者对于另类数据的关注程度日益上升。以产业链为代表的描述股票间关联的数据是一类重要的另类数据。有别于使用第三方的产业链数据来进行研究,本文构建了基于分析师共同覆盖的股票间关系,并应用于因子构建、改进和图神经网络模型,全面展示了如何利用分析师共同覆盖中的增量信息。本文总结如下: 1. 分析师共同覆盖可以从最根本的层面刻画上市公司的基本面关联。近20多年来,学界对于上市公司间的股价关联动量效应进行了大量研究,Ali and Hirshleifer (2019) 提出了基于分析师共同覆盖的关联动量,并认为分析师共同覆盖能从最根本的层面刻画出上市公司的基本面关联,可以解释前人研究中的各类上市公司间关联动量现象。本文基于A股市场数据,构建了基于分析师共同覆盖的上市公司间关联,并通过社区发现Louvain算法,论证了分析师共同覆盖的上市公司具有基本面上的关联性,且这种关联性涉及多种基本面的角度,如同行业、同供应链、相似业务等。 2. 基于分析师共同覆盖的关联动量因子能表示股票间的短期领先滞后现象。本文参照Ali and Hirshleifer (2019)中的因子构建方法,构建了基于分析师共同覆盖的关联动量因子CF_RET,该因子认为与某只股票关联的其他股票过去一段时间的收益率可以预测该股票未来的收益率,即体现出股票涨跌的领先滞后效应,本文还构建了行业关联动量因子和板块关联动量因子进行对比。在多种测试条件下,CF_RET因子TOP组合都表现最好,侧面说明了分析师共同覆盖确实是刻画股票间关系的有效方式。此外,股票间的关联动量效应可能偏短期,持续时间在一周左右。 3. 分析师共同覆盖能改进反转、换手率、波动率因子。基于金融市场均值回复的现象,本文进一步构建了基于分析师共同覆盖的改进反转因子CF_REV、改进换手率因子CF_TURN、改进波动率因子CF_STD。对于CF_REV,其含义是前期自身跌幅较大,但关联股票涨幅较大的股票因子取值较大,是均值回复现象的表现(CF_TURN和CF_STD的含义类似)。本文还构建了相应的行业改进因子和板块改进因子进行对比。在多种测试条件下,基于分析师共同覆盖的改进因子均能获得更好的表现,进一步说明了分析师共同覆盖确实是刻画股票间关系的有效方式。 4. 将分析师共同覆盖融入图神经网络中,可提升对三类量价因子的合成效果。本文将分析师共同覆盖关系输入图神经网络GAT,作为一种显式建图的方式来测试其在因子合成中的效果。针对反转、换手率、波动率因子的合成,相比全连接网络,GAT的RankIC从6.87%提升到7.29%,IC_IR从0.46提升到0.55,分5层测试TOP组合年化超额收益率提升了3.17%,分析师共同覆盖确实为三个因子的合成贡献了增量信息。本文还从注意力权重矩阵的角度对GAT做可解释性分析,结论有:(1)相比关联股票,股票自身的特征对于收益预测贡献最显著,关联股票的特征能提供一定信息补充;(2)股票之间的相互影响程度是不对称的。 关于分析师共同覆盖和图神经网络的研究,仍有以下值得尝试的方向: 1. 基于分析师共同覆盖,能否构建其他的股票间关联因子和关联事件驱动策略? 2. 目前图神经网络GAT仅能利用股票间是否有关联的信息,而不能利用先验的股票间关联权重信息,关联权重信息的利用值得关注。 3. 目前学界普遍认为GAT能较好地学习直接关联关系,而对间接关联关系学习效果不佳(比如A与B直接关联,B与C直接关联,A与C不直接关联,则A与C是间接关联),我们将紧密跟踪学界在相关问题的研究动态。 参考文献 [1] Ali, Usman, and David Hirshleifer. “Shared Analyst Coverage: Unifying Momentum Spillover Effects.” Journal of Financial Economics forthcoming (2019). [2] Menzly, Lior, and Oguzhan Ozbas. “Market Segmentation and Cross-Predictability of Returns.” Journal of Finance 65.4 (2010): 1555-1580. [3] Hoberg, Gerard, and Gordon M. Phillips. "Text-based industry momentum." Journal of Financial and Quantitative Analysis 53.6 (2018): 2355-2388. [4] Parsons C A, Sabbatucci R, Titman S. Geographic Lead-Lag Effects[J]. Available at SSRN 2780139, (2018). [5] Lee C, Sun S T, Wang R, et al. Technological Links and Predictable Returns[J]. Journal of Financial Economics (JFE), Forthcoming, (2018). [6] Moskowitz T J, Grinblatt M. Do industries explain momentum?[J]. The Journal of finance, (1999), 54(4): 1249-1290. 风险提示 因子测试是历史经验的总结,存在失效可能。本文测试的股票池仅包含有分析师覆盖的A股,测试结论不能推广到全A股。神经网络受随机性影响较大,可解释性较低,使用需谨慎。高频调仓受交易费用影响较大。 免责声明与评级说明 公众平台免责申明 本公众平台不是华泰证券研究所官方订阅平台。相关观点或信息请以华泰证券官方公众平台为准。根据《证券期货投资者适当性管理办法》的相关要求,本公众号内容仅面向华泰证券客户中的专业投资者,请勿对本公众号内容进行任何形式的转发。若您并非华泰证券客户中的专业投资者,请取消关注本公众号,不再订阅、接收或使用本公众号中的内容。因本公众号难以设置访问权限,若给您造成不便,烦请谅解!本公众号旨在沟通研究信息,交流研究经验,华泰证券不因任何订阅本公众号的行为而将订阅者视为华泰证券的客户。 本公众号研究报告有关内容摘编自已经发布的研究报告的,若因对报告的摘编而产生歧义,应以报告发布当日的完整内容为准。如需了解详细内容,请具体参见华泰证券所发布的完整版报告。 本公众号内容基于作者认为可靠的、已公开的信息编制,但作者对该等信息的准确性及完整性不作任何保证,也不对证券价格的涨跌或市场走势作确定性判断。本公众号所载的意见、评估及预测仅反映发布当日的观点和判断。在不同时期,华泰证券可能会发出与本公众号所载意见、评估及预测不一致的研究报告。 在任何情况下,本公众号中的信息或所表述的意见均不构成对客户私人投资建议。订阅人不应单独依靠本订阅号中的信息而取代自身独立的判断,应自主做出投资决策并自行承担投资风险。普通投资者若使用本资料,有可能会因缺乏解读服务而对内容产生理解上的歧义,进而造成投资损失。对依据或者使用本公众号内容所造成的一切后果,华泰证券及作者均不承担任何法律责任。 本公众号版权仅为华泰证券股份有限公司所有,未经公司书面许可,任何机构或个人不得以翻版、复制、发表、引用或再次分发他人等任何形式侵犯本公众号发布的所有内容的版权。如因侵权行为给华泰证券造成任何直接或间接的损失,华泰证券保留追究一切法律责任的权利。本公司具有中国证监会核准的“证券投资咨询”业务资格,经营许可证编号为:91320000704041011J。 华泰金工深度报告一览 金融周期系列研究(资产配置) 【华泰金工林晓明团队】2020年中国市场量化资产配置年度观点——周期归来、机会重生,顾短也兼长20200121 【华泰金工林晓明团队】量化资产配置2020年度观点——小周期争明日,大周期赢未来20200116 【华泰金工林晓明团队】风险预算模型如何度量风险更有效-改进风险度量方式稳定提升风险模型表现的方法 【华泰金工林晓明团队】周期双底存不确定性宜防守待趋势——短周期底部拐头机会渐增,待趋势明朗把握或更大20191022 【华泰金工林晓明团队】二十年一轮回的黄金投资大周期——黄金的三周期定价逻辑与组合配置、投资机会分析20190826 【华泰金工林晓明团队】如何有效判断真正的周期拐点?——定量测度实际周期长度提升市场拐点判准概率 【华泰金工林晓明团队】基钦周期的长度会缩短吗?——20190506 【华泰金工林晓明团队】二十载昔日重现,三四年周期轮回——2019年中国与全球市场量化资产配置年度观点(下) 【华泰金工林晓明团队】二十载昔日重现,三四年周期轮回——2019年中国与全球市场量化资产配置年度观点(上) 【华泰金工林晓明团队】周期轮动下的BL资产配置策略 【华泰金工林晓明团队】周期理论与机器学习资产收益预测——华泰金工市场周期与资产配置研究 【华泰金工林晓明团队】市场拐点的判断方法 【华泰金工林晓明团队】2018中国与全球市场的机会、风险 · 年度策略报告(上) 【华泰金工林晓明团队】基钦周期的量化测度与历史规律 · 华泰金工周期系列研究 【华泰金工林晓明团队】周期三因子定价与资产配置模型(四)——华泰金工周期系列研究 【华泰金工林晓明团队】周期三因子定价与资产配置模型(三)——华泰金工周期系列研究 【华泰金工林晓明团队】周期三因子定价与资产配置模型(二)——华泰金工周期系列研究 【华泰金工林晓明团队】周期三因子定价与资产配置模型(一)——华泰金工周期系列研究 【华泰金工林晓明团队】华泰金工周期研究系列 · 基于DDM模型的板块轮动探索 【华泰金工林晓明团队】市场周期的量化分解 【华泰金工林晓明团队】周期研究对大类资产的预测观点 【华泰金工林晓明团队】金融经济系统周期的确定(下)——华泰金工周期系列研究 【华泰金工林晓明团队】金融经济系统周期的确定(上)——华泰金工周期系列研究 【华泰金工林晓明团队】全球多市场择时配置初探——华泰周期择时研究系列 行业指数频谱分析及配置模型:市场的周期分析系列之三 【华泰金工林晓明团队】市场的频率——市场轮回,周期重生 【华泰金工林晓明团队】市场的轮回——金融市场周期与经济周期关系初探 周期起源 【华泰金工林晓明团队】金融经济周期的耗散结构观——华泰周期起源系列研究之十 【华泰金工林晓明团队】经济系统中有序市场结构的进化——华泰周期起源系列研究报告之九 【华泰金工林晓明团队】企业间力的产生、传播和作用效果——华泰周期起源系列研究之八 【华泰金工林晓明团队】耦合振子同步的藏本模型——华泰周期起源系列研究之七 【华泰金工林晓明团队】周期在供应链管理模型的实证——华泰周期起源系列研究之六 【华泰金工林晓明团队】不确定性与缓冲机制——华泰周期起源系列研究报告之五 【华泰金工林晓明团队】周期是矛盾双方稳定共存的结果——华泰周期起源系列研究之四 【华泰金工林晓明团队】周期是不确定性条件下的稳态——华泰周期起源系列研究之三 【华泰金工林晓明团队】周期趋同现象的动力学系统模型——华泰周期起源系列研究之二 【华泰金工林晓明团队】从微观同步到宏观周期——华泰周期起源系列研究报告之一 FOF与金融创新产品 【华泰金工林晓明团队】养老目标基金的中国市场开发流程--目标日期基金与目标风险基金产品设计研究 【华泰金工】生命周期基金Glide Path开发实例——华泰FOF与金融创新产品系列研究报告之一 因子周期(因子择时) 【华泰金工林晓明团队】市值因子收益与经济结构的关系——华泰因子周期研究系列之三 【华泰金工林晓明团队】周期视角下的因子投资时钟--华泰因子周期研究系列之二 【华泰金工林晓明团队】因子收益率的周期性研究初探 择时 【华泰金工林晓明团队】波动率与换手率构造牛熊指标——华泰金工量化择时系列 【华泰金工林晓明团队】A股市场低开现象研究 【华泰金工林晓明团队】华泰风险收益一致性择时模型 【华泰金工林晓明团队】技术指标与周期量价择时模型的结合 【华泰金工林晓明团队】华泰价量择时模型——市场周期在择时领域的应用 中观基本面轮动 【华泰金工林晓明团队】行业配置落地:绝对收益型ETF轮动策略——华泰中观基本面轮动系列之十八 【华泰金工林晓明团队】行业配置策略:资金流向视角——华泰中观基本面轮动系列之十七 【华泰金工林晓明团队】行业配置策略:投资时钟视角——华泰中观基本面轮动系列之十六 【华泰金工林晓明团队】行业配置落地:科技主题基金筛选——华泰中观基本面轮动系列之十五 【华泰金工林晓明团队】行业配置落地:消费主题基金筛选——华泰中观基本面轮动系列之十四 【华泰金工林晓明团队】行业配置策略:机构调研视角——华泰中观基本面轮动系列之十三 【华泰金工林晓明团队】行业配置落地:医药主题基金筛选——华泰中观基本面轮动系列之十二 【华泰金工林晓明团队】行业配置落地:指数增强篇(2)——华泰中观基本面轮动系列之十一 【华泰金工林晓明团队】行业配置落地:指数增强篇——华泰中观基本面轮动系列之十 【华泰金工林晓明团队】行业配置策略:拥挤度视角——华泰中观基本面轮动系列之九 【华泰金工林晓明团队】行业配置策略:景气度视角——华泰中观基本面轮动系列之八 【华泰金工林晓明团队】行业配置策略:趋势追踪视角——华泰中观基本面轮动系列之七 【华泰金工林晓明团队】行业配置策略:宏观因子视角——华泰中观基本面轮动系列之六 【华泰金工林晓明团队】行业全景画像:投入产出表视角——华泰中观基本面轮动系列之五 【华泰金工林晓明团队】行业全景画像:改进杜邦拆解视角——华泰中观基本面轮动系列之四 【华泰金工林晓明团队】行业全景画像:风格因子视角 ——华泰中观基本面轮动系列之三 【华泰金工林晓明团队】行业全景画像:宏观因子视角 ——华泰中观基本面轮动系列之二 【华泰金工林晓明团队】确立研究对象:行业拆分与聚类——华泰中观基本面轮动系列之一 行业轮动 【华泰金工林晓明团队】不同协方差估计方法对比分析(二)——华泰行业轮动系列报告之十三 【华泰金工林晓明团队】拥挤度指标在行业配置中的应用——华泰行业轮动系列报告之十二 【华泰金工林晓明团队】基于投入产出表的产业链分析 ——华泰行业轮动系列报告之十一 【华泰金工林晓明团队】不同协方差估计方法对比分析——华泰行业轮动系列报告之十 【华泰金工林晓明团队】景气度指标在行业配置中的应用——华泰行业轮动系列报告之九 【华泰金工林晓明团队】再探周期视角下的资产轮动——华泰行业轮动系列报告之八 【华泰金工林晓明团队】“华泰周期轮动”基金组合改进版——华泰行业轮动系列报告之七 【华泰金工林晓明团队】“华泰周期轮动”基金组合构建——华泰行业轮动系列之六 【华泰金工林晓明团队】估值因子在行业配置中的应用——华泰行业轮动系列报告之五 【华泰金工林晓明团队】动量增强因子在行业配置中的应用——华泰行业轮动系列报告之四 【华泰金工林晓明团队】财务质量因子在行业配置中的应用——华泰行业轮动系列报告之三 【华泰金工林晓明团队】周期视角下的行业轮动实证分析——华泰行业轮动系列之二 【华泰金工林晓明团队】基于通用回归模型的行业轮动策略——华泰行业轮动系列之一 Smartbeta 【华泰金工林晓明团队】重剑无锋:低波动 Smart Beta——华泰 Smart Beta 系列之四 【华泰金工林晓明团队】投资优质股票:红利类Smart Beta——华泰Smart Beta系列之三 【华泰金工林晓明团队】博观约取:价值和成长Smart Beta——华泰Smart Beta系列之二 【华泰金工林晓明团队】Smart Beta:乘风破浪趁此时——华泰Smart Beta系列之一 【华泰金工林晓明团队】Smartbeta在资产配置中的优势——华泰金工Smartbeta专题研究之一 多因子选股 【华泰金工林晓明团队】华泰单因子测试之历史分位数因子——华泰多因子系列之十三 【华泰金工林晓明团队】桑土之防:结构化多因子风险模型——华泰多因子系列之十二 【华泰金工林晓明团队】华泰单因子测试之海量技术因子——华泰多因子系列之十一 【华泰金工林晓明团队】因子合成方法实证分析 ——华泰多因子系列之十 【华泰金工林晓明团队】华泰单因子测试之一致预期因子 ——华泰多因子系列之九 【华泰金工林晓明团队】华泰单因子测试之财务质量因子——华泰多因子系列之八 【华泰金工林晓明团队】华泰单因子测试之资金流向因子——华泰多因子系列之七 【华泰金工林晓明团队】华泰单因子测试之波动率类因子——华泰多因子系列之六 【华泰金工林晓明团队】华泰单因子测试之换手率类因子——华泰多因子系列之五 【华泰金工林晓明团队】华泰单因子测试之动量类因子——华泰多因子系列之四 【华泰金工林晓明团队】华泰单因子测试之成长类因子——华泰多因子系列之三 【华泰金工林晓明团队】华泰单因子测试之估值类因子——华泰多因子系列之二 【华泰金工林晓明团队】华泰多因子模型体系初探——华泰多因子系列之一 【华泰金工林晓明团队】五因子模型A股实证研究 【华泰金工林晓明团队】红利因子的有效性研究——华泰红利指数与红利因子系列研究报告之二 人工智能 【华泰金工林晓明团队】人工智能57:文本FADT选股——华泰人工智能系列之五十七 【华泰金工林晓明团队】新闻舆情分析的HAN网络选股——华泰人工智能系列之五十六 【华泰金工林晓明团队】图神经网络选股的进阶之路——华泰人工智能系列之五十五 【华泰金工林晓明团队】基于遗传规划的一致预期因子挖掘——华泰人工智能系列之五十四 【华泰金工林晓明团队】揭秘微软AI量化研究——华泰人工智能系列之五十三 【华泰金工林晓明团队】神经网络组合优化初探——华泰人工智能系列之五十二 【华泰金工林晓明团队】文本PEAD选股策略——华泰人工智能系列之五十一 【华泰金工林晓明团队】再探cGAN资产配置——华泰人工智能系列之五十 【华泰金工林晓明团队】SinGAN 单样本生成——人工智能系列之四十九 【华泰金工林晓明团队】对抗过拟合:cGAN应用于策略调参——人工智能系列之四十八 【华泰金工林晓明团队】cGAN模拟宏观指标——人工智能系列之四十七 【华泰金工林晓明团队】AlphaNet改进:结构和损失函数——华泰人工智能系列之四十六 【华泰金工林晓明团队】cGAN应用于资产配置——华泰人工智能系列之四十五 【华泰金工林晓明团队】深度卷积GAN实证——华泰人工智能系列之四十四 【华泰金工林晓明团队】因子观点融入机器学习——华泰人工智能系列之四十三 【华泰金工林晓明团队】图神经网络选股与Qlib实践——华泰人工智能系列之四十二 【华泰金工林晓明团队】基于BERT的分析师研报情感因子——华泰人工智能系列之四十一 【华泰金工林晓明团队】微软AI量化投资平台Qlib体验——华泰人工智能系列之四十 【华泰金工林晓明团队】周频量价选股模型的组合优化实证——华泰人工智能系列之三十九 【华泰金工林晓明团队】WGAN生成:从单资产到多资产——华泰人工智能系列之三十八 【华泰金工林晓明团队】舆情因子和BERT情感分类模型——华泰人工智能系列之三十七 【华泰金工林晓明团队】相对生成对抗网络RGAN实证——华泰人工智能系列之三十六 【华泰金工林晓明团队】WGAN应用于金融时间序列生成——华泰人工智能系列之三十五 【华泰金工林晓明团队】再探AlphaNet:结构和特征优化——华泰人工智能系列之三十四 【华泰金工林晓明团队】数据模式探索:无监督学习案例——华泰人工智能系列之三十三 【华泰金工林晓明团队】AlphaNet:因子挖掘神经网络——华泰人工智能系列之三十二 【华泰金工林晓明团队】生成对抗网络GAN初探——华泰人工智能系列之三十一 【华泰金工林晓明团队】从关联到逻辑:因果推断初探——华泰人工智能系列之三十 【华泰金工林晓明团队】另类标签和集成学习——华泰人工智能系列之二十九 【华泰金工林晓明团队】基于量价的人工智能选股体系概览——华泰人工智能系列之二十八 【华泰金工林晓明团队】揭开机器学习模型的“黑箱” ——华泰人工智能系列之二十七 【华泰金工林晓明团队】遗传规划在CTA信号挖掘中的应用——华泰人工智能系列之二十六 【华泰金工林晓明团队】市场弱有效性检验与择时战场选择——华泰人工智能系列之二十五 【华泰金工林晓明团队】投石问路:技术分析可靠否?——华泰人工智能系列之二十四 【华泰金工林晓明团队】再探基于遗传规划的选股因子挖掘——华泰人工智能系列之二十三 【华泰金工林晓明团队】基于CSCV框架的回测过拟合概率——华泰人工智能系列之二十二 【华泰金工林晓明团队】基于遗传规划的选股因子挖掘——华泰人工智能系列之二十一 【华泰金工林晓明团队】必然中的偶然:机器学习中的随机数——华泰人工智能系列之二十 【华泰金工林晓明团队】偶然中的必然:重采样技术检验过拟合——华泰人工智能系列之十九 【华泰金工林晓明团队】机器学习选股模型的调仓频率实证——华泰人工智能系列之十八 【华泰金工林晓明团队】人工智能选股之数据标注方法实证——华泰人工智能系列之十七 【华泰金工林晓明团队】再论时序交叉验证对抗过拟合——华泰人工智能系列之十六 【华泰金工林晓明团队】人工智能选股之卷积神经网络——华泰人工智能系列之十五 【华泰金工林晓明团队】对抗过拟合:从时序交叉验证谈起 【华泰金工林晓明团队】人工智能选股之损失函数的改进——华泰人工智能系列之十三 【华泰金工林晓明团队】人工智能选股之特征选择——华泰人工智能系列之十二 【华泰金工林晓明团队】人工智能选股之Stacking集成学习——华泰人工智能系列之十一 【华泰金工林晓明团队】宏观周期指标应用于随机森林选股——华泰人工智能系列之十 【华泰金工林晓明团队】人工智能选股之循环神经网络——华泰人工智能系列之九 【华泰金工林晓明团队】人工智能选股之全连接神经网络——华泰人工智能系列之八 【华泰金工林晓明团队】人工智能选股之Python实战——华泰人工智能系列之七 【华泰金工林晓明团队】人工智能选股之Boosting模型——华泰人工智能系列之六 【华泰金工林晓明团队】人工智能选股之随机森林模型——华泰人工智能系列之五 【华泰金工林晓明团队】人工智能选股之朴素贝叶斯模型——华泰人工智能系列之四 【华泰金工林晓明团队】人工智能选股之支持向量机模型— —华泰人工智能系列之三 【华泰金工林晓明团队】人工智能选股之广义线性模型——华泰人工智能系列之二 指数增强基金分析 【华泰金工林晓明团队】再探回归法测算基金持股仓位——华泰基金仓位分析专题报告 【华泰金工林晓明团队】酌古御今:指数增强基金收益分析 【华泰金工林晓明团队】基于回归法的基金持股仓位测算 【华泰金工林晓明团队】指数增强方法汇总及实例——量化多因子指数增强策略实证 基本面选股 【华泰金工林晓明团队】华泰价值选股之相对市盈率港股模型——相对市盈率港股通模型实证研究 【华泰金工林晓明团队】华泰价值选股之FFScore模型 【华泰金工林晓明团队】相对市盈率选股模型A股市场实证研究 【华泰金工林晓明团队】华泰价值选股之现金流因子研究——现金流因子选股策略实证研究 【华泰金工林晓明团队】华泰基本面选股之低市收率模型——小费雪选股法 A 股实证研究 【华泰金工林晓明团队】华泰基本面选股之高股息率模型之奥轩尼斯选股法A股实证研究 财务质量 【华泰金工林晓明团队】财务质量分析体系初探-财务质量系列研究之一 【华泰金工林晓明团队】财报附注中隐藏的财务风险-财务质量系列研究之二 基金定投 【华泰金工林晓明团队】大成旗下基金2018定投策略研究 【华泰金工林晓明团队】布林带与股息率择时定投模型——基金定投系列专题研究报告之四 【华泰金工林晓明团队】基金定投3—马科维茨有效性检验 【华泰金工林晓明团队】基金定投2—投资标的与时机的选择方法 【华泰金工林晓明团队】基金定投1—分析方法与理论基础 基金评价 【华泰金工林晓明团队】基金评价及筛选全流程研究框架——股票型与债券型基金多种维度定量与定性评价法 【华泰金工林晓明团队】基金选股择时能力的定量分析法——我国公募基金大多具有较强选股能力 【华泰金工林晓明团队】基金业绩持续性的规律与策略构建——采用有效影响因子筛选出持续性较好的绩优基金 ETF季度盘点 【华泰金工林晓明团队】2021Q2中国ETF市场盘点回顾 【华泰金工林晓明团队】2021Q1中国ETF市场盘点回顾 【华泰金工林晓明团队】2020Q4中国ETF市场全景回顾——总规模创新高,行业主题类ETF渐成市场新主角20210112 【华泰金工林晓明团队】2020年三季度中国ETF市场回顾——产品百花齐放、投资者结构日渐成熟,规模创新高20201021 【华泰金工林晓明团队】ETF产品细分差异化或成突围之道——2020二季度中国ETF市场全景回顾盘点与展望20200803 【华泰金工林晓明团队】ETF规模数量大涨品类不断丰富——2020一季度中国ETF市场全景回顾盘点 其它 【华泰金工林晓明团队】A股市场及行业的农历月份效应——月份效应之二 A股市场及行业的月份效应——详解历史数据中的隐藏法则

大部分微信公众号研报本站已有pdf详细完整版:https://www.wkzk.com/report/(可搜索研报标题关键词或机构名称查询原报告)

郑重声明:悟空智库网发布此信息的目的在于传播更多信息,与本站立场无关,不构成任何投资建议。