首页 > 公众号研报 > “海量”专题(197)——使用高频数据跟踪核心资产的公募基金持仓变化

“海量”专题(197)——使用高频数据跟踪核心资产的公募基金持仓变化

作者:微信公众号【海通量化团队】/ 发布时间:2021-08-29 / 悟空智库整理
(以下内容从海通证券《“海量”专题(197)——使用高频数据跟踪核心资产的公募基金持仓变化》研报附件原文摘录)
  重要提示:《证券期货投资者适当性管理办法》于2017年7月1日起正式实施,通过本微信订阅号发布的观点和信息仅供海通证券的专业投资者参考,完整的投资观点应以海通证券研究所发布的完整报告为准。若您并非海通证券客户中的专业投资者,为控制投资风险,请取消订阅、接收或使用本订阅号中的任何信息。本订阅号难以设置访问权限,若给您造成不便,敬请谅解。我司不会因为关注、收到或阅读本订阅号推送内容而视相关人员为客户;市场有风险,投资需谨慎。 近几年来,我们基于逐笔成交数据构建了一系列选股因子,如净买入类因子、买入意愿类因子以及大单类因子等。随着对于高频数据研究的深入,我们认为高频数据不仅仅可服务于传统的因子选股,还可作为基础指标协助其他类型的研究。本文在前期高频研究的基础之上,尝试使用高频数据跟踪机构交易者的行为,高频率刻画个股上公募基金持仓占比的变化。 1 公募基金持仓变化的度量和预估 近年来,随着股票市场中公募基金定价能力的提升,投资者对于公募基金持仓的关注度也越来越高。然而,由于公募基金仅季度披露前10大持仓,且披露时间还有一定的滞后性,因此市场上关于公募基金持仓的研究大多集中在对于底层基金产品的筛选,通过精选底层基金产品,来提升公募基金持仓数据的整体质量。我们也在前期发布的专题报告中进行了深入探讨。 那么是否有方法改善公募基金持仓数据的稀疏性以及滞后性呢?我们认为可寻找与机构持仓变化高相关的指标并构建模型预估公募基金整体在个股上的持仓占比的变化。海外相关研究结果表明,机构季度持仓变化与一系列变量皆存在一定的关联。Sias(2004)发现机构季度持仓变化与前一季度持仓变化相关;Grinblatt(1995)、Wermers(2000)、Nofsinger(1998)、Bennett(2003)发现机构季度持仓变化与同期股票收益相关。 1972年以来,也有许多研究尝试通过纽交所公开披露的交易数据去高频地度量机构的股票交易行为。Kraus(1972)、Holthausen(1987)、Madhavan(1997)、Ofek(2003)、Bozcuk(2005)都在相关研究中尝试使用交易数据度量机构的交易行为。此外,越来越多的研究也开始使用TAQ数据库中的高频交易数据。 基于海外相关研究结果并结合国内的实际情况以及数据可得性,我们可构建以下回归模型: 其中,chgPct_{i,t,t+1}为股票i在t至t+1时刻之间公募基金持仓占比的变化(股票i上的公募基金持仓占比为公募基金在股票i上的持仓总金额占股票i总市值的比例),hldPct_{i,t}为股票i在t时刻的公募基金持仓占比,chgPct_{i,t-1,t}为股票i在t-1至t时刻之间的公募基金持仓变化,BO_{i,t,t+1}为股票i在t至t+1时刻之间的大单净买入占比,BS_{i,t,t+1}为股票i在t至t+1时刻之间的净主买占比,Ret_{i,t,t+1}为股票i在t至t+1时刻之间的超额收益。 由于国内市场公募基金季度披露的持仓为前10大持仓,仅有半年报与年报披露全部持仓,因此在实际处理的过程中,为了顾及数据的时效性以及统一性,本文模型使用了季度披露的前10大持仓计算个股的公募基金持仓占比。个股的公募基金持仓占比以及持仓占比变化计算公式如下: 其中,hldPct_{i,t}为股票i在t时刻的公募基金持仓占比,hldAmt_{j,i,t}为基金j季报披露的t时刻在股票i上的持仓金额,mktVal_{i,t}为股票i在t时刻的总市值,chgPct_{i,t,t+1}为股票i在t时刻至t+1时刻之间的公募基金持仓占比变化。 2 全市场模型 基于前文提出的回归模型,本章使用了2013年6月以来的数据构建模型。下表给出了回归模型中各变量的回归系数均值以及显著的比例(回归系数T统计量绝对值大于2的比例)。 观察上表可知,截距项均值为正,这体现出个股的公募基金持仓占比整体呈现持续上升的态势,这也与近年来公募基金管理规模持续上升的趋势较为一致。 期初持仓占比回归系数均值为负,这体现出个股期初公募基金持仓占比越高,该期的持仓占比增量越小。前一期持仓占比变化的回归系数均值同样为负,这体现出个股前一期持仓占比增量越大,该期公募基金持仓占比增量越小。观察该变量的回归系数在历史上的走势不难发现,回归系数围绕0值波动。该系数在2014年6月30日至2014年9月30日以及2017年3月31日至2018年9月30日之间处于0值之上。2020年6月30日以来,回归系数呈现出了较为明显的回升态势。这一结果同样体现出近年来公募基金季度持仓变化的反转性有所减弱。 大单净买入占比、净主买占比的回归系数皆为正值,且显著比例较高,这体现出个股的大单净买入占比越高或者净主买占比越高,个股的公募基金持仓占比增量越大。两变量的回归系数在历史上基本维持在0以上,且显著比例较高。除了大单净买入占比以及净主买占比以外,个股超额收益的回归系数均值也为正,且显著比例较高。这体现出了公募基金持仓变化与个股同期超额收益之间存在正向关联。 可进一步观察回归模型的样本内解释能力。模型在样本内对于个股的公募基金持仓占比变化具有一定的解释能力,但是该种解释能力在历史上的不同时段存在较为明显的差异。模型样本内调整R方在17%上下波动。模型R方在2014年9月30日至2014年12月31日这一期达到了42%的历史高点。2019年以来,模型调整R方基本处于10%~15%的区间内。 当然,我们也可使用模型进行样本外预测。在预测未来一期个股公募基金持仓占比变化时,可滚动使用历史回归系数均值作为预测模型的参数。在评价模型样本外预测效果时,不仅可使用预测结果与实际结果之间的相关性,还可使用样本外R方。样本外相关性度量了模型预测的个股公募基金持仓占比变化与实际的公募基金持仓占比变化之间的相关性。下图分别展示了模型历史上各期的样本外相关性与样本外R方。 观察上图不难发现,模型整体上呈现出了一定的样本外预测能力,且模型样本外预测能力与样本内预测能力差别较小。在滚动使用历史系数均值进行样本外预测时,模型样本外相关性在0.43上下波动,样本外R方在18%上下波动。值得注意的是,全市场模型的样本外R方在最近几期呈现出了回落态势,样本外预测能力有所回落。 综合上述结果来看,全市场回归模型具有一定的样本内解释能力以及样本外预测能力,但是模型依旧存在较为明显的改进提升空间。考虑到公募基金管理人对于不同范围的股票操作风格存在差异,因此使用全市场所有股票构建模型显然并不合理,因此本文将在下一章中对于不同范围内的股票分别构建公募基金持仓占比变化回归模型。 3 分板块模型 在前一章中,我们使用全市场数据初步构建了个股公募基金持仓占比变化回归模型。回测结果表明,虽然模型在样本内具有一定的解释能力且在样本外同样具有一定预测效果,但是模型依旧存在改进空间。 考虑到公募基金管理人对于不同类型的股票在操作上可能存在差异,因此可尝试划分不同的股票范围,并在不同的股票范围内分别构建模型。本章尝试了三种不同的范围划分方法:1)按照宽基指数划分;2)按照行业板块划分;3)按照期初公募基金持仓占比划分。 3.1 按照宽基指数划分 在按照宽基指数划分时,本节将股票分为了三个范围:沪深300指数内、中证500指数内以及中证800外。基于前文提出的回归模型,可使用2013年6月以来的数据构建回归模型。下表给出了回归模型中各变量的回归系数均值以及显著的比例。 期初持仓占比的回归系数均值在三个范围内皆为负,其中,沪深300指数内的回归系数均值相对较高,而中证500指数内与中证800指数外的回归系数均值较为接近。前一期持仓占比变化的回归系数均值在沪深300指数内为正,而在剩下两个范围内为负。这一结果体现出公募基金在大市值股票范围的持仓变化反转性较弱。此外,虽然该变量的回归系数虽然在中证500指数内为负,但是显著比例偏低。 大单净买入占比以及净主买占比的回归系数均值在不同的指数范围内为正,且显著比例较高。这表明大单净买入以及净主买与同时段机构持仓的变化之间存在显著联系。进一步观察回归系数的大小可知,沪深300指数内的回归系数均值高于中证500指数内的回归系数均值,而中证500指数内的回归系数均值高于中证800指数外的回归系数均值。这也说明,沪深300指数内的大单净买入或者净主买更有可能是公募基金的交易行为。 此外,个股超额收益的回归系数均值在不同的指数范围内为正,且显著比例同样较高。这说明公募基金的持仓变化与同期股票超额收益之间存在正向关联。相比而言,该变量在沪深300指数内的回归系数均值更高。 在划分了不同指数范围并分别构建模型后,模型的解释能力相比于全市场模型出现了较为明显的改进与提升。对比不同指数范围内的样本内调整R方,模型在沪深300指数内具有更强的解释能力,调整R方的均值以及中位数皆明显高于其他两个范围。 相比于全市场模型,滚动预测模型同样呈现出了较强的样本外预测能力,全市场持仓变动的样本外相关性从的0.43上升至0.46,样本外预测R方中位数从18%上升至20%。相比而言,模型对于沪深300指数内以及中证500指数内的股票的持仓占比变化的预测能力更强,模型样本外R方围绕30%波动。(下表在计算分板块模型在全市场的样本外相关性以及R方时,首先在各板块内进行预测,然后合并得到全市场股票的样本外预测,最后基于全市场股票的样本外预测结果计算样本外相关性以及R方。) 3.2 按照行业板块划分 在按照行业板块划分股票范围时,本节将股票分为了六个板块:原材料、工业、金融地产、消费、科技以及其他。基于前文提出的回归模型,可使用2013年6月以来的数据构建分板块模型。 期初持仓占比的回归系数均值在不同板块内皆为负,其中,消费以及其他板块中的系数均值相对更高。前一期持仓占比变化回归系数均值在各板块中皆为负,但是该变量在大部分板块中的显著比例处于50%上下。此外,该变量在消费板块中的回归系数明显更接近于0,这说明消费板块中个股公募基金持仓变化的反转性并不明显。 大单净买入占比、净主买占比的回归系数均值在不同的板块中内为正,两变量在科技板块以及消费板块内的系数均值明显高于其他板块,这表明两板块中的大单净买入或者净主买有更高的概率是公募基金的交易行为。这一结论也与近年来公募基金的偏好较为吻合。此外,个股超额收益的回归系数在不同板块中为正,这表明个股超额收益越明显,公募基金增配的概率越大。 在划分了不同行业板块范围并分别构建模型后,模型的解释能力相比于全市场模型出现了一定程度的改进与提升。对比模型在不同行业板块中的表现可知,模型在原材料以及科技板块中的解释能力相对更强。 在使用行业板块划分了股票范围后,我们并未观察到模型样本预测效果的明显改善。模型在全市场的样本外相关性的中位数从0.43回落至0.42,样本外R方的中位数从18%回落至17.4%。(下表在计算分板块模型在全市场的样本外相关性以及R方时,首先在各板块内进行预测,然后合并得到全市场股票的样本外预测,最后基于全市场股票的样本外预测结果计算样本外相关性以及R方。) 3.3 按照期初公募基金持仓占比划分 考虑到机构在调整持仓时也会考虑到股票当前的机构持仓情况,我们同样可根据期初个股的公募基金持仓占比进行范围划分。本节基于期初公募基金持仓占比将全市场股票分为了公募基金持仓占比高、公募基金持仓占比低以及无公募基金持仓三个范围。 公募基金持仓占比高为期初公募基金持仓占比大于0的股票中持仓占比前30%的股票,公募基金持仓占比低为期初公募基金持仓占比大于0的股票中持仓占比后70%的股票,无公募基金持仓占比为期初公募基金持仓占比为0的股票。基于前文提出的回归模型,可使用2013年6月以来的数据构建回归模型。 期初持仓占比的回归系数均值在公募基金持仓高以及公募基金持仓低两个范围中皆为负,其中,该变量回归系数在公募基金持仓高的股票中显著比例更高。前一期持仓占比变化回归系数均值在各范围中皆为负。相比而言,该系数在公募基金持仓占比高的股票中更加接近于0,且系数显著比例明显低于其他两个范围。这说明,在该范围中,公募基金持仓变化的反转性并不明显。在其余两个范围中,公募基金季度持仓变化具有一定的反转性。 大单净买入占比以及净主买占比的回归系数均值在各范围内为正,且在公募基金持仓占比高的股票范围中均值更高,显著比例也较高。这表明,在公募基金持仓占比较高的股票范围中,股票上的大单流入以及资金净流入有更高的概率为公募基金交易行为,这一结论也较为符合直观理解。 个股超额收益的回归系数均值在各个范围内同样为正,且在公募基金持仓占比较高的股票范围中系数均值更高。这同样说明,个股上公募基金持仓的变化与同期股票超额收益之间存在较为明显的正向关联。 模型在公募基金持仓占比较高的股票范围内有着较强的解释能力,模型调整R方围绕35%波动。对于公募基金持仓占比较低以及无持仓的股票,模型的解释能力相对偏弱,模型调整R方分别围绕15%以及5%波动。 相比于全市场模型,模型的样本外预测能力有所提升。模型在全市场的样本外相关性的中位数从0.43上升至0.55,样本外R方的中位数从18%上升至30%。分股票范围来看,模型在公募基金持仓占比高的股票中具有较强的预测能力,而对于公募基金持仓占比低的股票以及公募基金未持仓的股票的预测效果偏弱。(下表在计算分板块模型在全市场的样本外相关性以及R方时,首先在各板块内进行预测,然后合并得到全市场股票的样本外预测,最后基于全市场股票的样本外预测结果计算样本外相关性以及R方。) 3.4 模型对比 下表对比了不同的模型在不同的股票范围内的样本外预测效果。从样本外相关性的角度看,分板块模型(按照期初持仓占比)在各范围内具有相对更好的样本外预测能力。从全市场的角度看,模型的预测持仓变化与实际持仓占比变化之间的相关性中位数高于0.55。从各个股票范围的角度看,模型的样本外相关性同样高于其余模型。(下表在计算分板块模型在全市场以及特定股票范围内的样本外相关性以及R方时,首先在各板块内进行预测,然后合并得到全市场股票的样本外预测,最后基于指定范围股票的样本外预测结果计算模型在该范围内的样本外相关性以及R方。) 从样本外R方的角度看,分板块模型(按照期初持仓占比)同样较好。从全市场的角度看,模型的样本外R方中位数为30.2%,明显高于其余各模型。从各个股票范围的角度看,模型同样呈现出了较强的样本外预测能力,模型样本外R方在各股票范围内皆相对较高。 4 模型应用案例 基于前文构建的模型,我们可较为便捷地对于个股的公募基金持仓变动进行预测。本节展示了模型的三种应用方式,我们也会在后续报告中围绕相关应用进行更加详细的讨论。 由于个股的高频数据每日可得,因此可基于前期已披露的基金持仓占比以及模型预估的持仓占比变化得到当前的公募基金持仓占比预估。下图以部分股票为例展示了模型对于相关个股的公募基金持仓占比以及持仓占比变化的预测。(季度对比图为模型在每个季度末的预估值与季报披露的实际值的对比。而对于日度对比图,由于基金季报通常在季度结束后的15个工作日内披露,因此在对比实际披露以及模型预估的公募基金持仓占比时同样考虑了这一时间滞后。) 观察上图不难发现,相比于简单沿用前期披露的机构持仓占比,模型能够提供日度的持仓占比预期,对于机构持仓占比较高的股票,模型具有相对较高的预测效果。值得注意的是,模型对于个股的持仓占比预期在部分时点依旧存在一定的偏差。 基于个股的公募基金持仓占比预测结果,我们可进一步合成行业的公募基金持仓占比。下图以部分行业为例展示了模型对于相关行业的公募基金持仓占比以及持仓占比变化的预测。 除了个股与行业外,我们同样可使用个股的公募基金持仓占比预估特定股票构成的因子或者风格的公募基金持仓占比。下图以部分行业为例展示了BP_LY最高的10%的股票的模型预期以及实际披露的公募基金持仓占比。 对比个股、行业以及风格的公募基金持仓占比预估结果以及前期实际披露结果不难发现,模型预估结果具有更强的灵活性。由于实际披露数据具有明显的稀疏性以及滞后性,个股、行业以及风格的公募基金持仓占比实际披露结果整体呈现阶梯走势。相比而言,模型预估结果考虑了多方面的因素,会随着市场的演变而对于当前的公募基金持仓占比预期进行修正,因此展现出了更强的灵活性。 此外,模型预估结果也具有一定的准确性。特别是对于公募基金持仓占比较高的个股、行业或者风格。模型预估的持仓占比变化方向与实际披露的结果基本一致,部分时点上仅存在具体数值上的差异。 总而言之,模型预估结果相比于前期披露结果具有更强的灵活性以及准确性,因此可考虑基于模型预估结果构建选股、行业轮动等投资策略。 5 总结 本文尝试使用市场微观数据,从微观交易的角度跟踪刻画公募基金投资者的交易行为,并构建模型高频预估个股的公募基金持仓占比变化。回测结果表明,全市场模型在样本内对于个股的公募基金持仓变动具有一定的解释能力。通过划分股票范围,在不同股票范围内单独构建模型预测股票持仓变动,可进一步提升模型的解释能力。 在实际应用中,可构建模型滚动预估个股上公募基金持仓占比的变化。回测结果表明,全市场模型的样本外预测能力有待提升,按照期初公募基金持仓占比划分股票范围的分板块模型具有相对较好的样本外预测能力。基于个股的公募基金持仓预估,我们可进一步对于行业、因子以及风格的公募基金持仓占比变化进行预估。 总而言之,文中构建得到的个股公募基金持仓占比变化预估模型在具有样本内解释能力的同时也具有一定的样本外预测能力。我们将在后续报告中对于预估结果的应用进行更加细致的讨论。 6 风险提示 市场系统性风险、资产流动性风险以及政策变动风险会对策略表现产生较大影响。 联系人:袁林青,021-23212230 法律声明: 本公众订阅号(微信号:海通量化团队)为海通证券研究所金融工程运营的唯一官方订阅号,本订阅号所载内容仅供海通证券的专业投资者参考使用,仅供在新媒体背景下的研究观点交流;普通个人投资者由于缺乏对研究观点或报告的解读能力,使用订阅号相关信息或造成投资损失,请务必取消订阅本订阅号,海通证券不会因任何接收人收到本订阅号内容而视其为客户。 本订阅号不是海通研究报告的发布平台,客户仍需以海通研究所通过研究报告发布平台正式发布的完整报告为准。 市场有风险,投资需谨慎。在任何情况下,本订阅号所载信息或所表述的意见并不构成对任何人的投资建议,对任何因直接或间接使用本订阅号刊载的信息和内容或者据此进行投资所造成的一切后果或损失,海通证券不承担任何法律责任。 本订阅号所载的资料、意见及推测有可能因发布日后的各种因素变化而不再准确或失效,海通证券不承担更新不准确或过时的资料、意见及推测的义务,在对相关信息进行更新时亦不会另行通知。 本订阅号的版权归海通证券研究所拥有,任何订阅人如欲引用或转载本订阅号所载内容,务必联络海通证券研究所并获得许可,并必注明出处为海通证券研究所,且不得对内容进行有悖原意的引用和删改。 海通证券研究所金融工程对本订阅号(微信号:海通量化团队)保留一切法律权利。其它机构或个人在微信平台以海通证券研究所金融工程名义注册的、或含有“海通证券研究所金融工程团队或小组”及相关信息的其它订阅号均不是海通证券研究所金融工程官方订阅号。

大部分微信公众号研报本站已有pdf详细完整版:https://www.wkzk.com/report/(可搜索研报标题关键词或机构名称查询原报告)

郑重声明:悟空智库网发布此信息的目的在于传播更多信息,与本站立场无关,不构成任何投资建议。