首页 > 公众号研报 > 自选股与点击量:投资者关注度的选股能力 | 开源证券金融工程

自选股与点击量:投资者关注度的选股能力 | 开源证券金融工程

作者:微信公众号【开源证券研究所】/ 发布时间:2022-03-29 / 悟空智库整理
(以下内容从开源证券《自选股与点击量:投资者关注度的选股能力 | 开源证券金融工程》研报附件原文摘录)
  随着移动互联网的普及,手机端交易软件的推出大幅提升了投资者的交易便捷性。区别于机构投资者在Wind终端具有相对数量优势,同花顺和东方财富等第三方交易软件提供商则更多吸引了个人投资者的使用。 在大数据时代,数据即是价值。交易软件记录的海量投资者的交易行为,是否蕴含着丰富的alpha信息源?近期,开源证券金融工程团队发布专题报告《自选股与点击量:投资者关注度的选股能力》,我们尝试从交易软件记录的各类投资者行为中挖掘出潜藏的特征,以作为未来投资的参考依据。 本文以同花顺交易软件为例,通过对原始数据进行脱敏处理后,统计了几大类典型的投资者行为,包含但不限于投资者个股点击量、新闻点击量和自选股数量等多种行为。同时,为了区分不同资金量级下的投资者行为之间是否存在显著差异,同花顺也进行了相应的切分处理,为我们更细致地审视投资者间的差异提供了更加清晰的视角。 投资者关注度因子测试:具有稳定的负向选股能力 — 1、个股点击量占比:关注度的综合映射 个股点击量能够较好地反映市场上个股当前时刻的受关注程度,当前受关注程度相对更高的个股通常具有更高的点击次数,其可以理解为投资者对个股关注程度的映射。以此为切入点,我们构建了个股点击量占比因子,其计算方法为个股当天点击量占全市场所有个股当天点击量的比例。 通过观察每个交易日个股点击量占比的最大值时序图可知,单个股票最大点击量占比的平均值约为1.1%,极值能够达到全市场所有个股点击量的8%以上。 个股单日最大点击量占比最高可达8% 数据来源:同花顺iFind、开源证券研究所 考虑到全市场几千支股票,个股点击量占比数据大概率呈现厚尾形态。为了验证猜测,我们绘制了点击量占比数据的分布图,其呈现显著的右偏分布(为了方便显示,我们对个股点击量占比超过历史上单日最大点击量均值的数值予以剔除)。为此,我们尝试对原始数据进行取对数处理,可以看到转换后的新数据近似服从正态分布。 原始点击量占比数据呈现右偏分布 数据来源:同花顺iFind、开源证券研究所 从行业点击量占比分布来看,各行业之间亦存在较明显的差异。其中,行业点击量占比计算过程为:首先计算每个月末行业内个股点击量占比的均值,再对时序上的行业均值取平均值处理,最后在截面上进行归一化,得到各行业在全区间内的点击量占比情况。可以看到,非银金融、银行、有色金属和国防军工行业点击量占比相对较高,达到5%以上,商业贸易、纺织服装和休闲服务点击量占比则相对靠后,均低于2.5%。 不同行业点击量占比存在较大的差异 数据来源:同花顺iFind、开源证券研究所 我们按照50亿、100亿、500亿和2000亿将个股市值分为从低到高五个组别,并根据行业分组下点击量占比的计算方式统计了市值分组下点击量占比的情况。可以看到在时序上不同市值分组下点击量占比处于相对稳定的位置,高市值分组点击量占比相对更高,其中市值规模在500亿以上的个股被点击的概率显著高于其他分组。数据背后的直观解释是,大市值股票通常被投资者更熟知,被点击的概率更大,小市值股票通常受限于全A几千支标的,投资者精力有限,导致被遗忘在角落里的概率更高。 不同市值分组点击量占比在时序上变化相对稳定 数据来源:同花顺iFind、开源证券研究所 市值越高,点击量占比越高(单位:亿元) 数据来源:同花顺iFind、开源证券研究所 为了避免选择偏差,我们首先将自然月内的个股点击量占比取均值,然后在此基础上进行取对数处理,得到每个月末个股点击量占比。根据前文分析可知个股点击量占比在不同行业和市值分组下存在较大差异,因此我们在进行因子测试前,分别进行市值和行业中性化处理,同时为了避免次新股和新股的影响,我们剔除了上市不足一年的个股。如无特别说明,以下因子测试均采用此流程。 谚语有云,“人多的地方不要去”。对于个股而言,高点击量占比是否意味着个股的市场关注度过高,投资者情绪达到极端值,导致相关个股未来的潜在回报为负?从测试结果来看,符合前述猜测,即高点击量占比个股所在的分组通常未来的收益表现相对不佳。点击量占比因子的RankIC历史均值达到-10%,五分组收益虽然不严格单调,但多空分组表现优异,其中多头年化收益率11.57%,多空年化收益率19.83%。 高点击量占比个股潜在回报显著为负 数据来源:同花顺iFind、开源证券研究所 高点击量占比个股分组大幅跑输其他分组 数据来源:同花顺iFind、开源证券研究所 更进一步,高资金量级投资者的表现是否更加理性?其个股点击分布是否与低资金量级的投资者存在显著差别?为此,我们按照用户资金量的大小,将投资者分为低、中、高三种类型,其中低资金投资者持仓规模为10~50万元,中资金投资者规模为50~100万元,高资金投资者规模为100万元以上。 我们分别统计了三种类型投资者的累计RankIC变化情况,从测试结果来看,高中低三类投资者的个股点击量占比表现具有一致性,均呈现稳定的负向选股能力,但低资金投资者点击量占比高的个股未来表现相对更差,即负向指示效果更显著。 低资金用户的高点击量占比的个股未来表现相对更差 数据来源:同花顺iFind、开源证券研究所 前文,我们测试了个股点击量占比因子的表现,个股点击触发通常源于三个途径:第一,被点击个股源于行情软件对相关新闻消息的推送,投资者出于好奇心所引发的点击;第二,被点击个股本身处于自选股池,其点击触发源于投资者对个股每日的例行跟踪;第三,被点击个股既处于自选股池,又被行情软件推送相关新闻,进而引发投资者的点击操作。根据前两个影响因素,我们分别构建了新闻点击量占比和自选股占比因子。那么,这两类因子是否潜藏着收益差别呢? 2、新闻点击量占比:外驱关注度的度量 资本市场中每天充斥着上市公司各种新闻消息,既涵盖上市公司官方发布的公告,也包括财经媒体发布的关于上市公司的各种信息。在浩如烟海的新闻信息中,部分上市公司的相关新闻信息曝光度更高,更容易受到投资者的关注,被投资者点击的概率更大,但投资者点击率更高的新闻对应的个股未来表现会更好吗? 基于此,我们构建了新闻点击量占比因子,其计算方法为个股新闻点击量除以A股所有上市公司新闻点击量合计值。从测试结果来看,新闻点击量占比因子RankIC均值为-6.10%,五分组严格单调,多空收益在2021年3月后呈现了较大的回撤,多头年化收益率11.42%,多空年化收益率9.71%。 新闻点击量占比越高,潜在回报越低 数据来源:同花顺iFind、开源证券研究所 新闻点击量占比因子组间区分度单调 数据来源:同花顺iFind、开源证券研究所 3、自选股占比:内生关注度的度量 自选股票池方便了投资者对关注个股的持续跟踪,其很大程度上代表了投资者对上市公司的主动关注,而非被动接收,是投资者偏好的内在反映。当某个标的股票被多数投资者加入自选股票池时,个股未来表现又会如何呢?为此,我们构建了自选股占比因子,其计算逻辑为:个股自选股用户数 / 自选股用户数合计(注:当同一个用户自选股中有多个股票时,每个股票都会统计该用户)。 从测试结果来看,自选股占比因子行为特征与个股点击量占比和新闻点击量占比因子表现近似,均呈现出显著的负向选股能力,其RankIC均值为-7.58%,多头年化收益率为11.08%,五分组收益虽不完全单调,但多空收益更加稳定,年化收益率16.51%,夏普比率1.94。 自选股占比越高的个股潜在回报亦为负值 数据来源:同花顺iFind、开源证券研究所 分组收益不完全单调,但超额收益相对稳定 数据来源:同花顺iFind、开源证券研究所 类比点击量占比因子,我们亦根据用户资金量大小将自选股占比因子分为低、中、高三组,分别进行测试,观察不同资金量的用户其自选股占比是否蕴含着不同的信息。从累计RankIC的结果来看,低资金用户的自选股池代表的信息更偏负面,符合预期。 低资金用户自选股占比越高的个股,潜在回报越低 数据来源:同花顺iFind、开源证券研究所 4、自选股占比变化:内生关注度的边际变动 自选股票池是一个偏静态的动作,新增或剔除操作或许更能反映投资者对个股的偏好变化。新增或剔除操作是一体两面的关系,若个股当前自选股占比高于前序自选股占比,则认为是新增操作,反之,则认为是剔除操作。为了计算新增或剔除操作的表现,我们对原始的自选股占比因子进行差分和取变化率处理。 做差分处理时,将当前月份自选股占比均值减去上个月份自选股占比均值;计算变化率时,我们将当前月份自选股占比均值除以上个月份自选股占比均值后减去1。注意,这里没有考虑个股自选股新增或剔除绝对数量之间的前后差异,仅从相对维度来切入的。当自选股占比差分或变动数值高于零值时,认为是新增操作,反之,则归类到剔除操作。 自选股占比因子进行差分操作后,分布呈现尖峰形态。在分组收益层面,可以看到高新增或剔除自选股的操作均呈现负向选股效应,其中高新增操作负向效果更显著。 自选股占比差分后的分布呈现尖峰现象 数据来源:同花顺iFind、开源证券研究所 高新增比高剔除操作负向效应更显著 数据来源:同花顺iFind、开源证券研究所 自选股占比因子进行变化率计算时,自选股占比的变动值为正(新增)或为负(剔除),亦均是偏负向的效应,两种操作对应的分组的累计收益率均低于自选股占比变动量绝对值较小的分组。另一方面,高新增操作比高剔除操作,负向效用更加显著。 自选股占比的变化率呈现尖峰厚尾分布 数据来源:同花顺iFind、开源证券研究所 自选股占比变化下高新增操作负向效应最强 数据来源:同花顺iFind、开源证券研究所 从两种构建方法可以看到,自选股中关注度变化较低的个股未来表现具有相对优势。这个结果的含义是,影响个股未来表现的,是投资者关注度的高低,而非投资者关注度的方向。 投资者关注度因子比较:个股点击量占比因子相对占优 — 1、因子间绩效对比:不同因子表现差异主要源于空头端 从各投资者关注度因子的绩效表现来看,个股点击量占比因子空头效应最显著,年化收益率为-8.7%,远高于其他因子;自选股占比因子多空对冲稳定性最好,夏普比率最高,达到1.94;三类因子多头年化收益率近似,表明在多头端大家没有显著的差别。 投资者关注度因子均表现出稳定的负向选股能力 数据来源:同花顺iFind、开源证券研究所 从未来收益预测能力来看,个股点击量占比因子表现相对占优,RankIC均值的绝对值超过10%,年化RankICIR达到-3.2,因子表现十分稳定;自选股占比因子,RankIC均值的绝对值亦达到8%左右的水平。新闻点击量占比因子预测能力和因子稳定性均相对较弱。 个股点击量占比因子在预测能力和稳定性上相对占优 数据来源:同花顺iFind、开源证券研究所 2、因子间关联度:与主流大类风格因子呈现低关联度 前文中我们测试了不同投资者关注度因子的表现,从测试结果来看,投资者在个股上的相关行为整体呈现非常显著的负向选股效果。为了比较各因子之间的异同,我们计算了点击量占比因子、新闻点击量占比因子和自选股占比因子和主流风险因子之间的关联度。 个股点击量占比和自选股占比因子具有高关联度 数据来源:同花顺iFind、开源证券研究所 从关联度来看,个股点击量占比因子、新闻点击量占比因子、自选股占比因子两两之间具有较高的相关性,其中个股点击量占比和新闻点击量占比因子的相关性更是高达0.8,可以推断大部分的个股点击操作来源于投资者的自选股,而非新闻消息的推送;而投资者关注度因子与其他风格因子整体关联度较低,最高的为市值因子,平均相关性约0.49。 投资者关注度因子实践:空头个股剔除能有效增强收益 — 1、在主流宽基指数中的表现:在中证1000指数中表现占优 以上各投资行为因子的测试是在全市场股票池内进行,这里我们以表现相对占优的个股点击量占比因子为例,尝试在主流宽基成分股中进行效果测试。从测试结果来看,在不同宽基成分股池子中,个股点击量占比因子均有显著的负向选股能力。其中,个股点击量占比因子在中证1000指数成分股中表现最优,RankIC均值为-0.11,年化RankICIR为-3.10,其次为中证500指数,最次为沪深300指数。 个股点击量占比因子在不同股票池表现不同 数据来源:同花顺iFind、开源证券研究所 个股点击量占比因子在中证1000中表现最优 数据来源:同花顺iFind、开源证券研究所 2、指数增强:基于空头个股剔除的负向因子增强 考虑到投资者关注度因子的强预测能力,我们希望能将其进行投资落地,一个很朴素的想法便是应用于指数增强的框架下,获取超额稳健回报。但问题是,以上投资者关注度因子的选股能力主要体现在空头端,多头超额收益获取能力相对较弱且稳定性不足。若直接按照多头端因子构建增强组合的方式进行处理,可以预见的是效果并不出众。为了尽可能保留空头端蕴含的稳健信息,我们在构建增强模型前对股票池个股进行筛选,即对空头端个股预先进行剔除处理。 由前文测试结果可知,个股点击量占比因子的空头组(第五组)具有显著的负向选股能力,我们希望将这些表现低于市场均值的个股从样本池内剔除。具体而言,在每期调仓之际,我们在基准指数成分股内剔除掉空头端分组对应的个股,由于部分个股从基准指数成分股中剔除,导致当期指数权重之和不为1,我们对剩余个股做权重再平衡处理。我们亦尝试过在全市场股票池内先做尾部剔除,再与基准指数成分股取交集,最后进行权重再平衡,发现测试结果表现相对更优,有兴趣的读者可以尝试一下。 从事前剔除效果来看,空头端个股的剔除对不同宽基指数的增强效果不一。沪深300指数表现虽然有所提升,但超额收益并不稳定且幅度较小,测试期内累积超额收益仅14%;剔除空头端个股后,中证500指数收益增强效果相对稳健,但幅度相对较小,年化超额收益率仅为3.1%。 沪深300指数增强组合超额收益不稳定 数据来源:同花顺iFind、开源证券研究所 中证500指数增强组合年化超额收益约3.1% 数据来源:同花顺iFind、开源证券研究所 在中证1000指数成分股中做尾部个股剔除,效果优异,测试期内累积超额收益率约32%,年化超额收益率为4.7%,超额收益最大回撤仅为4.4%。 中证1000指数增强组合具有稳健超额收益,最大回撤仅4.4% 数据来源:同花顺iFind、开源证券研究所 风险提示:模型测试基于历史数据,市场未来可能发生变化。 研报发布机构:开源证券研究所 研报首次发布时间:2022.3.27 分析师:魏建榕 证书编号:S0790519120001 分析师:胡亮勇 证书编号:S0790522030001 《证券期货投资者适当性管理办法》于2017年7月1日起正式实施。通过微信形式制作的本资料仅面向开源证券客户中的金融机构专业投资者,请勿对本资料进行任何形式的转发行为。若您并非开源证券客户中的金融机构专业投资者,为保证服务质量、控制投资风险,请勿订阅、接收或使用本订阅号中的信息。本资料难以设置访问权限,若给您造成不便,还请见谅!感谢您给予的理解和配合。若有任何疑问,请与我们联系。 免责声明 开源证券股份有限公司是经中国证监会批准设立的证券经营机构,具备证券投资咨询业务资格。 本报告仅供开源证券股份有限公司(以下简称“本公司”)的机构或个人客户(以下简称“客户”)使用。本公司不会因接收人收到本报告而视其为客户。本报告是发送给开源证券客户的,属于机密材料,只有开源证券客户才能参考或使用,如接收人并非开源证券客户,请及时退回并删除。 本报告是基于本公司认为可靠的已公开信息,但本公司不保证该等信息的准确性或完整性。本报告所载的资料、工具、意见及推测只提供给客户作参考之用,并非作为或被视为出售或购买证券或其他金融工具的邀请或向人做出邀请。本报告所载的资料、意见及推测仅反映本公司于发布本报告当日的判断,本报告所指的证券或投资标的的价格、价值及投资收入可能会波动。在不同时期,本公司可发出与本报告所载资料、意见及推测不一致的报告。客户应当考虑到本公司可能存在可能影响本报告客观性的利益冲突,不应视本报告为做出投资决策的唯一因素。本报告中所指的投资及服务可能不适合个别客户,不构成客户私人咨询建议。本公司未确保本报告充分考虑到个别客户特殊的投资目标、财务状况或需要。本公司建议客户应考虑本报告的任何意见或建议是否符合其特定状况,以及(若有必要)咨询独立投资顾问。在任何情况下,本报告中的信息或所表述的意见并不构成对任何人的投资建议。在任何情况下,本公司不对任何人因使用本报告中的任何内容所引致的任何损失负任何责任。若本报告的接收人非本公司的客户,应在基于本报告做出任何投资决定或就本报告要求任何解释前咨询独立投资顾问。 本报告可能附带其它网站的地址或超级链接,对于可能涉及的开源证券网站以外的地址或超级链接,开源证券不对其内容负责。本报告提供这些地址或超级链接的目的纯粹是为了客户使用方便,链接网站的内容不构成本报告的任何部分,客户需自行承担浏览这些网站的费用或风险。 开源证券在法律允许的情况下可参与、投资或持有本报告涉及的证券或进行证券交易,或向本报告涉及的公司提供或争取提供包括投资银行业务在内的服务或业务支持。开源证券可能与本报告涉及的公司之间存在业务关系,并无需事先或在获得业务关系后通知客户。 本报告的版权归本公司所有。本公司对本报告保留一切权利。除非另有书面显示,否则本报告中的所有材料的版权均属本公司。未经本公司事先书面授权,本报告的任何部分均不得以任何方式制作任何形式的拷贝、复印件或复制品,或再次分发给任何其他人,或以任何侵犯本公司版权的其他方式使用。所有本报告中使用的商标、服务标记及标记均为本公司的商标、服务标记及标记。 长按识别二维码关注我们 开源证券研究所

大部分微信公众号研报本站已有pdf详细完整版:https://www.wkzk.com/report/(可搜索研报标题关键词或机构名称查询原报告)

郑重声明:悟空智库网发布此信息的目的在于传播更多信息,与本站立场无关,不构成任何投资建议。