首页 > 公众号研报 > 【国君金工】高风险组合的构建

【国君金工】高风险组合的构建

作者:微信公众号【辰奥临君】/ 发布时间:2021-04-14 / 悟空智库整理
(以下内容从国泰君安《【国君金工】高风险组合的构建》研报附件原文摘录)
  点击上方“辰奥临君” ,关注我们 陈奥林 从业证书编号 S0880516100001 杨 能 从业证书编号 S0880519080008 徐忠亚 从业证书编号 S0880519090002 引言 多因子选股历经市场多轮风格切换,模型在收益预测和风险控制上已逐渐走向成熟与趋同,在财富管理市场需求巨大的当下,高风险收益比的量化产品迎来了新一轮的高光时刻。然而,随着量化产品规模的扩张,低频量化选股领域的挑战也在不断加大,具体可以总结为以下3点:首先,同质化的模型使得增强型产品的冲击成本抬升、中性产品的贴水与ALPHA收益关联性加大;其次,传统线性模型的解释力度降低,如何实现非线性尚无定论;最后,2020年主动管理产品收益优势巨大,而多因子模型由于分散化持仓,牺牲了大量收益,量化产品的持仓如何集中从而进一步提升收益的研究迫在眉睫。 本系列报告将逐步构建起因子收益贡献更为多元、市场变化适应度更高、持股更加集中持股更加集中的离散因子非线性模型。基于离散特征的选股模型相比传统以连续特征为主的因子选股模型的优势体现为:模型的非线性表达能力、预测能力的鲁棒性以及对于低覆盖度、低解释度的另类非标数据的包容能力。人工智能科学家李沐曾说过“预测模型是使用离散特征还是连续特征,其实是一个[海量离散特征+简单模型]同[少量连续特征+复杂模型]的权衡”。随机森林、XGBoost等机器学习算法本质上也在进行连续变量离散化,二者殊途同归。积水成渊,聚沙成塔,对于偏好模型可解释性以及希望在模型中加入个人理解的投资者而言,基于离散特征的选股模型不失为一种解决现有因子选股痛点的方法。 作为该系列的首篇报告,我们将模型应用在个股排雷上,构建预测能力高、市场环境自适应强的负向选股模型,初步展现基于离散特征的选股模型的强大魅力。 研究思路 本篇报告的研究目的是构建个股周度下跌高风险组合,预测在全市场、中证500、沪深300和上证50中下跌风险最高的前5%个股。 在第三章节,我们希望总结出在A股历史上,特别是2017年以来,能够带来股票下跌的危险信号。不同时期市场关注的风险点也在不断变化,2017年以来,伴随退市制度的完善、注册制的推行以及风险偏好的下行等因素,市场对基本面风险更加重视。为了更好地观察风险指标在不同时期的收益情况,我们针对每一项风险点构建了基于该风险的股票组合并考察2011年以来其相对于中证全指的超额收益,同时将特别关注2017年以来指标的表现情况。 在第四章节,我们将对比危险信号简单线性加权以及Lasso回归预测加权的优劣,研究信号的最佳组合方式,并最终给出负面选股组合。 01 A股中的危险信号 我们把A股可能引起股票下跌的因素总结为六大模块,共63个细分指标:盈利模式存疑、成长过于激进、财报注水、管理薄弱、技术面看空和特殊风险事件。本章节具体展示各个模块的指标构成以及排雷效果。 盈利模式存疑 稳健清晰的盈利模式是企业长期发展之根本。盈利能力是盈利模式是否可靠的直接体现,但短期的盈利能力不能表明企业的盈利模式已经成熟,我们需特别堤防那些目前盈利能力较好,但实则盈利模式模糊的公司。从历史上来看,具有此类特征的公司存在更高的退市风险。此类公司的盈利可能过度依赖于联营投资、政府补助、海外收入或少数几家客户,而主营业务缺乏竞争优势;除此之外,复杂的股权结构,上游供应商过度集中、存货周转率的大幅下降等也是企业盈利模式不稳定的潜在风险因素。 在相关指标中,销售收入过低、毛利率异常、政府补助过大,供应商集中度过高2017年以来年化超额收益低于-10%。分域测试中,盈利模式存疑相关指标在全市场、沪深300、中证500内差异不大。 成长过于激进 高成长企业通常能享受更高的估值溢价,但是企业的成长性一旦无法持续,可能面临着估值业绩双杀的风险。不可否认,A股市场的确走出了许多的长期高速成长的股票,但从市场整体来看,短期过快成长的公司其成长可持续并不高,例如2016年营收增长最快的前5%的公司在两年后其增速基本和2016年营收增速最差的公司持平,3年后其营收增速甚至慢于当年的低成长公司,其中那些短期营收增速过快、长期不分红、自由现金流严重为负的公司更有可能采用了过度激进的发展方式,从而增加了基本面的经营风险。 从历史回测来看,长期不分红企业、以及高商誉企业的负超额收益最为显著。对于大市值企业而言持续成长难度更大,因而相关指标在沪深300内表现显著好于全市场和中证500。 财报注水 本模块主要关注企业盈利的真实性,规避存在造假嫌疑的公司。财报中的纳税、在建工程、现金流和费用资本化等科目能够反映公司财报注水的蛛丝马迹。 由下图可知,审计意见非标准无保留意见,实缴税比例过低以及在建增速过高是2017年以来最为显著的财报注水危险信号。相关信号在沪深300内排雷效果最为明显。 管理薄弱 在管理学经典著作《基业长青》一书中,作者提出企业的组织结构,而非领袖魅力或者产品成就了伟大的公司。尽管管理薄弱并不一定能在短期体现风险,但是长期来看,公司管理能力不佳的公司更有 “暴雷”的风险。 内控保留意见,财报披露延期、上市时间过短、提供关联融资等风险点2017年以来负向超额较高;管理薄弱指标在全市场和中证500内表现稳定,但是沪深300内表现一般。 技术面看空 技术类指标旨在提示短期技术面的危险信号,主要分为日间量价和日内量价信号两部分,除传统高波动、高换手风险因素外,我们加入了主力资金拥挤、风险模糊度过大、尾盘成交占比过高以及PIN值过大等经典量价指标,具体逻辑可参考历史专题报告,相关指标负面排除效果显著,可作为短期买卖点的参考。 技术类指标在全市场中排雷效果显著好于基本面风险指标,其中登上龙虎榜、过度换手、北上资金大幅流出和主力拥挤指标2017年以后负向收益最大,但2019年以来沪深300及中证500成分股内排雷效果下降明显。 特殊风险事件 风险事件模块涵盖可能影响到股票表现的负面事件,包括分析师预期下调、负面公告、大股东减持、限售股解禁、债券违约、重组失败等18个风险事件。 近年来,需要特别重视的高风险事件包括:被立案调查、业绩预亏、业绩预告大幅下滑、收到问询函、质押占比过高以及债券违约等。商道融绿ESG评级下滑在沪深300内排雷效果显著,整体上特殊风险事件在中证500成分股内表现最佳。 小节 本章节总结了A股市场常见的63个风险点,所有风险点均为0-1哑变量,整体来看,我们对危险信号的认定较为严苛,大部分风险事件入选个股数量只有二三百只,少部分信号可能只有两位数的个股符合要求。除此之外,我们更加关注个股中期(3个月以上)风险,而非指标短期波动风险。从2017年以来全市场组合收益来看,技术面看空模块排雷效果表现最佳,其他依次为财报注水、成长过于激进、特殊风险事件、治理薄弱以及盈利模式存疑。分域测试中,各个模块各有千秋,沪深300成分股受到财报注水、成长过于激进影响较大,中证500成分股更易受风险事件、管理薄弱因素影响。 02 危险信号的合成与组合构建 等权合成 由于细分指标风险源各不相同,所以指标间相关性并不高,各指标与其他指标的最大相关性基本保持在了60%以内,因此等权方法合成信号即可大致反映个股整体的风险情况。 合成指标主要呈现出小市值、高估值、低分红、高换手、高BETA的风格特征。2014年以来,指标原始IC为-4.34%,T统计量-11.37,剔除行业与十大风格后,IC为-2.63%,T统计量-11.76。指标值在2017年以来表现有进一步改善,IC进一步提升至-5.51%。 根据经验,我们可以把所有A股划分为A、B、C、D、E 5档用于表征个股的下跌风险的高低,A档风险最低,E档风险最高。中证800以内几乎没有E档个股,最高D档。 我们对各档股票基于流通市值加权构建组合计算累计净值。2013年以来,E档股票年化收益率-18.12%,跑输中证全指28%;沪深300内D档股票年化收益率-6.2%,跑输沪深300指数18.9%;中证500内D档股票-10.3%,跑输中证500指数17.6%。 LASSO回归加权方法 简单等权并非预测个股未来风险的最优方式,基于回归法的加权方式更加合理。通过回归检验可知,市场在不同时期对风险源的侧重不尽相同。2018年公司治理相关指标首次开始得到重视,2019年技术面指标“卷土归来”,2020年市场对各类风险事件更加关注。 回归方案具体设计如下: 第一步,确定股票样本池; 第二步,计算样本池标准化个股周收益率; 第三步,回归模型加入中信三级行业哑变量,基于LASSO回归选择解释变量及求得过去一年(48周)指标的因子收益率; Lasso( Y = Week_Return , X = (Indus, Signal), alpha = 0.005 ) 第四步,计算各风险指标过去48周平均因子收益率,由于我们先验假设指标收益率为负,所以剔除平均因子收益率为正的指标,避免反向暴露风险指标; 第五步,以预测因子收益率为权重,计算个股平均风险值。 使用LASSO回归进行特征选择避免了在小样本池(沪深300、上证50)内无法回归的问题,全市场选股中,历史入选因子数量在20至40之间。技术类最常入选指标为PIN值过高,高波动和高风险模糊度;基本面指标最常入选指标包括限售股解禁比例超过5%(1季内)、目标价下调和业绩预亏。 高风险组合构建 高风险组合构建方式 负面排除组合在全市场内选出50只高风险个股,在重要指数成分股中选出风险值最高的前5%股票,采用流通市值加权方式而非等权方式能够有效避免组合收益源于小市值风格。 高风险组合表现情况 全市场(中证全指成分股)高风险组合年化超额收益-41.05%,跟踪误差20.33%,信息比率-2.02,年换手倍数7.20,月胜率82.29%。 中证500高风险组合年化超额收益-23.72%,跟踪误差13.38%,信息比率-1.77,年换手倍数5.75,月胜率73.96%。 沪深300内高风险组合年化超额收益-25.17%,跟踪误差17.14%,信息比率-1.47,年换手倍数4.94,月胜率67.71%。 上证50高风险组合年化超额收益-17.73%,跟踪误差20.27%,信息比率-0.87,年换手倍数4.33,月胜率64.58%。 小节 本章节分别展示了使用等权法与LASSO回归加权法的信号合成效果,等权法下,我们把所有A股分为A-E 5档,各档组合收益差距明显;LASSO回归加权法适用于全市场、中证500、沪深300、上证50成分股中的排雷,排雷组合能够更加集中,负向收益显著高于等权法。全市场高风险组合年化超额收益-41.05%,中证500高风险组合年化超额收益-23.72%,沪深300内高风险组合年化超额收益-25.17%,上证50高风险组合年化超额收益-17.73%。 03 总结与展望 本篇报告通过负面选股信号构建了基于LASSO回归的离散多因子预测模型。全市场高风险组合年化超额收益-41.05%,跟踪误差20.33%,信息比率-2.02,年换手倍数7.20,月胜率82.29%,显著优于等权指标。 在接下来的报告中,我们将把基于离散多因子模型应用在多头选股中,进一步介绍正向选股离散特征,分析连续特征离散化的意义与方法,讨论海量离散特征的因子选择方法及特征权重分配等问题,逐步构建因子收益贡献更为多元、市场变化适应度更高、持股更加集中的非线性模型。 特别声明: 本订阅号发布内容仅代表作者个人看法,并不代表作者所属机构观点。涉及证券投资相关内容应以所属机构正规发布的研究报告内容为准。 市场有风险,投资需谨慎。在任何情况下,本订阅号中的信息或所表述的意见均不构成对任何人的投资建议。在决定投资前,如有需要,投资者务必向专业人士咨询并谨慎决策。 本订阅号内容均为原创,未经书面授权,任何媒体、机构和个人不得以任何形式转载、发表或引用。

大部分微信公众号研报本站已有pdf详细完整版:https://www.wkzk.com/report/(可搜索研报标题关键词或机构名称查询原报告)

郑重声明:悟空智库网发布此信息的目的在于传播更多信息,与本站立场无关,不构成任何投资建议。