首页 > 公众号研报 > 【专题报告】基于智能算法构建的行业择时与轮动模型

【专题报告】基于智能算法构建的行业择时与轮动模型

作者:微信公众号【华创金工】/ 发布时间:2022-05-24 / 悟空智库整理
(以下内容从华创证券《【专题报告】基于智能算法构建的行业择时与轮动模型》研报附件原文摘录)
  华创专题报告 根据《证券期货投资者适当性管理办法》及配套指引,本资料仅面向华创证券客户中的金融机构专业投资者,请勿对本资料进行任何形式的转发。若您不是华创证券客户中的金融机构专业投资者,请勿订阅、接收或使用本资料中的信息。本资料难以设置访问权限,若给您造成不便,敬请谅解。感谢您的理解与配合。 基于智能算法构建的行业择时与轮动模型 音频: 进度条 00:00 01:48 后退15秒 倍速 快进15秒 摘要 行业择时在投资中有着非常重要的作用,目前市场上行业择时采用多种方法,如基本面法、估值法、一致预期法、行业景气度或集中度法等等。在系列报告前两篇完成了沪深300、中证500上GP择时之后,本篇报告关注于行业择时。不同于一般的行业择时,我们使用了遗传规划的方式,针对每个行业交易数据的特点,进行深度挖掘,获得了很好的具有行业交易特色的择时模型。 我们规定了适用于行业择时的遗传规划的算子与适应度,应用交叉与变异,并在中信29个行业上(除外综合金融)进行测试,获得了全部跑赢行业指数的优秀结果,其中在煤炭与电力设备及新能源行业上,获得了超过100%的年化收益,并且最大回撤远小于指数最大回撤。 在行业上取得优秀择时收益后,我们尝试将行业择时信号合成轮动信号,即每天使用全部行业信号进行交易,由于行业指数很难做空,我们选取其中的看多信号合成轮动模型信号,经测试,该策略年化收益达50.51%,超额等权一级行业37.22%,夏普比率为1.61。 为方便使用,我们将所有行业指数择时历史统计与最新信号集成于华创金工择时系统中行业择时中心 (http://t.hcquant.com/ind/),可以随时查看。 1 智能算法择时报告回顾 随着市场的不断发展,各类因子的挖掘已经进入了规模化、工业化的时代,不论是从传统逻辑角度出发的主观因子,还是从数据角度出发的客观因子,各大机构因子挖掘能力相较数年前已经有了几何倍数的增长,我们在前期报告《数据探索的择时系列之一:多管齐下,四两拨千斤》中完成了基于遗传规划算法(下面简称GP)对宽基指数择时因子进行挖掘的探索,该篇报告规定了适合宽基择时的适应度函数,力求挖掘出的因子满足多维度要求,合成了最终的沪深300指数多空择时策略,年化收益率61.52%,最大回撤14.79%,年平均交易次数26.4次;在《数据探索的择时系列之进阶篇:自上而下,青出于蓝而胜于蓝》报告中,我们用GRASP(贪婪自适应搜索)算法思想进行因子组合,探讨了如何将不同的GP择时信号进行有效的选择并组合成我们最终的决策策略,最终中证500指数多空择时策略,年化收益率84.02%,最大回撤15.8%,年平均交易次数20.75次,夏普比率2.999,胜率67.88%,盈亏比3.232。 以上两篇报告都是基于宽基进行遗传规划择时,本篇报告将对中信一级行业(以下简称“行业”)进行择时,以探索GP在行业择时上的效果及其应用。 2 智能算法择时算法回顾 遗传规划不同于其他机器学习的黑箱模式,其可以获得显式的表达式,这在逻辑角度解读算式以及过拟合检验等方面都具有无可比拟的优势。遗传规划主要流程如下图所示,共包括建立初始种群、计算适应度、进化选择、交叉和变异五个步骤: 2.1.1 初始化种群 初始化种群即生成第一代个体集合,根据需要解决的问题来决定其带有的基因类型,通常利用随机算法来生成初始基因组合。在这个过程中同时需要对于问题进行抽象,将描述其特征的基因进行编码。初始种群的数量与多样性对后续解的收敛方向有重要的影响,种群数量过低会造成快速收敛至局部最优解的情况,种群数量过大会降低计算的效率,因此选择合适的初始种群数量是很重要的。 2.1.2 适应度 适应度的定义是遗传规划算法中最关键的环节。适应度在模型中是判断个体是否为最优解的比较依据。类似于进化论,个体适应能力越强说明其更适应环境,个体的适应度越高个体越接近最优解,其基因特征在算法过程中就会得到更大几率地传承。研究的问题不同,适应度函数也会有所差异。适应度函数是评估个体优劣的标准,也是遗传规划算法的核心之一,将个体优劣标准数值化,使个体间差异可以进行度量,并将适应度数值作为遗传选择的依据。 2.1.3 进化选择 进化选择目的是选择当前种群中优良的个体,让他们作为父代繁衍下一代,淘汰适应度较低的个体。常见的进化选择方式包括锦标赛选择、轮盘赌选择、NSGA-II选择(适用于多目标遗传算法)、有放回的随机选择、选择最佳、选择最差、Size+Finess双锦标赛选择、随机抽样选择、词典选择等方式。 2.1.4 交叉 交叉主要分两个步骤:第一步随机选择种群中的个体进行配对作为父代;第二步通过父代两个个体之间交换基因编码片段产生新的个体。新的个体分别继承了父辈双方部分基因,但又不同于父辈,其模型表现也既具有父辈的特点,又有别于父辈。 对于遗传规划的交叉过程,一般将两棵树随机选取各自的子节点,将两个子节点进行交换,实现个体之间的基因交换。基因的交换使得子代最大程度保留了父辈的基因编码,同时通过随机组合提供了多样性,使得其相比一般随机算法具有更优秀的寻找最优解能力。目前比较常用的交叉方式包括,单点交叉、两点交叉、均匀交叉、部分匹配交叉PMX、PMX变种、有序交叉、混合交叉、带进化策略的混合交叉、带进化策略的两点交叉、模拟二值交叉、有界模拟二值交叉、混乱单点交叉等。 2.1.5 变异 对于种群中的单个个体而言,在其产生后会保持一定的变异几率。通过变异个体中一个或多个位置的基因会突变为不同的基因特征。虽然变异几率较低,但是变异的存在可以保证一个种群特征的多样性。适度的突变可以帮助种群跳出局部最优解,让结果更靠近全局最优解。目前常用的变异方式包括,高斯突变、乱序突变、位翻转突变、有界多项式突变、均匀整数突变等。 2.2 挖掘 我们的系列报告中遗传规划择时挖掘所采用的工具为python的deap包,deap包可以支持多种数据结构,并且对适应度函数、进化选择、交叉、变异方式拥有更高的自由度,对多个优化目标的兼容性更强。下文将详细介绍挖掘的整个流程: 2.2.1 公式树终端数据与常数选择 遗传规划挖掘终端数据选择为宽基日线级别开盘价、收盘价、最高价、最低价、成交量。为了降低过拟合程度,公式树常数将从5、10、15、20中选择。 2.2.2 算子列表 算子的选择是遗传规划的核心问题之一,算子包括自定义算子和部分python中talib包中的算子。算子包括了针对长短周期的各种滤波,可以有效平滑长短周期的波动,提取趋势信息。算子列表如下所示: 2.2.3 适应度函数 适应度函数的选择是遗传规划的最核心问题,我们根据择时策略最为重视的几大方面,年化收益率、极端尾部风险、胜率、年平均交易次数、平均多头持仓天数出发来定义一个满足多维度的复合适应度函数。适应度函数为遗传规划生成因子表达式回测结果的卡玛比率×sqrt(年平均交易次数)×胜率×sqrt(平均多头持仓天数)。最终进入备选因子库的因子要求适应度>4、卡玛比率>0.8、年平均交易次数>=4、胜率>60%、平均多头持仓天数>5天。 2.2.4 遗传规划中的其他问题 在进化选择方式上,我们采用了自定义的选择最佳模式,除了选择适应度为最佳的前50%以外,还需保证以下辅助条件,卡玛比率>0.3、年平均交易次数>2、胜率>50%,平均多头持仓天数>6,这些辅助条件可以保证解的收敛方向不会过度趋向某一个或两个条件。最后,交叉方式选择了两点交叉,变异方式选择了均匀整数突变。 2.2.5 遗传规划整体流程 (1)使用终端数据和常数以及图表2中的算子生成大量表达式,并按照图表1中的流程进行筛选、进化选择、交叉和变异。 (2)样本内回测区间为2014年1月~2019年12月,样本外区间为2020年1月至最新交易日,样本期内保证因子表达式经历一整轮牛熊的考验。 (3)回测规则:我们检验了多种信号生成策略,最终选了效果较好且逻辑清晰的分位数突破策略。计算因子值过去60个交易日的80%分位点和20%分位点。当因子值向上突破80%分位点时发出看多信号,当因子值向下突破20%分位点时发出看空信号,其他情况发出空仓信号。 (4)适应度计算规则:因子表达式回测结果的卡玛比率×sqrt(年平均交易次数)×胜率×sqrt(平均多头持仓天数),回测过程中交易成本为双边万分之三。 (5)样本外检测规则:备选因子在样本外回测中保持卡玛比率>0.7,且能大幅跑赢基准则为通过了样本外检测,进入最终的因子池。 (6)信号合成: 目前有两种信号合成方法:分组合成与GRASP合成法。 分组合成是先计算各个信号的相关性,先组内合成信号相关性高的,在进行组间合成; GRASP合成是每次局部寻优问题求解时可以以一定概率选择非最优选项,从而让算法跳出局部最优区域,按其他方向进行寻优。 3 行业信号测试结果 我们采用上述遗传规划与信号合成做法,按照大消费、大周期、大金融、高端制造、TMT、综合六大板块类别分别展示行业择时效果: 3.1 大消费板块 该板块下包括:食品饮料、医药、商贸零售、家电、轻工制造、纺织服装、消费者服务与农林牧渔。 3.1.1 食品饮料 选择的遗传规划公式: 回测结果: 净值曲线: 3.1.2 医药 选择的遗传规划公式: 回测结果: 净值曲线: 3.1.3 商贸零售 选择的遗传规划公式: 回测结果: 净值曲线: 3.1.4 家电 选择的遗传规划公式: 回测结果: 净值曲线: 3.1.5 轻工制造 选择的遗传规划公式: 回测结果: 净值曲线: 3.1.6 纺织服装 选择的遗传规划公式: 回测结果: 净值曲线: 3.1.7 消费者服务 选择的遗传规划公式: 回测结果: 净值曲线: 3.1.8 农林牧渔 选择的遗传规划公式: 回测结果: 净值曲线: 3.2 大周期板块 该板块下包括:交通运输、建筑、建材、有色金属、基础化工、石油石化、煤炭、电力及公用事业、钢铁。 3.2.1 交通运输 选择的遗传规划公式: 回测结果: 净值曲线: 3.2.2 建筑 选择的遗传规划公式: 回测结果: 净值曲线: 3.2.3 建材 选择的遗传规划公式: 回测结果: 净值曲线: 3.2.4 有色金属 选择的遗传规划公式: 回测结果: 净值曲线: 3.2.5 基础化工 选择的遗传规划公式: 回测结果: 净值曲线: 3.2.6 石油石化 选择的遗传规划公式: 回测结果: 净值曲线: 3.2.7 煤炭 选择的遗传规划公式: 回测结果: 净值曲线: 3.2.8 电力及公用事业 选择的遗传规划公式: 回测结果: 净值曲线: 3.2.9 钢铁 选择的遗传规划公式: 回测结果: 净值曲线: 3.3 高端制造板块 该板块下包括:电力设备及新能源、汽车、机械、国防军工。 3.3.1 电力设备及新能源 选择的遗传规划公式: 回测结果: 净值曲线: 3.3.2 汽车 选择的遗传规划公式: 回测结果: 净值曲线: 3.3.3 机械 选择的遗传规划公式: 回测结果: 净值曲线: 3.3.4 国防军工 选择的遗传规划公式: 回测结果: 净值曲线: 3.4 大金融板块 该板块下包括:银行、非银行金融、房地产。 3.4.1 银行 选择的遗传规划公式: 回测结果: 净值曲线: 3.4.2 非银行金融 选择的遗传规划公式: 回测结果: 净值曲线: 3.4.3 房地产 选择的遗传规划公式: 回测结果: 净值曲线: 3.5 TMT板块 该板块下包括:电子、计算机、通信、传媒。 3.5.1 电子 选择的遗传规划公式: 回测结果: 净值曲线: 3.5.2 计算机 选择的遗传规划公式: 回测结果: 净值曲线: 3.5.3 通信 选择的遗传规划公式: 回测结果: 净值曲线: 3.5.4 传媒 选择的遗传规划公式: 回测结果: 净值曲线: 3.6 综合板块 该板块下包括:综合。 3.6.1 综合 选择的遗传规划公式: 回测结果: 净值曲线: 4 基于GP的日线级别综合行业筛选策略 以上,我们讨论了中信一级行业的GP多空择时策略与结果。下面整合全部行业择时策略,由于行业指数很难做空,我们仅考虑做多情况。 净值曲线: 回测结果: 5 总结 在系列报告前两篇完成了沪深300、中证500上GP择时之后,本篇报告关注于行业择时。不同于一般的行业择时,我们使用了遗传规划的方式,针对每个行业交易数据的特点,进行深度挖掘,获得了很好的具有行业交易特色的择时模型。 分行业择时结果如下: 所有行业择时收益都超过行业年化收益,并且最大回撤变小,证明择时效果显著。 我们利用29个行业择时信号,合成了基于日线级别的综合行业筛选策略,该策略年化收益达50.51%,超额等权一级行业37.22%,夏普比率为1.61。 所有行业指数择时历史统计与最新信号可以在华创金工择时系统中行业择时中心 (http://t.hcquant.com/ind/)中查看。 6 风险提示 本报告中所有统计结果和模型方法均基于历史数据,不代表未来趋势。 具体内容详见华创证券研究所05月05日发布的报告《基于智能算法构建的行业择时与轮动模型》。 欢迎扫码创见小程序阅读华创金工历史报告 华创金工团队 首席分析师、组长:王小川 执业编号:S0360517100001 电话:021-20572557 邮箱:wangxiaochuan@hcyjs.com 研究员:秦玄晋 电话:15801746890 邮箱:qinxuanjin@hcyjs.com 华创证券研究所定位为面向专业投资者的研究团队,本资料仅适用于经认可的专业投资者,仅供在新媒体背景下研究观点的及时交流。华创证券不因任何订阅本资料的行为而将订阅人视为公司的客户。普通投资者若使用本资料,有可能因缺乏解读服务而对报告中的关键假设、评级、目标价等内容产生理解上的歧义,进而造成投资损失。 本资料来自华创证券研究所已经发布的研究报告,若对报告的摘编产生歧义,应以报告发布当日的完整内容为准。须注意的是,本资料仅代表报告发布当日的判断,相关的分析意见及推测可能会根据华创证券研究所后续发布的研究报告在不发出通知的情形下做出更改。华创证券的其他业务部门或附属机构可能独立做出与本资料的意见或建议不一致的投资决策。本资料所指的证券或金融工具的价格、价值及收入可涨可跌,以往的表现不应作为日后表现的显示及担保。本资料仅供订阅人参考之用,不是或不应被视为出售、购买或认购证券或其它金融工具的要约或要约邀请。订阅人不应单纯依靠本资料的信息而取代自身的独立判断,应自主作出投资决策并自行承担投资风险。华创证券不对使用本资料涉及的信息所产生的任何直接或间接损失或与此有关的其他损失承担任何责任。 本资料所载的证券市场研究信息通常基于特定的假设条件,提供中长期的价值判断,或者依据“相对指数表现”给出投资建议,并不涉及对具体证券或金融工具在具体价位、具体时点、具体市场表现的判断,因此不能够等同于带有针对性的、指导具体投资的操作意见。普通个人投资者如需使用本资料,须寻求专业投资顾问的指导及相关的后续解读服务。若因不当使用相关信息而造成任何直接或间接损失,华创证券对此不承担任何形式的责任。 未经华创证券事先书面授权,任何机构或个人不得以任何方式修改、发送或者复制本资料的内容。华创证券未曾对任何网络、平面媒体做出过允许转载的日常授权。除经华创证券认可的媒体约稿等情况外,其他一切转载行为均属违法。如因侵权行为给华创证券造成任何直接或间接的损失,华创证券保留追究相关法律责任的权利。 订阅人若有任何疑问,或欲获得完整报告内容,敬请联系华创证券的机构销售部门,或者发送邮件至jiedu@hcyjs.com

大部分微信公众号研报本站已有pdf详细完整版:https://www.wkzk.com/report/(可搜索研报标题关键词或机构名称查询原报告)

郑重声明:悟空智库网发布此信息的目的在于传播更多信息,与本站立场无关,不构成任何投资建议。