华泰期货-量化专题报告:时间序列模型中样本时间窗口的选择-180508

《华泰期货-量化专题报告:时间序列模型中样本时间窗口的选择-180508(11页).pdf》由会员分享,可在线阅读,更多相关《华泰期货-量化专题报告:时间序列模型中样本时间窗口的选择-180508(11页).pdf(11页精品完整版)》请在悟空智库报告文库上搜索。
训练样本时间窗口简介
常见的量化模型根据训练样本的结构大致可分成两类:一类是截面模型,这类模型的输入通常是同一个时间节点上因子;另一类是时间序列模型,这类模型的训练样本通常涉及一段连续的时间序列。在训练截面模型时,通常可以随机选取一大部分数据作训练集,一小部分数据作验证集和测试集进行交叉验证,训练样本在时间上的出现顺序没有太严格的要求。而时间序列模型训练样本中的训练集和验证集在时间上往往会有先后顺序,因此在时间序列模型的实际训练通常是使用一部分时间靠前的数据进行模型训练,再去预测时间上靠后的数据,这样就不得不面对一个训练样本的时间窗口长度选择问题。如果使用了太长的数据可能包含了过时的信息,但如果使用了太短的数据就无法对历史情况做出准确的刻画,因此如何选择样本的时间窗口是所有时间序列模型训练中必须面对的一个问题。
在本报告主要研究递归时间窗口和滚动时间窗口训练方法在时间序列模型中的应用。递归时间窗口即根随着时间的流逝,训练样本数量不断增加,而滚动时间窗口则是指随着时间的流逝不断增加新样本,剔除就样本但保持训练样本数量不变。有相关学者的研究指出,如果数据结构发生了较大改变,使用滚动时间窗口的方法会比递归时间窗口要好,但实际上很难准确判断数据结构有否发生改变以及何时发生了改变,所以在实际应用中可以把这两种方法结合从而提高模型的预测效果。本报告尝试把这种方法应用到19种商品期货的周度收益率预测上,对大部分商品而言能够改善预测效果。