华泰期货-量化专题报告:基本面数据延时对量化模型影响研究-190201

《华泰期货-量化专题报告:基本面数据延时对量化模型影响研究-190201(14页).pdf》由会员分享,可在线阅读,更多相关《华泰期货-量化专题报告:基本面数据延时对量化模型影响研究-190201(14页).pdf(14页精品完整版)》请在悟空智库报告文库上搜索。
基本面数据通常都会包含延时等情况。比如在当天交易开盘前,可能拿不到当天需要的数据,又或者即使拿到了一个数据,但这个数据值可能在日后出现改变。如果在量化模型回测时无法知道具体指标录入数据库的时间,而是根据指标的标注时间进行回测,则有可能在回测时引入未来数据,从而无法有效评估交易策略的收益与风险。为了考察基本面数据延时对量化策略收益的影响,这里主要考察钢联提供的API数据库,里面提供了数据的录入时间,从而可以确定数据的延时。对比数据录入时间和数据标注时间可以发现,黑色商品数据的延时主要发生在节假日前后,其他时间出现延时的情况较少。
另外,这篇报告使用R-MIDAS模型综合日频和周频的黑色基本面数据进行日度预测,并按照数据的标注时间和录入时间,把策略分为三组,第一组按照标注时间训练和预测,第二组按照录入时间训练和预测,第三组按照标注时间训练,但按照录入时间进行预测。三组测试分别在螺纹钢、热轧卷板、铁矿石、焦煤和焦炭中进行。其中第一组和第二组在各个品种中表现各异,而且包含未来数据的第一组在各个品种中并无明显优势。第三组的收益表现通常在第一组和第二组之间。研究结果表明,虽然基本面数据可能存在延时的情况,但如果按照标注时间训练模型,录入时间进行预测,则仍有可能获得较好收益。