华泰证券-华泰人工智能系列之四十:微软AI量化投资平台Qlib体验-201222

《华泰证券-华泰人工智能系列之四十:微软AI量化投资平台Qlib体验-201222(34页).pdf》由会员分享,可在线阅读,更多相关《华泰证券-华泰人工智能系列之四十:微软AI量化投资平台Qlib体验-201222(34页).pdf(34页精品完整版)》请在悟空智库报告文库上搜索。
核心观点本文介绍微软AI量化投资平台Qlib基础和进阶功能,对比传统量化策略开发流程和Qlib提供的解决方案,提炼Qlib特色及优势,并探讨笔者使用体会。 Qlib于2020年9月公开初版源码,2020年12月获微软官网报道并引发热议。 我们认为Qlib的主要优势在于:1)覆盖量化投资全过程,用户无需切换工具包或编程语言,降低AI算法使用门槛;2)从工程实现角度,对因子数据储存、因子计算等环节提出创新解决方案,提升运算性能和开发效率,或能解决量化投资研究中的部分痛点。 笔者使用体会:侧重量价选股,解决部分痛点,开源或推动技术发展笔者使用Qlib的体会是,Qlib在“术”层面的创新要大于在“道”层面的创新。 Qlib在宣传中称其为“业内首个AI量化投资开源平台”,而就目前公开的功能看,Qlib的核心是“量价因子结合AI模型选股流程”,在“道”的层面未脱离传统因子选股方法论。 在“术”的层面,Qlib提出的数据存储方案、表达式引擎等工程创新一定程度上能够解决研究中的部分痛点。 微软此次的开源尝试能够降低整个行业的学习和研发成本,或能推动量化投资行业的技术发展。 Qlib基础功能:以港股日频量价因子LightGBM选股策略为例Qlib官方推荐的学习素材有GitHub文档和在线文档,包含A股日频量价因子AI选股策略案例,然而直接学习官方代码的“代入感”不强,并且官方代码绕过了很多“坑”,但研究者在实际学习使用时可能绕不开这些“坑”。 为了帮助读者快速上手Qlib,我们参考官方代码,设计新的应用场景,以港股日频量价因子LightGBM选股策略为例,分Qlib安装、数据准备、因子生成、策略构建、结果展示各步骤,讲解Qlib基础功能。 Qlib进阶功能:自定义策略组件我们以自定义因子、标签、数据预处理方式、AI模型为例讲解Qlib的进阶功能。 AI选股模型包含因子生成和预处理、模型训练、策略回测等组件,在Qlib中这些组件通过工作流workflow串联在一起,每个组件均有对应参数控制。 因此最简单的自定义策略方式是直接修改参数。 另外,每个组件都有其对应源码,更灵活的自定义策略方式是修改源码或仿照源码创建新的继承类。 Qlib特色:覆盖量化投资全过程,拥有多项工程上的创新Qlib的设计初衷之一在于覆盖量化投资的全过程,为用户的AI算法提供高性能的底层基础架构,降低AI算法的使用门槛,便于金融从业者使用。 Qlib的“高性能底层基础架构”体现在多项工程上的创新,例如数据存储方案、表达式引擎和缓存系统。 据论文Qlib:AnAI-orientedQuantitativeInvestmentPlatform测试显示,Qlib在读取原始数据和生成因子任务上的性能表现优于传统关系型数据库MySQL、非关系型数据库MongoDB、时序数据库InfluxDB和HDF5。 风险提示:本文的港股AI选股策略仅作案例教学使用,不具备实际投资价值,例如未剔除低价股、低流动性股票,训练集和测试集较短,未进行参数优化等。 Qlib仍在开发中,部分功能未加完善和验证,使用存在风险。 人工智能挖掘市场规律是对历史的总结,市场规律在未来可能失效。 人工智能技术存在过拟合风险。