浙商证券-机器学习与因子-一-:特征工程算法测评-230615

文本预览:
核心观点 本文使用一系列机器学习模型对相同的输入因子进行特征工程,对比不同模型选股组合的投资表现,并定量分析因子对个股定价的影响,得出如下结论: 首先,机器学习能够提高投资组合的绩效,集成学习树模型效果最佳。其次,机器学习模型体现出了对A股市场的一定动态适应能力。最后,交易类因子是决定个股短期定价最重要的因素之一。成交稳定,价格低波动的股票短期内表现出较高回报。 机器学习模型能提升组合绩效,树模型表现最佳 以万得全A指数为基准,各机器学习模型在样本外都可获得超额回报。分别在固定时间窗口训练模式和滚动时间窗口训练模式下,对比3类共10种机器学习模型在预测股票短期收益率方面的效果。结果显示,梯度提升树模型LightGBM和XGBoost在两种训练模式下表现最好。 机器学习模型有动态适应能力 测评各模型在滚动时间窗口模式下,预测股票短期回报的表现。结果显示,绝大多数模型在滚动窗口模式下,股票回报预测的准确性良好。这表明机器学习模型具有一定的动态环境适应能力。 交易类因子是影响个股短期定价最关键的因素 本文检验了主流多因子和经研究检验的补充因子的重要性。结果显示,各模型在不同年份,都认为交易类因子的重要性最高,交易类因子是影响股票短期定价的关键因素,重要程度占比为75%。相比而言,基本面因子对股票短期回报的解释力和预测力较弱。 流动性稳定、低波动性的股票短期收益占优 短期内回报较高的股票通常具备以下几个交易特征:成交额波动较小,价格对交易正弹性,短期内未发生过大幅度筹码交换且近期未发生过价格的剧烈波动。 风险提示 模型测算风险:超参数设定对模型结果有较大影响;收益指标等指标均限于一定测试时间和测试样本得到,收益指标不代表未来。 模型失效风险:机器学习模型基于历史数据进行测算,不能直接代表未来,仅供参考。
展开>>
收起<<
《浙商证券-机器学习与因子-一-:特征工程算法测评-230615(25页).pdf》由会员分享,可在线阅读,更多相关《浙商证券-机器学习与因子-一-:特征工程算法测评-230615(25页).pdf(25页精品完整版)》请在悟空智库报告文库上搜索。
(以下内容从浙商证券《机器学习与因子(一):特征工程算法测评》研报附件原文摘录)核心观点 本文使用一系列机器学习模型对相同的输入因子进行特征工程,对比不同模型选股组合的投资表现,并定量分析因子对个股定价的影响,得出如下结论: 首先,机器学习能够提高投资组合的绩效,集成学习树模型效果最佳。其次,机器学习模型体现出了对A股市场的一定动态适应能力。最后,交易类因子是决定个股短期定价最重要的因素之一。成交稳定,价格低波动的股票短期内表现出较高回报。 机器学习模型能提升组合绩效,树模型表现最佳 以万得全A指数为基准,各机器学习模型在样本外都可获得超额回报。分别在固定时间窗口训练模式和滚动时间窗口训练模式下,对比3类共10种机器学习模型在预测股票短期收益率方面的效果。结果显示,梯度提升树模型LightGBM和XGBoost在两种训练模式下表现最好。 机器学习模型有动态适应能力 测评各模型在滚动时间窗口模式下,预测股票短期回报的表现。结果显示,绝大多数模型在滚动窗口模式下,股票回报预测的准确性良好。这表明机器学习模型具有一定的动态环境适应能力。 交易类因子是影响个股短期定价最关键的因素 本文检验了主流多因子和经研究检验的补充因子的重要性。结果显示,各模型在不同年份,都认为交易类因子的重要性最高,交易类因子是影响股票短期定价的关键因素,重要程度占比为75%。相比而言,基本面因子对股票短期回报的解释力和预测力较弱。 流动性稳定、低波动性的股票短期收益占优 短期内回报较高的股票通常具备以下几个交易特征:成交额波动较小,价格对交易正弹性,短期内未发生过大幅度筹码交换且近期未发生过价格的剧烈波动。 风险提示 模型测算风险:超参数设定对模型结果有较大影响;收益指标等指标均限于一定测试时间和测试样本得到,收益指标不代表未来。 模型失效风险:机器学习模型基于历史数据进行测算,不能直接代表未来,仅供参考。