量化投资专题研究报告:机器学习合成非线性因子,增强效果如何?

  • 上传者:潘*
  • 时间:2021/03/14
  • 热度:2240
  • 1人点赞
  • 举报
因子有效性随市场变化,因子合成面临挑战。在经典的多因子选股框架里,等权法合成因子较为常见,特点是简单直观,但无法体现因子间的差异。IC加权法包含了因子的动量信息,以及因子之间的差异,但无法体现因子之间的交互作用。而机器学习可以寻找大量数据之间的映射(非线性)关系。机器学习因子合成:使用规模、估值、分红、盈利、财务质量、成长、反转、波动率、流动性、分析师一致预期10大类风格因子。应用机器学习模型,进行24个月滚动训练。分别测试逻辑回归、朴素贝叶斯、支持向量机、决策树、随机森林、梯度提升树、XGBoost、LightGBM、神经网络九种模型。 合成因子的多头组合相对等权组合有一定的增强作用,空头组合不同机器学习模型表现分化加大。多头组合中神经网络表现最好,其次是随机森林和XGBoost。决策树表现最差,几乎没有提升效果。空头组合中基于决策树的集成模型表现最好,较好地控制了年化波动率和最大回撤。合成因子多数年份表现优于追求动量的IC加权法,2017、2018年表现较差。 通过对单因子的边际依赖函数进行线性回归拟合,可以将单因子的边际影响拆分为线性和非线性两部分。以神经网络为例在2020年的训练结果为例,规模、流动性、盈利、成长因子的变化对预测值的非线性影响较大,而分红、财务质量、分析师一致预期的变化则几乎全部为线性影响。机器学习模型训练过程中,各类因子的贡献变化与IC的变化较为一致。 合成因子与流动性、波动率这两个因子相关性最高,其次是反转、估值、规模,与财务质量因子相关性最低。机器学习模型或许更适用于技术面因子,但提升的是空头组合收益。基本面因子的回测结果显示,不论是多头组合还是空头组合,机器学习模型相对于等权组合并没有提升。而从技术面因子的回测结果看,机器学习模型可以一定程度上提高空头组合的年化表现。 在特征和数据较少的情况下,模型很难充分学习数据的特征。在这种情况下,线性模型的表现也要优于复杂的非线性模型。将样本池由全市场换为中证500,由于训练样本数量明显减少,机器学习模型的效果并不突出。对于多头组合的表现并没有提升效果,可以一定程度上提升空头组合的表现。即使我们已经尽量避免使用复杂度过高的模型,但机器学习的表现非常依赖于数据量和特征数。
1页 / 共42
量化投资专题研究报告:机器学习合成非线性因子,增强效果如何?第1页 量化投资专题研究报告:机器学习合成非线性因子,增强效果如何?第2页 量化投资专题研究报告:机器学习合成非线性因子,增强效果如何?第3页 量化投资专题研究报告:机器学习合成非线性因子,增强效果如何?第4页 量化投资专题研究报告:机器学习合成非线性因子,增强效果如何?第5页 量化投资专题研究报告:机器学习合成非线性因子,增强效果如何?第6页 量化投资专题研究报告:机器学习合成非线性因子,增强效果如何?第7页 量化投资专题研究报告:机器学习合成非线性因子,增强效果如何?第8页 量化投资专题研究报告:机器学习合成非线性因子,增强效果如何?第9页 量化投资专题研究报告:机器学习合成非线性因子,增强效果如何?第10页 量化投资专题研究报告:机器学习合成非线性因子,增强效果如何?第11页 量化投资专题研究报告:机器学习合成非线性因子,增强效果如何?第12页 量化投资专题研究报告:机器学习合成非线性因子,增强效果如何?第13页 量化投资专题研究报告:机器学习合成非线性因子,增强效果如何?第14页 量化投资专题研究报告:机器学习合成非线性因子,增强效果如何?第15页
  • 格式:pdf
  • 大小:2.6M
  • 页数:42
  • 价格: 6积分
下载 获取积分

免责声明:本文 / 资料由用户个人上传,平台仅提供信息存储服务,如有侵权请联系删除。

留下你的观点
  • 相关标签
  • 相关专题
热门下载
  • 全部热门
  • 本年热门
  • 本季热门
分享至