量化投资专题研究报告:机器学习合成非线性因子,增强效果如何?
- 上传者:潘*
- 时间:2021/03/14
- 热度:2242
- 1人点赞
- 举报
因子有效性随市场变化,因子合成面临挑战。在经典的多因子选股框架里,等权法合成因子较为常见,特点是简单直观,但无法体现因子间的差异。IC加权法包含了因子的动量信息,以及因子之间的差异,但无法体现因子之间的交互作用。而机器学习可以寻找大量数据之间的映射(非线性)关系。机器学习因子合成:使用规模、估值、分红、盈利、财务质量、成长、反转、波动率、流动性、分析师一致预期10大类风格因子。应用机器学习模型,进行24个月滚动训练。分别测试逻辑回归、朴素贝叶斯、支持向量机、决策树、随机森林、梯度提升树、XGBoost、LightGBM、神经网络九种模型。
合成因子的多头组合相对等权组合有一定的增强作用,空头组合不同机器学习模型表现分化加大。多头组合中神经网络表现最好,其次是随机森林和XGBoost。决策树表现最差,几乎没有提升效果。空头组合中基于决策树的集成模型表现最好,较好地控制了年化波动率和最大回撤。合成因子多数年份表现优于追求动量的IC加权法,2017、2018年表现较差。
通过对单因子的边际依赖函数进行线性回归拟合,可以将单因子的边际影响拆分为线性和非线性两部分。以神经网络为例在2020年的训练结果为例,规模、流动性、盈利、成长因子的变化对预测值的非线性影响较大,而分红、财务质量、分析师一致预期的变化则几乎全部为线性影响。机器学习模型训练过程中,各类因子的贡献变化与IC的变化较为一致。
合成因子与流动性、波动率这两个因子相关性最高,其次是反转、估值、规模,与财务质量因子相关性最低。机器学习模型或许更适用于技术面因子,但提升的是空头组合收益。基本面因子的回测结果显示,不论是多头组合还是空头组合,机器学习模型相对于等权组合并没有提升。而从技术面因子的回测结果看,机器学习模型可以一定程度上提高空头组合的年化表现。
在特征和数据较少的情况下,模型很难充分学习数据的特征。在这种情况下,线性模型的表现也要优于复杂的非线性模型。将样本池由全市场换为中证500,由于训练样本数量明显减少,机器学习模型的效果并不突出。对于多头组合的表现并没有提升效果,可以一定程度上提升空头组合的表现。即使我们已经尽量避免使用复杂度过高的模型,但机器学习的表现非常依赖于数据量和特征数。
免责声明:本文 / 资料由用户个人上传,平台仅提供信息存储服务,如有侵权请联系删除。
热门下载
- 全部热门
- 本年热门
- 本季热门
- 量化投资专题研究报告:机器学习合成非线性因子,增强效果如何? 2243 6积分
- 清华大学-人工智能之机器学习.pdf 2228 40积分
- 机器学习和知识图谱在行业轮动中的应用.pdf 1532 6积分
- 亚马逊云科技7个典型的机器学习案例 1098 6积分
- 兰德-在中美竞争中保持人工智能和机器学习的竞争优势.pdf 997 5积分
- 世界经济论坛-负责任地使用技术:Microsoft案例研究(英文) 957 6积分
- 机器学习资产配置:HMM模型择时及配置策略.pdf 919 5积分
- 德邦金工文献精译第一期:机器学习因子,在线性因子模型中捕获非线性.pdf 811 4积分
- 人人懂AI之从机器学习到大模型.pdf 686 10积分
- IDC白皮书:加快机器学习开发步伐,加速构建智能应用程序.pdf 645 4积分
- 2025年人工智能与机器学习在医疗科技领域的崛起研究报告(英文版).pdf 363 5积分
- 人工智能和机器学习系列专题研究:基于动量Transformer模型的日内和隔夜交易策略.pdf 234 5积分
- 基于可微RankIC损失函数的深度学习选股策略——机器学习选股系列研究之一.pdf 132 5积分
- 金工机器学习系列专题报告:多模式合成的GRU深度学习选股因子.pdf 107 5积分
- 机器学习应用系列专题报告:DAFAT,基于Transformer模型的自适应解决方案.pdf 100 5积分
- 机器学习系列之一:mHC对Barra机器学习因子的改进.pdf 87 4积分
- 量化专题报告:“机器学习”选股模型系列研究(一),量价指纹模型的构建与应用初探.pdf 82 3积分
- 机器学习应用系列:强化学习驱动下的解耦时序对比选股模型.pdf 58 5积分
- 克莱尔:一种用于韧性估计的因果机器学习方法(英译中).pdf 52 6积分
- 机器学习选股系列研究之二:基于Dask计算图的遗传规划高频因子挖掘框架.pdf 15 4积分
- 机器学习系列之一:mHC对Barra机器学习因子的改进.pdf 87 4积分
- 量化专题报告:“机器学习”选股模型系列研究(一),量价指纹模型的构建与应用初探.pdf 82 3积分
- 机器学习应用系列:强化学习驱动下的解耦时序对比选股模型.pdf 58 5积分
- 克莱尔:一种用于韧性估计的因果机器学习方法(英译中).pdf 52 6积分
- 机器学习选股系列研究之二:基于Dask计算图的遗传规划高频因子挖掘框架.pdf 15 4积分
- 2026年度投资策略:枪炮与黄油.pdf 523 6积分
- 2026年1月投资策略:慢牛才近半,春季开门红.pdf 294 6积分
- 投资策略专题:掘金2026年五大潜在强主题机会.pdf 289 3积分
- A股投资策略周报(0118):近期资本市场资金面异动分析.pdf 252 3积分
- 2026年度全球资产配置和国内基金投资策略:重塑预期,回归价值.pdf 215 5积分
