AI选股模型特征筛选与处理:SHAP、中性化与另类特征.pdf
- 上传者:D***
- 时间:2024/09/11
- 热度:289
- 0人点赞
- 举报
AI选股模型特征筛选与处理:SHAP、中性化与另类特征。模型的特征工程研究。随着机器学习模型在量化投资领域的广泛应用,我们在此前的《Alpha掘金系列之九:基于多目标、多模型的机器学 习指数增强策略》、《Alpha掘金系列之十:机器学习全流程重构》和《ALPHA掘金系列之十二:排序学习对GRU选股 模型的增强》中,分别深入探讨了结合树模型和神经网络模型的机器学习量化选股架构、模型训练中的标签选择等细 节问题和新的排序学习框架的有效性。然而,对模型输入端因子的特征工程尚缺乏系统的研究。本报告旨在填补这一 空白,探索几个关键问题:特征选择的必要性、宏观数据与高频数据等的加入是否有益,因子与标签中性化处理的效 果。
通过对这些问题的深入探讨和实证分析,我们得出了一系列重要结论:首先,基于 SHAP(Shapley Additive Explanations)的特征选择方法显著降低了模型训练成本,并在一定程度上提升了GRU模型的精度,同时,SHAP提供 的可视化工具能够直观地展示各个因子的作用,为进一步优化模型提供了有价值的参考。相比之下,尽管基于简单统 计方法的特征选择方法也取得了一定效果,但深度学习特征选择模块STG的表现则不太理想。其次,关于另类因子的 引入,加入宏观经济数据和BARRA因子收益率等反映整体市场的另类因子,虽然能够在一定程度上提升LightGBM 模 型的超额收益,但总体而言缺乏显著的正向作用。引入高频因子方面,在小微盘股上显示出较高的有效性,而在大中 盘股上的应用方法仍需进一步探索。在因子与标签中性化处理方面,将中性化处理后的标签喂入LightGBM模型并与 原模型集成,能够显著优化模型的表现,然而,将因子中性化作为模型输入的整体表现则不尽如人意。
改进后因子与策略效果
最终,我们在保持原框架一致性的基础上,采用经过中性化标签合成改进的GBDT模型和经过SHAP特征选择改进的NN 模型,分别在不同成分股上进行测试,取得了显著的样本外效果。具体来说,在沪深300上,因子IC均值为11.91%, 多头年化超额收益达22.92%,而多头超额最大回撤为6.56%。在中证500上,因子IC均值为11.58%,多头年化超额 收益率为12.35%。特别是在中证 1000 成分股上,因子表现尤为突出,IC 均值达到15.42%,多头年化超额收益率为 25.42%,多头超额最大回撤仅为4.42%。综合这些结果,我们结合实际交易情况,构建了基于各宽基指数的指数增强 策略。其中,沪深300指数增强策略的年化超额收益达到15.83%,超额最大回撤为3.18%;中证500指数增强策略的 年化超额收益为18.23%,超额最大回撤为8.21%;而中证1000指数增强策略的年化超额收益则高达32.24%,超额最 大回撤为3.88%。这些结果表明,我们的方法在不同市场条件下均取得了显著的超额收益和较低的回撤风险。
免责声明:本文 / 资料由用户个人上传,平台仅提供信息存储服务,如有侵权请联系删除。
- 全部热门
- 本年热门
- 本季热门
- 人工智能AI产业链全景图.pdf 24746 8积分
- 铀行业专题报告:AI时代的关键资源品,全球核电复兴,铀矿景气反转.pdf 15160 7积分
- 元宇宙177页深度报告:人类的数字化生存,进入雏形探索期.pdf 14311 30积分
- 智慧城市专题研究:AIoT时代的智慧城市跃迁.pdf 13561 8积分
- 2024年AI医学影像行业发展现状与未来趋势蓝皮书.pdf 12978 22积分
- 中国AI智慧操场行业研究报告.pdf 10760 6积分
- 人工智能行业专题报告:从CHAT~GPT到生成式AI(Generative AI)-人工智能新范式,重新定义生产力.pdf 7576 10积分
- 5G+AI的杀手级应用:VR+AR深度研究报告.pdf 7513 9积分
- 埃森哲人工智能应用之道(92页).pdf 6707 8积分
- 新能源行业深度研究报告:新能源+AI三大方向展望,加速增长期来临.pdf 6658 8积分
- 中国AI智慧操场行业研究报告.pdf 10760 6积分
- 新能源行业深度研究报告:新能源+AI三大方向展望,加速增长期来临.pdf 6658 8积分
- 金域医学研究报告:数据资产价值重估,AI技术驱动创新应用场景拓展.pdf 6501 5积分
- MIM(金属粉末注射成型)行业专题报告:MIM在机器人、AI、消费电子领域应用前景广阔:破界生长,智领未来.pdf 6084 6积分
- 医疗AI专题报告:多组学篇,AI技术驱动精准诊断实现重要突破.pdf 4211 6积分
- AI的宏观悖论与社会主义全球化.pdf 3750 6积分
- 洞隐科技2025中国物流与供应链领域AI应用研究报告.pdf 3447 24积分
- 电力设备与新能源行业深度报告:AI动力打造固态电池发展新引擎.pdf 2535 7积分
- 2025年金融服务业中国AI现状与趋势.pdf 2169 4积分
- 人工智能行业分析:AI新纪元,砥砺开疆·智火燎原.pdf 2125 48积分
- 讯飞医疗科技公司研究报告:AI医疗先行者,贯通式布局医疗信息化.pdf 1160 3积分
- 医药生物行业医疗器械2026年度策略:把握出海陡峭曲线,卡位AI医疗商业化落地.pdf 726 4积分
- 艾瑞咨询:2025年中国企业级AI应用行业研究报告.pdf 644 7积分
- 新经济中工作的四大未来:2030年的AI与人才(英译中).pdf 637 3积分
- 2026年半导体设备行业策略报告:AI驱动新成长,自主可控大时代.pdf 491 6积分
- 青矩技术公司研究报告:全过程工程咨询服务领军者,积极布局AI推行数智化咨询新模式.pdf 458 4积分
- AI医疗行业专题报告:AI重构医疗,从场景落地到变现讨论.pdf 443 5积分
- 专题报告:个人AI助理OpenClaw部署及其在金融投研中的应用研究——AIAgent赋能金融投研应用系列之二.pdf 426 3积分
- 2026年AI行业应用深度展望:AI应用重塑流量格局,字节阿里腾讯C端布局加快.pdf 424 7积分
- 讯飞医疗科技公司研究报告:AI医疗龙头,GBC全场景贯通&中试基地卡位明确,规模化落地有望加速.pdf 417 5积分
