机器学习选股系列研究之二:基于Dask计算图的遗传规划高频因子挖掘框架.pdf
- 上传者:b**
- 时间:2026/03/13
- 热度:15
- 0人点赞
- 举报
机器学习选股系列研究之二:基于Dask计算图的遗传规划高频因子挖掘框架。遗传规划(Genetic Programming,GP)是更广泛的进化计算领域的一个子 领域,其根源可追溯至遗传算法(Genetic Algorithm,GA)。然而,与主 要用于优化参数的传统遗传算法不同,遗传规划旨在进化出算式本身作为 问题的解决方案。遗传规划的核心可以概括为“随机性”和“方向性”的权 衡,算法既要保证种群往更好的方向进化迭代,又要保证其种群的多样性与 进化的随机性,防止陷入局部最优解。 为实现日频与分钟频数据混合输入的高频因子自动化挖掘,本文基于遗传 规划库 gplearn 与分布式计算库 dask 进行深度重构,构建了一套高效且硬 件友好的高频因子挖掘框架。借助 dask 的分布式计算图与惰性求值机制, 分钟频数据得以分块存储、按需加载,在突破内存限制的同时,保持了高性 能计算,为混合频率因子挖掘提供了坚实的技术底座。 在框架优化方面,通过将分钟数据封装为 dask array,使其以分块形式高 效参与遗传规划迭代;基于 dask 算子对遗传规划分钟频算子进行重构,使 得因子表达式的执行可映射为 dask 计算图,进而实现了高效的并行调度; 此外,通过扩充算子库、引入覆盖度与多样性控制机制、设计多元化适应度 函数,有效提升了挖掘效率与因子多样性,使算法更聚焦于增量信息的发 现。 基于上述框架,本文初步挖掘了 10 个低相关性的遗传规划因子。单因子 20 日 Rank IC最高达 8.91%,ICIR 达5.10,多空组合年化收益率最高为 19.13%, 信息比率达 2.26。将遗传规划因子与既有因子群等权合成后,合成因子 20 日 Rank IC 提升至 13.24%,ICIR 为 4.61,多空组合年化收益率达 38.41%, 信息比率达 2.40。
免责声明:本文 / 资料由用户个人上传,平台仅提供信息存储服务,如有侵权请联系删除。
- 全部热门
- 本年热门
- 本季热门
- 量化投资专题研究报告:机器学习合成非线性因子,增强效果如何? 2243 6积分
- 清华大学-人工智能之机器学习.pdf 2228 40积分
- 机器学习和知识图谱在行业轮动中的应用.pdf 1533 6积分
- 亚马逊云科技7个典型的机器学习案例 1098 6积分
- 兰德-在中美竞争中保持人工智能和机器学习的竞争优势.pdf 997 5积分
- 世界经济论坛-负责任地使用技术:Microsoft案例研究(英文) 957 6积分
- 机器学习资产配置:HMM模型择时及配置策略.pdf 919 5积分
- 德邦金工文献精译第一期:机器学习因子,在线性因子模型中捕获非线性.pdf 811 4积分
- 人人懂AI之从机器学习到大模型.pdf 687 10积分
- IDC白皮书:加快机器学习开发步伐,加速构建智能应用程序.pdf 645 4积分
- 2025年人工智能与机器学习在医疗科技领域的崛起研究报告(英文版).pdf 364 5积分
- 人工智能和机器学习系列专题研究:基于动量Transformer模型的日内和隔夜交易策略.pdf 234 5积分
- 基于可微RankIC损失函数的深度学习选股策略——机器学习选股系列研究之一.pdf 133 5积分
- 金工机器学习系列专题报告:多模式合成的GRU深度学习选股因子.pdf 108 5积分
- 机器学习应用系列专题报告:DAFAT,基于Transformer模型的自适应解决方案.pdf 100 5积分
- 机器学习系列之一:mHC对Barra机器学习因子的改进.pdf 88 4积分
- 量化专题报告:“机器学习”选股模型系列研究(一),量价指纹模型的构建与应用初探.pdf 83 3积分
- 机器学习应用系列:强化学习驱动下的解耦时序对比选股模型.pdf 59 5积分
- 克莱尔:一种用于韧性估计的因果机器学习方法(英译中).pdf 54 6积分
- 机器学习选股系列研究之二:基于Dask计算图的遗传规划高频因子挖掘框架.pdf 16 4积分
