机器学习选股系列研究之二:基于Dask计算图的遗传规划高频因子挖掘框架.pdf

  • 上传者:b**
  • 时间:2026/03/13
  • 热度:15
  • 0人点赞
  • 举报

机器学习选股系列研究之二:基于Dask计算图的遗传规划高频因子挖掘框架。遗传规划(Genetic Programming,GP)是更广泛的进化计算领域的一个子 领域,其根源可追溯至遗传算法(Genetic Algorithm,GA)。然而,与主 要用于优化参数的传统遗传算法不同,遗传规划旨在进化出算式本身作为 问题的解决方案。遗传规划的核心可以概括为“随机性”和“方向性”的权 衡,算法既要保证种群往更好的方向进化迭代,又要保证其种群的多样性与 进化的随机性,防止陷入局部最优解。 为实现日频与分钟频数据混合输入的高频因子自动化挖掘,本文基于遗传 规划库 gplearn 与分布式计算库 dask 进行深度重构,构建了一套高效且硬 件友好的高频因子挖掘框架。借助 dask 的分布式计算图与惰性求值机制, 分钟频数据得以分块存储、按需加载,在突破内存限制的同时,保持了高性 能计算,为混合频率因子挖掘提供了坚实的技术底座。 在框架优化方面,通过将分钟数据封装为 dask array,使其以分块形式高 效参与遗传规划迭代;基于 dask 算子对遗传规划分钟频算子进行重构,使 得因子表达式的执行可映射为 dask 计算图,进而实现了高效的并行调度; 此外,通过扩充算子库、引入覆盖度与多样性控制机制、设计多元化适应度 函数,有效提升了挖掘效率与因子多样性,使算法更聚焦于增量信息的发 现。 基于上述框架,本文初步挖掘了 10 个低相关性的遗传规划因子。单因子 20 日 Rank IC最高达 8.91%,ICIR 达5.10,多空组合年化收益率最高为 19.13%, 信息比率达 2.26。将遗传规划因子与既有因子群等权合成后,合成因子 20 日 Rank IC 提升至 13.24%,ICIR 为 4.61,多空组合年化收益率达 38.41%, 信息比率达 2.40。

1页 / 共33
机器学习选股系列研究之二:基于Dask计算图的遗传规划高频因子挖掘框架.pdf第1页 机器学习选股系列研究之二:基于Dask计算图的遗传规划高频因子挖掘框架.pdf第2页 机器学习选股系列研究之二:基于Dask计算图的遗传规划高频因子挖掘框架.pdf第3页 机器学习选股系列研究之二:基于Dask计算图的遗传规划高频因子挖掘框架.pdf第4页 机器学习选股系列研究之二:基于Dask计算图的遗传规划高频因子挖掘框架.pdf第5页 机器学习选股系列研究之二:基于Dask计算图的遗传规划高频因子挖掘框架.pdf第6页 机器学习选股系列研究之二:基于Dask计算图的遗传规划高频因子挖掘框架.pdf第7页 机器学习选股系列研究之二:基于Dask计算图的遗传规划高频因子挖掘框架.pdf第8页 机器学习选股系列研究之二:基于Dask计算图的遗传规划高频因子挖掘框架.pdf第9页 机器学习选股系列研究之二:基于Dask计算图的遗传规划高频因子挖掘框架.pdf第10页 机器学习选股系列研究之二:基于Dask计算图的遗传规划高频因子挖掘框架.pdf第11页
  • 格式:pdf
  • 大小:3.8M
  • 页数:33
  • 价格: 4积分
下载 获取积分

免责声明:本文 / 资料由用户个人上传,平台仅提供信息存储服务,如有侵权请联系删除。

留下你的观点
  • 相关标签
  • 相关专题
热门下载
  • 全部热门
  • 本年热门
  • 本季热门
分享至