金融行业-九坤Kaggle量化大赛有哪些启示?.pdf
- 上传者:v*****
- 时间:2023/01/31
- 热度:1286
- 0人点赞
- 举报
九坤Kaggle量化大赛有哪些启示?本文梳理 2022 年九坤 Kaggle 量化大赛高分队伍解决方案,提炼出特征工 程、损失函数、交叉验证、模型集成四个主要方向,并应用于华泰人工智能 中证 500 指数增强策略改进。结果表明:(1)特征工程引入均值因子对神经 网络有效;(2)CCC 损失优于 MSE 损失和 IC 损失;(3)时序交叉验证作用不 明显;(4) 集成神经网络和决策树类模型提升较稳定。对比整合多项改进的 模型与基线模型,回测期 2011 年至 2022 年内,年化超额收益从 14.2%提 升至 17.0%,信息比率从 2.3/2.4 提升至 2.7。
多家头部量化机构在 Kaggle 发布竞赛,九坤竞赛贴近实际量化选股场景
随着数据科学在线社区日益成熟,越来越多的爱好者投身于网络编程竞赛之 中。Kaggle 是全球知名的数据科学在线平台之一,Two Sigma、Optiver 等 头部量化机构曾在 Kaggle 发布挑战竞赛。国内量化私募九坤投资于 2022 年 1 月启动 Kaggle 竞赛,吸引两千多只队伍参赛。比赛具体任务为基于给 定的 A 股匿名特征,预测股票未来短期收益,最终评价指标为预测收益和 真实收益的 IC 值,属于典型的监督学习问题,和实际量化选股场景较贴近。
四个改进方向:引入均值因子,引入 CCC 损失,时序交叉验证,模型集成
我们梳理九坤 Kaggle 量化大赛高分队伍解决方案,提炼出四个改进方向。(1) 特征工程引入截面上全部股票因子的均值,均值因子可能反映原始因子整体 分布的时变特性,是市场环境的一种简单表达。(2)损失函数引入一致性相关 系数 CCC,可视作 IC 和 MSE 的融合,兼顾相关性和距离。(3)采用时序交 叉验证选取最优超参数。(4)集成不同类型机器学习模型。以神经网络和 XGBoost 构建中证 500 指数增强策略作为基线,测试上述技巧的改进效果。
均值因子对神经网络有效,加权 CCC 损失回测表现好,模型集成提升稳定
四项改进技巧效果各异。特征工程引入的均值因子对神经网络有提升,但削 弱了 XGBoost 模型。损失函数中,MSE 表现不突出;IC 损失单因子测试 表现好,但指增组合回测表现差;CCC 损失在单因子测试表现一般,但指 增组合回测表现较好;加权均优于等权。交叉验证调参改进不显著,考虑到 时间开销大,性价比不高,算力有限前提下,使用经验超参数即可。模型集 成提升较稳定,神经网络类和决策树类模型有互补效果。
讨论:(1)如何使用弱因子;(2)因子合成和组合优化的目标错配问题
研究发现均值因子对神经网络有效但对 XGBoost 无效。均值因子属于弱因 子,有用但比重不宜过大。XGBoost 引入弱因子后,特征采样使原始因子 可能被排除在外,从而削弱模型。神经网络可通过预处理缩小取值,有限度 地使用弱因子。研究还发现 IC 损失单因子测试优于 MSE 损失,但指增组 合表现差,本质是因子合成和组合优化的目标错配。IC 属于全局统计量, 不会侧重于个别头部样本,但这些样本可能对组合优化影响较大。MSE 的 特点之一是给予极端误差较大惩罚,恰好弥补IC弱点。CCC融合IC和MSE, 兼顾共性和个性,是一类理想的损失函数。
免责声明:本文 / 资料由用户个人上传,平台仅提供信息存储服务,如有侵权请联系删除。
- 相关标签
- 相关专题
- 全部热门
- 本年热门
- 本季热门
- 北京大学数字普惠金融指数(2011-2021).pdf 19530 7积分
- 2020中国金融科技创新大赛优秀案例集.pdf 14703 20积分
- 区块链与数字货币深度解析:科技如何重塑金融(103页).pdf 9059 10积分
- 中国银行中国经济金融展望报告(2022年第3季度):“三重压力”倍增,政策全力稳定宏观经济大盘.pdf 8271 6积分
- 中国工商银行金融科技研究院:商业银行生物识别技术应用实践及趋势分析.pdf 5895 6积分
- 2020年全球金融科技指数报告.pdf 5552 36积分
- 供应链金融创新发展报告2019.pdf 5282 9积分
- 详解微众银行,见证金融科技的力量.pdf 5138 6积分
- 2019开放银行与金融科技发展研究报告.pdf 5096 8积分
- 金融集团大数据分析平台总体架构方案.pptx 5094 20积分
- 金融壹账通:2024年环境、社会及管治报告.pdf 1207 12积分
- 2025年中国金融科技(FinTech)行业发展洞察报告.pdf 1082 8积分
- 阿里云:2025年金融行业Agent百景图.pdf 1024 30积分
- RWA行业研究报告:真实资产走向链上世界,开启数字金融新时代.pdf 897 6积分
- 区域经济与银行股系列专题报告:山东省三项动能支撑,基建+产业升级+新兴,金融需求持续性强.pdf 677 14积分
- 金融工程专题报告:使用投资雷达把握行业轮动机会.pdf 671 5积分
- 蚂蚁数科:2025金融智能体深度应用报告.pdf 657 7积分
- RWA行业分析:为实体资产开启数字金融世界之门.pdf 649 6积分
- 稳定币行业专题报告:重塑全球金融秩序的变量.pdf 625 6积分
- 多元金融行业分析报告:稳定币如何影响和变革传统金融?.pdf 574 6积分
- 科技新周期系列1:穿越泡沫,从技术革命到金融资本.pdf 431 3积分
- 专题报告:个人AI助理OpenClaw部署及其在金融投研中的应用研究——AIAgent赋能金融投研应用系列之二.pdf 426 3积分
- A股量化择时研究报告:金融工程,AI识图关注中药、银行和红利.pdf 242 5积分
- 非银金融行业深度报告:海南全岛封关运作,跨境资管空间广阔.pdf 236 3积分
- 中国金融智能体发展研究与厂商评估报告 (2025).pdf 217 11积分
- 金融行业:金融业监管2025年度数据处罚分析及洞察建议.pdf 212 3积分
- 金融产品深度报告:广发中证传媒ETF(512980.SH),政策规范护航,AI产能兑现,低估值传媒ETF走向高质量增长.pdf 211 5积分
- 金融行业周报(20251214):公募销售新规落地,政银绑定深化下银行扩表动能有望复苏.pdf 205 5积分
- 5G环境下供应链金融解决方案.pdf 203 6积分
- 非银行金融行业研究:数字人民币专题,应用场景空间广阔,2.0时代将加速发展.pdf 201 3积分
