金融工程深度研究:LLM-FADT,大模型增强文本选股.pdf
- 上传者:v*****
- 时间:2025/06/11
- 热度:151
- 0人点赞
- 举报
金融工程深度研究:LLM-FADT,大模型增强文本选股。
人工智能 92:大模型增强下的文本选股策略 LLM-FADT
本文在前期报告《人工智能 63:再探文本 FADT 选股》(20221028)的基 础上,基于开源大模型 Qwen3-8b 增强 BERT-FADT 策略,构建效果更为 稳定的 LLM-FADT 策略。对于多头等权组合和因子增强 Top25 组合,LLM 增强后的策略效果显著优于增强前。与此同时,基于 LLM-FADT 策略,本 文对基于少量成分内股票的沪深 300 指增组合以及医药行业增强组合进行 探索,构建的 LLM-FADT Top25 沪深 300 指增组合年化超额收益率为 12.16%,LLM-FADT 医药行业增强组合年化超额收益率为 18.53%(回测区 间均为 20170126-20250530)。
大模型的文本“博观”视角:大模型对原始文本推理演绎形成增量信息
传统的文本分析往往仅基于原始文本及其固有特征,例如文本可读性、文本 复杂度、文本情绪、文本相似性等。而人类作为文本信息的常规受众,对文 本分析的基础行为之一是进行个性化的推理演绎,以获取文本中隐含的重要 信息,然而这一基本行为却难以被机器模拟。大语言模型或是难得的解决之 道,本文利用 Qwen3-8b 模型对原始分析师文本进行多角度重构,包括标题 新解、行情催化剂、“言外之意”、潜在风险、收益指引,以模拟人类阅读文 本时的推理演绎过程,构建额外的增量信息。
大模型文本因子:LLM 重构原始文本或将带来额外增量信息
本文对大模型文本因子进行逐一对比测试。在因子分层回测方面,分 10 层测试的情况下,行情催化剂文本分层 1 绝对收益与超额收益均领先于其 余文本,“言外之意”文本分层 10 则均低于其余文本。在组合回测方面, 对各文本因子分层 1 构建等权组合,行情催化剂文本自 2023 年起持续跑 赢其他文本,潜在风险文本则稳定逊色于其他文本。与此同时,行情催化 剂与潜在风险文本与原始文本相关性总体较低,二者相比于原始文本可能 具备独特的增量信息。
LLM-FADT 组合:多项业绩指标均表现出色,LLM 增强后>LLM 增强前
本文尝试对不同大模型文本因子进行合成,包括“先合成后训练”与“先训 练后合成”两种方案,也即先对文本特征向量取均值还是对训练得到的因子 取均值之分。测试结果显示“先训练后合成”方案更优。据此可构建 LLM-FADT 因子增强 Top25 组合,该组合相对于中证 500 基准,年化超额收益率为 27.60%,信息比率为 2.21,相对基准月胜率为 74.26%。基于“先训练后合 成”方案,无论是多头等权组合(因子分 10 层首层等权)还是因子增强组合 (多头等权+额外因子增强),LLM 增强后的组合业绩显著优于增强前。
应用案例:沪深 300 少成分股增强组合与医药行业增强组合
对于投资管理人而言,基于少量成分内股票构建指数组合、构建特定行业增 强组合皆为常见需求。本文通过修改模型训练标签,定制化构建 LLM-FADT Top25 沪深 300 增强组合和 LLM-FADT 医药行业增强组合,前者年化收益 率为 13.65%,年化超额收益率为 12.16%,相对基准月胜率为 59%,后者 年化超额收益率为 18.53%,年化跟踪误差为 12.22%,相对基准月胜率为 69.00%,年化双边换手率为 3.34。
免责声明:本文 / 资料由用户个人上传,平台仅提供信息存储服务,如有侵权请联系删除。
- 全部热门
- 本年热门
- 本季热门
- 北京大学数字普惠金融指数(2011-2021).pdf 19529 7积分
- 2020中国金融科技创新大赛优秀案例集.pdf 14703 20积分
- 区块链与数字货币深度解析:科技如何重塑金融(103页).pdf 9059 10积分
- 中国银行中国经济金融展望报告(2022年第3季度):“三重压力”倍增,政策全力稳定宏观经济大盘.pdf 8271 6积分
- 中国工商银行金融科技研究院:商业银行生物识别技术应用实践及趋势分析.pdf 5895 6积分
- 2020年全球金融科技指数报告.pdf 5552 36积分
- 供应链金融创新发展报告2019.pdf 5280 9积分
- 详解微众银行,见证金融科技的力量.pdf 5138 6积分
- 2019开放银行与金融科技发展研究报告.pdf 5095 8积分
- 金融集团大数据分析平台总体架构方案.pptx 5094 20积分
- 金融壹账通:2024年环境、社会及管治报告.pdf 1205 12积分
- 2025年中国金融科技(FinTech)行业发展洞察报告.pdf 1082 8积分
- 阿里云:2025年金融行业Agent百景图.pdf 1024 30积分
- RWA行业研究报告:真实资产走向链上世界,开启数字金融新时代.pdf 897 6积分
- 区域经济与银行股系列专题报告:山东省三项动能支撑,基建+产业升级+新兴,金融需求持续性强.pdf 677 14积分
- 金融工程专题报告:使用投资雷达把握行业轮动机会.pdf 671 5积分
- 蚂蚁数科:2025金融智能体深度应用报告.pdf 657 7积分
- RWA行业分析:为实体资产开启数字金融世界之门.pdf 649 6积分
- 稳定币行业专题报告:重塑全球金融秩序的变量.pdf 625 6积分
- 多元金融行业分析报告:稳定币如何影响和变革传统金融?.pdf 574 6积分
- 科技新周期系列1:穿越泡沫,从技术革命到金融资本.pdf 429 3积分
- 专题报告:个人AI助理OpenClaw部署及其在金融投研中的应用研究——AIAgent赋能金融投研应用系列之二.pdf 426 3积分
- A股量化择时研究报告:金融工程,AI识图关注中药、银行和红利.pdf 242 5积分
- 非银金融行业深度报告:海南全岛封关运作,跨境资管空间广阔.pdf 236 3积分
- 金融行业:金融业监管2025年度数据处罚分析及洞察建议.pdf 212 3积分
- 中国金融智能体发展研究与厂商评估报告 (2025).pdf 210 11积分
- 金融产品深度报告:广发中证传媒ETF(512980.SH),政策规范护航,AI产能兑现,低估值传媒ETF走向高质量增长.pdf 209 5积分
- 金融行业周报(20251214):公募销售新规落地,政银绑定深化下银行扩表动能有望复苏.pdf 205 5积分
- 5G环境下供应链金融解决方案.pdf 203 6积分
- 非银行金融行业研究:数字人民币专题,应用场景空间广阔,2.0时代将加速发展.pdf 201 3积分
