金融工程2025年中期策略:文本分析之自然语言处理——基于MD&A文本信息的行业轮动策略.pdf

  • 上传者:m*****
  • 时间:2025/06/10
  • 热度:28
  • 0人点赞
  • 举报

金融工程2025年中期策略:文本分析之自然语言处理——基于MD&A文本信息的行业轮动策略。目前量化投资的知识体系已非常成熟,无论是学术上还是业界,结构化 的数据均已被充分挖掘。为探索差异化的 Alpha 来源,本研究另辟蹊径, 聚焦于非结构化的文本数据,基于自然语言处理技术(NLP)构建文本 因子体系,以期为量化模型提供低相关性的增量信息,在此基础上构建 行业轮动策略。

因子样本内有效性显著:余弦相似度变化、编辑距离相似度变化因子正 向有效;情感语调和词典正式度变化因子负向有效。将上述四个因子等 权叠加,分组收益整体上呈现较为显著的单调性,随着预测收益的下降, 实际收益近似单调下行。

模型样本内平均 IC 较高:十个持仓周期中,只有三个持仓周期 IC 为 负,其余均为正。整体上看样本内各持仓周期的平均 IC 为 21.0%,表明 模型在样本内有较好的预测能力。

模型样本内收益稳定:2021 年至 2023 年每年均录得正超额收益(费后), 这三年的超额收益分别为 35.94%、18.48%和 5.08%。若以每一个持仓周 期为单位统计超额收益,样本内只有最后一个持仓周期的超额收益出现 亏损,其余持仓周期均录得正超额收益,整体上看单个持仓周期超额收 益的胜率为 90%,较月度胜率有显著提高。

模型样本外泛化性持续:2024 年超额收益为 7.34%,2025 年前 5 个月 累计超额收益为 2.08%。若从单个持仓周期来看,样本外五个持仓周期 中,只有一个持仓周期小幅亏损,超额收益为-0.32%,其余四个持仓周 期均录得正超额收益。

模型样本外优选行业收益排名靠前:从单个持仓周期所选行业收益位于 全行业的平均名次来看,每个持仓周期的平均排名均优于基准 15.5 名, 尤其是最后一个持仓周期,所选行业平均排名为 10.8 名,比基准高 4.7 个名次。此外整体样本外平均排名为 12.8 名,比基准高 2.7 个名次。

2025 年 5 月至 8 月持仓周期优选行业:基于上市公司 2025 年一季报中 MD&A 文本信息,本研究所构建的行业轮动模型优选行业为:煤炭、建 材、医药、食品饮料、银行以及综合金融等六个行业。

1页 / 共29
金融工程2025年中期策略:文本分析之自然语言处理——基于MD&A文本信息的行业轮动策略.pdf第1页 金融工程2025年中期策略:文本分析之自然语言处理——基于MD&A文本信息的行业轮动策略.pdf第2页 金融工程2025年中期策略:文本分析之自然语言处理——基于MD&A文本信息的行业轮动策略.pdf第3页 金融工程2025年中期策略:文本分析之自然语言处理——基于MD&A文本信息的行业轮动策略.pdf第4页 金融工程2025年中期策略:文本分析之自然语言处理——基于MD&A文本信息的行业轮动策略.pdf第5页 金融工程2025年中期策略:文本分析之自然语言处理——基于MD&A文本信息的行业轮动策略.pdf第6页 金融工程2025年中期策略:文本分析之自然语言处理——基于MD&A文本信息的行业轮动策略.pdf第7页 金融工程2025年中期策略:文本分析之自然语言处理——基于MD&A文本信息的行业轮动策略.pdf第8页 金融工程2025年中期策略:文本分析之自然语言处理——基于MD&A文本信息的行业轮动策略.pdf第9页 金融工程2025年中期策略:文本分析之自然语言处理——基于MD&A文本信息的行业轮动策略.pdf第10页
  • 格式:pdf
  • 大小:3.1M
  • 页数:29
  • 价格: 5积分
下载 获取积分

免责声明:本文 / 资料由用户个人上传,平台仅提供信息存储服务,如有侵权请联系删除。

留下你的观点
  • 相关标签
  • 相关专题
热门下载
  • 全部热门
  • 本年热门
  • 本季热门
分享至