“学海拾珠”系列之二百五十九:基于马氏距离K_Means聚类的价值_成长股分类.pdf
- 上传者:9*****
- 时间:2025/12/15
- 热度:45
- 0人点赞
- 举报
“学海拾珠”系列之二百五十九:基于马氏距离K_Means聚类的价值_成长股分类。本篇是学海拾珠系列第二百五十九篇。本文深入探讨了在价值与成长 投资风格分类的研究背景下,如何通过集成 K 均值聚类与马氏距离来提 升标普 500 股票分类的准确性与稳定性。研究指出,尽管传统方法依赖 于单一财务比率进行风格划分,但此类方法难以捕捉金融指标间的多元依 赖性。本文通过比较标准 K 均值 MD、K 均值++MD 及新型 K 均值++MD 混合算法,结合 2008 至 2023 年的 Refinitiv 数据,系统性地验证了混合 算法在簇稳定性、经济可解释性及时间一致性方面的优势,为无监督学习 在金融风格分类中的应用提供了方法论创新与实践洞见。
混合算法显著提升聚类稳定性与鲁棒性
K-Means++MD 混合算法通过结合 K-Means++初始化和马氏距离计 算,有效解决了传统 K 均值对初始质心敏感的局限性。实证表明,该算 法将戴维森堡丁指数(DBI)降至 1.86,特征标准差锐减至 0.03,显著优 于基准方法(如 K-Means MD 的 DBI 为 2.06),确保了聚类结果在投资 组合构建中的可重复性与可靠性。
特征复杂度与分类效果存在权衡关系
研究通过对比不同财务指标组合发现,仅包含市净率(P/B)和市盈 率(P/E)的简约特征集产生最优聚类效果(DBI=0.93,轮廓系数=0.32), 而引入增长类指标(如动量、季度增长率)反而降低分类清晰度(如“增 长”组合 DBI 升至 1.68)。这表明价值-成长分类应聚焦核心估值比率,避 免冗余指标引入噪声。
纯化组合凸显风格区分与经济意义
基于轮廓系数和距离比率构建的“纯价值”与“纯成长”组合,在 2008– 2023 年间展现出显著的风险调整后超额收益:纯成长组合夏普比率达 0.66,最大回撤仅-32.4%,显著优于基准指数。此类组合在行业分布上(如 金融股主导价值组合、科技股主导成长组合)亦符合传统风格定义,验证 了聚类结果的经济可解释性。
免责声明:本文 / 资料由用户个人上传,平台仅提供信息存储服务,如有侵权请联系删除。
- 全部热门
- 本年热门
- 本季热门
- 十六年成长占优行情全复盘:那些年我们追过的成长.pdf 1153 9积分
- 中小盘中期策略报告:科技成长为主线,关注新股机会 435 5积分
- 超额图谱视角下的成长股投资策略.pdf 364 9积分
- 中小市值行业2024年度投资策略 :重视科技革命带来的成长股投资机会.pdf 317 5积分
- 投资策略专题:成长股高股息,A股新生态下的一种新投资思路.pdf 290 5积分
- 量化专题报告:成长股估值波动的逻辑.pdf 270 5积分
- 2023Q3基金持仓分析:基金Q3的反转交易,增配价值股,减配成长股.pdf 226 5积分
- 2023年度策略报告:全球成长股或将迎来绝地反击.pdf 175 5积分
- 基金狂推新兴产业成长股.docx 158 8积分
- 2024年报与2025一季财报分析:总量业绩增速转正,成长股资本开支提速.pdf 128 5积分
