“学海拾珠”系列之二百五十九:基于马氏距离K_Means聚类的价值_成长股分类.pdf

  • 上传者:9*****
  • 时间:2025/12/15
  • 热度:45
  • 0人点赞
  • 举报

“学海拾珠”系列之二百五十九:基于马氏距离K_Means聚类的价值_成长股分类。本篇是学海拾珠系列第二百五十九篇。本文深入探讨了在价值与成长 投资风格分类的研究背景下,如何通过集成 K 均值聚类与马氏距离来提 升标普 500 股票分类的准确性与稳定性。研究指出,尽管传统方法依赖 于单一财务比率进行风格划分,但此类方法难以捕捉金融指标间的多元依 赖性。本文通过比较标准 K 均值 MD、K 均值++MD 及新型 K 均值++MD 混合算法,结合 2008 至 2023 年的 Refinitiv 数据,系统性地验证了混合 算法在簇稳定性、经济可解释性及时间一致性方面的优势,为无监督学习 在金融风格分类中的应用提供了方法论创新与实践洞见。

混合算法显著提升聚类稳定性与鲁棒性

K-Means++MD 混合算法通过结合 K-Means++初始化和马氏距离计 算,有效解决了传统 K 均值对初始质心敏感的局限性。实证表明,该算 法将戴维森堡丁指数(DBI)降至 1.86,特征标准差锐减至 0.03,显著优 于基准方法(如 K-Means MD 的 DBI 为 2.06),确保了聚类结果在投资 组合构建中的可重复性与可靠性。

特征复杂度与分类效果存在权衡关系

研究通过对比不同财务指标组合发现,仅包含市净率(P/B)和市盈 率(P/E)的简约特征集产生最优聚类效果(DBI=0.93,轮廓系数=0.32), 而引入增长类指标(如动量、季度增长率)反而降低分类清晰度(如“增 长”组合 DBI 升至 1.68)。这表明价值-成长分类应聚焦核心估值比率,避 免冗余指标引入噪声。

纯化组合凸显风格区分与经济意义

基于轮廓系数和距离比率构建的“纯价值”与“纯成长”组合,在 2008– 2023 年间展现出显著的风险调整后超额收益:纯成长组合夏普比率达 0.66,最大回撤仅-32.4%,显著优于基准指数。此类组合在行业分布上(如 金融股主导价值组合、科技股主导成长组合)亦符合传统风格定义,验证 了聚类结果的经济可解释性。

1页 / 共29
“学海拾珠”系列之二百五十九:基于马氏距离K_Means聚类的价值_成长股分类.pdf第1页 “学海拾珠”系列之二百五十九:基于马氏距离K_Means聚类的价值_成长股分类.pdf第2页 “学海拾珠”系列之二百五十九:基于马氏距离K_Means聚类的价值_成长股分类.pdf第3页 “学海拾珠”系列之二百五十九:基于马氏距离K_Means聚类的价值_成长股分类.pdf第4页 “学海拾珠”系列之二百五十九:基于马氏距离K_Means聚类的价值_成长股分类.pdf第5页 “学海拾珠”系列之二百五十九:基于马氏距离K_Means聚类的价值_成长股分类.pdf第6页 “学海拾珠”系列之二百五十九:基于马氏距离K_Means聚类的价值_成长股分类.pdf第7页 “学海拾珠”系列之二百五十九:基于马氏距离K_Means聚类的价值_成长股分类.pdf第8页 “学海拾珠”系列之二百五十九:基于马氏距离K_Means聚类的价值_成长股分类.pdf第9页 “学海拾珠”系列之二百五十九:基于马氏距离K_Means聚类的价值_成长股分类.pdf第10页
  • 格式:pdf
  • 大小:2M
  • 页数:29
  • 价格: 5积分
下载 获取积分

免责声明:本文 / 资料由用户个人上传,平台仅提供信息存储服务,如有侵权请联系删除。

留下你的观点
分享至