2025年量化研究系列报告：让情绪“有结构”，大模型如何挖掘研报新价值

来源：华安证券
发布时间：2025/08/13
浏览次数：185
举报

相关深度报告REPORTS

量化研究系列报告：让情绪“有结构”，大模型如何挖掘研报新价值.pdf

量化研究系列报告：让情绪“有结构”，大模型如何挖掘研报新价值。本篇报告依托DeepSeek大模型，将情感分析从研报标题拓展至摘要层面，结合摘要结构解析与多维量化方法，并基于结构化情绪信号实现对研报摘要价值的重构。基于DeepSeek大模型的研报摘要结构化情感分析本文依托DeepSeek大模型，将情感分析从研报标题拓展至摘要，实现从黑箱评分向结构化、可解释评分的转变。通过拆解摘要结构（业务发展—战略布局、技术创新、渗透率、经营效率；财务表现—盈利质量、稳健性、业绩对比；其他因素—股东行为、政策影响、市场驱动），引入类别识别、情绪倾向、出...

1 大模型迭代下的文本探索之路

2022 年 11 月，ChatGPT 面世后，我们首次尝试将其应用于情感分析领域，通过分析卖方分析师对公司盈余公告点评标题中的情感态度，取得了初步成果，感受到了大型语言模型在文本分析中的强大潜力。ChatGPT 不仅能够准确且连贯地进行评分，还能精准捕捉核心情感信息，表现明显优于传统模型如 BERT。然而，受限于当时的技术水平与模型调用成本，我们的研究仅聚焦于标题情感分析，尚未延伸至研报摘要部分。今年，DeepSeek 模型的出现为我们提供了新的契机。该模型相比 ChatGPT，参数规模更小、成本更低、操作更便捷，且依然保持了出色的性能表现，使得大规模自动化文本分析任务成为现实可能。

基于此，本研究尝试利用 DeepSeek 将文本分析拓展至卖方分析师研报的摘要部分。一方面，摘要承载了更丰富、全面的信息；另一方面，近年来分析师研报措辞普遍偏积极，特别是标题部分过于简略且不包含客观数据，单纯依赖文字情绪易导致偏差。传统的诸多研究多聚焦于大模型对摘要进行综合评分，虽取得一定成果，但仍存在若干亟需探讨的问题：其一，评分过程“黑箱化”，模型直接输出总分，难以洞察评分细节；其二，情绪评分易受分析师个人写作风格影响，乐观型分析师偏好正面词汇，部分中立分析师则措辞平和，导致评分可能被局部情绪主导；其三，综合评分缺乏灵活性，通常仅反映分析师对公司整体状况的判断，难以洞察不同经营维度的细节。因此，本文基于 DeepSeek 大模型，围绕卖方研报摘要展开系统研究，实现“黑箱评分”向“可解释结构化”评分。我们从分析逻辑与方法论出发，结合模型选择与训练过程，深入解析模型输出的情绪结构与信息维度，并探讨其在投资决策中的实际应用价值。

2 研报内容的框架拆解与多维信息挖掘

在金融研究领域，研报是分析师与投资者进行信息交流的关键桥梁，而摘要浓缩了全文的核心内容。本章将介绍研报分类的整体框架，深入探讨从研报结构分析到情绪分类的全过程，同时详细介绍分类任务中的各类细节，包括业务发展、财务表现、外部因素等方面的分类定义。通过对研报结构的拆解与分类解读，探索其在投资决策中的应用价值和实用性。

2.1 研报摘要内容的结构化解读

分析师撰写的公司报告的摘要通常遵循一个程序化的框架，主要包括以下四个部分：事件：对核心经营结果的总结，涵盖财务预告、快报或正式报告中的关键财务数据，以及公司的重要事件，如分红公告、股份回购简要和其他重大事件。点评：分析师对上述“事件”的详细分析和观点，通常包括对公司整体业绩的评价、经营性指标的解读、毛利率和净利率的分析、流动性状况、销售渠道表现、研发进展以及战略布局等内容。此外，还可能涉及股东行为、政策环境、市场资金和热度等其他相关因素。盈利预测：对公司的评级，以及未来三年的盈利预测、估值等前瞻性分析。风险提示：对公司可能面临的风险因素进行说明和提示。

为了确保研究的准确性和客观性，避免模型过度依赖盈利预测和风险提示部分，进而对分析结果产生干扰，我们对研报摘要的原文进行了初步清洗，剔除了盈利预测和风险提示这两部分内容。以典型的业绩点评为例，其结构通常包括：先总体描述公司业绩成果，然后对业绩进行拆分，分析单项构成并陈述分析师的观点，内容涵盖整体盈利情况、公司经营性指标、毛利率和净利率、流动性指标、公司销售渠道情况、研发相关情况以及公司的战略布局等。此外，还可能涉及股东行为、政策情况、市场资金和热度等其他相关因素。

2.1.1 业务发展：战略优化与核心能力提升

“业务发展”类聚焦于公司优化举措，不一定已经体现在了披露业绩中，包括战略布局、技术创新、渗透率、经营效率。

2.1.2 财务表现：盈利质量、稳健性与业绩超预期分析

“财务表现”类重点关注公司经营成果，已经发生而非分析师预期，包括盈利改善、财务稳健性、业绩对比预期与同业是否存在超预期。

财务稳健性提升：核心是验证是否降低系统性风险。企业通过资本结构优化（资产负债率同比下降≥3 个百分点）、债务控制（短期债务占比≤30%）、现金流改善（经营性现金流净额/净利润≥80%）等方式显著增强抗风险能力，但需排除融资输血或资产出售等非经营手段，且需多维度验证（如流动性、负债率、现金流同步优化）。

业绩对比预期和同业：业绩对比预期与同业是超预期、低于预期还是符合预期。公司经营结果（如利润、营收、ROE、毛利率、订单、资产质量等）好于市场预期或分析师预测或行业平均水平。一般而言，若指标表现优于预期或显著高于行业水平的关键词为“超预期、超预测、高于预期、超同业、超行业、创纪录、超指引”等；若指标表现低于预期或显著差于行业水平，关键词为“不及预期、低于预期、弱于同业、不及指引、逊于行业”等。

2.1.3 其他因素：股东行为、政策影响与市场驱动分析

“其他因素”类主要是公司外部因素，包括股东行为、政策驱动、市场驱动。股东行为：包括股份回购（需区分注销或员工激励用途）、大股东及管理层增减持、股息政策调整（提高/降低分红、暂停派息）等。

政策驱动：由政府或监管机构直接针对公司或所在行业发布的政策，且会对公司未来的核心经营指标（收入/利润/成本等）产生可量化的直接影响，包含两类情形： (1)直接财务影响:政策直接改变公司收入、成本或现金流（如补贴、税收优惠、专项采购等）; (2)间接需求驱动:政策放松/收紧通过改变行业供需环境，导致公司未来需求变化（如放宽行业准入、刺激终端消费等）。

市场驱动：反映市场因素对公司的直接影响，包括(1) 资金驱动：反映外部机构资金行为对公司的持股情况，包括国家队、公募基金、保险资金、北向资金/陆股通、 QFII、产业资本等市场机构投资者对公司持股比例的情况及潜力。(2) 公司所在的赛道热度、景气度情况。

2.2 摘要信息处理与多维度量化分析

在本篇报告中，我们依托慧博投研的分析师文本数据库，对沪深 A 股自 2019 年 9 月 30 日至 2025 年 4 月 30 日的 38 万余篇研报摘要数据进行了系统处理。通过对海量研报摘要的深度挖掘与分析，我们旨在从文本中提取关键信息，并从以下四个维度进行量化分析，以揭示研报中的潜在价值信息：（1）类别识别：识别研报摘要中所涉及的利好类别，力求精准地梳理出各类潜在的积极因素，涵盖前边提到的 3 大类 10 小类，如战略布局、技术创新、盈利改善等。（2）情感倾向：为便于快速统计与高效信息整合类别识别的结果，我们引入情绪倾向判断机制，即用简洁明了的数字标签来表征各类别所对应的情绪色彩。其中， 1 代表正面利好，意味着该因素大概率对相关标的产生积极助推作用；-1 则象征负面利空，暗示存在潜在风险或不利影响；0 表示中性，即倾向性不明显或者影响程度微乎其微。（3）出现顺序：在信息处理进程中，我们还融入了顺序记录，捕捉各类别在摘要中的出现次序。这一设计基于一个假设：前面提及的利好因素，是否是因撰写者的刻意安排或信息重要性排序，可能更具代表性与优先级，或是更能契合当下市场关注焦点，所以在处理过程中对该信息予以记录。（4）字数占比：计算每个类别在摘要全文中的字数占比，这一指标能反映各类别在摘要中的文本权重。字数占比高的类别，通常包含更丰富的内容和细节，我们是否可参考其占比来判断该类别在核心观点中的重要性，从而聚焦关键信息呢？

2.3 模型选择与场景规则化训练

为了满足不同场景下的需求，我们对多种模型进行了测试和评估，并探索了本地部署与云端调用的可行性。以下内容将详细介绍我们在模型选择、任务规则化以及调用实践方面的具体工作。

2.3.1 模型选择与部署调用

根据前边的任务要求，我们分别测试了三种不同的模型：DeepSeek-R1-32B、 DeepSeek-R1-671B、DeepSeek-V3-671B。

在本机（搭载 RTX 4090 32G 显卡）上，我们部署了 DeepSeek-R1-32B 模型，可直接通过程序本地调用。而 DeepSeek-R1-671B 和 DeepSeek-V3-671B 模型由于本地部署对硬件要求较高，我们选择通过 API 调用进行测试。我们对多家 API 进行了反复对比，包括官方 API。从收费情况来看，各家 API 基本一致。综合考虑稳定性和响应速度后，我们最终选择了火山引擎提供的 API。

2.3.2 任务规则化：为大模型在投资领域“降噪”增效

在投资场景，精准与可靠的信息分析至关重要。然而，大语言模型常常因“幻想”问题（如事实性幻觉与忠实性幻觉）而输出不准确或不切实际的内容，这在严谨的投资决策场景中显然是不可接受的。为了确保模型输出能够尽量契合金融分析的需求，任务规则化显得尤为关键。通过明确的规则化设计，我们可以有效约束模型的输出，避免其“幻想”，从而显著提升模型的输出效率和可用性。

1. 核心任务规则化

目前大模型最大的问题是“幻想”（即事实性幻觉与忠实性幻觉），在金融领域这类严谨任务场景中，需要对任务提示进行明确规则化，通过结构化约束与量化标准实现分析过程的确定性控制。

2. 输入、输出格式

输入格式：在输入格式中，system 字段需包含系统提示以明确定义任务及处理要求，user 字段接收清洗后的研报摘要文本作为输入数据。

3 基于 DeepSeek 的分类任务实践与企业价值洞察

3.1 DeepSeek 在研报分类任务的实践

在本研究的研报利好分类任务中，我们的目标是通过系统提示规则，对文本内容进行归类、情绪判断、记录出现顺序、计算字数占比，并按照规定格式输出结果。这一任务的复杂性要求模型具备高准确率、稳定性以及对任务规则的严格遵循能力。为了评估不同模型在这一场景下的表现，我们对三种模型（DeepSeek-R1-32B、 DeepSeek-R1-671B、DeepSeek-V3-671B）进行了详细测试，重点关注分类结果的合理性、输出格式的正确率以及结果的稳定性。 DeepSeek-R1-32B 模型的推理过程基本符合逻辑，但在输出结果格式的准确率方面表现欠佳，仅为约 50%。另外，多次测试同一输入时，其分类稳定性也未能达到理想水平。这表明该模型在处理复杂任务时，可能因参数量较小而难以完全适应此复杂场景的任务要求。

DeepSeek-R1-671B 模型的推理过程严谨且符合逻辑，输出格式的准确率接近 100%，显示出其对任务规则的良好理解。然而，尽管其分类结果在明确类别上表现准确，但在易混淆的类别中，多次测试仍可能出现不同结果。这可能是由于模型的弱规范约束和自主决策的融入导致路径灵活性增加，从而引入了结果的多样性。

DeepSeek-V3-671B 模型虽然没有实时推理过程，但其操作路径明确且标准化，生成目标的确定性高。测试结果显示，其分类结果与 R1 版本接近，且输出格式符合率高达 100%。在连续测试 100 条任务时，V3 版本的输出结果稳定性甚至略优于 R1版本。此外，V3 版本支持批量请求，每次可输入多达 15 条摘要，显著提高了任务执行效率。

综合来看，DeepSeek-R1 和 DeepSeek-V3 的 671B 满血版本均能基本完成给定任务，但 R1-32B 版本在复杂任务场景下表现欠佳。R1 版本由于存在推理过程，反应速度略慢于 V3 版本，且不支持批量任务请求，只能逐条输入“系统提示+1 条研报摘要”进行调用，效率较低。相比之下，DeepSeek-V3-671B 不仅支持批量请求，还具备更高的输出格式符合率和结果稳定性。

3.2 文本分类准确性的复查与调整

在完成所有研报摘要的处理工作后，我们对大模型的分类结果进行了初步检查。过程中主要发现两类问题，并据此进行了针对性处理与优化。

（1）模型无法输出预期结构化结果

部分摘要未能成功返回预期的 JSON 分类结构。针对这类情况，我们首先尝试重新运行程序，判断是否属于偶发性错误。若多次运行仍无法解析，我们进一步排查原始摘要文本，发现多数问题源于文本中存在部分词汇，导致模型拒绝输出结果。对此，我们建立了词汇识别与替换机制，对相关文本进行适度修改后再次运行模型，从而恢复分类能力。

（2）分类逻辑偏离传统“超预期”理解

在模型输出中，我们注意到模型对分类 7（业绩对比预期与同业）的认定范围比我们最初设定的范围更为宽泛。具体来看，该分类在全部研报摘要中的占比高达 21.9%。虽然模型对分类 7 的解释在某些情况下具有一定合理性，但为了使我们的分类方法与传统的“超预期”识别方法保持一致，我们决定对分类 7 进行进一步的优化处理。

具体的复查逻辑如下：（1）初步筛选：检查模型初步输出结果是否包含分类 7。如果包含，则对该部分进行分词检查，以确保其准确性。（2）情绪一致性检查：如果分词后仍存在分类 7，进一步检查其情绪结果是否一致。如果情绪结果不一致，则重新运行模型进行分析。（3）关键词检查：如果分词后不存在分类 7，则检查文本中是否包含与分类 7 相关的关键词，如“行业平均”“同业”“行业水平”“预期”“承诺”“业绩预告”“预告上限”“预告”“一致预期”“市场预期”“市场一致预期”“创纪录”“超指引”等。如果文本中不包含这些关键词，则重新运行模型。

在优化分类 7 的过程中，我们发现了一个特殊情况：部分研报摘要文本中并未涉及该分类，但模型返回的结果中却出现了分类 7 且情绪值为 0。模型假设未明确提及“超预期”或“不及预期”时，即为“符合预期”。然而，这种假设与其他分类逻辑及提示不符，其他分类基本遵循“未涉及则不输出”的原则。为了确保所有分类规则的一致性，我们决定剔除存在分类 7 且情绪为 0 的记录，并重新调整每篇报告中各分类的顺序。

3.3 细分类别助力从细节洞察企业真实价值

在本次金融文本分析任务中，分类识别作为核心环节，不仅有效避免了对研报摘要进行整体评分时出现的“笼统性”问题，还能更细致地揭示公司在不同经营维度上的具体表现。该分类方法的优势在于各类别相互独立，使我们能够从更全面且贴近主观研究的角度开展分析。以下是三种典型应用场景：

（1）沙里淘金：洞察逆势价值，捕捉潜在反转

在整体业绩承压的背景下，通过分类识别挖掘局部亮点，预判企业的反转潜力。例如，即使公司盈利状况不佳，但通过运营优化和产品创新突破，公司仍可能具备实现反弹的潜力。如图表 14 中的示例，尽管公司盈利状况不佳，但通过运营优化和产品优势，公司具有实现反弹的潜力。这种分析方法和主观分析逻辑相契合，如周期底部行业筛选、困境反转策略标的挖掘等逆向投资策略下的价值发现。

（2）去伪存真：剥离非核心因素，聚焦内生经营质量

通过剔除并表效应、汇率变动及政策影响等非持续性干扰，聚焦企业内生经营质量，还原企业的真实盈利水平。例如，某公司因并购及汇率波动导致净利润亏损，但剔除异常因素后，核心业务表现稳健且增长显著，符合“盈利改善”的判断逻辑。

（3）拨云见日：剖析盈利本质，明确核心竞争力

区分经常性收益与非经常性损益（如政府补贴、资产处置），防止盈利质量被虚高数据掩盖，确保企业间的可比性。如图表 16 展示，某公司预告的归母净利润看似优异，但扣除非经常性损益后实际盈利表现不尽如人意。

4 结构化情绪视角下的研报摘要价值重构

4.1 研报分类与情绪分析全景

在统计区间 20190930 - 20250430 内，共有 38.5 万余篇报告获得了有效分类结果。从每篇报告所涉及的分类数量看，大部分报告涉及的类别数量为 3-5 类。

总体来看，超过 90% 的报告涉及分类 5 - 盈利改善，占比（存在该分类的报告数/总报告数）最高；其次是分类 1 - 战略布局和分类 3 - 渗透率，分别约有 65% 和 49% 的报告涉及；而涉及比例最低的分类是分类 9 - 政策驱动、分类 7 - 对比预期和同业和分类 10 - 市场驱动，占比分别为 8%、12% 和 15%。从年度分布来看，各年度各类别报告数量占当年报告总数的比例在时间序列上整体较为均衡。相对而言，分类 1 - 战略布局和分类 10 - 市场驱动（主要与行业板块赛道热度相关）被分析师提及的频率呈现逐年上升的趋势。另外，自去年以来，随着分红新规的实施，与分类 8 - 股东行为相关的公司行为日益增多，导致该分类的报告数量占比逐渐上升，近三年的占比分别为 13.6%、19.1% 和 23.2%。

和预期一致，分析师在报告中倾向聚焦正向因素，对负向因素或不提，或持中性态度。从数据统计来看，所有报告的分类中，正向情绪（+1）占比（正向情绪数量/总情绪数量）高达 85.3%，中性（0）和负向（-1）情绪占比分别为 6.1% 和 8.6%。年度间的不平衡度略有差异，其中 2021 年和 2023 年表现得更为显著（图表 21）。从各分类的情绪分布来看（图表 22），所有分类均呈现出显著的正向情绪倾向。其中，分类 5 - 盈利改善因基于客观财务数据，情绪分布相对均衡一些，+1、0、-1 的情绪占比分别为 62.5%、15.3% 和 22.2%。

4.2 利好密度驱动下的收益预测与策略应用

在建立了情绪分类体系并完成情绪标签标准化后，我们尝试进一步探讨各类“利好情绪”在实际市场中的表现机制与定量效能。为此，我们以“未来超额收益”为核心指标，分别从报告维度、个股维度以及选股策略构建维度，系统性分析“利好密度”与市场收益之间的关系，评估不同类别情绪对未来收益的指示性。

4.2.1 短期利好驱动强，超预期与盈利改善信息更具价值

我们首先从报告维度出发，分别测试每个类别的正负情绪与未来收益的关系。图表 23 展示了每个类别中，不同情绪的报告对应的未来累计收益 CAR 的相关性。这里，为了剔除不同时间的市场环境的影响，我们用相对全 A 的超额收益，观察时间窗口为 5、20、60 交易日。可以发现：（1）在几乎所有类别下，情绪值为 +1 的报告的 CAR 值及 CAR 为正的比例，明显高于情绪值为 -1 的报告，这表明市场对利好消息的交易通常比对利空消息更积极。（2）当观察期较短（例如 5 日、20 日）时，利好的超额收益相比利空更为显著，这说明事件驱动型利好所带来的超额收益会随着事件的发酵和时间推移而逐步减弱。（3）无论处于哪个时间窗口，分类 7 - 对比预期和同业（情绪值为 +1）的报告的 CAR 值和 CAR 为正的概率均最高，显示出市场对业绩超预期这一明确利好信号的高度敏感性。（4）鉴于其他分类的正样本占比远高于负样本，负样本的统计收益均值易受离群值影响。然而，分类 5 - 盈利改善的样本分布相对平衡。结果依然是情绪值为+1 的报告对应的 CAR 均显著高于情绪值为-1 的报告。表明市场对盈利改善类别下不同情绪的反应较为理性，且该类信息在不同时间维度上均具有一定的价值。

4.2.2 从报告到个股：分类利好密度可有效预测未来收益

前文在报告维度中验证了利好情绪与未来收益之间的关系：整体来看，利好类报告的累积超额收益（CAR）普遍高于利空类，符合预期。进一步地，我们将分析视角切换至个股维度，探讨在指定时间区间内，若某类利好消息占比越高，是否能带来更高的未来超额收益。

4.2.3 构建基于情绪利好密度构建主动选股策略

在确认了“利好密度”在个股层面对未来收益具有稳定预测能力后，我们进一步从实操角度出发，尝试构建基于不同情绪类别的主动选股策略。具体而言，我们尝试基于“利好密度”，以“分类 7”（最显著）与“分类 5”（样本量最大、情绪分布最均衡）为例构建类别分域下的主动量化选股组合。（1）在每个报告时间 t，计算近 N 个交易日的该分类利好密度；（2）在每个调仓周期，保留个股近 6 个月内最新的利好密度记录；（3）从全市场中筛选利好密度最高的前 K 只个股，构成等权重组合；如存在相同占比，则优先选择在各自行业中利好密度排名靠前的个股。

4.3 研报信息结构是否影响未来走势？

本小节我们进一步探讨研报中利好与利空信息的“强调方式”（包括篇幅比例与出现顺序）是否与未来超额收益存在关联。理论上，若某类利好信息被分析师优先呈现或详细阐述，往往表明其重要性较高，因而更可能推动股价上涨。相反，利空信息若被突出强调，则可能对后续收益产生负面影响。

5 研报摘要综合因子的构建与评估

在前文中，我们从情绪类别方向、摘要顺序、情绪密度及篇幅占比等多个维度探讨了研报内容结构与未来收益之间的关系。接下来，我们进一步整合上述信息，构建研报层面和个股层面的综合评分指标，以衡量其对未来收益的预测能力，并探索实际的应用价值。

5.1 报告维度的综合评分算法

首先从报告维度计算报告本身的得分，我们尝试了多种评分方法，并分析多种方式对未来超额收益（CAR5/CAR20/CAR60）的回归分析结果，主要比较了它们在回归系数、显著性、模型解释力（R²）和 Rank IC（日度横截面预测力）四个维度的表现。

5.1.1 简单加权及集中度调整

我们首先尝试采用分类情绪值的简单累加或均值计算方式，对研报整体的正负信息倾向进行评分。其中，直接累加各类别情绪值得到的总得分为?????_???。这一方法的问题在于，大多数研报仅覆盖 3–4 类情绪，导致得分集中度高，且得分高度依赖于“提及类别的数量”，即使各类内容仅为轻描淡写，类别越多，得分也越高。相比之下，情绪均值得分（?????_????）试图剔除类别数量影响，但该方法同样存在两个缺陷：（1）结果集中度过高，不利于区分不同摘要；（2）完全忽视了利好类别数量的价值。例如，摘要 A 仅涉及 1 个情绪为正向的类别，摘要 B 涉及 3 个情绪为正向的类别，两者的得分均为 1。

5.1.2 篇幅占比加权

为了更准确反映研报摘要中信息的表达强度，我们引入各类别在摘要中所占的篇幅比例，将情绪值按篇幅加权。这样可以有效区分“重点阐述”与“轻描淡写”的差异。例如，两份报告都提及“技术创新”，但若一份用 10%的篇幅深入展开，另一份仅一句带过，前者的加权得分更高，更贴近信息的实际重要性。

5.1.3 类别重要性加权

我们前述的加权方法隐含一个前提假设：所有类别的影响力是相同的。然而，从我们此前各个类别的“情绪方向与未来收益关系”的实证分析可以看出，不同类别对收益的预测能力存在显著差异：某些类别表现出更强的相关性，有些则几乎无预测作用，甚至呈现反向关系。因此，有必要引入反映类别重要性的权重体系，从而提高综合得分的含义。

5.2 个股层面的评分指标构建

从报告评分与未来收益的相关性来看，研报评分在研报发布后 20 日、40 日具有显著的收益解释力，体现出较强的事件驱动特征。那么，从截面选股角度是否同样具备选股能力？为此，我们进一步将报告评分延伸至个股层面，尝试将其转化为可实际应用的因子。基于所有研报样本，我们构建了以下两种算法的评分因子，用于评估其在截面选股中的表现。 (1) 等权评分因子（?????????）：滚动窗口期内所有有效记录的简单等权，并非先计算日均评分再日间等权。如近 3 日有 10 个有效的评分记录，则直接计算 10 个记录的均值，反映了分析师的整体看法，预期为正向因子，即高的均匀评分与较高的未来收益有关。 (2) 指数衰减加权因子（?????????）：根据时间对评分进行加权，使最近的评分得到更大的权重。这种加权方式能够确保因子更加关注近期的市场情绪或分析师的看法，认为最近的评价更能反映股票的当前或未来表现。理论上，时间衰减评分因子也是正向因子。

6 总结

本文基于 DeepSeek 大模型，探索将情感分析从研报标题拓展至摘要部分，旨在实现从“黑箱式”综合评分向“结构化、可解释”评分的转变。相较于 ChatGPT， DeepSeek 具备成本低、性能优等优势，使大规模文本分析更具可行性，有助于揭示分析师情绪结构和投资信号的细节。研报摘要内容的框架拆解：我们系统拆解了卖方研报摘要的内容结构与分类框架，将摘要划分为事件、点评、盈利预测与风险提示四部分，并聚焦事件与点评部分的细分类别，明确三大类共十小类利好因素，包括业务发展、财务表现与其他外部因素。在此基础上，研究引入四维度量化分析：类别识别、情绪倾向、出现顺序与字数占比，以更精细地提取信息结构。模型选择与场景规则化训练：我们采用 DeepSeek 系列模型，为提高模型在金融场景的适用性，通过系统化任务规则设计避免“幻想”输出，实现信息抽取的可控性与一致性。此外，分别实现本地部署与云端 API 调用，兼顾处理效率与硬件资源限制，为后续大规模研报分析奠定基础。通过对三种模型的测试，我们最终选择 DeepSeek-V3-671B 执行主任务，因其在输出格式规范性、结果稳定性及批量处理效率方面均优于其他版本。

结构化情绪视角下的研报摘要价值重构：分类识别方法显著提升了研报分析的颗粒度，使得我们能够从“沙里淘金”“去伪存真”“拨云见日”三个维度洞察企业真实经营价值，进而为逆势投资、剥离外部干扰和提升盈利质量判断提供有力支持。情绪上的“利好密度”对未来超额收益的预测效能：研究发现，短期内利好情绪的市场反应更为强烈，特别是“业绩超预期”和“盈利改善”类情绪信号在多个时间窗口均展现出显著的正向收益预测能力。在个股层面，构建“利好密度”指标，用于衡量特定时间段内，某一类别的利好情绪在全部情绪中的相对占比。基于该指标设计了主动选股策略，“盈利改善密度”策略在 20 日窗口期，Top30 组合年化收益 15.0%，相对中证 800 超额 15.6%，最大回撤 27.5%。研报摘要中情绪信息的“出现顺序”与“篇幅占比”：“出现顺序”与“篇幅占比” 属于研报中利好与利空信息的“强调方式”，结果显示，利好信息出现越靠前，或篇幅占比越高，往往具有更强定价能力，尤其在战略、创新与政策类信号上更为明显；而基本面类利好则因信息普遍性，信号效力相对较弱。

研报摘要因子的综合构建与效果评估：最后基于大模型分类的研报摘要内容，综合情绪类别、篇幅占比、情绪密度等多个维度，构建了涵盖报告维度和个股维度的系列评分因子。通过引入集中度调整（HHI）与非线性篇幅权重，并结合类别重要性权重，逐步构建出四类核心因子：?????_????_ℎℎ?、?????_??_???、?????_??_???、 ?????_??_??????。结果表明，?????_??_??? 与 ?????_??_?????? 在多头年化收益上表现较优，而 ?????_????_ℎℎ? 在 Rank IC 与 IC 胜率上占优。进一步将四类因子等权合成综合评分因子 ?????_??????_???，其整体表现更为均衡，具备一定选股与收益预测能力，五分组收益结构严格单调，且与传统因子相关性较低。该因子自 2020 年以来相对中证 800 的年胜率达 100%，今年月胜率 100%，超额 10.4%；整个区间的最大回撤控制良好（相对分组等权的超额最大回撤均控制在 4% 以内，2025 年更仅为 1.2%）。

（本文仅供参考，不代表我们的任何投资建议。如需使用相关信息，请参阅报告原文。）