2023年ESG数据治理专题报告 ESG数据披露标准有待完善,数据治理扮演重要角色
- 来源:中信证券
- 发布时间:2023/01/11
- 浏览次数:2014
- 举报
ESG数据治理专题报告:改善披露不足,并重逻辑与理念.pdf
ESG数据治理专题报告:改善披露不足,并重逻辑与理念。高度结构化的ESG数据是开展ESG投资的重要基础设施,但是目前国内ESG数据质量较差,整体信息披露率较低,部分关键指标更是严重缺失,例如碳排放披露率不足5%,同时由于ESG评分结果需要具备可解释性,使得ESG数据治理工作难度较大。围绕ESG数据治理,我们通过实战案例对数据获取、体系搭建与资产沉淀等不同环节进行介绍与探讨,并对中信证券ESG通用评级体系的39个指标进行了数据治理剖析。ESG数据披露标准不一,完善程度有待提升,数据治理扮演重要角色。上市公司CSR报告是ESG评分最重要的数据源之一,报告在信披维度上直接受到ESG信披标准影响。国际...
ESG数据披露标准有待完善,数据治理扮演重要角色
获取 ESG 数据是构建 ESG 评价体系的第一步,良好的数据质量是客观评价上市公司 ESG 表现的基础。目前,常见的 ESG 底层数据来源包括: 1) 企业自行披露的数据,例如企业社会责任报告(Corporate Social Responsibility, CSR)、企业年报、半年报、企业官网信息等; 2) 政府监管部门披露的数据; 3)第三方披露的数据,例如非政府组织、学术机构数据库等; 4)其他数据,例如新闻媒体报道、问卷调查等。
其中第 1)为基础数据来源,是上市公司按证券监管部门、证券交易所和其他监管组 织的要求自行披露,结构化程度较高;2)、3)和 4)为另类数据,具有更强的时效性、多 元性,是基础数据来源披露不完善时的重要补充,能够有效弥补公司主动披露数据的不足 并进行交叉验证。根据 MSCI 的统计,这些另类数据在该机构用以 ESG 评分的全部底层 数据中占比约为 45%。 除上述公开数据外,问卷调查反馈也是国际评级机构使用的主流数据获取方式之一。 例如标普全球每年邀请所有参评企业填写可持续发展评估问卷,参评企业最终的 ESG 得分将基于该问卷填写情况以及标普所收集到 的来自媒体及利益相关方的相关信息而评出。未填写问卷的受邀企业则由标普直接获取公 司的年度报告、可持续发展/企业社会责任报告等公开信息进行整理和评分。
作为使用最广泛的数据来源之一,CSR 报告等企业自行发布的信息在披露维度和数据 质量上直接受到当地政府部门和交易所所制订的 ESG 信息披露政策及标准影响。目前国 内外针对 ESG 数据披露均制订了一定的政策及规范。其中国外起步较早,目前已形成较 为完备的披露体系;而国内近两年在信披体系建设方面也得到加速。

国际ESG数据披露:体系成熟,互为补充
ESG 投资理念最早可以追溯到 1920 年代的伦理道德投资,到 20 世纪 60-70 年代, 由于欧美的公众环保运动逐渐兴起,国际社会开始关注企业对环境和资源的过度破坏,因 此逐步形成了责任投资的概念。最终在 2004 年,联合国正式提出了 ESG 理念。2006 年, 联合国责任投资原则组织提出了负责任投资原则(Principles of Responsible Investments, PRI),该原则将社会责任、公司治理与环境保护相结合,旨在帮助投资者理解环境、社会 和公司治理等要素对投资价值的影响,并支持各签署机构将这些要素融入投资战略、决策 及积极所有权中,以降低风险、提高投资价值并创造长期收益,最终实现全社会的可持续 性发展。
综合来看,从最早群众树立起环境和生态保护意识为契机,以西方发达国家为主的国 际社会积极将环境保护、社会责任和公司治理与国民经济发展相结合,同时利用法律规则 制度等手段推进上市公司 ESG 信息披露。得益于信披程度高,以 MSCI、标普、路孚特等 第三方评级机构利用所获取的信息能够给予上市公司客观的 ESG 评价,可直接或间接得 影响上市公司的市场表现,使得上市公司主动披露 ESG 信息的意愿得到进一步激励,ESG 投资生态体系形成正反馈。
国内ESG数据披露:强调中国特色,规范标准化与执行力度有待加强
相较西方发达经济体,我国在 ESG 投资方面起步较晚。但随着“双碳”等目标的设 立,ESG 理念近两年在我国得到加速普及。相较国外较为成熟的披露体系,国内在 ESG 信息披露方面突出了符合中国本土特色的指标数据。例如,“扶贫”、“普惠金融”等议题 受到上市公司、监管部门、评级机构等多个角色的重视。 另一方面,国内上市公司 ESG 相关信息多依据证监会和交易所要求披露。2006 年, 深圳证券交易所发布《上市公司社会责任指引》,鼓励上市公司自愿披露 CSR 报告。对于 “深证 100 指数”的成分股上市公司则要求必须披露 CSR 报告。
2008 年 12 月,上海证 券交易所发布了《关于做好上市公司 2008 年年度报告工作的通知》,要求 “上证公司治 理板块”的样本公司、发行国际上市外资股的公司以及金融公司必须披露 CSR 报告,同 时鼓励其他有条件的公司自愿披露。通知发布次年,上交所发布了《2008 年年报工作备 忘录第一号》,提供了 CSR 报告的格式文本。2016 年,证监会发布的上市企业年报及半 年报内容与格式准则中提到,属于环境保护部门公布的重点排污单位的公司及子公司应根 据相关法律要求强制公布有关环境信息。2018 年 9 月,中国证监会发布了《上市公司治 理准则》,其中第六章第八十六条明确提到“上市公司应当依照法律法规和有关部门的要 求,披露环境信息以及履行扶贫等社会责任相关情况”。

在政策强制性上,目前由我国政府部门或交易所出台的 ESG 相关政策主要采取以引 导鼓励为主的方式。在强制程度上,国内政策针对公司管理(G 层面)的信披要求程度最 高,且覆盖范围包括全部上市公司;针对环境(E 层面)的强制性程度其次,目标对象多 为高污染企业且强制披露的信息范围较窄;针对社会责任(S 层面)的强制性要求最低, 多为鼓励公司自行披露。而在要求形式上,大部分政策文件纳入的指标多为定性指标,对 ESG 投资应用的指导性和可操作性尚有待提升。在这种情况下,我国上市公司在信息披露 方面主要存在如下几个问题: 1)整体 ESG 披露率不足。截止 2022 年 5 月,发布 2021 年 CSR 报告的 A 股上市企 业数量为 1400 家,占整体的 30%。虽然较 2020 年增加 330 家,增速明显提升,但披露 比例仍然较低。
2)行业之间披露率差异大。根据我们对公司公开发布信息进行的统计,2021 年银行 业公司均已发布 CSR 报告,非银行金融披露比例也达到了 89%。该现象或与央行持续推 动绿色金融体系建设相关,也受金融业自身注重合规、信息安全等行业属性影响。钢铁、 交通运输、煤炭、石油石化、电力及公共事业、房地产、传媒 7 个行业的披露比例超过 40%, 而消费者服务、机械行业披露比例则不足 20%。
3)定量指标披露率低于定性指标。按照数据性质的不同,ESG 披露数据可以划分为 定量数据与定性数据。定量数据包含具体数值,更为客观和具体,同时可以参加数学运算,有助于数据间对比,但获取难度较大;定性数据以文字描述为主,能够增加信息的丰富程 度,但不同主体间数据可比性较低。根据 PRI 发布的《中国的 ESG 数据披露——关键 ESG 指标建议》,沪深 300 成份股公司在 2018 年对环境指标的平均披露率为 40.4%,环境管 理指标的披露率为 44.6%,而环境数据的披露率为 35.2%,表明定性披露的比例高于定量 披露。
4)披露维度和数据质量不足。落实到具体指标方面,上市公司主动披露鼓励性指标 意愿有待进一步激励。例如 SCOPE3 温室气体排放量方面,截至 2022 年 11 月 30 日仅有 1%的 A 股上市公司主动披露。而在信息正负性方面,上市公司多对负面指标采取回避态 度而只倾向于披露对企业起到正面影响的数据或难以验证的描述性信息,呈现“报喜不报 忧”的现状。
数据缺失与透明度低,导致流程差异化,或使ESG指标失真
截至 2022 年 8 月,国内 ESG 评价体系数量由 2019 年的 8 家激增到 19 家,且机构 属性更趋多元化。这些机构除秩鼎技术、wind、恒生聚源等金融及专业数据服务商,还包 括如中证指数公司、华证指数公司等多家指数公司,中诚信绿金、润灵环球 RKS 等专业 评级机构和多家资管机构、学术机构、咨询服务公司、公益性社会团体等。然而目前投资 机构在 ESG 投资方面面临的痛点之一是各评价体系间评价结果差异显著,造成其难以判 断企业 ESG 风险与机遇。例如,根据我们计算,在路孚特、标普、富时罗素、秩鼎、嘉 实基金、中信证券和华证 8 个 ESG 评价体系之间,评价绝对值相关系数最高仅为 0.628。

评分结果的差异化实质上体现出评价机构属性、价值观的差异化,因此形成了对 ESG 理念的不同解构,体现在指标设置、缺失值处理、权重设置等评分体系的细节中。然而对 于国内市场,由于数据积累和技术起步较晚,目前国内评分机构所依赖的数据大部分来自 于企业自行披露的内容,缺乏第三方数据进行参照和比对。由于信披体系的不成熟,A 股 上市公司在 ESG 信息披露存在的数据缺失、透明度低等问题容易导致数据失真。此外由 于 ESG 数据为非标准财务数据,不恰当的数据处理方法亦会加剧此问题,从而使得评级 机构难以对上市公司 ESG 表现给出客观、准确的评估结果。综上所述,结合国内 ESG 信披体系现状,设计符合中国国情的 ESG 评价体系和数据治理方法,使评分结果能够准确地反映出上市公司在 ESG 方面的表现具 有重要的意义。
ESG数据治理:因“数”制宜,强调逻辑与理念的双重可解释性
ESG数据治理流程:以应用场景为导向,自下而上环环相扣
ESG 数据治理最初的对象是上市公司 CSR 报告、舆情数据等 ESG 原始数据源,这 些数据来源分散,因此 ESG 数据治理的第一步是收集 ESG 数据需求并根据需求选定数据 源,之后对相关原始数据进行采集。 采集的ESG数据除企业年报外,多数数据缺乏标准组织格式,尤其是舆情等另类数 据。因此ESG数据治理第二步是利用 AI+人工的手段从数据源中将核心数据进行精炼,并 经过复核流程确保数据与原始文件的匹配。复核后的底层数据已经由形式多样的数据源规 整为具有多个属性的数据项,因此这一步骤成为“数据结构化”。
数据治理的第三步是对底层数据通过算法逻辑计算得到“原始指标”。对于 ESG 评价 体系来说,部分指标可能涉及多项底层数据,这些底层数据将通过关联计算得到相应原始 指标。此时的原始指标具有标准化的组织结构,因此该过程称为“数据标准化”。 标准化后的数据虽然在组织结构一致,但数值类型并非均为数值型。例如,“是否单 独披露 CSR 报告”的指标项可视为布尔型变量。这些非数值型变量无法直接参与数学模 型的计算。此外,即使是数值型的变量也需要经过进一步加工才能与 ESG 应用需求匹配。 因此数据治理的第四步即数据归一化,即依据指标的含义及类型,采取适当的策略将其归 一化为一定区间(如 0-100 分)的数值型指标。这些指标将量化出上市公司在 ESG 多个 方面的表现,并具备全市场或行业内可比性。
最后评级机构按照特定的方法将多个数值型指标聚合为上市公司的 ESG 评分供用户 使用。值得注意的是,聚合过程中指标选择和指标权重会根据不同的 ESG 应用场景而有 所差异。

ESG数据治理的鲜明特征:强调可解释性
与其他领域的数据治理方法相比,ESG 数据治理更加强调可解释性,分别可以从以下 五个维度进行理解: 1)底层数据处理逻辑可解释。由于我国 A 股市场信披体系尚未成熟,部分上市公司 披露的数据质量较低,评级机构在开展 ESG 数据治理时普遍要面对的问题之一是数据缺 失。在数据清洗过程中,处理低质量数据的逻辑需要具备可解释性,同时这些逻辑依据指 标含义的不同可能存在差异。例如,对于“企业政策量化得分”,我们可以采取行业均值 填充该指标缺失值,这是因为政策的发布与施行对象通常是行业而非公司。而对于“管理 层平均任期”,我们则倾向用同行业同属性公司的指标均值填充。这是因为国有企业和非 国有企业在此项指标方面通常存在较大差异。
2)指标处理流程对 ESG 理念可解释。ESG 数据治理是以需求为导向,其在处理过 程中应始终与 ESG 理念相匹配。例如能够反映企业供应链稳定性的“供应链集中度”指 标,其在量化处理时需要对上市公司头部供应商数量做认真调研。调研所需考量的方向包 括要覆盖一定数量的头部供应商以客观反映集中度水平,同时还需要考虑经过计算后的指 标能够在同行业的公司间形成分化,以此提升该指标应用价值。
3)指标处理结果与公司实际情况可解释。经过数据治理后的数值指标项除量化应用 外,还要面向主动权益应用。因此归一化后的指标一方面能够通过数值大小客观反映出上 市公司在该方面表现的优劣,还应具备向底层信息穿透的能力以解释公司的实际情况。例 如,若上市公司在“交易所、证监会监管与处罚”一项得分为满分,则意味着该上市公司 在过去一定时间内未受到相应处罚。依据此特性,若多数指标项与专家经验或行业认知不 符,说明所使用的数据或处理逻辑存在较大缺陷。
4)行业间可比的处理逻辑可解释。评级机构的ESG得分是覆盖市场多个行业的多家上市公司,在应用方面可能需要在部分指标上对不同行业公司进行对比。因此归一化范畴的设定同样需要可解释的处理逻辑。例如体现企业污染排放水平的相关指标上,第三产业在整体上相比第一、第二产业具有天然的优势因此需要在行业内做归一化。如此得到的结果消除了因行业特性带来的影响,可视为当前上市公司在行业内的相对表现。而对于“管理层增减持比例”这一指标,由于其含义与行业特性关联较小,因此采用的是全市场范围归一化。

5)最终结果对应用方向可解释。融入投资于研究体系,是 ESG 理念间接影响产业的 重要应用方向之一,目前国内外均存在 ESG 主题相关的公募基金、银行理财等产品。在 该背景下,ESG 的长期价值可解释性与投资有效性成为检验全流程数据治理质量的最核心 维度之一。 综上所述,可解释性是贯穿 ESG 数据治理过程中的核心特点,其覆盖的多个维度亦 可成为衡量数据治理优劣的依据。
ESG数据治理的难点:对数据与行业的理解缺一不可
从外部数据上,ESG 数据来源多。这些数据除企业披露的年报外缺乏严格的组织范式, 形式多样。从数量上,新闻舆情属于典型的另类数据,具有体量大、更新时间快等典型的 大数据特征。而且多个数据源间还可能存在信息重叠的问题,需要从海量数据中对数据进 行提炼。从对象上,为了提升 ESG 评分的投资有效性,评级体系的覆盖的上市公司应尽 可能全面。在这种情况下,依靠纯人工开展 ESG 数据治理势必需要付出巨大的时间成本, 难以满足及时性等实际应用需求,因此势必要借助金融科技的手段提升工作效率。
典型的 场景包括利用自然语言处理(NLP)对原始数据源的跟踪与分析,而 NLP 作为一种机器学 习技术,在模型设计与训练方面存在较高的技术门槛。例如专业的人才、强大的算力、充 足的训练数据等。另一方面,机器学习虽然能够极大缓解人工作业强度,但受技术水平限 制,机器学习在数据提炼时仍然可能会引入额外的噪声。因此需要一定量的人力进行数据 校验,尤其是在模型尚未成熟的阶段。
ESG 数据治理还要求研究团队具备行业的理解和对数据理解,能够自上而下的设计驱 动数据治理的过程。一方面,团队需要基于国内企业生产经营实际的外部环境调整指标选 取、量化与权重,从而设计能够有效、真实、客观地反馈企业在该理念下表现情况的评分 体系。另一方面,团队也需要清楚这些指标背后的数据点分布,即如何从海量数据中挖掘 指标因子。此外 ESG 概念在行业间存在较大差异,每个行业均具备一定的实质性议题, 因此在数据治理过程中亦需要团队在相关行业具备丰富的经验和知识储备。

不同视角下的ESG数据治理案例
ESG体系构建中的数据治理:贴近国情、聚焦实战
数据治理是围绕 ESG 评分体系构建而展开的,而 ESG 评分体系指标设计也需要根据 当前信披情况因地制宜。按照自上而下的设计逻辑,我们首先认为中信证券 ESG 评分体 系需要结合我国客观的经济基础与经济结构,应当在评分核心理念与国际共识标准一致的 前提下,求同存异。在这种背景下,我们在数据治理方面的考量有如下要点: 我国 ESG 理念数据的披露制度与投资整体处于起步阶段,尤其体现在企业信息披露 情况上,部分国际准则下的指标存在严重数据缺失或数据失真,难以形成对企业的有效评 价,因此需要扩充第三方数据源,或对指标进行合理调整。
例如在环境议题方面,我们关 注到伴随着人们环保意识逐步增强和监管力度逐步趋严,环境友好型企业具有更大的发展 机遇。但由于当前阶段下企业自主信息披露数据维度有限、可靠性低,我们没有采用一般 的环保投入、清洁生产改造费用等指标,而是使用单位收入的污染物排放量、环境/能源管 理体系认证和工信部颁发的绿色制造认证等指标以更客观真实地反映企业的污染排放水 平、气候问题重视程度。而在企业碳排放量方面,以 2020 年为例,中证 800 企业年自主 披露数据中包含企业碳排放量的仅为 24%。在这种背景下,我们从定量转为定性,以企业 是否披露其碳排放数据作为其气候问题的代表性指标,据此评判企业在气候问题的信息披 露上是否投入了更多的成本。
经过精心设计,中信证券 ESG 通用评分体系包含 39 项指标。数据来源包括企业自主披露 CSR 报告、年报,Wind、秩鼎技术等服务商提供的数据和全国企业环境违法处罚数 据、各省份环境信用评价数据、工信部绿色制造公示等另类特色专业数据。部分非标准的 数据由机器学习技术定位抽取,并加工为指标原始数据。例如在“企业的政策量化得分” 一项,在指标计算中为了排除人为主观的先验判断,我们以中共中央、国务院、部分国家 部委发布的相关政策为原始数据,关联财经新闻中对政策的提及和解读,自动化量化出每 个政策相关新闻对公司或主题的正负情绪,最后以公司维度对量化得到的公司或主题支持 程度进行归一化聚合。

在指标量化方法的设计上,我们依据指标自身特点,在以下维度对指标进行分类,并 最终综合指标特点选择合适的缺失值补充方案和量化打分方法。 (1)依据指标反映公司状况的正负向,分为正向指标、负向指标和中位数向指标。 例如“单位收入颗粒物排放”是负向指标,说明该项指标数值越小,则得分越高。又比如 企业供应链方面,我们认为企业应该适度的应用自身在供应链体系中的地位,不可过分压 榨供应商,也不应当放弃自身议价能力,因此我们以行业内中位数为最优标准对供应链进 行评价。
(2)依据指标的更新频率,可分为区间型指标(年度、半年度定期报告更新)、事件 型指标(高频事件监控更新)。对于诸如安全生产处罚等事件型指标,在量化时需要综合 考虑事件影响程度,包括处罚力度和事件发生时间。 (3)依据指标实际数值分布情况,可分为离散型与连续性。 (4)依据指标在企业间的可比性,分为行业可比、自身可比与全市场可比。例如衡 量管理层稳定性的管理层增持比例是全市场可比,而污染物排放方面受行业特性影响为行 业内可比。 量化后的指标将根据全市场/行业内通过 Min-Max 处理方式归一化为 0-100 分的数值 型指标,这些数值型指标将按照一定权重整合为上市公司最终的 ESG 评价得分。下面我 们以“安全生产处罚”为代表细致阐述其处理流程。
上市公司在安全生产处罚指标的得分满分为 100 分,若在统计周期内未发生安全生产 处罚事件,则上市公司在此项指标的表现为满分。反之,若上市公司曾发生过安全生产处 罚事件,则我们会根据事件的发生时间和影响等级进行扣分。其中事件发生时间决定扣分 项权重,而影响等级决定扣分项数值。安全生产处罚事件数据源包括各省市信用网站、应 急管理厅网站等官方数据,上市公司招股说明书、事故说明书等自行披露文件和企查查等 第三方数据库。通过事件搜索引擎获取相应事件后,首先对文本数据做格式化处理,提取 关键要素,包括处罚文书号、处罚类别、处罚日期、处罚内容、罚款金额、处罚机关、违 法行为内容、违法事实等。之后按照依据处罚文书,去除不同数据源披露的重复事件。
现在介绍如何确定安全生产处罚事件的影响等级。影响该等级的因素包括“处罚类型 等级”、“被处罚企业股权关联度”、“处罚金额级别”、“事故等级”首先,利用从底层数据 提取出各数据要素,将每个处罚事件加工为包含“处罚类型等级”、“被处罚企业股权关联 度”、“处罚金额级别”、“事故等级”四个维度的向量。对于罚款金额高、处罚等级严厉、 被罚企业是上市公司主体的事件,其影响等级无疑会提升。因此,为量化事故等级,我们 首先对上述 4 个维度进行赋值,其数值根据“安全生产处罚”事件元素映射量化表得到: 例如“处罚类别”将映射“处罚等级”并赋值 c。若处罚为没收、责令、吊销、撤销、拘 留或关闭,则 c=c1;若处罚为警告、罚款,c=c2。
新的事件向量将作为函数()的输入,映射为当前安全生产处罚事件的“影响等级”。 该等级表示事件对上市公司或发债主体的影响程度,取值为数值 1~4,1 为影响最大,4 位影响最小。例如 c=c1,l=l1,f=f4,a=a4,则影响等级为 3 级。在获取事件影响等级后, 我们依据等级高低设定相应的扣分项 p,具体为{等级 1:-60,等级 2:-40,等级 3:-20, 等级 4:-10}。

数据获取流程中的数据治理:秩鼎技术——先进技术与高效流程赋能,夯实数据基础
金融数据供应商在 ESG 数据治理方面扮演着重要的角色。秩鼎技术在 ESG 数据层面 的目标包括符合国际标准和投资市场、来源广泛、内容合规、历史完整、覆盖全面和可溯 源。其数据治理过程主要分为三个模块:数据采集,数据校验和指标评价模块。其中,数 据采集包括借助数据管理工具和内容提取引擎等手段从外部数据源自动抓取并解析数据。 在此过程中公司使用了大量人工智能技术,尤其是自然语言处理技术来进行表格解析、数 据字段解析、公司名称匹配等工作,从而避免人工处理数据时信息阅读不全、拷贝数字错 误、公司名称录入错误等问题。而对于 CSR 报告,由于上市公司披露格式不统一,因此 秩鼎技术采用了人工提取的方法对报告信息做精炼。
数据质量是数据商竞争力的核心之一,为了夯实数据基础,秩鼎技术对解析后的 ESG 数据增加人工检查和录入。该项工作由数十位具有 ESG 数据治理经验的成员人工完成, 检查对象覆盖 100%的自动提取数据。此外公司还借助辅助性检查文件,提高人工复核的 效率和准确性。经过检查/录入的数据将作为底层数据送入指标评价模块。
指标评价模块由数据的自动化的计算引擎驱动,以此减少人为干预从而保证数据结构 的稳定性。微观上,该模块由 2 部分构成: 1. 指标计算:根据原始的披露数据,如上市公司披露的环境污染情况、人均薪资等, 计算出月度和年度指标。其中年度指标计算是将公司主动披露的年度数据与其他数据源的 年度数据合并起来并进行标准化处理。比如将外汇数字结合汇率历史转为人民币数字,将 能耗数字根据单位转换为标准煤。之后再使用企业人数等数据进行人均、同比等类型指标的计算;月度指标计算是根据比较实时的数据源计算出月度指标。底层数据包括 ESG 舆 情事件、专利、排污、高管变动等。指标包括近 12 个月的处罚情况、当月的污染物排放 量、当期末持有的专利数量等。
2. 评价计算:根据上市公司的不同行业,在行业内部根据 ESG 指标计算评价结果。 该模块具备主体覆盖全面、行业特点突出、可追溯时间长的特点。具体来说,该模块 覆盖全部 A 股上市公司和国内发债主体,并将其下属企业的数据也都汇聚到这些主体上; 其次,指标设计上充分考虑了行业特点,比如设置了汽车召回、药品抽检等特定行业指标; 最后,所有指标均从 2013 年开始,充分满足历史追溯要求。 总结来说,秩鼎技术的 ESG 数据治理凭借多种先进的金融科技技术,配合高效且以 自动化为主的数据处理流程,保证了数据的精准和稳定。

数据获取流程中的数据治理:恒生聚源——人机结合打造行业级ESG多维数据体系
针对 ESG 数据相较于传统的金融数据具有非结构化、缺少统一的标准、数据连续性 及可比性差的问题,聚源 ESG 数据治理的目标是为用户提供结构化、连续性、可比的 ESG 数据,供客户进行分析。此外,由于不同行业的 ESG 特性表现出较大的差异,对于行业 ESG 特色数据的研究挖掘也是聚源 ESG 数据治理的重要目标。 聚源深刻得认识到数据管理流程对于保障数据的有效性和质量具有重要意义,因此自 上而下得建立了从研究规划、到生产、到稽核、到维护使用的数据管理流程以及相应的团 队。
规划环节由研究团队负责,主要工作包括业务调研、梳理,ESG 指标体系搭建,规则、 定义明确,最终进行生产方案提交、验证和发布。此外,基于通用和行业特色 ESG 数据, 由策略研究员进行策略研究并进行有效性分析。在该阶段将形成一系列的业务规范包括 《ESG 指标体系及分行业指标体系》、《ESG 指标说明手册》、《ESG 数据库规划文档》、《ESG 数据库生产规则》等。
ESG 数据生产、稽核由生产中心负责,包括生产团队和稽核团队。生产环节分为自动 化采集和人工采集。团队具备多种核心的算法,并与多家权威科研机构开展合作,在图像 识别、资讯抓取、文本挖掘、自然语义识别技术、标签系统、智能推荐算法等方面进行产 品的不断迭代优化。采集的数据均需经过稽核,稽核设置数据准确度目标,并对数据准确 度和错误原因进行分析形成数据稽核日报、周报、月报,反馈生产或规划错误问题,形成 解决方案,保障数据质量。综合来看,恒生聚源在 ESG 数据治理突出了数据生产自动化+人工结合的数据治理模 式,以及通用体系+行业体系相结合的数据模型。前者保障了数据的覆盖度、时效性和质 量;后者突出了行业特色,对提升应用表现具有重要意义。
数据治理流程中的资产沉淀:大浪淘沙,层层细化
根据前文所述,ESG 数据治理分为多个环节,每个环节都会产生大量中间数据。这些 数据一方面在得分可解释性方面具有重要作用,还可能在不同的任务复用。例如政策数据 还广泛应用于基本面量化,因此有效组织并沉淀数据具有重要的意义。根据产生的顺序, 这些中间数据大致可分为从文本中初级加工的原始数据,原始指标数据,量化指标数据。 最后,量化指标数据将通过聚合产生 ESG 评分。本章将按照上述顺序介绍中信证券在 ESG 数据治理过程中存储的数据资产。
数据的存储与调用:标准化工具降低维护成本,提升数据资产复用性
ESG 数据治理过程中产生的数据实体通过具备多个属性,通过对属性进行归集可以将 具有相同属性的数据实体在一张表上按行排布,所形成的二维表满足关系型数据库的存储 要求。通过定义每张表的属性字段,可以用多张表将 ESG 数据治理产生的所有数据进行 规范存储。因此,我们采用了 Oracle 数据库对 ESG 数据治理产物进行保存与管理。Oracle 数据库是关系型数据库的一种,除关系型数据库强调的原子性(Atomicity)、一致性 (Consistency)、隔离性(Isolation)、持久性(Durability)以外,Oracle 数据库还在分 布式、开放性方面具有突出的表现,可以满足多个用户对事务性要求较高,或者需要进行 复杂数据查询的操作需求,充分发挥数据库的高性能。对于保存在 Oracle 数据库中的数据, 可以通过标准查询语言 SQL 访问。

原始指标数据库格式
原始指标数据库负责存储从 CSR 报告、年报、新闻报道、问卷调查等数据源经过结 构化后的初级加工数据。这些数据对应的指标繁多、意义多样,因此在属性上可能存在差 异。我们依据属性对原始指标数据进行归类,不同属性的数据将被保存在不同的表单中。 例如下列图片分别展示了事件型指标数据表、政策文本数据表、和重污染天气限供限产风 险数据表。而诸如环境行政处罚、安全生产处罚、市场监管机构处罚、纪委监委调查、交 易所、证监会监管与处罚和刑事诉讼此类事件型指标对应的原始数据由于属性一致,将存 储在“事件型指标数据表”一张表单中并以“事件子类型”字段加以区分。
数值型指标数据库格式
数值型指标数据库记载着 ESG 评分体系对上市公司不同指标的结果。对于每一项指 标,除指标名称、对应上市公司和评价时间(更新时间)外,均具有指标数值这一属性。 因此,所有上市公司的所有指标均可保存在同一表单中。通过在 SQL 语句中指定指标名 称和更新时间,用户可以直观快捷地对比不同公司在不同时间节点下相同指标项上的表现。
ESG评分数据库格式
由于 ESG 评分是经过深度处理后的数据,因此其数据属性很少,通过股票代码和评 分更新时间便可定位相应数值。与数值型指标数据库类似,所有上市公司的 ESG 评分均 可保存在同一表单中。考虑到目前针对 A 股市场有多家 ESG 评级机构提供评分结果,我 们在组织该数据表时将评级机构作为补充字段,以此实现在一张数据表上对上市公司 ESG 评分结果做评级机构维度上的对比,这也为我们提供市场 ESG 一致性评价打好了基础。
(本文仅供参考,不代表我们的任何投资建议。如需使用相关信息,请参阅报告原文。)
- 相关标签
- 相关专题
- 相关文档
- 相关文章
- 全部热门
- 本年热门
- 本季热门
- 1 中国ESG与新质生产力行业洞察与实践白皮书.pdf
- 2 中国企业ESG战略与实践白皮书:放眼长远,激发价值.pdf
- 3 ESG主题2024年中复盘及展望:公司治理机遇和外贸环境风险.pdf
- 4 ESG专题研究:沪深300行业龙头ESG议题变迁史.pdf
- 5 2024中国环保行业ESG发展报告.pdf
- 6 ESG专题报告:共筑ESG生态圈,践行可持续发展.pdf
- 7 蜜雪冰城2024环境社会及管治ESG报告.pdf
- 8 2024河南上市公司ESG报告.pdf
- 9 2024中国ESG发展白皮书.pdf
- 10 2023年ESG与气候趋势展望.pdf
- 1 蜜雪冰城2024环境社会及管治ESG报告.pdf
- 2 2024河南上市公司ESG报告.pdf
- 3 物业服务ESG:物业存量竞争时代的突破密码.pdf
- 4 商道纵横:2025企业可持续发展(ESG)经理人调研报告.pdf
- 5 荣续ESG智库:2025年基建行业ESG白皮书.pdf
- 6 2025建筑材料行业ESG白皮书.pdf
- 7 Keep:2024年环境、社会和管治(ESG)报告.pdf
- 8 2025年与水相关的企业ESG和生物多样性管理报告.pdf
- 9 2025光储充行业ESG白皮书.pdf
- 10 2025年光储充行业ESG白皮书.pdf
- 1 中国上市公司协会:中国上市公司ESG发展报告(2025年).pdf
- 2 基金市场与ESG产品周报:被动资金显著加仓大盘宽基ETF,国防军工主题基金表现占优.pdf
- 3 ESG观察——本月聚焦:可持续信息披露政策深化,产业绿色转型加速.pdf
- 4 基金市场与ESG产品周报:周期主题ETF资金净流入规模扩大,国防军工主题基金净值表现不佳.pdf
- 5 2026年新能源汽车行业ESG白皮书(氢能・甲醇・生物质・天然气・太阳能类).pdf
- 6 责扬天下中上协:中国上市公司ESG价值核算报告(2025年).pdf
- 7 ESG及绿色金融月报:中国ESG政策体系多维提速,欧盟监管趋严与弹性调整并举.pdf
- 8 艾美多:2025艾多美(中国)ESG报告书.pdf
- 9 基金市场与ESG产品周报:被动资金显著加仓周期主题ETF,国防军工主题基金表现占优.pdf
- 10 基金市场与ESG产品周报:军工、医药主题基金业绩亮眼,港股ETF资金流入超百亿.pdf
- 全部热门
- 本年热门
- 本季热门
- 1 2026年为什么需要ESG—理念、实践与趋势
- 2 2026年ESG及绿色金融月报:全国碳市场扩围后全面进入常态化运行,全球ESG基金规模迈向四万亿美元新台阶
- 3 2026年ESG动态跟踪月报(2026年2月):国内“双碳”引领新型能源体系建设,海外ESG监管环境持续承压
- 4 2026年AI赋能资产配置(三十七):AI+Deep Research,ESG投研自动化解决方案
- 5 2026年第9周基金市场与ESG产品周报:周期主题基金业绩领先,港股ETF资金流入规模扩大
- 6 2026年ESG观察——本月聚焦:可持续信息披露政策深化,产业绿色转型加速
- 7 2026年第5周基金市场与ESG产品周报:周期主题ETF资金净流入规模扩大,国防军工主题基金净值表现不佳
- 8 2026年第2周基金市场与ESG产品周报:军工、医药主题基金业绩亮眼,港股ETF资金流入超百亿
- 9 2026年第2周ESG及绿色金融月报:中国ESG政策体系多维提速,欧盟监管趋严与弹性调整并举
- 10 2026年第2周基金市场与ESG产品周报:被动资金显著加仓周期主题ETF,国防军工主题基金表现占优
- 1 2026年为什么需要ESG—理念、实践与趋势
- 2 2026年ESG及绿色金融月报:全国碳市场扩围后全面进入常态化运行,全球ESG基金规模迈向四万亿美元新台阶
- 3 2026年ESG动态跟踪月报(2026年2月):国内“双碳”引领新型能源体系建设,海外ESG监管环境持续承压
- 4 2026年AI赋能资产配置(三十七):AI+Deep Research,ESG投研自动化解决方案
- 5 2026年第9周基金市场与ESG产品周报:周期主题基金业绩领先,港股ETF资金流入规模扩大
- 6 2026年ESG观察——本月聚焦:可持续信息披露政策深化,产业绿色转型加速
- 7 2026年第5周基金市场与ESG产品周报:周期主题ETF资金净流入规模扩大,国防军工主题基金净值表现不佳
- 8 2026年第2周基金市场与ESG产品周报:军工、医药主题基金业绩亮眼,港股ETF资金流入超百亿
- 9 2026年第2周ESG及绿色金融月报:中国ESG政策体系多维提速,欧盟监管趋严与弹性调整并举
- 10 2026年第2周基金市场与ESG产品周报:被动资金显著加仓周期主题ETF,国防军工主题基金表现占优
- 1 2026年为什么需要ESG—理念、实践与趋势
- 2 2026年ESG及绿色金融月报:全国碳市场扩围后全面进入常态化运行,全球ESG基金规模迈向四万亿美元新台阶
- 3 2026年ESG动态跟踪月报(2026年2月):国内“双碳”引领新型能源体系建设,海外ESG监管环境持续承压
- 4 2026年AI赋能资产配置(三十七):AI+Deep Research,ESG投研自动化解决方案
- 5 2026年第9周基金市场与ESG产品周报:周期主题基金业绩领先,港股ETF资金流入规模扩大
- 6 2026年ESG观察——本月聚焦:可持续信息披露政策深化,产业绿色转型加速
- 7 2026年第5周基金市场与ESG产品周报:周期主题ETF资金净流入规模扩大,国防军工主题基金净值表现不佳
- 8 2026年第2周基金市场与ESG产品周报:军工、医药主题基金业绩亮眼,港股ETF资金流入超百亿
- 9 2026年第2周ESG及绿色金融月报:中国ESG政策体系多维提速,欧盟监管趋严与弹性调整并举
- 10 2026年第2周基金市场与ESG产品周报:被动资金显著加仓周期主题ETF,国防军工主题基金表现占优
- 最新文档
- 最新精读
- 1 固收+基金2025年Q4季报分析:25Q4绩优固收+基金有什么特征?.pdf
- 2 食品饮料行业扩大内需战略专题研究(一):消费表现与市场定价有哪些潜在预期差?.pdf
- 3 浮息债全景:浮息债的理论定价与现实应用.pdf
- 4 2026年3_5月债券投资策略展望:核心矛盾切换+资产配置平衡延续,降久期防逆风.pdf
- 5 基金经理研究系列报告之九十二:南方基金林乐峰,宏观为锚,质量为核,始于客户需求,打造多元可复制的固收+产品线.pdf
- 6 信用债ETF研究系列一:升贴水率篇,折价幅度越大的信用债ETF更具性价比吗?.pdf
- 7 小核酸行业系列报告(一):小核酸成药之路——Listening to the Sound of Silence,The Road to RNA Therapeutics.pdf
- 8 2026年人形机器人行业投资策略报告:聚焦量产新阶段,把握供应链机遇.pdf
- 9 医药生物行业In vivo CAR疗法:并购与合作持续火热,多条在研管线陆续迎来概念验证数据读出.pdf
- 10 人形机器人行业系列报告五:灵巧手,核心终端,机器人融入物理世界的接口.pdf
- 1 2026年美国主导的科技繁荣本质是债务幻觉
- 2 2026年食品饮料行业深度研究报告:原油大宗上涨的影响及传导机制专题研究
- 3 2026年原油行业分析框架
- 4 2026年永立潮头,东方不败——基于实战检验的A股“抓主线”投资方法论
- 5 2026年电子行业深度:AI引爆供需缺口,光芯片迎黄金机遇
- 6 2026年人形机器人行业系列报告五:灵巧手,核心终端,机器人融入物理世界的接口
- 7 2026年氢能与燃料电池行业:能源安全与双碳目标交汇,氢能开启规模化元年
- 8 2026年固收深度报告:债券“科技板”他山之石,海外科技巨头债券融资路径演变对我国非国有科技企业有何启示?(AI、半导体、新能源)
- 9 2026年餐饮行业:秉承长期主义,格局边际向好
- 10 2026年从资本开支到利润修复:2026年行业景气再判断
