非结构化数据管理主要内容有哪些?

非结构化数据管理主要内容有哪些?

最佳答案 匿名用户编辑于2023/06/07 08:51

非结构化数据管理作为组织的重要职能,是落实非结构化数据顶层设计及治理的关键。主要包括非结构化数据标准、元数据、数据质量、数据安全、数据合规和数据集成等六个方面内容。

1. 非结构化数据标准

非结构化数据标准是组织对非结构化数据提出的规范性要求。组织应以非结构化数据标准体系构建为基础,指导和规范各类非结构化数据管理工作。非结构化标准体系构建包括了对内容模型、内容分类、编码命名、内容格式、内容本体、版本策略、元数据、内容指标和内容接口等规范的标准。

(1)内容模型标准

内容模型标准主要包括子域规划、活动模型规划、文件版本规划、结构化规划、元数据建设、体系合规建设、安全策略等各个方面。

子域规划从业务过程出发,构建出多层级式的子域结构;活动模型规划从文件发送、共享和外发等流转活动出发,关注文件的动态业务活动;文件版本规划关注文件的主次版本、生效版本、修订版本、版本留存数量等版本规范;结构化规划关注图像类、专业类文件如何基于 OCR 识别、兼容解析等技术实现内容结构化;元数据建设从行业元数据和内容元数据两方面进行规划和建设;体系合规建设是从文件的新增、修订、权限申请以及敏感内容等方面进行规范;安全策略是从授权访问限制、共享外发安全和水印安全等方面进行规范建设。

内容模型作为规范和标准,在非结构化数据管理的过程中尤为重要,内容模型是构建内容库的基础。良好的内容模型需要对各类活动模型、版本模型、权限模型、元数据模型、流程模型和安全模型等各个环节进行全面和规范化的构建。

内容模型与内容库关系紧密,内容库的每个层级都对应着不同业务体系化的数据。不同业务要求不同的数据规范,这些规范的建设都是需要通过内容库的内容模型来实现的。

(2)内容分类标准

内容分类标准是指目录树分类、标签分类、智能分类和分类编号等方面的规则和规范。

目录树分类侧重于体系化内容的分类建设,根据组织维度、业务维度、战略维度等进行内容划分。如果说目录树分类是内容的“垂直分类”,那么标签分类则侧重于内容的“横向分类”。

标签分类是在“垂直分类”的基础上,支持跨业务目录的一种分类方式;同时标签分类是在用户对内容理解的基础上,对内容进行标签化标注的一种以内容为维度的分类方式。智能分类是标签分类的延伸,基于人工智能自然语言处理(NLP)技术实现对内容的智能标签分类,辅助人工标签化的过程。

分类编号是通过格式化的编码自动生成分类号进行内容分类,进而延伸出的业务逻辑分类。

内容分类的建设过程主要包括内容分类梳理、分类规范建设、分类执行、分类结果分析评审等关键环节。其中,内容分类梳理需要组织明确内容分类规范;分类规范建设主要遵循漏斗结构原理进行梳理,包括现状调研、现状评估、分析梳理、知识规划、展示设计、用户评价等阶段过程。

内容分类规范性还体现在文档管理的分类分级,需要满足各个层级的用户内容需求,内容分类需要具有清晰的层级结构,从而为后续的多维文档提供良好的支撑。

(3)编码命名标准

编码命名标准是指编码分类、代码表、流水码、手动命名、自动命名等方面的规则和规范。

(4)格式标准

格式标准主要体现在模板库、文件格式、文档尺寸、文件大小、文档期限、文档保管格式等方面。

(5)内容本体标准

内容本体标准主要体现在内容分类分级、内容敏感度、敏感词过滤、内容密级、内容模板和内容审批等方面。

(6)版本标准

版本标准主要体现在主版本(生效版本)、次版本(修订版本)、历史版本、版本控制、版本配置、版本清理、版本策略管理等方面。

(7)元数据标准

元数据标准主要体现在内容属性、内容扩展属性、内容结构、内容标记、内容类别、元数据分类、元数据格式、元数据检验、元数据追踪等方面。

(8)指标标准

指标标准主要体现在内容指标体系、内容指数、内容维度、内容度量和内容指标项等方面。

(9)接口标准

内容服务接口标准主要体现在接口类型、接口引擎、接口集成、接口配置、接口策略、第三方扩展接口服务、应用程序接口等方面。

2. 非结构化元数据

非结构化元数据是开展非结构化数据管理的基础,组织应当基于非结构化数据战略构建具体的元数据管理战略。

元数据是描述数据的数据(Data about data),主要是描述数据的上下文信息。非结构化数据的元数据,需要在非结构化数据上下文环境中构建关联,便于对非结构化数据进行发现、使用、管控和洞察。组织中的非结构化元数据管理目标体现在四个方面:

(1)形成统一的信息地图与知识传承平台,有助于解决数据孤岛的问题; (2)形成整个机构或行业范围的指标库,统一指标和业务内容管理过程;(3)消除系统与内容平台或电子文件的孤立关系,为规划和设计业务提供数据间的内在联系; (4)维护业务与数据之间的一致性,如一致的数据使用方式、一致的数据服务输出和一致的企业数据流程规范等。

非结构化元数据管理包括非结构化元数据定义、非结构化元数据策略、非结构化元数据权限、非结构化元数据应用和非结构化元数据分析等。其中,组织需要特别注重非结构化元数据应用、非结构化元数据安全和非结构化元数据治理工作。

参考报告

非结构化数据管理知识与实践( 2023版).pdf

非结构化数据管理知识与实践(2023版)数据,是当今时代企业生产生存的命脉。企业的持续经营必将产生大量数据,而海量的数据也无时不刻地在影响着企业的经营。无论是在企业的战略层面还是执行层面,数据管理对于企业决策都具有举足轻重的作用。在战略层面,基于数据管理能够有效梳理企业数据资源,支撑企业优化战略决策,提前洞悉业务中存在的潜在问题,把握市场,拓展机遇,抢占竞争先机;而在执行层面,通过数据管理能够帮助企业解决现有业务中的数据责权不清、数据标准不明、管理流程混乱、数据质量低下等常态问题,形成标准化的数据利用流程,提升运营效率,培养企业的核心竞争力。

查看详情
相关报告
我来回答