相关热词搜索:
电子文件元数据自动采集的原则与实施路径研究2600字
电子文件元数据自动采集的原则与实施路径研究2600字 本文通过理论研究与实证分析,进一步论证了元数据是电子文件管理的命脉, 是电子文件真实性、可靠性、完整性与可用性的重要保障,是对电子文件实施前 端控制和全程管理的关键,是实现自动化管理和智能分析的重要基础;同时展示 了对《文书类电子文件元数据方案》的实施与拓展,对元数据实现自动采集的需 求分析、原则与思路以及具有可操作性的研究成果。摘要:
本文系“电子文件元数据自动采集与智能分析实证研究”的项目成果。通过 探讨理论架构并系统实施电子文件元数据自动采集,实现标准化、自动化管理, 全面提升机构电子文件管理水平,同时为电子文件内容信息智能分析奠定基础;
通过智能分析研究,充分挖掘隐含在电子文件内容信息中的知识关联,深度开发, 支持决策。
一、元数据自动采集需求分析 元数据是描述文件背景、内容、结构及其整个管理过程的数据。不同于传统 意义上的著录,元数据内涵更丰富,功能更全面,要求更严格,不可能由人员在 文件归档后进行著录,更不可能由形成机构文件管理人员或业务人员手工录入。
元数据需要全程规划,需要嵌入系统,需要实时自动采集,需要真实、动态地再 现电子文件管理的背景信息及过程信息。实现元数据自动采集,是元数据自身管 理的要求,也是形成机构实际业务的需求。
(1)元数据管理要求 国际标准《信息与文献电子办公环境中文件管理原则与功能要求》(ISO 16175 1-3)一再强调,文件管理元数据(metadata)包括“识别、认证文件和文件 背景关联等信息以及生成、管理、维护和使用文件的人员、流程和系统的信息, 文件管理政策”。只有伴有界定了关键特征元数据的文件才是真实有效的文件, 这些特征必须被清晰地记录下来。元数据在文件捕获点上对文件进行详细说明, 固化文件与其业务背景的关联,对文件实施管理控制。在整个生命周期中,新的 元数据不断伴随业务的开展、提供利用而持续增加,以长期保证真实性、完整性、可靠性、可用性,使得对文件的管理成为可能。
在电子文件管理系统中必须实现元数据的有效管理。电子文件管理系统 (ERMS)作为专门用于对文件的维护和处置予以管理的系统,具有如下属性:在背 景中生成文件;管理和维护文件;依据要求的时间长度维护文件;文件管理元数据 要可以设定。
作为描述文件背景、内容、结构及其整个管理过程的数据,元数据最大的特 征是动态性,动态地再现文件生成、流转、管理的全过程,在整个生命周期中为 电子文件(包括由此转化而成的电子档案)的真实、完整、可靠、可用保驾护航。
元数据的重要价值在于还原文件的背景信息,反映其所生成的政策法规和技术环 境,显示与其他文件以及业务行为责任者等的各种关系,克服电子文件虚拟存在 的局限。可见,元数据记录和反映的这些错综复杂、动态变化的信息已经无法仅 仅依靠手工进行记录,必须嵌入系统,由系统自动判断、计算与识别,实现系统 自动采集元数据是元数据自身管理的要求。
(2)机构业务需求 电子文件的特点决定了对元数据的采集必须前置,由前端形成机构伴随业务 活动的开展和其间文件的形成进行采集与管理。《文书类电子文件元数据方案》 (以下简称《元数据方案》)给出了88项元数据元素,其中80%需要形成机构进行 采集,而且过程性元数据需要反复著录,侧重记录电子文件生成的技术环境与业 务过程信息,所涉问题难度大且较复杂。特别是《元数据方案》中规定的一些元 数据项存在“宏观”或“笼统”的情况,比如元数据中“日期”项,如不结合文 件生成、运转、处置的流程予以细化,则无法确定采集节点和采集方式;仅从文 件生成流程来看,面临着起草、会商、审核、签发等诸多“日期”,哪些日期最 为关键、哪些应作为元数据予以采集、在文件生命周期中是否重复元数据以及如 何采集等,都需要结合机构业务流程和相关规范深入研究,并实施精细化管理。
对文件形成机构(即业务机构)而言,因为元数据管理而徒增繁重手工著录工作量, 造成人力物力财力的巨大浪费,进而影响机构工作效率与绩效。需要指出的是, 元数据并不是独立的,而是与机构自身电子文件管理基础密不可分。没有科学的电子文件、档案一体化全程管理流程,没有完备的电子文件元数据管理功能要求, 便无法构建完善的元数据管理方案。因此,本文的研究内容是综合性的,从狭义 来讲是电子公文元数据自动采集方案;从广义来讲是机构电子文件管理方案。
二、元数据自动采集原则 (1)基于档案管理的基本原则 1.来源原则。元数据采集虽然通过对电子文件信息加以采集、提炼、分析和 组织,揭示文件、档案的内容及其产生规律,但是仍然以尊重档案的本质属性和 规律为前提,在采集时注重体现电子文件来源,使机构中同一来源的电子文件通 过元数据采集得到集中反映,使元数据与档案的来源相联系,以此通过元数据揭 示同一来源的档案、文件之间的各种联系,为档案、文件的理解与利用提供来源 方面的背景信息。
2.有机联系原则。有机联系原则也是档案管理的基本原则,是指系统中文件 及组成系统的诸要素之间需保持时空上的相互联系。由于电子文件是以二进制代 码的形式分散存在于之中,因此保持文件之间的有机联系显得尤为重要,而要保 持这种有机联系,必须依赖于元数据。以此原则为导向的元数据采集实质上就是 电子文件信息的系统化增值过程,其目的是把分散的文件信息转化为互相联系、 系统的信息流,形成更高级的信息产品,满足用户的特定利用需求。通过元数据 采集与管理过程,使大量文件特征信息加以系统化和组织化,有效控制档案、文 件信息揭示的数量和质量,克服档案、文件查询和利用的困难,提高检索效率, 节省查询成本和精力耗费,实现价值增益。
(2)基于电子文件管理的原则 1.前端控制原则。就元数据采集来说,在已经建立了电子文件管理系统的机 构,电子文件在系统中生成、运转,电子文件元数据采集的前端“超前”至系统 的设计阶段,前端控制的形式也部分转移到系统功能的设计之中,即尽可能地把 文件生命周期各个阶段的元数据需求设计在系统之中,以功能合理的OA系统作为 管好电子文件的先决条件。