电子文件元数据标准

  • 格式:ppt
  • 大小:126.50 KB
  • 文档页数:22

下载文档原格式

  / 22
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
ห้องสมุดไป่ตู้
设计原则
依据有关理论进行推导的原则 模块化原则 一致性原则 可扩展性原则 稳定性原则 互操作原则 递归性原则 开放性原则
信息来源建模
文件系统模型
文件处理者 分发
文件保管者
*
文件形成与 处理系统 文件形成者
捕获
文件保管与 利用系统 文件利用者
信息来源建模(续)
文件管理过程模型(图略) 信息来源模型(图略)
图书情报等信息领域
是一种用来描述数字化信息资源, 是一种用来描述数字化信息资源,特别是网络信息资源的 基本特征及其相互关系, 基本特征及其相互关系,从而确保这些数字化信息资源能 够被计算机及其网络系统自动辨析、分解、 够被计算机及其网络系统自动辨析、分解、提取和分析归 即所谓机器可理解性) 整套编码体系。 纳(即所谓机器可理解性)的—整套编码体系。 整套编码体系
元数据功能(二)
资源保护与长期保存:支持对资源的长期保存, 除了对信息资源的描述与确认之外,往往还需 要关于该资源的格式信息、制作信息、转换方 式、技术环境等,以便于资源的利用。 使用:用以描述信息资源的使用层次与类型。 如使用与使用者记录追踪、内容再利用与不同 版本的信息。 真实性保障(正处于研究之中 正处于研究之中) 正处于研究之中
信息模型(图略)
内容信息元数据层次
数据对象 表述信息(即结构信息)
保护描述信息元数据层次
内容特征 背景信息 保护信息 固化信息
分层索引与编码体系
分层索引
参见索引表
编码体系
参见编码体系表
谢谢大家!
Questions ?
电子文件长期保存的相关策略
更新:是指媒体的更新,即复制。但此策略并不 能确保信息在未来能够被检索与处理。 迁移:资料格式、结构或标准的转换,其目的 迁移 在于保障数字对象的完整性和长期有效性,使 其具有能够被使用者随时调用(可浏览、可运 能够被使用者随时调用( 能够被使用者随时调用 可浏览、 可检索等) 行、可检索等)的能力。成功的迁移有赖于所 建立的元数据。 模拟:是指能在未来或未知的系统上仿真旧系 统,使得数字对象的原始程序能在未来运作。 技术典藏:软、硬件系统本身的典藏。
电子文件元数据标准
金更达 2005年4月22日
主要内容
元数据概况
何为元数据? 元数据功能
数字信息长期保存策略 电子文件元数据
概念 总体说明 信息模型 元素分层索引
元数据概况
何为元数据? 元数据功能
何为元数据?
元数据是关于数据的数据,是描述资源的结构 化信息。
是数字信息组织和处理的基本工具,为各种形态的 数字化信息单元和资源集合提供了规范、普遍的描 述标准和方法,使得资源易于被检索、使用和管理。
元数据功能( 元数据功能(一)
信息发现:帮助使用者检索和确认所需要的资 信息发现 源,如Dublin core(简称DC)主要用于组织 网络信息资源。 信息描述:用于对数据单元进行详细、全面的 信息描述 信息描述,如图书的MARC、档案的机读目录、 地理空间信息(FGDC)等。 资源管理: 资源管理:支持对资源利用和管理过程的政策 与控制机制的描述,例如权限管理、资源评价、 电子签名、使用管理等。
主要困难
要求能够保障电子文件的真实性、 要求能够保障电子文件的真实性、完整性和证 据价值 ; 要求能够对分布式存储的、具有多样性和异构 要求能够对分布式存储的、 性的电子文件进行集成管理, 性的电子文件进行集成管理,确保电子文件的 安全和长期有效性; 安全和长期有效性; 要求能够通过集成管理和建立电子文件实时捕 获和共享机制,消除信息孤岛现象 信息孤岛现象, 获和共享机制,消除信息孤岛现象,有效实现 档案信息资源的共享,并能够为不同类型的用 档案信息资源的共享,并能够为不同类型的用 户群体提供有效的档案信息资源服务。 户群体提供有效的档案信息资源服务。
不同的元数据标准支持不同的目的需求
简单 VS 复杂 如:Dublin Core VS MARC 通用 VS 专用 如:Dublin Core VS FGDC 注:MARC为图书馆书目信息元数据标准 FGDC为数字地理空间元数据标准
何为元数据?(续)
不同行业对元数据的定义也不仅相同
档案领域
元数据是与电子文件的制作形成、运转、处理、储存、 元数据是与电子文件的制作形成、运转、处理、储存、检 传输和利用有关的数据。 将元数据定义为: 索、传输和利用有关的数据。ISO15489将元数据定义为: 将元数据定义为 是描述文件的背景、内容、 “是描述文件的背景、内容、结构及其整个管理过程的数 据” 。
总体说明
设计框架 功能需求 设计原则 信息来源建模
设计框架
元数据应用 元数据语义、语法定义
元数据模块化元素定义 设计框架(由下至上)
元数据信息模型
元数据信息来源UML建模
基础理论:文件运动理论
功能描述
设计原则
功能需求
确保并且证明电子文件的真实性和凭证 价值。 有助于对电子文件的保护与长期保存, 使其具有长久有效性。 有效地管理电子文件 有助于信息发现和信息共享,方便查询 和利用
电子文件元数据
概念 总体说明 信息模型 元素分层索引
电子文件元数据概念
GB/T 18894—2002:指描述电子文件数据属性 的数据,包括文件的格式、编排结构、硬件和 软件环境、文件处理软件、字处理和图形工具 软件、字符集等数据。 ISO15489:电子文件元数据是描述电子文件背 景、内容、结构及其整个管理过程的数据。 我们认为: 我们认为:电子文件元数据是描述电子文件背 内容、结构及其整个管理过程并可为计算 景、内容、结构及其整个管理过程并可为计算 机及其网络系统自动辨析、分解、 机及其网络系统自动辨析、分解、提取和分析 归纳的数据。 归纳的数据。
电子文件长期保存
存在问题 主要困难 相关策略
存在问题
电子文件的特性(依赖性、非直读性、信息与 载体的相分离性、物理结构与逻辑结构的复杂 性等等) 信息技术频繁的范式转换 信息技术的多样性和多种软硬件技术平台的存 在,导致形成了多种互不兼容的计算机信息系 统和结构各异的电子文件,使信息孤岛现象普 遍存在。 数字信息利用过程中,自然衍生而出的著作权、 公布权、确实性与可信赖性等问题。