纸质档案数字化技术规范.doc
- 格式:doc
- 大小:61.00 KB
- 文档页数:7
《纸质档案数字化技术规范》(DAT 31-2005)《纸质档案数字化技术规范》(DA/T 31-2005)(2008-05-07 12:48:46)(中华人民共和国档案行业标准 DA/T 31-2005,中华人民共和国国家档案局2005年4月30日发布,2005年9月1日起实施)1 范围本标准规定了纸质档案数字化的主要技术要求。
本标准适用于用扫描仪对各种纸质档案的数字化加工处理。
2 规范性引用文件下列文件中的条款通过本标准的引用而成为本标准的条款。
凡是注日期的引用文件,其随后所有的修改单(不包括勘误的内容)或修订版均不适用于本标准,然而,鼓励根据本标准达成协议的各方研究是否可使用这些文件的最新版本。
凡是不注日期的引用文件,其最新版本适用于本标准。
GB,T 17235.1 连续色调静态图像的数字压缩编码T 17235.2 连续色调静态图像的数字压缩编码 GB,GB,T 18894—2002 电子文件归档与管理规范ITU(CCITT)G3 二值图像压缩算法ITU(CCITT)G4 二值图像压缩算法DA,T18—1999 档案著录规则档案管理软件功能要求暂行规定国家档案局档发[2001]6号3 术语和定义下列术语和定义适用于本标准。
3.1数字化 Digitization用计算机技术将模拟图像转换为数字图像的处理过程。
3.2纸质档案数字化Digitization of Paper—Based Records 对普通(黑色字迹清晰)的油印、铅印、胶印等印刷件或复印件纸质档案进行数字化及应用的过程。
3(3数字图像 Digital Image表示景物图像的整数阵列。
一个二维或更高维的采样并量化的函数,由相同维数的连续图像产生。
在矩阵(或其他)网络上采样一连续函数,并在采样点上将值最小化后的阵列。
3(4黑白二值图像 Binary Image只有黑白两级灰度的数字图像。
它对应于黑和白的两种状态文字稿、线条图、指纹图等。
纸质档案数字化技术规范DA/T 32-2005(2005年4月30日发布2005年9月1日实施)一、概述国家标准《纸质档案数字化技术规范》DA/T 31—2005是由中国国家档案局颁布的,其批准时间为2005年4月30日,实施时间为2005年9月1日。
该标准共分为十三章。
其中包括范围,规范性引用文件,术语和定义,纸质档案数字化基本要求,档案整理,档案扫描,图像处理,图像存储,目录建库,数据挂接,数据验收,数据备份,数字化成果管理等。
该技术规范的出台结束了我国纸质档案数字化的初探阶段,标志着我国各级档案馆馆藏数字化技术的成熟。
二、主要条款简介第一章范围本标准规定了纸质档案数字化的主要技术要求。
本标准适用于采用各种设备对纸质档案的数字化加工处理及数字化成果的管理。
第二章规范性引用文件下列文件中的条款通过本标准的引用而成为本标准的条款。
凡是注日期的引用文件,其随后所有的修改单(不包括勘误的内容)或修订版均不适用于本标准,然而,鼓励根据本标准达成协议的各方研究是否可使用这些文件的最新版本。
凡是不注日期的引用文件其最新版本适用于本标准。
GB/T 17235.1-1998 信息技术连续色调静态图像的数字压缩及编码第一部分:要求和指南。
GB/T 17235.2-1998 信息技术连续色调静态图像的数字压缩及编码第二部分:一致性测试GB/T 18894-2002 电子文件归档与管理规范。
第三章术语和定义下列术语和定义适用于该标准。
(1)数字化digitization用计算机技术将模拟信号转换为数字信号的处理过程。
(2)纸质档案数字化digitization of paper-based records采用扫描仪或数码相机等数码设备对纸质档案进行数字化加工,将其转化为存储在磁带、磁盘、光盘等载体上并能被计算机识别的数字图像或数字文本的处理过程。
(3)数字图像digital image表示实物图像的整数阵列。
一个二维或更高维的采样并量化的函数,由相同维数的连续图像产生。
纸质档案数字化技术规范根据国家档案局2005年4月30日发布的《纸质档案数字化技术规范》,制定本局纸质档案数字化技术规范。
特对图像扫描、图像处理、图像存储作如下说明。
一、图像扫描1、扫描方式a、根据档案幅面的大小选择相应规格的扫描仪或专业扫描仪进行扫描。
大幅面档案可采用专用数码平台进行扫描或者采用图像拼接方式处理。
同一页面有两个以上文件,需分别扫描。
b、纸张状况较差,以及过薄、过软或超厚的档案,应采用平板扫描方式;纸张状况好的档案可采用高速扫描方式以提高工作效率。
2、扫描色彩模式、分辨率及扫描格式扫描色彩模式、分辨率及扫描格式的选择见下表:彩色档案举例:带红头的文书档案。
对清晰度有较高要求的图纸可适当提高分辨率。
二、图像处理图像处理以无限还原档案原貌为标准,注意图像偏斜度、清晰度、失真度、排列顺序等等。
三、图像存储1、图像存储格式黑白原稿:*.tiff;彩色档案、图纸:*.pdf, jpg文件需通过pdf转换器来转换成pdf文件。
转换器可以网上下载。
2、图像文件的命名命名原则:以纸质档案目录数据库为依据,将每一份图像文件命名为档案目录数据库中该份文件的档号。
通过档号的一致性和唯一性,建立起一一对应的关联关系,为实现档案目录数据库与图像文件的批量挂接提供条件。
a、命名格式(一)对立卷改革之前的纸质文书档案进行扫描,其图像文件命名格式由全宗号、目录号、案卷号、顺序号所组成,各字段间用“-”连接,即以xxx-xxx-xxxx-xxxx.tiff(或pdf)表示,数据结构见下表:b、命名格式(二)立卷改革后形成的纸质文书档案的扫描,其图像文件命名由全宗号、年度、保管期限、档案室编件号等四部分组成,各字段间用“-”连接,即以xxx-xxxx-xxxx-xxxx.tiff (或pdf)表示,数据结构见下表:全宗号用三位代码标识,用阿拉伯数字标识某一属类全宗的顺序号。
如“002”表示2号全宗。
年度以四位阿拉伯数字标注公元纪年,如“2002”表示2002年。
河南省档案馆纸质档案数字化技术规范1 范围本标准规定了河南省档案馆纸质档案数字化的主要技术要求。
本标准适用于河南省档案馆采用扫描设备对纸质档案数字化加工处理及数字化成果的管理,适用于省直向省档案馆移交纸质档案数字化成果的单位。
各市、县级综合档案馆参照执行。
2 规范性引用文件本规范根据中华人民共和国档案行业标准DA/T 31-2017《纸质档案数字化规范》,结合河南省档案馆纸质档案数字化工作实际情况制定。
3 术语和定义GB/T 20530—2006、DA/T 1-2000、DA/T 18-1999界定的以及下列术语和定义适用于本文件。
3.1 数字化 digitization利用计算机技术将模拟信号转换为数字信号的处理过程。
3.2 数字图像 digital image表示实物图像的整数阵列。
一个二维或更高维的采样并量化的函数,由相同维数的连续图像产生。
3.3 纸质档案数字化 digitization of paper-based records采用扫描仪等设备对纸质档案进行数字化加工,使其转化为存储在磁带、磁盘、光盘等载体上的数字图像,并按照纸质档案的内在联系,建立起目录数据与数字图像关联关系的处理过程。
3.4 分辨率 resolution单位长度内图像包含的点数或像素数,一般用每英寸点数(dpi)表示。
4 总则4.1 河南省档案馆根据档案的珍贵程度、开放程度、利用率、亟待抢救程度、数字化资金情况等因素统筹规划、科学开展纸质档案数字化工作。
制定数字化规划与年度计划,有目标有计划地开展数字化工作。
4.2 纸质档案数字化的基本环节主要包括:档案出库、数字化前处理、目录数据库建立、档案扫描、图像处理、数据挂接、数字化成果验收与移交、档案归还入库,具体流程见附录A。
4.3 应采取有效的管理和技术手段,确保纸质档案数字化成果质量。
纸质档案数字化应遵循档案管理的客观规律,真实反映档案内容,最大程度地展现档案原貌。
纸质档案数字化规范DAT31-2017纸质档案数字化规范DA/T31—2017前言本标准按照GB/T 1.1-2009的规则起草,替代了DA/T31-2005《纸质档案数字化技术规范》。
与DA/T31-2005相比,本标准增强了组织与管理部分的内容,完善了数字化工作中管理相关要求;增加了数字化过程中元数据采集的要求;修改了档案扫描部分参数要求;修改了图像处理部分内容,更加强调保持档案原貌的要求;细化了数字化成果验收的内容;删除了原标准数据备份和数字化成果管理相关内容。
本标准由___提出并归口,起草单位为___、___、___技术部,主要起草人为___、___、___、___、___、___、___、___、田军、___、___。
本标准所代替的标准为DA/T31—2005.引言DA/T31-2005的发布实施,从技术标准方面对纸质档案数字化工作提出了要求,促进了纸质档案数字化工作向科学化、规范化的方向发展,在档案信息化工作中发挥了重要作用。
然而,经过10年的时间,数字化设备、存储、网络等技术条件都发生了较大变化,同时,纸质档案数字化工作管理方法和管理理念等都在不断更新、发展。
因此,及时对本标准进行修订,适时调整相关要求,从档案行业层面科学规范纸质档案数字化工作,具有重要的现实意义。
本次修订更加注重我国纸质档案数字化工作自身的特点,结合目前信息技术发展的水平,提出适用于档案行业的纸质档案数字化工作的规范性要求。
纸质档案数字化规范1范围本标准规定了纸质档案数字化技术和管理要求,适用于采用扫描设备对纸质档案的数字化加工过程的管理。
2规范性引用文件本标准引用了GB/T 1.1-2009《标准化工作导则第1部分:标准的结构和编写》。
5.1.2 数字化工作需要具备相应能力的工作人员,包括熟悉档案业务并具有较高的调查研究水平和良好的组织领导能力的管理人员,熟悉相关标准规范并能够为纸质档案数字化工作各环节提供技术支持的技术人员,以及掌握一定数字化基础知识并熟悉本职工作的操作人员等。
纸质档案数字化规范纸质档案数字化规范是指将纸质档案通过扫描、录入等技术手段转换成电子形式的一种操作规范。
纸质档案数字化的目的是提高档案管理的效率和便捷性,降低档案的保存成本,并便于档案的检索和共享。
下面是纸质档案数字化的规范要点:1. 核查和整理在数字化过程之前,必须对纸质档案进行核查和整理。
首先,核查档案是否完整,并将缺失或损坏的档案进行补充或修复。
其次,将档案按照分类、时序等原则进行整理,确保顺序和清晰度。
2. 扫描和录入将整理好的纸质档案通过扫描仪或其他相关设备转换为电子文件。
扫描时应保证文件清晰度和色彩准确性。
对于文字类档案,可以通过OCR技术进行文字的自动识别;对于图像、图片类档案,可以进行编辑和修复,以便更好地保留档案的内容和质量。
3. 统一命名和分类对于数字化后的档案文件,应进行统一的命名和分类。
文件名可以采用有意义的命名方式,如档案编号、日期等,以方便检索。
同时,将档案按照不同的类别、主题、格式等进行分类标注,并建立相应的文件夹或目录结构。
4. 元数据录入和索引建立对于数字化后的档案文件,应进行元数据的录入和索引的建立。
元数据包括档案的基本信息,如档案名称、创建日期、创建者、所属机构等;索引是对档案的内容和属性进行关键词标注,以便更方便地进行检索和查找。
5. 存储和备份数字化后的档案文件应按照一定的存储结构进行保存和备份。
可以采用硬盘、服务器、云存储等方式进行存储,并设定访问权限和安全措施,以保护档案的完整性和安全性。
同时,定期进行档案的备份和恢复,以防止文件丢失或损坏。
6. 数据质量和准确性的验证在数字化过程之后,需要对档案的数据质量和准确性进行验证。
首先,对数字化后的档案进行比对和校验,确保数字化结果与原始档案的一致性。
其次,进行数据质量的检测和修复,如修正错别字、调整图像亮度等,以提高档案的可读性和准确性。
7. 档案的检索和共享数字化后的档案应具备便捷的检索和共享功能。
可以通过建立档案管理系统或数据库,进行关键词检索、全文检索等操作,以方便用户查找所需档案。
纸质档案数字化规范DA/T31—2017前言本标准按照GB/T 1.1-2009给出的规则起草。
本标准替代DA/T 31-2005《纸质档案数字化技术规范》。
本标准与DA/T 31-2005相比,主要技术变化如下:——标题进行了修改;——增强组织与管理部分的内容,完善数字化工作中管理相关要求;——增强数字化前处理部分的内容,包括对实体档案保护和档案规范化管理方面的要求;——增加数字化过程中元数据采集的要求;——修改了档案扫描部分参数要求;——修改了图像处理部分内容,更加强调保持档案原貌的要求;——细化了数字化成果验收的内容;——删除原标准数据备份和数字化成果管理相关内容。
本标准由国家档案局提出并归口。
本标准起草单位:国家档案局档案科学技术研究所、国家档案局信息管理中心、国家档案局技术部。
本标准主要起草人:王良城、马淑桂、郝晨辉、程春雨、杜琳琳、蔡伟、宋涌、王大众、田军、曹燕、李华峰。
本标准所代替标准的历次版本发布情况为:——DA/T 31—2005。
引言DA/T 31-2005的发布实施,从技术标准方面对纸质档案数字化工作提出了要求,很好的促进了纸质档案数字化工作向科学化、规范化的方向发展,在档案信息化工作中发挥了重要作用。
由于纸质档案数字化工作所依赖的信息技术发展迅速,经过10年的时间,数字化设备、存储、网络等技术条件都发生了较大变化,同时,纸质档案数字化工作管理方法和管理理念等都在不断更新、发展。
因此,及时对本标准进行修订,适时调整相关要求,从档案行业层面科学规范纸质档案数字化工作,具有重要的现实意义。
标准本次修订更加注重我国纸质档案数字化工作自身的特点,结合目前信息技术发展的水平,提出适用于档案行业的纸质档案数字化工作的规范性要求。
纸质档案数字化规范1 范围本标准规定了纸质档案数字化技术和管理要求。
本标准适用于采用扫描设备对纸质档案的数字化加工过程的管理。
2 规范性引用文件下列文件对于本文件的应用是必不可少的。
纸质档案数字化规范
一、总体要求
1、纸质档案数字化必须贯彻落实“以人为本”的方针,尊重用户权益
实现信息共享。
2、纸质档案数字化的内容应充分反映历史价值、文化传承,合理应用
信息技术,实现信息资源的统一集成,确保信息安全与完整性。
二、技术标准
1、采用图像处理技术,对纸质档案进行拍摄和扫描,根据记录需求,
把纸质档案图像、音频、视频数据处理成图像格式、文本格式、文档
格式进行存储。
2、要求文件格式和质量达到标准,采用TIFF带压缩格式保存,便于
存储、检索和调阅,合理利用格式的优势,强化档案的管理、查阅等。
3、利用数据库技术、信息检索技术、图像检索技术等技术,帮助档案
馆实现档案资源的有效管理和识别与应用,优化档案管理能力。
三、管理规范
1、纸质档案数字化时必须完成鉴定,确定档案类别和合法性,保证清晰、完整的档案信息。
2、将原有的档案索引体系迁移至电子文档管理系统,以实现档案的集中、统一、有序管理,保证信息的安全。
3、对档案数字化过程,应记录处理环节,对每一步处理做出核实,并
记录正确性和完整性。
4、定期进行档案数字化管理培训和质量测试,保证档案数字化工作质量。
上海交通大学档案馆纸质档案数字化技术规范为了规范、科学、合理的开展纸质档案数字化工作,使档案信息资源准确、方面、快捷地提供共享利用,以满足学校对档案的需求,现参照《纸质档案数字化技术规范》(DA/T 31-2005),并结合本馆实际,制订本技术规范。
一、本规范的适用范围本规范规定了纸质档案数字化的主要技术要求。
本规范适用于采用各种设备对纸质档案的数字化加工处理及数字化成果的管理。
二、纸质档案数字化的基本原则:纸质档案数字化的基本原则是使档案信息资源准确、方便、快捷地提供利用,使可以公开的档案信息资源得到共享,以满足社会对档案利用的需求。
1.规范性原则:所有档案信息必须按照规定的技术要求、文本格式和工作标准进行数字化,并尽可能采取通用标准,在特定技术参数方面适当调高。
2.安全性原则:在档案信息数字化过程中要确保档案原件的安全、确保数字化档案信息的内容与档案原件相吻合、确保档案信息内容不泄密。
3.效益性原则:在充分调研的基础上选择最优的档案信息数字化方案,包括选择最优的工作流程、最合理的技术手段和最适宜的数字化加工设施等。
三、纸质档案数字化对象的确定:应当对所要进行数字化的对象按照一定的原则和利用方法进行确认,只有符合一定要求的纸质档案文献才能进行数字化。
1.保护至上,分步实施原则2.需求导向,急用先上原则3.剔除无用,避免浪费原则四、纸质档案数字化技术要求1.扫描档案的总体要求:每张图片应在200%的查看比例下,字迹、边框清晰,图片上加有水印专用章、图片顺序号与案卷的页码号一致;2.扫描均为24位色彩色模式。
分辨率要求:历史档案:≥400dpi;非历史档案:≥200dpi。
数码相机拍摄档案的分辨率要求:相机的像素设定应相当于或大于分辨率200dpi;分辨率的设定应以“每张图片应在200%的查看比例下,字迹清晰、完整”为原则;若有特殊情况导致影响扫描图像的利用和阅读的(包括图像的清晰度是否理想、图像大小是否合适),可根据实际情况作以调整:3.对于所扫描图片原始文件,按照相应的规格,在保存时,应按照图片的最高品质保存;对于压缩、处理后的图片,应保证图像的清晰、可读。
纸质档案数字化规范DA/T31—2017前言本标准按照GB/T 1.1-2009给出的规则起草。
本标准替代DA/T 31-2005《纸质档案数字化技术规范》。
本标准与DA/T 31-2005相比,主要技术变化如下:——标题进行了修改;——增强组织与管理部分的内容,完善数字化工作中管理相关要求;——增强数字化前处理部分的内容,包括对实体档案保护和档案规范化管理方面的要求;——增加数字化过程中元数据采集的要求;——修改了档案扫描部分参数要求;——修改了图像处理部分内容,更加强调保持档案原貌的要求;——细化了数字化成果验收的内容;——删除原标准数据备份和数字化成果管理相关内容。
本标准由国家档案局提出并归口。
本标准起草单位:国家档案局档案科学技术研究所、国家档案局信息管理中心、国家档案局技术部。
本标准主要起草人:王良城、马淑桂、郝晨辉、程春雨、杜琳琳、蔡伟、宋涌、王大众、田军、曹燕、李华峰。
本标准所代替标准的历次版本发布情况为:——DA/T 31—2005。
引言DA/T 31-2005的发布实施,从技术标准方面对纸质档案数字化工作提出了要求,很好的促进了纸质档案数字化工作向科学化、规范化的方向发展,在档案信息化工作中发挥了重要作用。
由于纸质档案数字化工作所依赖的信息技术发展迅速,经过10年的时间,数字化设备、存储、网络等技术条件都发生了较大变化,同时,纸质档案数字化工作管理方法和管理理念等都在不断更新、发展。
因此,及时对本标准进行修订,适时调整相关要求,从档案行业层面科学规范纸质档案数字化工作,具有重要的现实意义。
标准本次修订更加注重我国纸质档案数字化工作自身的特点,结合目前信息技术发展的水平,提出适用于档案行业的纸质档案数字化工作的规范性要求。
纸质档案数字化规范1 范围本标准规定了纸质档案数字化技术和管理要求。
本标准适用于采用扫描设备对纸质档案的数字化加工过程的管理。
2 规范性引用文件下列文件对于本文件的应用是必不可少的。
纸质档案数字化规范DA/T31—2017前言本标准按照GB/T 1.1-2009给出的规则起草。
本标准替代DA/T 31-2005《纸质档案数字化技术规范》。
本标准与DA/T 31-2005相比,主要技术变化如下:——标题进行了修改;——增强组织与管理部分的内容,完善数字化工作中管理相关要求;——增强数字化前处理部分的内容,包括对实体档案保护和档案规范化管理方面的要求;——增加数字化过程中元数据采集的要求;——修改了档案扫描部分参数要求;——修改了图像处理部分内容,更加强调保持档案原貌的要求;——细化了数字化成果验收的内容;——删除原标准数据备份和数字化成果管理相关内容。
本标准由国家档案局提出并归口。
本标准起草单位:国家档案局档案科学技术研究所、国家档案局信息管理中心、国家档案局技术部。
本标准主要起草人:王良城、马淑桂、郝晨辉、程春雨、杜琳琳、蔡伟、宋涌、王大众、田军、曹燕、李华峰。
本标准所代替标准的历次版本发布情况为:——DA/T 31—2005。
引言DA/T 31-2005的发布实施,从技术标准方面对纸质档案数字化工作提出了要求,很好的促进了纸质档案数字化工作向科学化、规范化的方向发展,在档案信息化工作中发挥了重要作用。
由于纸质档案数字化工作所依赖的信息技术发展迅速,经过10年的时间,数字化设备、存储、网络等技术条件都发生了较大变化,同时,纸质档案数字化工作管理方法和管理理念等都在不断更新、发展。
因此,及时对本标准进行修订,适时调整相关要求,从档案行业层面科学规范纸质档案数字化工作,具有重要的现实意义。
标准本次修订更加注重我国纸质档案数字化工作自身的特点,结合目前信息技术发展的水平,提出适用于档案行业的纸质档案数字化工作的规范性要求。
纸质档案数字化规范1 范围本标准规定了纸质档案数字化技术和管理要求。
本标准适用于采用扫描设备对纸质档案的数字化加工过程的管理。
2 规范性引用文件下列文件对于本文件的应用是必不可少的。
纸质档案数字化规范DA/T31—2017前言本标准按照GB/T 1.1-2009给出的规则起草。
本标准替代DA/T 31-2005《纸质档案数字化技术规范》。
本标准与DA/T 31-2005相比,主要技术变化如下:——标题进行了修改;——增强组织与管理部分的内容,完善数字化工作中管理相关要求;——增强数字化前处理部分的内容,包括对实体档案保护和档案规范化管理方面的要求;——增加数字化过程中元数据采集的要求;——修改了档案扫描部分参数要求;——修改了图像处理部分内容,更加强调保持档案原貌的要求;——细化了数字化成果验收的内容;——删除原标准数据备份和数字化成果管理相关内容。
本标准由国家档案局提出并归口。
本标准起草单位:国家档案局档案科学技术研究所、国家档案局信息管理中心、国家档案局技术部。
本标准主要起草人:王良城、马淑桂、郝晨辉、程春雨、杜琳琳、蔡伟、宋涌、王大众、田军、曹燕、李华峰。
本标准所代替标准的历次版本发布情况为:——DA/T 31—2005。
引言DA/T 31-2005的发布实施,从技术标准方面对纸质档案数字化工作提出了要求,很好的促进了纸质档案数字化工作向科学化、规范化的方向发展,在档案信息化工作中发挥了重要作用。
由于纸质档案数字化工作所依赖的信息技术发展迅速,经过10年的时间,数字化设备、存储、网络等技术条件都发生了较大变化,同时,纸质档案数字化工作管理方法和管理理念等都在不断更新、发展。
因此,及时对本标准进行修订,适时调整相关要求,从档案行业层面科学规范纸质档案数字化工作,具有重要的现实意义。
标准本次修订更加注重我国纸质档案数字化工作自身的特点,结合目前信息技术发展的水平,提出适用于档案行业的纸质档案数字化工作的规范性要求。
纸质档案数字化规范1 范围本标准规定了纸质档案数字化技术和管理要求。
本标准适用于采用扫描设备对纸质档案的数字化加工过程的管理。
2 规范性引用文件下列文件对于本文件的应用是必不可少的。
纸质档案数字化技术规范Specification for Digitization of Paper-Based Records1 范围本标准规定了纸质档案数字化的主要技术要求。
本标准适用于采用各种设备对纸质档案的数字化加工处理及数字化成果的管理。
2 规范性引用文件下列文件中的条款通过本标准的引用而成为本标准的条款。
凡是注日期的引用文件,其随后所有的修改单(不包括勘误的内容)或修订版均不适用于本标准,然而,鼓励根据本标准达成协议的各方研究是否可使用这些文件的最新版本。
凡是不注日期的引用文件,其最新版本适用于本标准。
GB/T 17235.1 连续色调静态图像的数字压缩编码第一部分:要求和指南GB/T 17235.2 连续色调静态图像的数字压缩编码第二部分:一致性测试GB/T 18894 电子文件归档与管理规范3 术语和定义下列术语和定义适用于本标准。
3.1数字化digitization用计算机技术将模拟信号转换为数字信号的处理过程。
3.2纸质档案数字化digitization of paper-based records采用扫描仪或数码相机等数码设备对纸质档案进行数字化加工,将其转化为存储在磁带、磁盘、光盘等载体上并能被计算机识别的数字图像或数字文本的处理过程。
3.3数字图像digital image表示实物图像的整数阵列。
一个二维或更高维的采样并量化的函数,由相同维数的连续图像产生。
在矩阵(或其他)网络上采样——连续函数,并在采样点上将值最小化后的阵列。
3.4黑白二值图像binary image只有黑白两级灰度的数字图像。
它对应于黑白两种状态的文字稿、线条图等。
3.5连续色调静态图像continuous-tone still image以多于两级灰度的不同浓淡层次或以不同颜色通道组合成的静态数字图像。
在纸质档案数字化过程中,通常表现为灰度扫描和彩色扫描两种模式。
3.6分辨率resolution单位长度内图像包含的点数或像素数,一般用每英吋点数(dpi)表示。
3.7失真度distortion measure对档案进行数字化转换后,数字图像与档案原件在色彩、几何等方面的偏离程度。
3.8可懂度intelligibility数字图像向人或机器提供信息的能力。
3.9图像压缩image compression清除图像冗余或对图像近似的任一种过程,其目的是对图像以更紧凑的形式表示。
纸质档案数字化过程中,较常见的有TIFF(G4)、JPEG等压缩格式。
4 纸质档案数字化基本要求4.1基本原则纸质档案数字化的基本原则是使档案信息资源准确方便快捷地提供利用,使可以公开的档案信息资源得到共享,以满足社会对档案利用的需求。
4.2 数字化对象的确定原则应当对所要进行数字化的对象按照一定的原则和方法进行确认,只有符合一定要求的纸质档案文献才能进行数字化。
4.2.1 符合国家法律法规的原则纸质档案的数字化,必须符合国家档案开放规定以及有关规定。
4.2.2价值性原则属于归档范围且应永久或长期保存的、社会利用价值高的档案可列入数字化加工的范围。
4.3 基本环节纸质档案数字化的基本环节主要包括:档案整理、目录建库、档案扫描、图像处理、图像存储、数据质检、数据挂接、数据验收、数据备份、成果管理等。
4.4 过程管理4.1.1应加强纸质档案数字化各环节的安全保密管理机制,确保档案原件和数字化档案信息的安全。
4.2.2纸质档案数字化的各个环节均应进行详细的登记,并及时整理、汇总,装订成册,在数字化工作完成的同时建立起完整、规范的记录。
5 档案整理在扫描之前,根据档案管理情况,按下述步骤对档案进行适当整理,并视需要作出标识,确保档案数字化质量。
5.1 目录数据准备按照《档案著录规则》(DA/T18)等的要求,规范档案中的目录内容。
包括确定档案目录的著录项、字段长度和内容要求。
如有错误或不规范的案卷题名、文件名、责任者、起止页号和页数等,应进行修改。
5.2 拆除装订在不去除装订物情况下,影响扫描工作进行的档案,应拆除装订物。
拆除装订物时应注意保护档案不受损害。
5.3 区分扫描件和非扫描件按要求把同一案卷中的扫描件和非扫描件区分开。
普发性文件区分的原则是:无关和重份的文件要剔除,有正式件的文件可以不扫描原稿。
5.4 页面修整破损严重、无法直接进行扫描的档案,应先进行技术修复,折皱不平影响扫描质量的原件应先进行相应处理(压平或熨平等)后再进行扫描。
5.5 档案整理登记制作并填写纸质档案数字化加工过程交接登记表单,详细记录档案整理后每份文件的起始页号和页数。
5.6 装订扫描工作完成后,拆除过装订物的档案应按档案保管的要求重新装订。
恢复装订时,应注意保持档案的排列顺序不变,做到安全、准确、无遗漏。
6 目录建库6.1 数据格式选择目录建库应选择通用的数据格式。
所选定的数据格式应能直接或间接通过XML文档进行数据交换。
6.2 档案著录按照《档案著录规则》(DA/T18)的要求进行著录,建立档案目录数据库。
6.3 目录数据质量检查采用人工校对或软件自动校对的方式,对目录数据库的建库质量进行检查。
核对著录项目是否完整、著录内容是否规范、准确,发现不合格的数据应要求进行修改或重录。
7 档案扫描7.1 扫描方式7.1.1 根据档案幅面的大小(A4、A3、A0等)选择相应规格的扫描仪或专业扫描仪(如工程图纸可采用0号图纸扫描仪)进行扫描。
大幅面档案可采用大幅面数码平台,或者缩微拍摄后的胶片数字化转换设备等进行扫描,也可以采用小幅面扫描后的图像拼接方式处理。
7.1.2纸张状况较差,以及过薄、过软或超厚的档案,应采用平板扫描方式;纸张状况好的档案可采用高速扫描方式以提高工作效率。
7.2扫描色彩模式7.2.1扫描色彩模式一般有黑白二值、灰度、彩色等。
通常采用黑白二值。
7.2.2页面为黑白两色,并且字迹清晰、不带插图的档案,可采用黑白二值模式进行扫描。
7.2.3页面为黑白两色,但字迹清晰度差或带有插图的档案,以及页面为多色文字的档案,可采用灰度模式扫描。
7.2.4页面中有红头、印章或插有黑白照片、彩色照片、彩色插图的档案,可视需要采用彩色模式进行扫描。
7.3 扫描分辨率7.3.1扫描分辨率参数大小的选择,原则上以扫描后的图像清晰、完整、不影响图像的利用效果为准。
7.3.1 采用黑白二值、灰度、彩色几种模式对档案进行扫描时,其分辨率一般均建议选择≥100dpi。
特殊情况下,如文字偏小、密集、清晰度较差等,可适当提高分辨率。
7.3.2 需要进行OCR汉字识别的档案,扫描分辨率建议选择≥200dpi。
7.4 扫描登记认真填写纸质档案数字化转换过程交接登记表单,登记扫描的页数,核对每份文件的实际扫描页数与档案整理时填写的文件页数是否一致,不一致时应注明具体原因和处理方法。
8 图像处理8.1 图像数据质量检查8.1.1 对图像偏斜度、清晰度、失真度等进行检查。
发现不符合图像质量要求时,应重新进行图像的处理。
8.1.2 由于操作不当,造成扫描的图像文件不完整或无法清晰识别时,应重新扫描。
8.1.3 发现文件漏扫时,应及时补扫并正确插入图像。
8.1.4 发现扫描图像的排列顺序与档案原件不一致时,应及时进行调整。
8.1.5 认真填写相关表单,记录质检结果和处理意见。
8.2 纠偏对出现偏斜的图像应进行纠偏处理,以达到视觉上基本不感觉偏斜为准。
对方向不正确的图像应进行旋转还原,以符合阅读习惯。
8.3 去污对图像页面中出现的影响图像质量的杂质如黑点、黑线、黑框、黑边等应进行去污处理。
处理过程中应遵循在不影响可懂度的前提下展现档案原貌的原则。
8.4 图像拼接对大幅面档案进行分区扫描形成的多幅图像,应进行拼接处理,合并为一个完整的图像,以保证档案数字化图像的整体性。
8.5 裁边处理采用彩色模式扫描的图像应进行裁边处理,去除多余的白边,以有效缩小图像文件的容量,节省存储空间。
9 图像存储9.1 存储格式9.1.1 采用黑白二值模式扫描的图像文件,一般采用 TIFF(G4)格式存储。
采用灰度模式和彩色模式扫描的文件,一般采用JPEG格式存储。
存储时的压缩率的选择,应以保证扫描的图像清晰可读的前提下,尽量减小存储容量为准则。
9.1.2 提供网络查询的扫描图像,也可存储为CEB、PDF或其他格式。
9.2图像文件的命名9.2.1纸质档案目录数据库中的每一份文件,都有一个与之相对应的唯一档号,以该档号为这份文件扫描后的图像文件命名。
9.2.2 多页文件可采用该档号建立相应文件夹,按页码顺序对图像文件命名。
10 数据挂接10.1 汇总挂接档案数字化转换过程中形成的目录数据库与图像数据库,通过质检环节确认为“合格”后,通过网络及时加载到数据服务器端汇总。
通过编制程序或借助相应软件,可实现目录数据对相关联的数字图像的自动搜索、加入对应的电子地址信息等,实现批量、快速挂接。
10.2 数据关联以纸质档案目录数据库为依据,将每一份纸质档案文件扫描所得的一个或多个图像存储为一份图像文件。
将图像文件存储到相应文件夹时,要认真核查每一份图像文件的名称与档案目录数据库中该份文件的档号是否相同,图像文件的页数与档案目录数据库中该份文件的页数是否一致,图像文件的总数与目录数据库中文件的总数是否相同等。
通过每一份图像文件的文件名与档案目录数据库中该份文件的档号的一致性和唯一性,建立起一一对应的关联关系,为实现档案目录数据库与图像文件的批量挂接提供条件。
10.3认真填写纸质档案数字化转换过程交接登记表单,记录数据关联后的页数,核对每一份文件关联后的页数与档案整理、扫描时填写的页数是否一致,不一致时应注明具体原因和处理办法。
11 数据验收11.1数据抽检11.1.1 以抽检的方式检查已完成数字化转换的所有数据,包括目录数据库、图像文件及数据挂接的总体质量。
11.1.2 一个全宗的档案,数据验收时抽检的比率不得低于5%。
11.2 验收指标11.2.1 目录数据库与图像文件挂接错误,或目录数据库、图像文件之一出现不完整、不清晰、有错误等质量问题时,抽检标记为“不合格”。
11.2.2 一个全宗的档案,数字化转换质量抽检的合格率达到95%以上(含95%)时,给予以验收“通过”。
合格率=抽检合格的文件数/抽检文件总数×100%11.3 验收审核验收“通过”的结论,必须经分管领导审核、签字后方有效。
11.4 验收登记认真填写纸质档案数字化验收登记表单。
12 数据备份12.1 备份范围经验收合格的完整数据应及时进行备份。
12.2 备份方式为保证数据安全,备份载体的选择应多样化,可采用在线、离线相结合的方式实现多套备份,并注意异地保存。
12.3 数据检验备份数据也应进行检验。
备份数据的检验的内容主要包括备份数据能否打开、数据信息是否完整、文件数量是否准确等。