档案馆

当前位置: 首页>>学术交流>>正文
馆藏档案数字化的前整理
2015-12-11 09:17 谈胜祥 

摘自《档案工作》电子期刊2015年第1期

http://www.hada.gov.cn/html/News/0_47289.html

如何提高档案数字化的整体效益,提升档案信息资源的质量,馆藏档案数字化的“前整理”是非常重要的环节。

所谓“前整理”是数字化的一项基础工作,是对馆藏全部实体档案的价值、损坏程度和原整理情况进行一次梳理,同时也是对需要数字化的实体档案进行拆卷、修复、装订整理工作的约定。“前整理”的工作质量对接下来的数字化效益具有决定性的影响。“前整理”内容包括馆藏档案数字化方案制定、馆藏档案数字化操作流程、损坏档案抢救措施、档案信息的重新分类和专题建立、实体档案的拆卷、组卷规则制订等。

一、馆藏档案数字化方案制定,确定馆藏档案数字化范围和整理原则。

(一)馆藏档案数字化的范围:一是馆藏珍贵档案;二是具有长远使用价值的档案;三是具有经济、科技、文化价值的档案;四是具有地方特色的档案;五是利用率高、需求大的档案;六是开放的档案。

此外,对于未集中数字化扫描的档案,可采取即用即扫。即对于利用率很低,偶然使用的档案,采取用时单独扫描。

(二)实体档案拆、并卷整理原则

1、坚守历史档案整理的基本原则

档案作为一种历史文化遗物,不仅记录了当时的实践活动,而且反映了长久以来对档案整理和保存的情况和成果。要注意对历史和前人的劳动的尊重,充分利用以前的整理基础。这样可以提高档案整理工作的质量和效率。凡是已经整理过的档案,只要有规可循,有目可查,就应该尽量保持原有的整理体系,切忌轻易打乱重整。原来不够合理的部分,可适当调整或通过编制检索工具等一系列的措施进行补救。

2、重新整理时依然注意保持文件的历史联系

所谓档案文件之间的历史联系,就是文件在其产生和处理过程中形成的内在的相互关系,也称为“内在联系”或者是“有机联系”。按照档案文件的形成规律,保持档案文件在形成活动中的固有联系,才能整理组成有机的整体。

(1)档案文件在来源方面的联系每一份文件形成的单位或者个人,其在来源方面存在着不可分割的联系。在整理档案时,必须保持文件的固有的联系,不可以随意拆散和任意的脱离其形成单位。从全部整理工作程序来看,来源联系是档案文件之间的首要联系。

(2)档案文件在时间方面的联系形成档案的单位和个人所进行的具体活动,都有一定的过程和阶级性,因而使得文件之间具有自然的时间联系。我们在整理这些文件时,要保持文件之间的这种时间联系。

(3)档案文件在内容方面的联系,档案文件是机关或者个人行使只能和进行工作活动的产物,其形成者的特定活动构成了档案文件内容上的联系。档案文件在内容上的联系,往往是最重要的联系。

(4)档案文件在形式方面的联系,文件的内容必然是通过一定的形式表现出来的。其形式包括内部和外部两个方面。因此,在必要的情况下,应该按照文件形式方面的联系进行整理。

3、实体档案的整理必须便于保管和利用

便于保管和利用也是档案整理工作的基本出发点和最终要求。但是由于历史的原因,有些历史档案的分类、装订存在不合理的现象,尤其是档案存在破损,需要修补,加上原案卷太厚,且卷内文件并非是关联的,更需要整理者根据卷内文件状况做好备考记录,将超厚卷分卷。整理者应基本保持原文件装订顺序,分离的案卷共享原档号,但增加一个分号。由于实体档案经过数字化,一般利用只需调阅电子文档,一则可以保护实体档案;二则文件间的联系可以采取电子文档直接关联,不必对实体档案在物理上改变组卷形式。至于原卷内文件的分类与组卷与当前馆藏的分类不符,可以将电子文档按照当前分类组合,文件之间的联系用一种虚拟的方式连接。

二、馆藏档案数字化的操作流程

在既定的数字化方案下,进一步对需要数字化的档案,制定调卷,拆卷、扫描、修补、装订、验收、入库的具体操作规范。

(一)数字化主要工序的操作规定

1、调档交接:指定调卷人从档案库房提取需要进行数字化加工的档案原件到加工现场,以目录号(年度)为单位调卷,并对领取档案进行逐卷(件)清点和登记,不出现遗漏登记或重复登记。

2、实体核对:对领取的档案实体以件为单位进行核查,检查文件数量有无短缺,发现短缺及时通知档案局管理人员;对页号和顺序进行检查,对不合要求的页号进行重新修订

3、档案整理:整理人员对领出的档案原件进行数量清点、拆除装订物和纸张检查,发现问题及时登记并提交用户审核处理,然后根据需要进行拆卷、纠正、平整、鉴定、分页等处理工作。同时准备好目录数据,做好档案前处理登记工作。

4、目录修订:著录人员逐条检查纸质档案目录和电子档案目录,对存在问题的目录进行修订。

5、档案扫描:扫描操作员将整理好的档案原件,首先根据纸张状况和工作任务进行扫描,然后利用计算机对扫描后形成的影像文件进行精细处理,包括纠偏、去污、裁剪、色彩调整等修饰工作,处理后的图像以档案局规定的文件格式保存。

6、图像处理:工作人员对扫描后的图像进行逐页纠偏、去污、图像拼接、裁边处理和排列顺序调整,以符合正常的阅读习惯。

7、数据挂接:分别对目录数据和全文数据进行分批处理,将档案扫描图像和对应目录进行挂接,建立图像文件与档案目录的对应关系。

8、综合自检:对档案实体、纸质档案目录、电子档案目录及电子图像数据送交检查验收前,对加工成果进行自检。

9、目录打印装订:对经过修订的目录数据进行检查,无误后以目录号为单位进行打印。

10、光盘刻录:按照档案局的要求刻录光盘并提交。

装订、装盒:将档案原件按原始状态装订成册,对档案进行清点后装盒,交由档案局管理人员审核,并签字认可。

11、数据验收:参照档案局加工质量验收要求对已完成数字化加工的所有数据进行检验。

(二)操作流程中的业务指导和监管机制

目前档案馆数字化的工作一般都外包给专业公司,培训和业务指导以及监督管理是档案馆必须重视的一项工作内容。除了培训档案实体整理规则,更进一步需要培训公司操作人员档案保护知识。在案卷开始扫描前,操作人员需要检查卷内每一页,将卷内有无虫蛀、霉变、字迹模糊、纸张粘连、破损等情况记录到备考信息数据库中,由档案馆的管理人员确定是否先抢修再扫描,或者先扫描以后再修补。

档案馆工作人员对于无卷内目录的案卷,应加强指导操作人员拟文件标题和修订案卷标题。对于重要的手写体档案,应要求在著录信息中著录文件摘要,以便计算机全文检索。

馆藏档案数字化是一项长期工作,保障档案的安全是档案馆时时刻刻必须警惕的大事。档案的安全问题要注意四个方面:一是防止档案信息外泄;二是防止实体档案丢失;三是防止实体档案损坏、搞乱;四是防止数字化后的电子文档无效,即出现错误。因此,档案馆与外包公司签订合同时需要签署保密和责任认定协议,并且共同制定监管措施。为了检验这些监管措施是否有效,档案馆可以从五各方面对外包公司的实际操作进行评估。即外包公司在日常的工作中是否做到责任到人、监控到位、交接清楚、张数控制,同时应急处理的预案是否有效。一旦发现问题及时提出整改意见,督促外包公司尽快解决问题。

三、馆藏档案数字化前整理的备考信息数据库

所谓备考信息数据库就是将原案卷中的备考表的功能拓展,用计算机记录前整理中的案卷情况,对于今后的档案保护、鉴定、考证、利用都有重要的意义。

备考信息数据库按照档案门类划分,建立独立的文书、科技、基建、会计、声像等备考信息库。备考信息数据库的字段:档号、案卷标题、卷内文件件数、案卷张数、页数、保管期限、页码错误、缺少张数、夹带物品(字条、电报、文件、照片、其他)、原备考记录(时间、内容、记录者)、案卷损害情况(虫蛀、霉变、字迹模糊、纸张粘连、破损等)抢修时间、抢修人员、案卷整理人员、整理时间、电子文档对应号、其他。

备考信息数据库可以导入全部案卷信息,也可以按照数字化的范围导入相关的案卷信息,这更加便于对本期数字化项目的质量监控。备考信息数据库需要配置一个简易的功能系统,便于信息的采集、录入、检索、查询。

某馆档案数字化整理情况的备考信息数据库应用案例:

1、错漏页码处置——实体档案备考表填写本卷共有多少张,错漏页码在第几张到第几张。扫描件按正确页码排列,同时备考信息进数据库,原始错漏的页码与扫描件重新编码的情况在备考信息管理系统中一目了然。但实际操作时,不需对原件重新敲码,不损伤原件。

2、档案缺损处置——是指内容明显缺少,但页码连续。在拆开扫描后重新装订时加空白页,注明内容缺页,属原始遗漏,同时在备考表写上,进备考数据库。

3、案卷内夹带物品处置——发现案卷内夹带照片,但卷内文件无任何说明,将照片取出另外集中存放,但将原案卷档号+夹在的具体页号作为照片命名,并在备考信息中记录。如果发现字条、电报或散开的文件与原案卷内容有关联,应原拆原放,但要加空白页固定夹带物。

4、涉及敏感信息处置——不扫描全文内容的档案,将原因记录到备考信息数据库,一旦今后利用全文不存在,自动连接备考信息记录。

建立备考信息数据库的意义:在馆藏档案数字化的进程中,不仅要对档案的内容通过扫描信息化,同时对档案鉴定、整理工作也需要信息化。其作用不仅提高档案鉴定、整理水平,而且更大限度地保护实体档案,甚至对档案的历史考证都有很大的价值。

关闭窗口