(1)档案扫描的基本要求
档案扫描应根据纸质档案原件实际情况、数字化目的、数字化规模、计算机网络和存储条件等选择相应的扫描设备,和进行相关参数的设置和调整。参数的设置和调整应保证扫描后数字图像清晰、完整、不失真,图像效果最接近档案原貌。
(2)扫描设备的选择
① 应特别注意对档案实体的保护,尽量采用对档案实体破坏性小的扫描设备进行数字化。纸张老旧、薄脆、破损的,不得使用高速扫描仪进行扫描。② 超出所使用扫描仪扫描尺寸的档案可采用更大幅面扫描仪进行扫描,也可以采用小幅面扫描仪分幅扫描后进行图像拼接的方式处理。分幅扫描时,相邻图像之间应留有足够的重叠,并且采用标版等方式明确说明分幅方法;若后期采用软件自动拼接的方式,重叠尺寸建议不小于单幅图像对应原件尺寸的1/3。③ 应遵循相关设备的使用规律进行定期维护、保养。· 档案数字化 | 数字化扫描设备如何选择?
(3)扫描色彩模式
① 宜全部采用彩色模式进行扫描。② 扫描的电子图像色泽、亮度、饱和度需要和档案实体原件基本保持一致。③ 扫描图像不得出现档案实体原件没有的异常颜色。
(4) 扫描分辨率
一般,纸质档案的扫描分辨率采用300 DPI。照片档案、文字密集的档案、珍贵档案可以使用600 DPI或更高的分辨率。· 档案数字扫描分辨率的设置要求
(5)存储格式
① 纸质档案数字图像长期保存格式为TIFF、JPEG等通用格式,同一批档案应采用相同的存储格式。② 图像压缩率的选择可根据实际应用的需求而定。一般,A4幅面档案图像文件容量大小控制在500KB至1.5MB之间,A3幅面档案图像文件控制在500KB至2MB之间。③ 纸质档案数字图像利用时,也可从网络浏览速度、易操作性、存储空间占用等方面进行综合考虑,将图像转换为PDF等其他格式。· 档案数字化对图像文件的存储格式有什么要求?
(6)图像命名
① 应以档号为基础对数字图像命名,确保图像命名的唯一性。② 建议将数字图像存储为单页文件,并按档号与图像流水号的组合对图像命名。
以“卷”为保管单位的档案
以“档号”+“.”+“扫描页顺序号”+“图像后缀名”的形式命名,扫描页顺序号一般采用三位阿拉伯数字。如:
J001-WS·1999-Y-0001-001.001.tif
J001-WS·1999-Y-0001-001.002.tif
以“件”为保管单位的档案
以“档号”+“.”+“扫描页顺序号”+“图像后缀名”的形式命名,扫描页顺序号一般采用三位阿拉伯数字。如:
J001-WS·2012-Y-0001.001.tif
J001-WS·2012-Y-0001.002.tif
③ 数字图像确需存储为多页文件时,可采用该档案的档号对图像命名。如:
J001-WS·1999-Y-0001-001.pdf
J001-WS·2020-Y-0001.pdf
④ 用“档号”的组成项来分类存储数字资源,确保数据挂接的准确性。《归档文件整理规则》规定归档文件档号的结构宜为:
全宗号-档案门类代码·年度-保管期限-机构(问题)代码-件号
如:J011-WS·2020-Y-BGS-0001
那么,存储路径就可以是:
\全宗号\档案门类代码\年度\保管期限\机构(问题)代码\档号
即 \J011\WS\2020\Y\BGS\J011-WS·2020-Y-BGS-0001
《档号编制规则》提供的按卷整理档案(税务稽查档案)档号编制示例
全宗号-档案门类代码·二级类别号·三级类别号·年度·保管期限
示例:J019-ZY•JC•CC•2019•D30-001-001
说明:J019为全宗号,ZY为档案门类代码(专业档案),JC为二级类别号(税务稽查),CC为三级类别号(查处类),2019为年度,D30为保管期限代码,001为案卷号,001为件号。
那么,存储路径就可以是:
\全宗号\档案门类代码\二级类别号\三级类别号\年度\保管期限\案卷级档号\文件级档号
即 \J019\ZY\JC\CC\2019\D30\J019-ZY•JC•CC•2019•D30-001\J019-ZY•JC•CC•2019•D30-001-001
在使用档号的组成项来分类存储数字资源时,可以按照档号的组成项先后顺序来分类存储,也可以根据实际工作情况进行调整,但是作为一个档案门类,一定要能够统一标准。· 档案数字化应该选择什么样的存储路径· 档案数字扫描分辨率的设置要求· 纸质档案数字化扫描图像文件夹和图像文件如何命名