浙江省省直单位档案电子文件登记备份非涉密数据脱机报送技术要求 |
浙档函〔2012〕8号 为统一浙江省省直单位档案电子文件登记备份非涉密数据(以下简称登记备份数据)脱机报送的数据组织、划分、存储等方面操作规范,便于报送、受理、检查、保管等环节的操作,确保档案电子文件登记备份工作顺利进行,特制定本要求。 1 报送批次确定 登记备份数据报送时应根据数据类别(指数字化成果、电子公文、业务数据或其他电子文件,下同)、时间属性、保管期限等因素合理确定报送批次,各批次分别填写有关纸质报送材料。 1.1 报送批次划分 立档单位的数字化成果可按归档年度、档案类型(指文书档案、科技档案、专业档案等,下同)予以划分,若数据量大,可按归档年度、档案类型、保管期限予以划分。重点工程的数字化成果一般以项目为单位予以划分。 电子公文可按归档年度予以划分,若数据量大,可结合归档年度、保管期限予以划分。 电子业务数据可按业务系统、备份时间予以划分。 CAD图纸、音视频文件等其他电子文件可结合其内容和时间予以划分。 1.2 报送批次编号 每一批次的登记备份数据应具有唯一的报送批次编号。报送批次编号的命名规则为:全宗号(或单位编号,或单位名称)—年度(指登记备份报送年度)—数据类别代码—本年度同类别内批次顺序号,其中,数据类别代码对应关系如下:
例如,某单位2012年电子业务数据进行第二次登记备份,报送批次编号为:J101—2012—003—002。 2 数据整体结构 相同数据类别、不同报送批次的登记备份数据应具有相同的整体结构。以数字化成果为例,单页扫描所形成数字化成果的数据整体结构如图一所示:
图一
多页扫描所形成数字化成果的数据整体结构如图二所示: 图一、图二中,带双引号的“数字化成果(单页扫描)”、“数字化成果(多页扫描)”、“说明文件”、“目录文件”、“图像文件”等表示是固定文件夹名。“数据说明”是对本批次数字化成果数据的一个总体描述,具体包括全宗号(或单位编号)、单位名称、年度、档案类型、色彩模式、分辨率、总件数、总页数等项目。“目录文件”文件夹里可存放一个或多个DBF目录文件,其中有且仅有一个DBF文件作为与图像文件形成挂接关系的主目录。“图像文件”文件夹里应存放均与主目录DBF相挂接的有效图像。 电子公文、电子业务数据和其他电子文件登记备份数据的数据整体结构参照数字化成果要求并结合各自的数据特点确定。 3 数据分包结构 3.1 数据划分 数据划分是指将一个报送批次数据整体划分成若干个数据单元的过程。这种划分是对众多文件在文件数量上的划分,而不对某一单个文件进行文件切割。考虑到异质保存需要和校验码计算时间耗费,目前要求每一单元的容量一般不超过4GB。具体按以下几种情况进行处理: (1)若总数据量不超过4GB,则不进行数据划分,直接将数据整体作为一个单元; (2)若总数据量超过4GB,并且其中每个数据文件大小均不超过4GB,则应将数据整体合理划分为若干单元,每个单元大小均不超过4GB; (3)若总数据量超过4GB,并且其中有单个数据文件大小超过4GB,则将每个大小超过4GB的文件分别作为一个单元,其余部分合理划分为若干不超过4GB的单元。 数据划分要求:每一单元中的数据文件须保持原始数据整体结构中的相对路径;每一单元之间数据文件不重复、不遗漏,容量相对均匀;各单元中的数据直接拷贝、合并在一起后应与原始数据相同;数字化成果中,“说明文件”和“目录文件”部分容量较小,应分入第一单元,“图像文件”部分可以放在之后。 3.2 数据打包 数据打包应采用通用的RAR或ZIP格式的压缩软件,为提高打包速度,可选择“存储”、“最快”等合适的压缩方式。 数据打包以数据划分后形成的各个单元或者不必划分的数据整体为操作对象。每个操作对象均形成一个RAR或ZIP数据包文件,数据包文件的命名规则为:报送批次编号—批次内顺序号。 对形成的每个数据包文件需要计算MD5校验码,并在相应纸质报送材料上记录该码值。 4 载体介质选择 脱机报送的数据存储载体介质可以选用光盘、U盘、移动硬盘等,各单位可以根据数据量、耗材成本、复制时间等因素自行选择。选用光盘应符合《浙江省档案局关于规范使用档案登记备份光盘的函》(浙档函〔2011〕10号)规定要求。 5 数据存放要求 数据脱机报送的存储载体介质中直接存放经过打包形成的数据包文件,而不直接存放原始数据文件或原始数据单元。一个报送批次内的所有数据包文件经过解包、归并后应与原始数据文件相同。 通常一张光盘里只存放一个数据包,U盘、移动硬盘等便携式磁介质里可存放一个或多个数据包。 6 病毒检查 档案登记备份的原始数据文件及数据包文件均应通过病毒检查,确认无病毒后方可报送。 |