龙空技术网

从两大流派看“迁移(Migration)”的含义

数字罗塞塔计划 108

前言:

目前小伙伴们对“数据迁移是迁移什么”大体比较看重,大家都想要学习一些“数据迁移是迁移什么”的相关资讯。那么小编同时在网摘上收集了一些对于“数据迁移是迁移什么””的相关内容,希望看官们能喜欢,小伙伴们一起来学习一下吧!

关注我们 - 数字罗塞塔计划 -

笔者在梳理历史上曾经出现过的数字资源长期保存技术措施时,总结出一共八种技术措施(详见《数字资源长期保存技术概览(上)》和《数字资源长期保存技术概览(下)》):计算机博物馆(系统保存)、风干、更新、再生性保护、仿真、标准化(格式转换)、封装、迁移,如下图所示:

但在考证其中“迁移(Migration)”的范围和含义时却碰到了两大流派不一样的说法,今天就来聊聊这个话题。

1、流派一

我们先来看看业界影响力极高的ISO 14721:2012《空间数据和信息传输系统 开放档案信息系统(OAIS) 参考模型》,在1.7.2 TERMINOLOGY(术语)中对于“Digital Migration(数字迁移)”的定义如下:

Digital Migration: The transfer of digital information, while intending to preserve it, within the OAIS.

数字迁移:在OAIS中出于保存目的而执行的数字信息转移活动。

这个描述比较笼统,说明不了什么问题。

我们接着再看ISO 14721在5.1.3关于“迁移类型(Migration Type)”的描述,标准原文如下:

这里就很清楚了,ISO 14721将迁移类型分为两大类一共四种:

01 不改变数字信息的比特流

a) Refreshment(更新):相同类型载体之间的数据拷贝,用新载体替换旧载体;

b) Replication(复制):相同或者不同类型载体之间的数据拷贝(比如将硬盘数据刻录到光盘上)。根据定义,更新可以认为是复制的一种特殊情况。

02 改变数字信息的比特流

a) Repackaging(重新封装):对数字信息进行重新打包,显然会改变其中的封装信息;

b) Transformation(转换):为了实现数字信息长期保存而采取的变更数字信息内容的方式,比如格式转换或者ASCII码和Unicode之间的转换。

总体而言,ISO 14721将迁移的范围定义得很大,覆盖了数据迁移、载体迁移、系统迁移、格式迁移等,甚至还包括重新封装。由于ISO 14721超强的影响力,人大2017年8月出版的《电子文件管理教程(第二版)》第七章“电子文件的保存”中关于“迁移”的描述也沿袭了这一流派:“从迁移对象上看,迁移可分为硬件迁移、操作系统迁移、应用系统迁移、文件格式迁移和载体迁移等”。

2、流派二

下面,我们再来看看另一个有一定影响力的国际标准ISO 13008:2012《数字档案转换和迁移过程》,在3 Terms and definitions对“迁移(Migration)”进行了明确定义:

迁移:在不改变格式的情况下将数字档案及其属性从一个软硬件配置转移到另一个软硬件配置的过程。注意前提是“不改变格式”!

按照以上定义我们可以认为,ISO 13008:2012中的“迁移”的范围包含了数据迁移、系统迁移,应该包含了载体迁移,但肯定不包含格式迁移。

属于这一流派的还有中国档案行业标准DA/T 58-2014《电子档案管理基本术语》,其中对于“迁移(Migration)”进行了如下定义:

显然,这一定义和ISO 13008:2012高度一致,可以说是一脉相承。

3、总结

对于这两大流派,笔者更倾向于后者,即ISO 13008中的定义,即“迁移(Migration)”的范围包含了数据迁移、系统迁移和载体迁移,但不包含格式迁移和重新封装。如果按照ISO 14721中的说法,迁移的范围就太广了,本文开头的八大技术措施中,“更新”、“封装”、“标准化(格式转换)”都可以被归入其中。

数字资源长期保存是数字罗塞塔计划项目的核心研究内容。数字罗塞塔计划是由杨安荣博士联合国内知名投资机构发起的一项利用蓝光存储、数字胶片、玻璃存储等技术,旨在解决电子档案乃至数字资源长期保存的国产化替代科技攻关工程项目,以实现“保存社会记忆,传承人类文明”的最终目标。

END

关注我们 - 数字罗塞塔计划 -

标签: #数据迁移是迁移什么