龙空技术网

ISO/EC11179元数据注册标准|非结构化数据

DGBOK数字行者 53

前言:

今天朋友们对“isodata算法流程图”大约比较关注,你们都想要了解一些“isodata算法流程图”的相关资讯。那么小编在网上收集了一些关于“isodata算法流程图””的相关资讯,希望看官们能喜欢,小伙伴们一起来学习一下吧!

·12.1.3.3.ISO/EC11179元数据注册标准ISO的元数据注册表标准ISO/IEG11179提供了定义元数据注册的框架,它旨在基于数据的精确定义从数据元素开始,启用元数据驱动的数据交换。该标准由几个部分组成:

→1.第1部分:数据元素的生成和标准化框架;

→2.第2部分:数据元素的分类(补充内容);

→3.第3部分:数据元素的基本属性;

→4.第4部分:制定数据定义的规则和准则;

→5.第5部分:数据元素的命名和识别原则;

→第6部分:数据元素的注册8106;

→第6部分:数据元素的注册12.1.3.4.非结构化数据的元数据。

常用函数及函数性质考察就其性质而言所有数据都有某种结构,尽管并非所有数据都是在关系型数据库的熟悉的行业和记录中正式构造的,任何不在数据库或数据文件中的数据(包括文档或其他媒体)都被视为非结构化数据(请参阅第914章)。

元数据对于非结构化数据的管理与对结构化数据的管理一样重要,也许更重要。再想想章节介绍中的卡片目录类比图书馆中的书籍和杂志,是非结构化数据的良好示例。卡片目录中元数据的主要用途是检索要查找的材料无论其格式是什么。

非结构化数据的元数据包括:

·1.描述元数据如目录信息和词典关键字;

·2.结构元数据如标签字段结构格式;

·3.管理元数据如来源更新计划访问权限和导航信息;

·4.书目元数据如图书馆目录条目;

·5.记录保留元数据如保留政策;

·6.保存元数据如存储归档条件和保护规则。(请参阅第9章)虽然大多数关于非结构化数据元数据的主张都与传统的内容管理问题有关,但围绕管理数据湖中的非结构化数据出现了新的实践。

希望利用数据湖(使用Hadoop等大数据平台)的组织发现,必须对引入的数据进行编目以便以后进行访问,大多数都采用收集元数据作为数据摄取的部分流程,需要收集一组关于数据湖中摄取的每个对象的最小集合的元数据属性名称格式来源版本接收日期等),这将生成数据湖内容的目录。

·12.1.3.5.元数据的来源从元数据类型中应该清楚,元数据可以从许多不同的来源收集。

此外如果应用程序和数据库的元数据管理良好,则只需收集并集成元数据即可。然而,大多数组织在应用程序级别管理元数据方面表现欠佳,因为元数据通常是应用程序处理的副产品而非作为最终产品创建的(即它不是在考虑消费者的情况下创建的)。与其他形式的数据一样,在集成元数据之前,准备元数据需要花费大量的工作。大多数操作元数据都是在数据处理时生成的,使用元数据的关键在于以可用的形式收集它,并确保负责解释它的人拥有所需的工具。

请记住,在错误日志本身等地方解释数据时,也需要描述日志的元数据。同样,可以从数据库对象中获取大部分技术元数据,也可以对现有系统的数据进行逆向工程,以获得数据知识并从现有数据字典、模型和流程文档中获取业务元数据(Loshin2001,Aiken1995)。但是,这样做有一定的风险。最大的风险在于,如果定义不完善或模棱两可,则它们将无法为数据消费者提供所需的信息。因此,有必要意识到需要开发定义,并且需要使用适当的技能集(例如写作和简化技能)来开发业务元数据。

·数据建模过程需要讨论数据元素的含义及其之间的关系,应收集和整理此类讨论期间共享的知识,以便用于数据字典、业务术语表等存储库。

·数据模型本身包含有关数据、物理特性的重要详细信息,应分配时间以确保项目包含符合企业标准的高质量元数据。

·定义良好的业务元数据可以在项目之间重用,可以促使一致地了解业务概念,并有助于避免重复工作。

·作为有意开发元数据以重用元数据的一部分,组织还可以规划元数据的集成。

·组织可以开发系统清单,并使用相同的系统标识符对与特定系统相关的所有元数据进行标记。

大多数组织不会为此类工作提供资金,即使这样做也不太可能实施维护流程。

因此,有必要开发支持整体质量的工具,将其创建为定义明确的过程的产品,并确保有流程来维护与这些流程相关的元数据。

管理专员和其他数据管理专业人士应确保有流程来维护与这些流程相关的元数据。

如果组织从其数据模型中获取关键元数据,则应确保有一个变更管理流程来保持模型最新。

为了了解任何组织中元数据的广度,可以按字母顺序而不是优先级顺序列出一系列来源。

标签: #isodata算法流程图