龙空技术网

图数据库--基本概念

cloudcoder 187

前言:

现时看官们对“网络数据库概念”可能比较重视,我们都需要剖析一些“网络数据库概念”的相关内容。那么小编在网摘上搜集了一些对于“网络数据库概念””的相关内容,希望姐妹们能喜欢,各位老铁们一起来学习一下吧!

随着社交、电商、金融、零售、物联网等行业的快速发展,现实社会织起了了一张庞大而复杂的关系网,亟需一种支持海量复杂数据关系运算的数据库即图数据库。本系列文章是学习知识图谱以及图数据库相关的知识梳理与总结

本文会包含如下内容:

图相关的基本概念图分区方案图数据库概念

本篇文章适合人群:架构师、技术专家、对知识图谱与图数据库感兴趣的高级工程师

1. 图数据表示模型

常见的图数据表示模型有两种,分别是RDF(Resource Description Framework)模型和属性图(Property Graph)模型。 RDF和Property Graph都是最基础、最有名的图表示模式,都能够表示各种图的实体关系建模。 RDF是W3C标准,而Property Graph是工业标准,受到广大图数据库厂商的广泛支持。

1.1 属性图

目前neo4j、hugegraph等主流图数据库,都是采用Property Graph。一个属性图是由顶点(Vertex)、边(Edge)、标签(Label)、关系类型和属性(Property)组成的有向图

顶点(Vertex):一般指实体。比如:人、账户等。

边(Edge):一般指顶点之间的关系。比如:朋友关系、转账动作等。

属性(Property):顶点或边可以包含属性,比如:人的姓名、人的年龄、转账的时间等

标签(Label): 指顶点、边或者索引的类型

在图形中,节点和关系是最重要的实体,所有的节点是独立存在的,为顶点设置标签,那么拥有相同标签的顶点属于一个集合;关系通过关系类型来分组,类型相同的关系属于同一个集合。关系是有向的,关系的两端是起始顶点和结束顶点,通过有向的箭头来标识方向,顶点之间的双向关系通过两个方向相反的关系来标识。顶点可有零个、一个或多个标签,但是关系必须设置关系类型,并且只能设置一个关系类型。

假设构造一个包括一个科研项目中不同合作者的属性图,如下图。顶点属性可能包含用户名和职业。边属性描述合作者之间关系

1.2 RDF图

RDF是语义网体系的基础技术。目前知识图谱普遍采用了语义网框架中RDF(Resource Description Framework,资源模式框架)模型来表示数据

RDF是W3C的语义网框架中的数据描述的标准,通常称之为RDF三元组<主体 (subject),谓词 (predicate),宾语(object)>。其中主体一定是一个被描述的资源,由URI来表示。谓词可以表示主体的属性,或者表示主体和宾语之间某种关系;当表示属性时,宾语就是属性值,通常是一个字面值(literal);否则宾语是另外一个由URI表示的资源

北京大学开源的gStore【】采用的是RDF图。

RDF图示例如下:

2. 图分区方案

对于分布式图数据库而言,图的分区存储方式有两种:分别是边分割存储(Edge Cut)和点分割存储(Vertex Cut),如下图所示。 使用Edge Cut方式存储图时,任何一个顶点只会出现在一台机器上,而边可能分布在不同机器上,这种存储方式有可能导致边多次存储。 使用Vertex Cut方式存储图时,任何一条边只会出现在一台机器上,而每相同的一个点可能分布到不同机器上,这种存储方式可能会导致顶点多次存储。

Vertex Cut:根据顶点进行切割,每个边只存储一次,只要是顶点对应的边会多一份该顶点的存储Edge Cut:根据边进行切割,以顶点为中心,边会存储两次,源节点的邻接列表存储一次,目标节点的邻接列表存储一次

采用EdgeCut分区方案可以支持高性能的插入和更新操作,而VertexCut分区方案更适合静态图查询分析,因此EdgeCut适合OLTP图查询,VertexCut更适合OLAP的图查询。

目前图数据库: HugeGraph目前采用EdgeCut的分区方案,Janusgraph在默认的情况下使用EdgeCut,而针对热点顶点可以通过配置makeVertexLabel('product').partition()来将顶点类型为product类型的顶点进行Vertex Cut

3. 什么是图数据库

图数据库是基于数学里图论的思想和算法而实现的高效处理复杂关系网络的新型数据库系统。

图形数据库善于高效处理大量的、复杂的、互连的、多变的数据,计算效率远远高于传统的关系型数据库。

目前图形数据库在社交网络、实时推荐、征信系统、人工智能等领域有着广泛的应用

社交领域:Facebook, Twitter,Linkedin用它来管理社交关系,实现好友推荐零售领域:eBay,沃尔玛使用它实现商品实时推荐,给买家更好的购物体验金融领域:摩根大通,花旗和瑞银等银行在用图数据库做风控处理汽车制造领域:沃尔沃,戴姆勒和丰田等顶级汽车制造商依靠图数据库推动创新制造解决方案电信领域:Verizon, Orange和AT&T 等电信公司依靠图数据库来管理网络,控制访问并支持客户360酒店领域:万豪和雅高酒店等顶级酒店公司依使用图数据库来管理复杂且快速变化的库存4. 图数据库排名

在上,根据图数据库的受欢迎情况,排名如下:

标签: #网络数据库概念 #网络数据库概念是什么