龙空技术网

数仓中什么是指标?什么是标签?别再傻傻分不清了

Jtao3212 118

前言:

眼前我们对“变量标签和变量值标签有什么区别”大概比较关心,大家都想要知道一些“变量标签和变量值标签有什么区别”的相关文章。那么小编同时在网络上收集了一些有关“变量标签和变量值标签有什么区别””的相关知识,希望你们能喜欢,同学们一起来了解一下吧!

什么是指标,什么是标签,可能大家都有一个简单的理解,但是最本质的区别在哪?如何识别呢?大家能清晰的表述清楚吗?今天就跟着我重新学习一遍吧,希望能对大家有所启发。

何为指标?

[心]指标是说明总体综合数量特征的概念,所有指标能用数值来表示,一个完整的统计指标,一定要附带好相应维度信息;

​[心]指标是生产性思维、拆解式思维,讲究的是化整为零,将事物分解开来进行多角度的描述,得到很多的指标;

​[心]指标最擅长的是监测、分析、评价;

​[心]指标是受业务管理导向的,需要提前规划,应用场景涉及较多。

何为标签?

​[心]标签是面向对象的一种属性。

​[心]指标是半成品,标签是成品,标签是指标进一步产品化的结果。

​[心]标签是合成性思维、聚合式思维,讲究的是化零为整,将多个分散的指标进行综合加工,得出概括性的结果。

​[心]标签是一种资源,可定价、可售卖的一种数据产品。

​[心]标签是应用导向的,跟随业务需求的而变化,随时增加。

​[心]标签主要应用在客户分群、用户画像、数据建模、数据可视化等方面。

标签分层

下面我们以一个具体例子讲解一下标签分层

1. 理解根目录、标签类目、标签、标签值四者的区别和联系,对标签体系就比较清晰了。下面是保险资产层级思考,可以对应数据中台架构设计思考。

2. 根目录指向标签所属的对象:根目录往往是一种较为模糊、宽泛、简单的名词或动名词,例如用户、购房者、酒店、浏览(记录)、交易(记录)、报修(记录)。在数据物理层面往往映射为某张大宽表中的主键,这张大宽表中的信息都是对该主键对象的详细刻画和数据记录:大宽表的列即映射为标签,大宽表的行记录则对应于具体的对象在各标签属性上的具体属性值记录。

3.类目是对标签的分类:客户标签可以分类为基本信息、地理位置、社交关系等,这些分类名也是类目名。一个类目及其所归类的标签在数据物理层面可以和某张具体表对应,例如“客户”对象的【基本信息】类目下,有“性别”“年龄”“籍贯”等多个标签,一般对应于客户数据库中的一张客户基本信息表,该表中会有“性别”“年龄”“籍贯”等多个字段。

4. 标签是对象的属性,颗粒度到字段级:“客户姓名”“客户电话”“客户居住地址”等字段粒度的属性就是“客户”对象的标签。标签往往由前后两个名词构成,前一个名词作为对象定语修饰后一个名词。标签一般对应于某数据库中某张数据表中的某字段。

5. 标签值是对象属性的具体取值:例如【小明】【小红】是“客户姓名”标签的标签值,【男】【女】是“性别”标签的标签值。标签值往往是形容词、名词或数字,一般对应于数据库中某张数据表中的某字段取值。标签值的取值类型可以是数值型、文本型、日期型、Key-value型,但主要为数值型。

结论

标签是对象的属性,一般到字段粒度,面向数据应用端,是资源,是资产,可定价、可售卖、可交易的一种数据产品,主要用在客户分群、用户画像等分析;

指标是可量化的,用数值表示的字段,面向业务管理,需要提前规划,擅长的应用是监测、分析、评价和建模;

标签: #变量标签和变量值标签有什么区别 #变量标签是什么