龙空技术网

数据挖掘中的关联分析

一辰的游乐场 511

前言:

目前我们对“数据关联分析实验报告”大体比较珍视,看官们都想要剖析一些“数据关联分析实验报告”的相关资讯。那么小编同时在网摘上汇集了一些有关“数据关联分析实验报告””的相关知识,希望咱们能喜欢,各位老铁们快快来学习一下吧!

关联分析是数据挖掘中的一种任务,用于发现隐藏在大型数据集中的令人感兴趣的联系。所发现的联系可以用关联规则或频繁项集的形式表示。

一、关联规则定义

关联规则:是形如X->Y的蕴涵表达式,其中X和Y是不相交的项集。

描述关联规则的强度指标

支持度:确定规则在给定数据集的频繁程度。

置信度:确定Y在包含X的失误中出现的频繁程度。

两个子任务:频繁项集生成、规则生成。

二、实例

辛苦宝宝了,又把你贴出来

购物篮数据示例

1.{面包,牛奶}

2.{面包,尿布,啤酒,鸡蛋}

3.{牛奶,尿布,啤酒,可乐}

4.{面包,牛奶,尿布,啤酒}

5.{面包,牛奶,尿布,可乐}

可提取出如下规则:

{尿布}->{啤酒}

该规则表明,尿布和啤酒之间存在着很强的联系,因为许多购买尿布的顾客也购买了啤酒。零售商们可以使用这类规则,帮助他们发现新的交叉销售机会。

聪明的小伙伴一定发现了{面包}->{牛奶}这一规则支持度也很高,但这样规则是常见的、价值不高的,分析的意义不大。

所以:应当小心解释关联分析的结果。由关联规则做出的推论并不必然蕴涵因果关系,它只表示规则前件和后件中的项明显地同时出现。另一方面,因果关系需要关于数据中原因和结果属性的知识,并且通常涉及长期出现的联系。

三、用途

除了购物篮数据外,关联分析也可以应用于其他领域,如生物信息学、医疗诊断、网页挖掘和科学数据分析等。例如:在地球科学数据分析中,关联模式可以揭示海洋、陆地和大气过程之间的有趣联系。这样的信息能够帮助地球科学家更好地理解地球系统中不同的自然力之间的相互作用。

关注一辰君,获取更多有趣有用的知识。

标签: #数据关联分析实验报告 #数据关联分析实验报告怎么写