龙空技术网

Excel作为一种强大的数据挖掘工具,数据分析是做什么的

Excel自力更生 1496

前言:

此时姐妹们对“spss clementine”大概比较关切,看官们都想要学习一些“spss clementine”的相关知识。那么小编在网络上网罗了一些有关“spss clementine””的相关知识,希望咱们能喜欢,朋友们一起来了解一下吧!

生活中有许多数据,那数据分析是做什么的呢?面对浩繁数据的时候,仅仅依靠人类的大脑和双手无法从这些庞大的数据中获得宝贵的信息。即便可以,如果没有任何科学依据。也不能从中找出有效信息。因此,融合了统计技术和IT技术的“数据挖掘”便应运而生。

起初,数据挖掘紧跟“One to One”或“CRM(Customer RelationshipManagement)”的潮流,主要用于分析顾客行为、开发新客户、预测新产品和库存管理等,尤其被期待能够应用于市场营销领域。因此,逐渐出现了把顾客数据和poS数据存储到数据库(Data Warehouse) (下图)的方法:

通过搭配使用数据库(Data warechouse)和数据挖掘,相关人员从市场营销领域获得了许多有效信息、知识、假设和课题。近年来,这种 方法还被广泛地应用于财务、质量管理、医疗、科学研究等众多领域。

在进行实际的数据挖掘时,首先应该做什么准备?数据挖掘工具(道具)有S-PLUS、SAS、SPSS等各类软件和专业应用软件。在美国,把数据挖掘工具称为Siftware,大约有两百多种。在这些众多软件中,既包含具有综合性功能的软件。还包含具备强大单一功能的软件。例如,IBM的Intelligence Mining,SAS公司的EnterpriseMiner,SPSS公司的Clementine,数理系统股份公司的VMS(Visual Mining Studio).都是具有综合性功能的软件,而SPSS公司的Answer Tree,则是采用决策树预测理论的Siftware。

在简单了解了数据分析是做什么的之后,简单给初学者说几句重要的话,其实初学者完全没必要掌握复杂的操作,也不需要具备高深的专业知识,更下需花费高额费用。日常使用的Excel就是一款卓越的数据挖掘工具。让我们一起学习Excel吧!根据数据挖掘的目的、数据性质、规模和预算等情况,选择适当的工具完成工作。

数据挖掘的目的是什么呢?我们总结数据挖掘主要有以下三个目的:

(1)把握趋势和模式;通过分析网购交易的记录数据、呼叫中心内的投诉数据、顾客满意度的调查数据、购物数据等,可以把把握顾客的购买意愿和类型、投诉的种类等信息。数据挖掘工具(方法)中神经网络、购物篮分析,粗糙(Rough)集、对应分析(双尺度法)、主成分分析、聚类分析等。

(2)预测;利用数万个数据进行预测,最有效的方法是神经网络法,它是具有强大功能的工具,即使数据是非线性关系也无妨。伹缺点是,需要大量数据并且因子分析的功能弱。利用数十个、数百个数据进行预测(和因子分析)的方法有回归分析、判别分析、逻辑回归分析、数量化理论I、数量化理论II等,另外,预测时间序列数据的方祛有灰色理论、最近邻法、霍尔特(Holt)法、指数平滑法、移动平均祛、博克斯-詹金斯(Box-Jenkins)法(ARIMA模型)、数量化理论I等。

(3)求最优解。在多种约束条什下,要实现利益最大化或者成本最小化,应该怎样求解参数(未知参数)呢?使用Excel的规划求解可以轻松地解决这个问题。

这三点就是数据挖掘的主要目的,希望对您对数据挖掘的认识有所帮助。

普遍认为Excel是一种“表格计算软件”,实际上,它还兼具了数据挖掘工具和数据库的功能,是非常实用的用excel学数据挖掘的软件。接下来我们会循序渐进地介绍用excel挖掘数据的操作工具和分析方法.

Excel作为一种强大的数据挖掘工具,具备以下五大功能:①函数、②图表、③数据分析、④数据透视表、⑤规划求解。

为什么说上述功能是“数据挖掘工具”呢? 下面分别介绍各自的功能并说明与数据挖掘之间的关系。

一、Excel中的函数

每人不断地存储在电脑中的数据,不能直接分析,需要进行“统计和分析处理”。数据挖掘之前,需要求出数据的平均值、总和、最大值、最小值。开始挖掘之后,为厂得到更深层的结果,还需要“统计”和“分析”。能够有效地进行“统计和分析处理”的是“函数”.Excel大约有350种函数,根据统计和分析的目的以及数据的性质,灵活使用不同的函数.

二、Excel中的图表

数据挖掘的重要方法之一是“数据可视化”。它不是把每一个数据都罗列出来,而是通过可视化,采取一目了然的表现形式。通常这样可以得到新的、有价值的结果.将数据可视化,毋庸置疑,“图表”是首选方法。做演讲时,图表更是不可或缺。Excel的“绘图工具”支持许多功能,非常实用。

Excel有70多种图表,常用的有:a、柱形图 b、折线图 c、散点图 d、直方图 e、帕雷托图(如下图):

想必许多读者在日常工作中都使用过“函数”和“图表”,但是有多少人知道下面的三种功能呢?特別是“ ”和“规划求解”,根据安装Excel时的不同设置,很多情况下并不会自动显示在菜单栏中。通过操作“加载宏(添加初始设置时未包含的功能)”,可以大幅提高数据挖掘和统训分析的功能。

三、Excel中的数据分析

数据挖掘工具有S-PLUs、SAS、SPSS等多种软件和专业应用程序。使用这些软件吋,需要具备一定的专业技术,还要负担一些费用。与此相反,Excel的“数据分析”对于数据挖掘的初学者而言,是一款操作简单而且实用的 分析工具。

Excel小编不知道Excel具备“数据分析”功能时也使用其他软件,但是,自从知道并了解它的便利性、实用性之后,为了普及数据挖掘和数据分析,在研究班课程或咨询业务中都使用它。

四、Excel中的数据透视表

Excel可以将表格中的数据转换成“数据透视表”。数据透视表又叫“交叉表”。交叉表是把数据“分层”的表。数据挖掘时“分层”也是非常重要的一环。例如,分析销售数据时,从性別、年龄、星期、天气等不同的角度进行分析,通常能够得到非常有趣的结果。但是,每次改变角度时都需要修改表格数据,非常麻烦。使用菜单栏的“数据”→“数据透视表和数据透视图”,就能方便地制作分层表。点击鼠标,可以方便地切换分析的角度。另外,双击交叉表内单元格中的数字,还可以显示该数字详细的数据(下表)。

五、Excel中的规划求解

规划求解(下图),简单地说就是“线性规划法程序”,包括线性规划法,非线性规划法和整数规划法.打开“线性规划法’,读者可能会觉得难以操作。“规划求解”是在多种约束条件(公式化)下,为了使目标变量最大(最小)而求解未知数(也叫参数)的工具,使用范围非常广泛。

曾任职于日本东京理科大学的芳贺教授说:“Excel的‘規划求解’具有强大的功能。今后通过改进使用方法,估计统计学教程也需要大幅修改!”

以前,为了求解逻辑斯蒂曲线和龚伯兹曲线等生长曲线的参数,例如在逻辑曲线中求解y=a/[l+b exp(-cx)]的a、b、c时,Excel网小编曾经使用过S-PLUS。后来才知道可以用规划求解计算。

最近,规划求解也被应用于计算协方差分析等程序,其应用范围不断扩大。从趋势上看,选择用excel学数据挖掘是个明智之举,使用规划求解极有可能促进神经网络早日实现。规划求解是实现数据挖掘的目的求最优解的代表工具。

标签: #spss clementine