龙空技术网

拿到一份数据,如何去做数据分析呢?

POINT小数点数据 239

前言:

今天各位老铁们对“获取数据的途径教案高中”都比较注重,朋友们都需要剖析一些“获取数据的途径教案高中”的相关文章。那么小编在网络上收集了一些对于“获取数据的途径教案高中””的相关内容,希望朋友们能喜欢,我们快快来了解一下吧!

点点说在前面:

本篇文章的作者来自数据分析pointer同时从事教育行业B端产品的Daisy,她做过CRM系统、题库教案系统、BI系统,目前在往数据产品方向在发展。作者结合目前所学,分为什么是、如何做和具体制作步骤向大家展示数据分析的完整过程,堪称保姆级指南,同样作为新手的你相信认真阅读完后一定能够有所收获!

文章来自公众号:特立独行喵

前言

我们的生活中无处不在产生数据,我们使用手机后被记录的操作数据、我们浏览各个网站的时间、内容等、我们在某个网站购物品类、金额、时间等等、我们出行到达的地方乘坐的车次等等。

数据虽然很多,但是如果没有合理的被应用那么就会无意义。

因此我们会发现我们在淘宝、抖音、今日头条、微博等平台时会发现千人千面的个性化内容等等都是通过数据分析做出选择的体现。

工作中我们总是被要求要有数据思维、要用数据去说话去决策等等,越来越多的工作岗位JD上也是要求应聘者要会数据分析,会数据分析这个技能对打工人来说也越来越重要。

—1—那什么是数据分析呢?

数据分析是指用适当的统计分析方法对收集来的大量数据进行分析,将它们加以汇总和理解并消化,以求最大化地开发数据的功能,发挥数据的作用。数据分析是为了提取有用信息和形成结论而对数据加以详细研究和概括总结的过程。

数据分析的使用场景一般有3种:描述性分析、诊断性分析、和预测性分析。

描述性分析一般是基于现有的数据根据对应的指标体系去评估目前业务发展的情况是否健康正常;诊断性分析一般是发现数据异常后,去分析背后的逻辑,从而去定位和解决问题;预测性分析一般是基于过去的数据结合实际情况去预测未来的数据,比如一般企业在定指标预算时、或零售行业库存备货时使用的比较多;

—2—那如何去做数据分析呢?

刚好我最近参加了小数点数据分析课程的学习,最近在完成课程毕业大作业过程中有一些感触,于是想写一篇文章对自己所学内容做一下梳理和总结。

毕业大作业内容是:给我们提供一份数据,根据这份数据输出分析报告

我们一般是因为某个问题才想要去看看数据做做分析,因为数据分析的本质是为了协助解决问题

所以在拿到大作业的数据后,我们需要确定是为了解决什么问题而做的分析,也就是数据分析的目标。但是因为我们的大作业是没有给出问题的,需要自己去定义问题,所以就需要先了解下数据有哪些信息。

我拿到的这份数据是一些投资机构在1999-2016年的投资事项,包括各个投资事项的年份、投资金额、投资回报率、行业等信息。

2.1 拿到数据后对数据进行清洗

我们可以对数据清洗下,处理那些垃圾数据、无用数据,我根据数据纬度将数据字段分成了3类:机构信息(黄色)、项目信息(绿色)、投资详情信息(橙色)

我大概的看了下数据后基于这些数据我可以得到哪些信息:

在同一个行业,哪个机构回报率更高?哪个城市的投资项目最高?投资金额最高?投资回报率最高?机构成立的越久投资回报率是否越高?是否发展更好的城市的项目回报率更高?哪个行业投资金额最高?回报率更高?哪个投资机构投资的钱最高?回报率最高?有哪些项目有多轮投资及多个投资机构都投了?投资回报率是一直以来的投资回报率? 投资回报率=公司利润/投资金额如果我是某某投资项目负责人,有多家投资机构要投资,我要选择谁?需要定义一个分析的时间;

2.2 在了解数据的大致信息后就需要确定分析目标

然后此时我要基于这些信息去定义一个分析目标了,我选择的角度是:如何给与想要创业的小明同学一些建议,关于如何去选择获得投资金额和投资回报率都不错的城市和行业?

2.3 接下来确定分析纬度

确定分析纬度是根据你的分析目标你要哪些纬度的数据做支撑能得出对应的结论。基于上面的分析目标,我会从如下分析纬度去分析:

从投资机构纬度去分析哪些行业的投资金额和回报率高、哪些省份/市的投资金额和回报率高;从投资行业纬度去分析哪些行业的投资金额和回报率高、哪些省份/市的投资金额和回报率高;从省份/市纬度去分析哪些行业的投资金额和回报率高(因这个纬度与上面有重复,故不用重复分析看哪些城市行业回报率更稳定、风险更低;

2.4 接下来就是分析工具的选择

一般情况下我们使用Excel 的数据透视表和vookup函数可以分析出大部分内容,如果需要做可视化图表等现在比较火的第三方工具如Power BI、Tableau都非常不错,我目前使用的第三方工具是Tableau。

工具其实没有高低之分,只要适合自己的能达到分析目的就是好的

—3—数据图表的制作

工具选择好了后就是数据分析图表的制作,这里就不一一赘述了,如果对工具操作不熟练的话可以去网上找一些视频学习就好了。

3.1 形成分析报告

最后就是将分析的结果用PPT展示出来,然后给业务方或者领导去讲解,一般我们是基于某个问题去分析数据、去辅佐做决策解决问题,所以在分析报告中要将分析的结论及建议等告知对方,且分析的结论是怎么得出来的一定要有实际的数据依据来证明。

另数据分析报告内容需要告诉大家项目背景、分析目标、数据分析的过程和结论几部分,这样便于查看的人了解整个项目背景内容和过程。

需要注意的点:

在得出结论前多考虑有没有特殊情况没想到,且得出的结论需要结合用户的背景等实际情况;如果对方根据建议等调整了,后续还需去验证调整后的数据是否和之前的结论相符,这样整个流程的验证能更加保证数据分析的准确性.最后

最后提醒下在拿到数据后需确认用来分析的数据选取的原则是否符合如下3个:

数据是否真实性、数据是否足够大、数据是否能代表总体

比如我拿到的大作业数据,我去IT桔子上看了一些数据,发现在这些年份内还有一些其他机构也投资了一些项目但是在表格里却没有这些数据,那么就需要考虑选取数据分析的数据源是否覆盖全面了,因为数据的选取会对我们的分析结果产生很大的影响甚至会得出相反的结论,所以这个点非常重要。

END

深圳10.16-10.17 我们不见不散^_^

北京11.20-11.21 我们不见不散^_^

标签: #获取数据的途径教案高中