龙空技术网

数字零售时代的淘金者丨大数据从业人员的文武之道

亿欧网 129

前言:

如今兄弟们对“pathon编写遗传算法”大约比较看重,兄弟们都需要了解一些“pathon编写遗传算法”的相关资讯。那么小编也在网上搜集了一些有关“pathon编写遗传算法””的相关知识,希望同学们能喜欢,兄弟们一起来学习一下吧!

从读书时代一名数据的狂热爱好者,到大数据的传道授业解惑者,再到当今新零售浪潮中向大数据要价值的从业者,在我多年和大数据打交道的过程中,我见到过无数的大数据从业人员:大数据首席科学家、大数据分析师、大数据经理、大数据可视化人才等等,同时我也指导过很多学生和企业员工走上了这条被《哈佛商业评论》称之为“二十一世纪最性感的职业”的坎坷而又光明之路。

一名合格的大数据从业人员,要有能力分析现在的商品和运营情况,使用商业技巧和科学技术对于内部与外部的数据进行调查和挖掘,并且结合严密的完整商业思考及严密逻辑推理,得出针对业务好坏的结论,找出改善目前商业分析实践的方法得出业务改进的策略,并由此把握商业机遇做出更好的决策。这就要求了数据从业人员要有“文武”兼备的本领和能力。

大数据从业人员的“文”

不少人认为大数据从业人员就是学数学、统计学或者IT技术的,而这个以男性居多的行业中不少人把自己就定位是个“理工男”。但往往给我留下深刻印象的“内功深厚”的大数据从业人员,则往往是跨专业、跨学科的,并且在不同领域有着丰富的工作和人生阅历,有的甚至有管理学、市场学、心理学、社会学、人口学、营销学等背景。

这些跨界而又复杂的经历其实就是显示了他们对于各个不同领域的“好奇心”,他们渴望向来自不同领域问题深入探索,并且有能力建立起关联关系,最终找出问题的心脏所在。这种追根朔源的精神本后本质上就是联想发散的思维方式,最具备创造精神的大数据从业人员都具备这种思维方式。

数据分析从另外一个角度讲其实就是对人或者群体行为、思想以及人性洞察和探究的过程,也就要求了数据分析师能够做到换位思考,对数据分析的诉求、目的、痛点有准确和深刻的认识,然后善于同感共情,并且很有见地的透过现象看到问题的本质,不仅要有要有宏观思考能力,看到大格局的能力,同时从微观讲要从消费者和具体业务的立场出发,有良好业务感觉与业务判断能力。

数据分析的过程其实也是个反复交流、解释、反馈、洞察的过程,这个过程和形形色色的人打交道必不可少的,因为数据从业人员一定要有能力处理好人际关系,因此良好的沟通能力是一个重要基础,这其实也就是有能力让利益相关者都能够理解的语言来讲述数据自身和背后的故事,而且还要让他们真正的接受。

因为有的人不明白数据价值将信将疑;有的人对数据心怀抗拒,恐怕大数据夺去了自己饭碗;有的人则循规蹈矩,不愿意让大数据的力量打破自己多年的习惯。这些其实都是大数据分析过程中必不可少的沟通、教育、协调、甚至是抗争和妥协的过程。

大数据从业人员还要大力培养自己的人格魅力,这其实也是众多从业人员所需要加强的。专业技能经过学习和培养总是能够学会的,并且总是“这山望着那山高”,而大数据分析的独特风格和视角将是独一无二的。

如同一个顶级的数据科学家所说:我越是见到越多的数据,越多的模式,我越是尊重数据,敬畏数据背后的动因,这就促使我要了解和数据有关故事的来龙去脉,然后再去真正的用技术手段去分析,而不是轻易的跑模型得出结论。

大数据从业人员的“武”

大数据从业人员的“武”其实也就是专业过硬的技术实力。他们要熟悉统计、数学和预测建模技术,也要具备建立必要算法的能力,能提出正确的问题并有方向和能力找到正确的答案,同时还要了解数据分析应用产品是如何开发出来的,他们的教育背景如果来自于统计学、应用数学、工程学、计量经济学、生物统计学、物理学、计算机科学等,那将是个很好的基础。

以下则是他们要熟悉的学科领域:

机器学习:使用计算机开发和改善算法

统计分析:了解和突破模型中的可能限制

预测建模:能够预测未来的结果

概念建模:能够描述、沟通和分享模型

关联分析:通过联系和序列分析能够找到关联关系

聚类分析:能够将物体、事件和概念分类到类别集群中去

自然语言处理:计算机和人类之间交互的能力

假设验证:能够发展假设并用实际结果进行验证

因此对于以上学科的相关算法的了解就成了数据分析的基本功:决策树、人工神经网络、支持向量机、KNN、GA、贝叶斯、线性/非线性回归、ANN、回归树、SVM、Holt Winter、自回归法、ARIMA、演绎算法、随机森林、K-Means、近邻传播-AP聚类、谱聚类、遗传算法、蚁群算法、粒子群等等。

当然,一名出色的大数据从业人员还要会编程,并且最好会多种程序语言,Pathon、R、Java、Matlab、Ruby、Pig、SQL等,同时能了解Hadoop、Rapidminer、Hive、Rapidminer等将会让他们的视野更加宽广。假如要从事大数据的可视化相关工作的话,那就需要深入了解该领域的编程语言以及新型的可视化框架比如Gephi、Processing等

除了“文武之道”,我还想特别强调大数据从业人员的道德责任感,因为他们所掌握的数据都是消费者个人的隐私和企业的商业机密,高度保守机密、杜绝对于自己手中所掌握的原始数据和分析结果的滥用则成为大数据从业人员的一项基本素养,这也是我培养和认可大数据从业人员的第一准则。

标签: #pathon编写遗传算法