龙空技术网

使用Python的seaborn 包做出波士顿矩阵图,改善店铺销售水平

外星人玩Python 1112

前言:

现时你们对“二维矩阵模型怎么做”大约比较关切,你们都想要知道一些“二维矩阵模型怎么做”的相关知识。那么小编在网摘上汇集了一些关于“二维矩阵模型怎么做””的相关知识,希望你们能喜欢,各位老铁们一起来了解一下吧!

此系列文章收录在公众号中:数据大宇宙 > 数据可视化 > py

转发本文并私信我"python",即可获得Python资料以及各种心得(持续更新的)

江湖流传一句话:"字不如表,表不如图",在 Python 中数据可视化有许多选择,但是大多数的库在语法简洁与灵活度不能平衡,本系列将探讨数据探索时如何使用合适的数据可视化库完成工作。

本系列或多或少涉及一些 pandas 的骚操作(网上很难看到相关的资料),其并非可视化的重点,不会多做讲解。

一切技巧与应用,尽在 pandas 专栏中:

前言

不管是在数据探索还是报告阶段,数据可视化都是一个非常有用的工具。今天我们来看看如何使用四象限图(波士顿矩阵图),为店铺销售员分门别类。本系列我将尽可能使用不同的工具制作。

计划中的工具:

Python 的 seabornPython 的 altair (能做出动态图,这是目前能比较方便做出图表之间联动的库)Python 的 plotly (能做出动态图,这是一个非常容易学习的库,前提是找到正确的思路)Power BITablueaExcel

今天的主角是 seaborn

为什么需要介绍多个 Python 的可视化库?因为它们各有特点,而且我不喜欢太复杂的东西,总是在找一个最简单的可视化库。这也是我为可视化专栏做的准备工作

导入包代码如下:

用你的分析能力,提供改善建议

某商品销售店铺某天的订单数据:

每一行记录表示,某订单的信息(单价多少,数量多少,是哪位销售员负责)日期列不重要,因为我们只分析一天的数据

每位销售员接待客人的记录:

每个销售员接待的人数

现在你要根据这些数据,得到这些问题的答案:

换掉其中某几位员工(意味着裁员),应该裁掉谁?从中选出某一位员工,对其他员工进行培训和销售技能分享。应该选谁分享,哪些人需要被培训?分析指标

如果我们只是根据简单的销售数量或销售额:

这些指标不足以看出问题。在零售领域中已经有许多被证明有效的统计指标,今天我们将使用其中2个指标:

客单价:能反映每个顾客的质量,这其实与大环境因素(店铺位置,商品组合等)有关,也能反映销售能力。成交率:这就能直观反映销售员的能力

假设大环境元素相对固定的情况下,我们就可以使用以上指标分析销售员的水平

如何用 pandas 得到这些指标不是本文重点,反正一顿骚操作如下:

行5-9:其中的 pd.NameAgg 需要 pandas 0.25 或以上的版本才能使用

虽然得到2个重要的指标,但你能通过数据看出啥吗?

不容易吧。因为人对数字的变化不是很敏感。

但是,人对位置却极其敏感。

接下来,我们不妨把数值的差异在位置上展现出来。

散点图加点料

有2个数值指标,刚好对应二维图表的xy轴,于是很容易想到的是使用散点图:

对于 seaborn 来说,散点图是数据关系可视化的一种,rel 实际是 relationships 的缩写relplot 是一个图形级别的函数(意味着我们能使用他做出多种或一次性多个图表的复合图表),用它能做出多种不同的图像,默认情况下是散点图(参数 kind='scatter')

现在能大致看出这些销售员的能力位置!

但这还不够,因为还不能直观看出来哪些处于平均水平以下或以上。

那么,就在2个指标上各自加上一个均值线:

使用 matplotlib 能简单画出直线行2:plt.axvline 画出垂直线(v 是 vertical 的缩写),自然地,需要在第一个参数中指定该线穿过 x 轴的那个点行3:plt.axhline 画出横线(h 是 horizontal 的缩写),自然地,需要在第一个参数中指定该线穿过 y 轴的那个点

现在还缺点东西,在图上看不出那些点是哪位员工。

把销售员名字加上:

行2:通过 relplot 返回的对象的 axes[0] 中包含多个图表,由于现在我们只是画出简单的一个图表,因此通过索引 0 即可获取其中的图表对象(Axes)行4-6:遍历数据,通过 ax.text 就可以在图表上写字。前2个参数分别是 x,y 的位置,第3个参数是文本内容

这就是四象限图,它有如下特点:

按2个指标以及指标的均值线,把平面划分出4个代表不同能力的区域一般情况尽可能使得2个指标越大表示越有优势,这样右上区域就是优秀水平,左下区为次等水平

现在可以回答文章开头的问题:

员工D是最差劲的,A和H同样如此,但是H的成交率距离均值线不远(可以考虑留下考察)员工C在2项指标都高于平均水平,并且他的成交率是最高的,可以让他对B/G/F/H 做有关提高成交率的销售培训员工E在客单价方面很低(只推销低端商品),此时可以考虑让F对其培训员工B应该是最有潜力的员工总结

seaborn 一般需要配合 matplotlib 才能做出比较复杂的图表。因此,了解 matplotlib 的对象层次是一个比较关键的学习方式。

标签: #二维矩阵模型怎么做