龙空技术网

用茎叶图分析数据,中位数、平均数、标准差一目了然!

三乐大掌柜 699

前言:

如今你们对“如何确定中位数所在组中的位置”大体比较关注,看官们都需要剖析一些“如何确定中位数所在组中的位置”的相关内容。那么小编也在网络上搜集了一些对于“如何确定中位数所在组中的位置””的相关知识,希望小伙伴们能喜欢,你们一起来学习一下吧!

茎叶图是一种显示原始数据分布状况的图形,由“茎”和“叶”两部分组成。茎叶图不仅能反映数据的分布特征,还能保留原始数据的信息。茎叶图适用于未分组的定量数据,特别是当数据量较少时。

要绘制茎叶图,首先要把一个数字分成两部分,通常以该数据的高位数值作为树的“茎”,树的“叶”只保留该数值的最后一位数字。例如,425分为42|5,42为“茎”,5为“叶”。然后,按照“茎”的大小顺序排列,并把对应的“叶”列在“茎”的右边。如果某个“茎”对应的“叶”过多,可以将该“茎”重复一次或多次,以便观察数据的细节。

下面是一个茎叶图的例子:

 8| 0 10| 0 10| 123456789 11| 0123456789 11| 0123456789 12| 0123456789 12| 0123456789 12| 56789 13| 0123456789 13| 0123456789 13| 123456789 14| 0123456789 14| 0123456789 14| 0123456789 14| 56789

这个茎叶图表示了一组8-20岁年龄的调研样本。从图中可以看出,每个“茎”代表10个年龄段,每个“叶”代表一个样本。例如,第一行表示有一个8岁的样本,第二行表示有一个10岁的样本,第三行表示有10个10岁的样本,依此类推。

从图中还可以看出,数据的分布大致呈对称形状,没有明显的极端值或异常值。我们可以用一些统计量来描述数据的分布特征,如中位数、平均数、标准差等。

中位数是将数据从小到大排列后位于中间位置的数值。如果数据个数是奇数,则中位数就是中间那个数;如果数据个数是偶数,则中位数就是中间两个数的平均值。在茎叶图中,可以通过计算每个“茎”对应的“叶”的频数来确定中位数所在的位置。例如,在上面的例子中,共有150个样本,所以中位数应该在第75和第76个样本之间。从图中可以看出,第75个样本是13岁,第76个样本也是13岁,所以中位数就是13岁。平均数是将所有数据相加后除以数据个数得到的数值。在茎叶图中,可以通过将每个“茎”乘以主干宽度(即每个“茎”代表多少个单位),再加上每个“叶”的值来计算每个样本的具体数值。然后将所有样本的数值相加,并除以样本个数来得到平均数。例如,在上面的例子中,主干宽度是10,所以第一个样本的数值是80(8乘以10加上0),第二个样本的数值是100(10乘以10加上0),依此类推。将所有样本的数值相加得到13200(80+100+101+…+145),再除以样本个数150得到平均数88(13200除以150)。标准差是衡量数据离散程度的一个指标,它反映了每个数据与平均数之间的偏差大小。标准差越小,说明数据越集中在平均数附近;标准差越大,说明数据越分散在平均数两侧。在茎叶图中,可以通过计算每个样本与平均数之间的差值(即残差)来得到标准差。然后将所有残差平方相加,并除以样本个数减一来得到方差。最后再开方来得到标准差。例如,在上面的例子中,第一个样本与平均数之间的残差是-8(80-88),第二个样本与平均数之间的残差是12(100-88),依此类推。将所有残差平方相加得到11400(-8(2+12)2+…+57^2),再除以149得到方差76.51(11400除以149)。最后再开方得到标准差8.75(76.51开方)。

标签: #如何确定中位数所在组中的位置 #如何确定中位数所在组成的数据 #数据离散程度怎么看