前言:
目前小伙伴们对“样本均值算法”都比较着重,看官们都需要剖析一些“样本均值算法”的相关知识。那么小编也在网络上搜集了一些对于“样本均值算法””的相关知识,希望各位老铁们能喜欢,小伙伴们一起来学习一下吧!使用Excel来统计一组样本的均值、标准差,并计算落到某个区间的样本的个数。
然后用Excel绘制图形来直观的显示结果,最后的图形如下:
除了用柱状图显示落在某个区间的样本个数,还可以在图中叠加一个当前均值和标准差下的正态分布曲线,来显示实际样本统计结果与正态分布的相似度程度。
如何用Excel来做这些统计的事情呢?
1 把统计样本输入Excel
比如有y1, y2 两组数,计算他们的差别y2-y1
2 用Excel计算均值和标准差
2.1 均值使用公式AVERAGE
计算E这一列的所有数值的均值就用公式 =AVERAGE(E3:E14)
2.2 标准差使用公式 STDEVP
计算E这一列的所有数值的标准差就用公式=STDEVP(E3:E14)
3 统计区间样本数
3.1 区间划分
区间划分是以均值mean和标准差sigma为基准,围绕mean,以一个sigma为一个区间
3.2 计算区间边界点的值
在步骤2计算出了mean和sigma的值之后,这些区间边界点的值就只是简单的加减和乘,如图所示
3.3 统计区间内的样本个数
统计区间样本数要使用SUMPRODUCT这个公式
统计mean-0.5sigma~mean+0.5sigma区间的样本个数就是:
=SUMPRODUCT((E3:E14>=E20) * (E3:E14<E21))
其中E3:E14就是样本数据的那一列的所有数据
E20就是mean-0.5sigma
E21就是mean+0.5sigma
这样统计之后的表格就是:
4 绘制图表
4.1 在Excel中制作这样一个表格
除了统计好区间的样本个数,
笔者还添加了另外一栏,就是计算当前的mean和sigma下各个区间中间点的正态分布概率密度
具体方法请参考笔者之前在头条号写文章:
【如何用Excel来绘一个函数的曲线 - 今日头条 - 今日头条】
4.2 把表格转化成图表
在这里,要把表格的两栏分别转化成柱状图和折线图,需要使用到插入组合图
点击插入,组合图,点击组合图的第二个
点击插入后:
然后调整一下样式就是这样: