前言:
此时同学们对“判断是否为无偏估计量”大概比较关注,我们都需要了解一些“判断是否为无偏估计量”的相关资讯。那么小编也在网摘上网罗了一些关于“判断是否为无偏估计量””的相关文章,希望我们能喜欢,兄弟们一起来了解一下吧!要理解估计量的无偏性、有效性、一致性首先必须知道什么是估计量。
初识估计量
通俗辨析就是:
估计量相当于一个已知参数的模型,将数据代入模型计算出来的结果。
上述解释是从'大局观'上去理解,是不是还是很迷糊,下面具体看看什么是估计量
再识估计量
估计量作用就是估计数据中的一个特性,例如:均值、方差、标准差、模型待估参数等等。
为什么引入估计量?在现实生活中,我们要了解一种数据背后的规律时,难免要对所有符合条件的数据,在数据量大、人力资源有限的情况下了解数据背后的规律就变得困难了,于是就有了样本估计量,从抽样数据中最大程度上的估计出总体数据特性。
说白了就是由样本特性推断总体特性--这个特征的代数式就叫估计量
常见的估计量:
均值
方差
估计量有了,伴随的问题也就来了,抽样时随机的,多次抽样数据会有多个估计值,要确定一个估计量的好坏,就不能仅仅依据某次抽样的结果来衡量,而必须由大量抽样的结果来衡量。于是我们就要立规范(无偏性、有效性、一致性)
无偏性
估计量在样本环境下的期望值等于整体环境下的期望值(此时的估计量才是无偏的)
在上述我们给定的场景下,无偏性就要求样本均值估计量的数学期望等于总体均值
证明
无偏性的直观理解:
无偏性建立在多次抽样环境下才能发挥其作用价值,某些场合无偏性的作用没有实际意义(后文解释)。
有效性
如果一个总体参数有两个无偏估计量时,此时只进行了两次抽样,那么估计时该选择那个估计量的值呢?
这个时候有效性就发挥了作用,选择办法就是选择方差小的那个估计量的值。
例如:以下两次抽样中,第一次抽了10个样本数据,第二次抽了10个样本数据,这时他们的估计量有可能分别是下面两种:
此时这两个估计量都是无偏的(估计量的期望值都是U),但是M2的方差小于M1。那么在只抽两次的样本环境下,自然选择方差小的估计量是最合适的。
注意点:针对少量抽样案例中,无偏性作用发挥不大,应当加上估计量的有效性一起判断,选择方差比较小的。因为无偏性是建立在多次抽样的环境下的理想型判断指标。
小案例综合理解无偏性、有效性
你和一家饲料厂长期合作,每月订购一大批猪饲料,由于你人数精力有限,每次订购时随便抽出几袋猪饲料,取其均值后乘以总订购袋数,以此方式来计算总订购饲料的重量,这样大家都觉得公平。为什么去样本均值公平呢呢?两点原因:
1、样本均值是总体均值的无偏估计;
2、也是很重要的一个因素,长期合作。
长期合作意味着多次取样,在多次取样的基础上,均值的无偏性价值才能发挥出来(因为多次合作过程中,总有估计值离真实值偏差远的,也总有近的,多次无偏取样会使得估计的总重量在真实重量上下波动,所以你不吃亏,商家也不吃亏)
若是单次合作,此后不再有交易进行,这时双方就没有公平性可言,没人敢只合作一次,直接取样本均值来估计总体均值(除非是百年老店啊),此情况的估计误差不存在相互补偿,所以即使样本均值是无偏的,但是偏离真实值过大,无偏性在这里发挥的作用就没有那么有效了。
一致性(相合性)
在一个已经明确估计量表达式的情况下,我们将样本容量逐渐增多,随着样本容量的增大,估计量值若总是在真实值周围波动,没有逐渐接近真实值趋势,这个时候该估计量就不满足一致性。
一致性要求在样本容量逐渐增大的情况下,其估计量的值是要越来越接近真实值
例1:无偏一致:方差无偏估计量在在样本了增大情况下(n增大,估计值越越接近真实值)
例2:有偏一致:方差有偏估计量在在样本了增大情况下(n增大,估计值越越接近真实值)
若样本量足够大,尽管是有偏估计量也是可以选的,因为大样本量环境下满足一致性
结语:
判断一个估计量“好坏”,至少可以从无偏、有效、一致三个方面来考虑:
扩展:
1、对于无偏性而言,当抽样次数非常之多时,也就是抽样次数趋于无穷大时,估计量的期望才是真实值得期望的话,这种无偏估计还有另一个名字:渐进无偏估计(有偏一致)
2、估计量的期望值与整体的期望值之间的差称为:系统误差,无偏估计的另一个实际意义就是 消除系统误差。
3、无偏估计不一定存在,即使存在也不一定唯一,而且无偏估计有时并不是一个好的估计。
4 、有效性(样本组数量无限增大,长期合作)、一致性(样本容量无限增大)、渐进无偏(样本组数量无限增大)
首发地址: 公众号:数据与编程之美
历史好文:
最小二乘估计参数为什么使用残差平方和?
概率和统计是一回事么?
极大似然估计原来很简单
标签: #判断是否为无偏估计量 #怎么判断是否为无偏估计量 #怎么判断无偏估计 #怎么判断无偏估计量哪个最有效 #如何判断无偏估计量最有效