龙空技术网

做问卷调查时,你真的会选择样本吗?

人人都是产品经理 1146

前言:

此时你们对“置信度95对应的z”大体比较注意,姐妹们都想要知道一些“置信度95对应的z”的相关知识。那么小编在网络上搜集了一些对于“置信度95对应的z””的相关内容,希望咱们能喜欢,你们一起来了解一下吧!

编辑导语:问卷调查的作用主要是通过部分来推断整体情况,那么部分的选择就至关重要,选择的部分能否代表整体,决定了问卷调查的可靠性。本篇文章就从样本选择的角度出发,讲讲什么是样本框,如何进行抽样,以及如何确定最小的样本量。

一、抽样框

抽样框在抽样调查中处于基础地位,是抽样问卷调查必不可少的部分,其对于推断总体具有相当大的影响。

抽样框是用来代表总体,从中抽选样本的一个框架。具体表现形式可以是一个学生的花名册、工商企业名录等。例如:假设现在要调查全国32万所小学的学生家长对于国家“双减政策”的民意调查,从中选取出10所最具有代表性的小学,并从中抽取出10000名学生家长进行调查。

那么在这个例子中 ,总体是32万所小学的学生家长,抽样框是所选出的10所小学的学生家长名册,样本是最后抽取出的10000名学生家长。

当然抽样框也不定是具象的,也可能是抽象的,例如,在大型零售商场对购买者或消费者进行随机访问调查时,并没有具体的名册。

抽样框选取能否代表总体,直接决定了调研结果的可靠性。在我们的例子中选取10所学校家长需要能够代表全国32万所学校的学生家长,需要考虑的因素有很多,比如:收入因素、地域因素、宗教因素等等,因此在调研初期,根据调研的目的和主题尽可能确定准确的抽样框,从而减少调查的误差。

我们来看一个由于抽样框选取错误,而导致失败的案例:1936年美国总统选举民意测验。

1936年美国总统大选,竞选的是民主党的罗斯福和共和党的兰登。美国权威的《文学摘要》杂志社,为了预测总统候选人谁能当选,采用了大规模的模拟选举(他们以电话簿上的地址和俱车辆注册系统的地址发出1000万封信,收到回信200万封)。预测兰登将以57%对43%的比例获胜,并大力进行宣传。

最后选举结果却是罗斯福以62%对38%的巨大优势获胜。原因是在1936年的美国,富裕的家庭才有私人电话和汽车。为了挽救大萧条造成的经济打击,当时的罗斯福政府强行干预市场经济,从而在富人中普遍缺乏好感。

因此,《文学摘要》的调查样本不是从总体(全体美国选民)中随机地抽取,而是主要从富人的抽样框中抽取,这样的调查结果当然对罗斯福不利。

在问卷领域,最关注的是“代表性”,而非数量。因此在选取样本框时,一定要从多方面因素来考虑,从而避免选取出误差较大的样本框。

也许你想问,怎么才能知道自己的样本数据是否正确。 很遗憾的告诉你,没有办法,除非调查了全部的总体,才能准确的知道自己抽取的样本是否正确。 但是没有关系,误差是会永远存在的,我们需要做的是尽可能的减少误差,而不是消灭误差。

二、抽样方法

抽样是指从抽样框或总体中抽取出一部分数据作为样本的动作。抽样的方法有很多,介绍几种常见的抽样方法。

1. 简单随机抽样

一般的,设一个总体个数为N,如果通过逐个抽取的方法抽取一个样本,且每次抽取时,每个个体被抽到的概率相等,这样的抽样方法为简单随机抽样。适用于总体个数较少的。

2. 系统抽样

当总体的个数比较多的时候,首先把总体分成均衡的几部分,然后按照预先定的规则,从每一个部分中抽取一些个体,得到所需要的样本,这样的抽样方法叫做系统抽样。

3. 分层抽样

抽样时,将总体分成互不交叉的层,然后按照一定的比例,从各层中独立抽取一定数量的个体,得到所需样本,这样的抽样方法为分层抽样。适用于总体由差异明显的几部分组成。

4. 整群抽样

整群抽样又称聚类抽样。是将总体中各单位归并成若干个互不交叉、互不重复的集合,称之为群;然后以群为抽样单位抽取样本的一种抽样方式。应用整群抽样时,要求各群有较好的代表性,即群内各单位的差异要大,群间差异要小。

5. 多段抽样

多段随机抽样,就是把从调查总体中抽取样本的过程,分成两个或两个以上阶段进行的抽样方法。

系统、分层、整体、多段比较难实现,在问卷调查中经常被使用到的方法是简单随机抽样。

三、如何确定最小取样数量

样本量越大越好吗?样本量确实越大越好,样本越大越接近数据总体情况,但样本量越大同时也代表需要付出更多的人力和财力,所以往往出于现实因素的考虑,需要确定最少取样数量。最小取样数量公式如下:

n:样本量

标签: #置信度95对应的z