抽样是统计学应用中最重要的技术,抽样的方式分类如下:
概率抽样:
- 简单随机抽样
- 整群抽样
- 多阶段抽样
- 分层抽样
- 系统抽样
非概率抽样
- 方便抽样
- 自愿抽样
- 配额抽样
- 判断抽样
- 滚雪球抽样
下面来逐一介绍这些抽样方法。
概率抽样(probability sampling)
概率抽样,就是遵循随机原则。特点如下:
- 按照一定概率,以随机原则抽取样本
- 每个单位被抽中的概率是已知的,或者是可以被计算出来的
- 具体分为概率抽样与等概率抽样
简单抽样(simple random sampling)
抽样框
首先,要理解一个概念,抽样框:对可以选择作为样本的总体单位列出名册或者排序编号,以确定总体的抽样范围。也叫 抽样结构或者 抽样框架。举个例子:
- 抽样框为门牌号,则抽样总体为住户
- 抽样框为学号,则抽样总体为学生
- 抽样框为企业名录,则抽样总体为企业
定义
简单抽样定义:从总体为$N$个单位(元素)的抽样框中,随机地,一个一个地抽取$n$个单位作为样本,使得总体中的每个都有相同的机会(概率)被抽中。
类别
简单随机抽样细分为两种:
- 重复抽样:有放回抽样
- 不重复抽样:无放回抽样
可以证明,这两种抽样,对于每个样本被抽中的概率都是相同的。
优缺点
优点:
- 简单随机抽样简单、直观,在抽样框完整的时候,可以直接从中抽取样本。
- 用样本统计量对目标量进行估计比较方便,比如假设检验、参数估计 都是基于 简单随机抽样
缺点:
- 当样本数$N$比较大时,不容易构造抽样框
- 抽出的单位分散,给实施调查增加了难度
- 没有利用其它辅助信息以提高估计的效率
分层抽样(stratified sampling)
定义
分层抽样定义:将总体按照某种特征或者某种规则划分为不同的层,然后从不同的层中独立、随机地抽取样本
优缺点
优点:
- 分层抽样可以保证样本的结构与总体的结构比较接近,从而提高估计的精度
- 既可以对总体参数进行估计,也可以对各层的目标量进行估计
- [应用统计学观点]组织实施调查比较方便
整群抽样(cluster sampling)
定义
整群抽样定义:将总体中若干个单位合并为组(群), 抽样时直接抽取群,然后对选中的群中的所有单位全部进行调查。
优缺点
优点:
- 在抽样的时候,只需要群的抽样框就OK了,可以极大地简化工作量
- 选中的地方相对集中,节省调查费用,与调查的实施。
缺点:
- 估计的精度比较差
系统抽样(systematic sampling)
定义
系统抽样定义:将总体中的所有单位按一定顺序排列,在规定的范围内随机地抽取一个单位作为初始样本,然后按事先规定好的规则确定其他样本单位。
比如:先从数字$1$到$k$中随机抽取一个数字$r$作为初始单位,然后依次选取$r+k,r+2k,...$等单位。
优缺点
优点:
- 操作简便,可以提高估计的精度
缺点:
- 对估计量的方差估计比较困难,理论上不太完备
多阶段抽样(multi-stage sampling)
定义
多阶段抽样定义:首先抽取群,但并不是调查群内的全部单位,而是再进一步抽样(可以多个阶段)
可以看出,多阶段是 分层抽样 与 整群抽样 的有机结合
优缺点
优点:
- 保证了样本相对集中,降低了调查费用
- 不需要包含所有低阶段抽样单位的抽样,适用于更广泛的抽样调查
非概率抽样
定义
在抽取样本的时候,不是依据随机原则,而是根据研究目的对数据的要求,采用某种方式从总体中抽出部分单位对其实施调查。
非概率抽样有如下特点:
- 简便易行,节省费用
- 估计往往是有偏差的
- 不具有推断总体的作用
非概率抽样有如下几种:
方便抽样(convenience sampling)
定义
方便抽样定义:调查过程中,由调查员依据方便原则自行确定入样单位
优缺点
优点:
- 容易实施,调查成本低
缺点
- 样本单位带有随意性,调查结果不能推广到总体
判断抽样(judgement sampling)
定义
研究人员根据经验、判断,有目的地选择单位作为样本
类别
判断抽样分为多种,包括:
- 重点抽样:比如随堂考试,要尽量选成绩差的几个重点户进行调查;
- 典型抽样:当分析学生为什么成绩差的时候,肯定不需要选优秀生,而是选差生进行调查;
- 代表抽样:选择可以代表目标的样本,如果奶粉生产商要调查婴儿奶粉的喜好情况,肯定是要调查婴儿的父母,而非婴儿自身;
特点
- 主观性比较强,样本质量取决于经验
- 成本比较低,容易操作
- 结果不适合用于推断总体样本
自愿抽样(volunteer sampling)
定义
被调查者自愿参与调查
特点
- 与随机性无关,结果是有偏的
- 结果不能用于推断总体
- 适用于反应某类群体的一般看法
滚雪球抽样( sampling)
定义
先选择一组调查单位,对其调查后,再请他们提供另一些属于研究总体的调查对象,调查人员根据线索,进行此后的调查……类似滚雪球
特点
- 容易找到特定的群体,成本低
配额抽样(quota sampling)
定义
首先将总体中的所有单位按一定的标志分为若干类,然后在每个类中用方便抽样或者判断抽样的方式选取样本
特点
- 操作方便,可以保证总体中不同类别的单位都能包含在所抽样本中
- 可以按单一变量控制抽样,也可以按照交叉变量控制抽样,可以保证样本的分布更均匀。
比较
- 概率抽样与非概率抽样区分在与是否遵循随机原则
- 概率抽样通常可以根据样本结果推断总体,而非概率抽样则反之
- 非概率抽样的其他特定:操作简便、时效快、成本低,适合探索性研究或预备性研究,调查结果用于发现问题
- 分层抽样与整群抽样有明显的区别:分层抽样要求 群内差异越小越好,群间差异越大越好;而整群抽样则希望 群内差异越大越好,群间差异越小越好。
学习交流:
微信:ElijahMingLiu