抽样是统计学应用中最重要的技术,抽样的方式分类如下:

  • 概率抽样:

    • 简单随机抽样
    • 整群抽样
    • 多阶段抽样
    • 分层抽样
    • 系统抽样
  • 非概率抽样

    • 方便抽样
    • 自愿抽样
    • 配额抽样
    • 判断抽样
    • 滚雪球抽样

下面来逐一介绍这些抽样方法。

概率抽样(probability sampling)

概率抽样,就是遵循随机原则。特点如下:

  • 按照一定概率,以随机原则抽取样本
  • 每个单位被抽中的概率是已知的,或者是可以被计算出来的
  • 具体分为概率抽样等概率抽样

简单抽样(simple random sampling)

抽样框

首先,要理解一个概念,抽样框:对可以选择作为样本的总体单位列出名册或者排序编号,以确定总体的抽样范围。也叫 抽样结构或者 抽样框架。举个例子:

  • 抽样框为门牌号,则抽样总体为住户
  • 抽样框为学号,则抽样总体为学生
  • 抽样框为企业名录,则抽样总体为企业

定义

简单抽样定义:从总体为$N$个单位(元素)的抽样框中,随机地一个一个地抽取$n$个单位作为样本,使得总体中的每个都有相同的机会(概率)被抽中。

类别

简单随机抽样细分为两种:

  • 重复抽样:有放回抽样
  • 不重复抽样:无放回抽样

可以证明,这两种抽样,对于每个样本被抽中的概率都是相同的。

优缺点

优点:

  • 简单随机抽样简单直观,在抽样框完整的时候,可以直接从中抽取样本。
  • 用样本统计量对目标量进行估计比较方便,比如假设检验、参数估计 都是基于 简单随机抽样

缺点:

  • 当样本数$N$比较大时,不容易构造抽样框
  • 抽出的单位分散,给实施调查增加了难度
  • 没有利用其它辅助信息以提高估计的效率

分层抽样(stratified sampling)

定义

分层抽样定义:将总体按照某种特征或者某种规则划分为不同的层,然后从不同的层中独立、随机地抽取样本

优缺点

优点:

  • 分层抽样可以保证样本的结构与总体的结构比较接近,从而提高估计的精度
  • 既可以对总体参数进行估计,也可以对各层的目标量进行估计
  • [应用统计学观点]组织实施调查比较方便

整群抽样(cluster sampling)

定义

整群抽样定义:将总体中若干个单位合并为组(群), 抽样时直接抽取群,然后对选中的群中的所有单位全部进行调查。

优缺点

优点:

  • 在抽样的时候,只需要群的抽样框就OK了,可以极大地简化工作量
  • 选中的地方相对集中,节省调查费用,与调查的实施。

缺点:

  • 估计的精度比较差

系统抽样(systematic sampling)

定义

系统抽样定义:将总体中的所有单位按一定顺序排列,在规定的范围内随机地抽取一个单位作为初始样本,然后按事先规定好的规则确定其他样本单位。

比如:先从数字$1$到$k$中随机抽取一个数字$r$作为初始单位,然后依次选取$r+k,r+2k,...$等单位。

优缺点

优点:

  • 操作简便,可以提高估计的精度

缺点:

  • 对估计量的方差估计比较困难,理论上不太完备

多阶段抽样(multi-stage sampling)

定义

多阶段抽样定义:首先抽取群,但并不是调查群内的全部单位,而是再进一步抽样(可以多个阶段)

可以看出,多阶段是 分层抽样 与 整群抽样 的有机结合

优缺点

优点:

  • 保证了样本相对集中,降低了调查费用
  • 不需要包含所有低阶段抽样单位的抽样,适用于更广泛的抽样调查

非概率抽样

定义

在抽取样本的时候,不是依据随机原则,而是根据研究目的对数据的要求,采用某种方式从总体中抽出部分单位对其实施调查。

非概率抽样有如下特点:

  • 简便易行,节省费用
  • 估计往往是有偏差的
  • 不具有推断总体的作用

非概率抽样有如下几种:

方便抽样(convenience sampling)

定义

方便抽样定义:调查过程中,由调查员依据方便原则自行确定入样单位

优缺点

优点:

  • 容易实施,调查成本低

缺点

  • 样本单位带有随意性,调查结果不能推广到总体

判断抽样(judgement sampling)

定义

研究人员根据经验、判断,有目的地选择单位作为样本

类别

判断抽样分为多种,包括:

  • 重点抽样:比如随堂考试,要尽量选成绩差的几个重点户进行调查;
  • 典型抽样:当分析学生为什么成绩差的时候,肯定不需要选优秀生,而是选差生进行调查;
  • 代表抽样:选择可以代表目标的样本,如果奶粉生产商要调查婴儿奶粉的喜好情况,肯定是要调查婴儿的父母,而非婴儿自身;

特点

  • 主观性比较强,样本质量取决于经验
  • 成本比较低,容易操作
  • 结果不适合用于推断总体样本

自愿抽样(volunteer sampling)

定义

被调查者自愿参与调查

特点

  • 与随机性无关,结果是有偏的
  • 结果不能用于推断总体
  • 适用于反应某类群体的一般看法

滚雪球抽样( sampling)

定义

先选择一组调查单位,对其调查后,再请他们提供另一些属于研究总体的调查对象,调查人员根据线索,进行此后的调查……类似滚雪球

特点

  • 容易找到特定的群体,成本低

配额抽样(quota sampling)

定义

首先将总体中的所有单位按一定的标志分为若干类,然后在每个类中用方便抽样或者判断抽样的方式选取样本

特点

  • 操作方便,可以保证总体中不同类别的单位都能包含在所抽样本中
  • 可以按单一变量控制抽样,也可以按照交叉变量控制抽样,可以保证样本的分布更均匀。

比较

  • 概率抽样与非概率抽样区分在与是否遵循随机原则
  • 概率抽样通常可以根据样本结果推断总体,而非概率抽样则反之
  • 非概率抽样的其他特定:操作简便、时效快、成本低,适合探索性研究或预备性研究,调查结果用于发现问题
  • 分层抽样与整群抽样有明显的区别:分层抽样要求 群内差异越小越好,群间差异越大越好;而整群抽样则希望 群内差异越大越好,群间差异越小越好

学习交流:
微信:ElijahMingLiu
Wechat

最后修改:2021 年 06 月 01 日 02 : 18 PM
如果觉得我的文章对你有用,请随意赞赏