卡方分布

卡方分布是 Abbe 于 186年提出的,后又由 Hermert 和 Pearson 分别推导出来。

卡方分布是,设:

$$ X \sim N\left(\mu, \sigma^{2}\right) $$

则:

$$ z=\frac{X-\mu}{\sigma} \sim N(0,1) $$

令$Y=z^2$,则$Y$服从自由度为1的$\chi ^{2}$分布。

$$ Y \sim \chi^{2}(1) $$

当总体$X \sim N\left(\mu, \sigma^{2}\right)$,从中抽取容量为$n$的样本,则:

$$ \frac{\sum_{i=1}^{n}\left(x_{i}-\overline{x}\right)^{2}}{\sigma^{2}} \sim \chi^{2}(n-1) $$

自由度是$n-1$因为均值占用了一个自由度。

可以看到,$\chi^2$分布在不同自由度下形状不同,自由度越低,右偏越严重;自由度越高,越接近对称的正态分布。

$\chi^2$分布的期望和方差分别为:$E(\chi^2)=n,D(\chi^2)=2n$。

T分布

T分布也称学生分布,T分布能解决小样本量的这些问题,T分布的定义如下:

设随机变量$X \sim N(0,1)$,$Y\sim \chi^2(n)$,则:

$$ t=\frac{X}{\sqrt{Y / n}} $$

假设,$X_{1}, X_{2}, \cdots, X_{n}$是来自正态分布的样本,

$$ \overline{X}=\frac{1}{n} \sum_{i=1}^{n} X_{i}\\ S^2=\frac{1}{n} \sum_{i=1}^{n}\left(X_{i}-\overline{X}\right) $$

则:

$$ \frac{\sqrt{n}(\overline{X}-\mu)}{S} \sim t(n-1) $$

F分布

F分布是由Fisher提出的,所以以其命名。

设$U$为服从自由度为$n_1$的$\chi^2$分布,$V$为服从自由度为$n_2$的$\chi^2$分布,且$U$和$V$相互独立,那么构造一个新的统计量$F$,则:

$$ F=\frac{U / n_{1}}{V / n_{2}} $$

称$F$为服从自由度$n_1$和$n_2$的$\chi^2$分布:

$$ F\sim F(n_1,n_2) $$

不同自由度的$F$分布图片如下:

设$X\sim F(m,n)$则:

$$ \begin{align} &E(X)=\frac{n}{n-2}, n>2\\ &D(X)=\frac{2 n^{2}(m+n-2)}{m(n-2)(n-4)}, n>4\\ &F\text{分布}P\text{分位数}F_{p}\left(v_{1}, v_{2}\right)\\ &F_{p}\left(v_{1}, v_{2}\right)=\frac{1}{F_{1-p}\left(v_{2}, v_{1}\right)} \end{align} $$

样本均值的抽样分布

不论总体服从什么样的分布,只要样本量足够大,则样本均值总是服从正态分布。它也是一种理论的概率分布。

$$ X \sim N\left(\mu, \frac{\sigma^{2}}{n}\right) $$

样本均值的期望:

$$ E(\overline{x})=\mu $$

样本均值的方差:

$$ \begin{align} \text{重复抽样}\sigma_{\overline{x}}^{2}&=\frac{\sigma^{2}}{n}\\ \text{不重复抽样}\sigma_{\overline{x}}^{2}&=\frac{\sigma^{2}}{n}\left(\frac{N-n}{N-1}\right) \end{align} $$

中心极限定理

设从均值为$\mu$方差为$\sigma^2$的一个任意总体中抽取容量为$n$的样本,当$n$充分大的时候($n>30$),样本均值的抽样分布近似服从均值为$\mu$方差为$\sigma^2/n$的正态分布。

样本比例的抽样分布

样本比例定义:当重复选取容量为$n$的样本时,由样本比例的所有可能取值形成的相对频数分布。

  • 样本比例是一种理论概率分布
  • 当样本容量很大时,样本比例可以用正态分布来近似
  • 样本比例是推断总体比例$\pi$的理论基础

样本比例的期望:

$$ E(p)=\pi $$

样本比例的方差:

$$ \begin{array}{l}\text{重复抽样:}{\sigma_{p}^{2}=\frac{\pi(1-\pi)}{n}} \\ \text{不重复抽样:}{\sigma_{p}^{2}=\frac{\pi(1-\pi)}{n}\left(\frac{N-n}{N-1}\right)}\end{array} $$

两样本平均值之差的分布

两个总体都为正态分布

$$ X_{1} \sim N( \mu_1, \sigma_{1}^{2}) \quad X_{2} \sim N(\mu_{2}, \sigma_{2}^{2}) $$

两个均值之差的抽样分布服从正态分布:

$$ \begin{align} E\left(\overline{x}_{1}-\overline{x}_{2}\right)&=\mu_{1}-\mu_{2}\\ \sigma_{\overline{x}_{1}-\overline{x}_{2}}^{2}&=\frac{\sigma_{1}^{2}}{n_{1}}+\frac{\sigma_{2}^{2}}{n_{2}} \end{align} $$

两样本比例之差的抽样分布

两个总体都服从二项分布,分别从两个总体中抽取容量为$n_1,n_2$的独立样本,两个样本比例之差的抽样分布可以用正态分布表示:

$$ \begin{align} E\left(p_{1}-p_{2}\right)&=\pi_{1}-\pi_{2}\\ \sigma_{p_{1}-p_{2}}^{2}&=\frac{\pi_{1}\left(1-\pi_{1}\right)}{n_{1}}+\frac{\pi_{2}\left(1-\pi_{2}\right)}{n_{2}} \end{align} $$

样本方差的分布

在重复选取容量为$n$的样本时,由样本方差的所有可能取值形成的相对频数分布。

对于来自正态总体的简单随机样本,则比值

$$ \frac{(n-1) s^{2}}{\sigma^{2}} $$

的抽样分布服从自由度为$n-1$的$\chi^2$分布:

$$ \frac{(n-1) s^{2}}{\sigma^{2}} \sim \chi^{2}(n-1) $$

两个样本方差比的分布

两个总体都服从正态分布,即$X_{1} \sim N\left(\mu_{1}, \sigma_{1}^{2}\right)$,$X_{2} \sim N\left(\mu_{2}, \sigma_{2}^{2}\right)$。

从两个总体分别抽取容量为$n_1,n_2$个样本,两个样本方差比的抽样分布,服从$F(n_1-1,n_2-1)$:

$$ \frac{s_{1}^{2} / s_{2}^{2}}{\sigma_{1}^{2} / \sigma_{2}^{2}}=\frac{s_{1}^{2} / \sigma_{1}^{2}}{s_{2}^{2} / \sigma_{2}^{2}}\sim F(n_1-1,n_2-1) $$

学习交流:
微信:ElijahMingLiu
Wechat

最后修改:2021 年 06 月 01 日 02 : 18 PM
如果觉得我的文章对你有用,请随意赞赏