跳转至

6 统计量与抽样分布

说明

  1. 有些公式块因为已经有图片了,懒得打 \(\KaTeX\) 了,所以就直接用图片替代了
  2. 本文档仅涉及部分内容,仅可用于复习重点知识

1 随机样本与统计量

1.1 总体与样本

  1. 总体: 研究对象的全体
    1. 有限总体: 容量有限的总体
    2. 无限总体: 容量无限的总体
  2. 个体: 总体中的每个成员
  3. 样本: 被抽取的部分个体
    1. 样本容量: 被抽取的个体数量
  4. 随机样本
  5. 简单随机抽样: 抽出简单随机样本所用的抽样方式
  6. 样本值(观测值): 对所抽取的样本进行观测得到的一组数据

定义:

设总体 \(X\) 是具有分布函数 \(F(·)\) 的随机变量,\(X_1,X_2,···,X_n\) 是来自总体 \(X\) 的随机样本。若满足

  1. 独立性: \(X_1,X_2,···,X_n\) 是相互独立的随机变量
  2. 代表性: 每一 \(X_i\) 与总体 \(X\) 有相同的分布函数

则称 \(X_1,X_2,···,X_n\) 为取自总体 \(X\)简单随机样本i.i.d 样本(independent identically distributed sample)

在实际操作中,采用有放回抽样所得到的样本为简单随机样本。而采用无放回抽样所得到的样本,既不满足独立性,也不满足代表性,故不是简单随机样本。但对于无限总体或总体容量很大的有限总体,也常常将无放回抽样所得的样本近似当作简单随机样本

1.2 统计量

定义:

\(X_1,X_2,···,X_n\) 是来自总体 \(X\) 的一个样本,\(g(X_1,X_2,···,X_n)\) 是样本 \(X_1,X_2,···,X_n\) 的函数,若 \(g\) 不含未知参数,则称 \(g(X_1,X_2,···,X_n)\) 是一 统计量

  1. 样本均值: \(\bar{X} = \dfrac{1}{n}\sum\limits_{i=1}^nX_i\)
  2. 样本方差: \(S^2 = \dfrac{1}{n-1}\sum\limits_{i=1}^n(X_i - \bar{X})^2 = \dfrac{1}{n-1}(\sum\limits_{i=1}^nX_i^2 - n \bar{X}^2)\)
  3. 样本标准差: \(S = \sqrt{S^2} = \sqrt{\dfrac{1}{n-1}\sum\limits_{i=1}^n(X_i - \bar{X})^2}\)
  4. 样本 \(k\) 阶(原点)矩: \(A_k = \dfrac{1}{n}\sum\limits_{i=1}^nX_i^k\)
  5. 样本 \(k\) 阶中心矩: \(B_k = \dfrac{1}{n}\sum\limits_{i=1}^n(X_i - \bar{X})^k\)

2 \(\chi^2\) 分布,\(t\) 分布,\(F\) 分布

2.1 \(\chi^2\) 分布

定义:

\(X_1,X_2,\cdots,X_n\) 为独立同分布的随机变量,且都服从标准正态分布 \(N(0,1)\)。记 $$ Y = X_1^2 + X_2^2 + \cdots + X_n^2 $$ 则称 \(Y\) 服从自由度为 \(n\)\(\chi^2\) 分布,记为 \(Y \sim \chi^2(n)\)

  1. \(\chi^2\) 分布可加性:设 \(Y_1 \sim \chi^2(m), Y_2 \sim \chi^2(n), m, n \geqslant 1\),且两者相互独立,则 \(Y_1 + Y_2 \sim \chi^2(m+n)\)
  2. \(E(Y) = n, Var(Y) = 2n\)
  3. \(\chi^2\) 分布分位数

2.2 \(t\) 分布

定义:

\(X \sim N(0,1), Y \sim \chi^2(n)\),且 \(X,Y\) 相互独立,则称随机变量

\[ t = \dfrac{X}{\sqrt{\dfrac{Y}{n}}} \]

服从自由度为 \(n\)\(t\) 分布,记为 \(t \sim t(n)\)

  1. \(t\) 分布的密度函数 \(f_t(x)\) 是偶函数,关于 \(y\) 轴对称
  2. \(\lim\limits_{n \rightarrow + \infty}f_t(x) = \dfrac{1}{\sqrt{2\pi}}e^{-\frac{x^2}{2}}\) 即当 \(n\) 足够大时,\(t\) 分布近似于标准正态分布 \(N(0,1)\)
  3. \(t\) 分布分位数:\(t_{1-\alpha}(n) = -t_\alpha(n)\)

2.3 \(F\) 分布

定义:

\(U \sim \chi^2(n_1), V \sim \chi^2(n_2)\),且 \(U\)\(V\) 相互独立,则称随机变量

\[ F = \frac{\dfrac{U}{n_1}}{\dfrac{V}{n_2}} \]

服从第一自由度为 \(n_1\),第二自由度为 \(n_2\)\(F\) 分布,记为 \(F \sim F(n_1,n_2)\)

  1. \(F \sim F(n_1,n_2)\),则 \(\dfrac{1}{F} \sim F(n_2,n_1)\)
  2. \(X \sim t(n)\),则 \(X^2 \sim F(1,n)\)
  3. \(F\) 分布分位数:\(F_{1-\alpha}(n_1,n_2) = \dfrac{1}{F_\alpha(n_2,n_1)}\)

3 正态总体下的抽样分布

定理:

\(X_1, X_2,\cdots, X_n\) 为来自正态总体 \(N(\mu, \sigma^2)\) 的简单随机样本, \(\bar{X}\) 是样本均值,则有

\[ \bar{X} \sim N(\mu, \dfrac{\sigma^2}{n}) \]

定理:

\(X_1, X_2,\cdots, X_n\) 为来自正态总体 \(N(\mu, \sigma^2)\) 的简单随机样本, \(\bar{X}\) 是样本均值,\(S^2\) 是样本方差,则

  1. \(\dfrac{(n-1)S^2}{\sigma^2} \sim \chi^2(n-1)\)
  2. \(\bar{X}\)\(S^2\) 相互独立

定理:

\(X_1, X_2,\cdots, X_n\) 为来自正态总体 \(N(\mu, \sigma^2)\) 的简单随机样本, \(\bar{X}\) 是样本均值,\(S^2\) 是样本方差,则有

\[ \dfrac{\bar{X} - n}{\dfrac{S}{\sqrt{n}}} \sim t(n-1) \]

定理:

\(X_1, X_2,\cdots, X_n\)\(Y_1, Y_2,\cdots, Y_n\) 分别为来自正态总体 \(N(\mu_1, \sigma_1^2)\)\(N(\mu_2, \sigma_2^2)\) 的两个相互独立的简单随机样本。记 \(\bar{X},\bar{Y}\) 分别是两个样本的样本均值,\(S_1^2, S_2^2\) 分别是两个样本的样本方差,则有

  1. \(\dfrac{\dfrac{S_1^2}{\sigma_1^2}}{\dfrac{S_2^2}{\sigma_2^2}} \sim F(n_1 - 1, n_2 - 1)\)
  2. \(\sigma_1^2 = \sigma_2^2 = \sigma^2\) 时,
\[ \dfrac{(\bar{X} - \bar{Y}) - (\mu_1 - \mu_2)}{S_w \sqrt{\dfrac{1}{n_1} + \dfrac{1}{n_2}}} \sim t(n_1 + n_2 - 2) \]

其中

\[ S_w^2 = \dfrac{(n_1 - 1)S_1^2 + (n_2 - 1)S_2^2}{n_1 + n_2 -2} \]

评论区

欢迎在评论区指出文档错误,为文档提供宝贵意见,或写下你的疑问