6 统计量与抽样分布¶
说明
- 有些公式块因为已经有图片了,懒得打 \(\KaTeX\) 了,所以就直接用图片替代了
- 本文档仅涉及部分内容,仅可用于复习重点知识
1 随机样本与统计量¶
1.1 总体与样本¶
- 总体: 研究对象的全体
- 有限总体: 容量有限的总体
- 无限总体: 容量无限的总体
- 个体: 总体中的每个成员
- 样本: 被抽取的部分个体
- 样本容量: 被抽取的个体数量
- 随机样本
- 简单随机抽样: 抽出简单随机样本所用的抽样方式
- 样本值(观测值): 对所抽取的样本进行观测得到的一组数据
定义:
设总体 \(X\) 是具有分布函数 \(F(·)\) 的随机变量,\(X_1,X_2,···,X_n\) 是来自总体 \(X\) 的随机样本。若满足
- 独立性: \(X_1,X_2,···,X_n\) 是相互独立的随机变量
- 代表性: 每一 \(X_i\) 与总体 \(X\) 有相同的分布函数
则称 \(X_1,X_2,···,X_n\) 为取自总体 \(X\) 的 简单随机样本 或 i.i.d 样本(independent identically distributed sample)
在实际操作中,采用有放回抽样所得到的样本为简单随机样本。而采用无放回抽样所得到的样本,既不满足独立性,也不满足代表性,故不是简单随机样本。但对于无限总体或总体容量很大的有限总体,也常常将无放回抽样所得的样本近似当作简单随机样本
1.2 统计量¶
定义:
设 \(X_1,X_2,···,X_n\) 是来自总体 \(X\) 的一个样本,\(g(X_1,X_2,···,X_n)\) 是样本 \(X_1,X_2,···,X_n\) 的函数,若 \(g\) 不含未知参数,则称 \(g(X_1,X_2,···,X_n)\) 是一 统计量
- 样本均值: \(\bar{X} = \dfrac{1}{n}\sum\limits_{i=1}^nX_i\)
- 样本方差: \(S^2 = \dfrac{1}{n-1}\sum\limits_{i=1}^n(X_i - \bar{X})^2 = \dfrac{1}{n-1}(\sum\limits_{i=1}^nX_i^2 - n \bar{X}^2)\)
- 样本标准差: \(S = \sqrt{S^2} = \sqrt{\dfrac{1}{n-1}\sum\limits_{i=1}^n(X_i - \bar{X})^2}\)
- 样本 \(k\) 阶(原点)矩: \(A_k = \dfrac{1}{n}\sum\limits_{i=1}^nX_i^k\)
- 样本 \(k\) 阶中心矩: \(B_k = \dfrac{1}{n}\sum\limits_{i=1}^n(X_i - \bar{X})^k\)
2 \(\chi^2\) 分布,\(t\) 分布,\(F\) 分布¶
2.1 \(\chi^2\) 分布¶
定义:
设 \(X_1,X_2,\cdots,X_n\) 为独立同分布的随机变量,且都服从标准正态分布 \(N(0,1)\)。记 $$ Y = X_1^2 + X_2^2 + \cdots + X_n^2 $$ 则称 \(Y\) 服从自由度为 \(n\) 的 \(\chi^2\) 分布,记为 \(Y \sim \chi^2(n)\)
- \(\chi^2\) 分布可加性:设 \(Y_1 \sim \chi^2(m), Y_2 \sim \chi^2(n), m, n \geqslant 1\),且两者相互独立,则 \(Y_1 + Y_2 \sim \chi^2(m+n)\)
- \(E(Y) = n, Var(Y) = 2n\)
- \(\chi^2\) 分布分位数
2.2 \(t\) 分布¶
定义:
设 \(X \sim N(0,1), Y \sim \chi^2(n)\),且 \(X,Y\) 相互独立,则称随机变量
服从自由度为 \(n\) 的 \(t\) 分布,记为 \(t \sim t(n)\)
- \(t\) 分布的密度函数 \(f_t(x)\) 是偶函数,关于 \(y\) 轴对称
- \(\lim\limits_{n \rightarrow + \infty}f_t(x) = \dfrac{1}{\sqrt{2\pi}}e^{-\frac{x^2}{2}}\) 即当 \(n\) 足够大时,\(t\) 分布近似于标准正态分布 \(N(0,1)\)
- \(t\) 分布分位数:\(t_{1-\alpha}(n) = -t_\alpha(n)\)
2.3 \(F\) 分布¶
定义:
设 \(U \sim \chi^2(n_1), V \sim \chi^2(n_2)\),且 \(U\) 与 \(V\) 相互独立,则称随机变量
服从第一自由度为 \(n_1\),第二自由度为 \(n_2\) 的 \(F\) 分布,记为 \(F \sim F(n_1,n_2)\)
- 若 \(F \sim F(n_1,n_2)\),则 \(\dfrac{1}{F} \sim F(n_2,n_1)\)
- 若 \(X \sim t(n)\),则 \(X^2 \sim F(1,n)\)
- \(F\) 分布分位数:\(F_{1-\alpha}(n_1,n_2) = \dfrac{1}{F_\alpha(n_2,n_1)}\)
3 正态总体下的抽样分布¶
定理:
设 \(X_1, X_2,\cdots, X_n\) 为来自正态总体 \(N(\mu, \sigma^2)\) 的简单随机样本, \(\bar{X}\) 是样本均值,则有
定理:
设 \(X_1, X_2,\cdots, X_n\) 为来自正态总体 \(N(\mu, \sigma^2)\) 的简单随机样本, \(\bar{X}\) 是样本均值,\(S^2\) 是样本方差,则
- \(\dfrac{(n-1)S^2}{\sigma^2} \sim \chi^2(n-1)\)
- \(\bar{X}\) 与 \(S^2\) 相互独立
定理:
设 \(X_1, X_2,\cdots, X_n\) 为来自正态总体 \(N(\mu, \sigma^2)\) 的简单随机样本, \(\bar{X}\) 是样本均值,\(S^2\) 是样本方差,则有
定理:
设 \(X_1, X_2,\cdots, X_n\) 和 \(Y_1, Y_2,\cdots, Y_n\) 分别为来自正态总体 \(N(\mu_1, \sigma_1^2)\) 和 \(N(\mu_2, \sigma_2^2)\) 的两个相互独立的简单随机样本。记 \(\bar{X},\bar{Y}\) 分别是两个样本的样本均值,\(S_1^2, S_2^2\) 分别是两个样本的样本方差,则有
- \(\dfrac{\dfrac{S_1^2}{\sigma_1^2}}{\dfrac{S_2^2}{\sigma_2^2}} \sim F(n_1 - 1, n_2 - 1)\)
- 当 \(\sigma_1^2 = \sigma_2^2 = \sigma^2\) 时,
其中