6 统计量与抽样分布¶

说明

有些公式块因为已经有图片了，懒得打 $\KaTeX$ 了，所以就直接用图片替代了
本文档仅涉及部分内容，仅可用于复习重点知识

1 随机样本与统计量¶

1.1 总体与样本¶

总体： 研究对象的全体
1. 有限总体： 容量有限的总体
2. 无限总体： 容量无限的总体
个体： 总体中的每个成员
样本： 被抽取的部分个体
1. 样本容量： 被抽取的个体数量
随机样本
简单随机抽样： 抽出简单随机样本所用的抽样方式
样本值（观测值）： 对所抽取的样本进行观测得到的一组数据

定义：

设总体 $X$ 是具有分布函数 $F(·)$ 的随机变量，$X_1,X_2,···,X_n$ 是来自总体 $X$ 的随机样本。若满足

独立性： $X_1,X_2,···,X_n$ 是相互独立的随机变量
代表性： 每一 $X_i$ 与总体 $X$ 有相同的分布函数

则称 $X_1,X_2,···,X_n$ 为取自总体 $X$ 的 简单随机样本 或 i.i.d 样本（independent identically distributed sample）

在实际操作中，采用有放回抽样所得到的样本为简单随机样本。而采用无放回抽样所得到的样本，既不满足独立性，也不满足代表性，故不是简单随机样本。但对于无限总体或总体容量很大的有限总体，也常常将无放回抽样所得的样本近似当作简单随机样本

1.2 统计量¶

定义：

设 $X_1,X_2,···,X_n$ 是来自总体 $X$ 的一个样本，$g(X_1,X_2,···,X_n)$ 是样本 $X_1,X_2,···,X_n$ 的函数，若 $g$ 不含未知参数，则称 $g(X_1,X_2,···,X_n)$ 是一 统计量

样本均值： $\bar{X} = \dfrac{1}{n}\sum\limits_{i=1}^nX_i$
样本方差： $S^2 = \dfrac{1}{n-1}\sum\limits_{i=1}^n(X_i - \bar{X})^2 = \dfrac{1}{n-1}(\sum\limits_{i=1}^nX_i^2 - n \bar{X}^2)$
样本标准差： $S = \sqrt{S^2} = \sqrt{\dfrac{1}{n-1}\sum\limits_{i=1}^n(X_i - \bar{X})^2}$
样本 $k$ 阶（原点）矩： $A_k = \dfrac{1}{n}\sum\limits_{i=1}^nX_i^k$
样本 $k$ 阶中心矩： $B_k = \dfrac{1}{n}\sum\limits_{i=1}^n(X_i - \bar{X})^k$

2 $\chi^2$ 分布，$t$ 分布，$F$ 分布¶

2.1 $\chi^2$ 分布¶

定义：

设 $X_1,X_2,\cdots,X_n$ 为独立同分布的随机变量，且都服从标准正态分布 $N(0,1)$。记 $$ Y = X_1^2 + X_2^2 + \cdots + X_n^2 $$ 则称 $Y$ 服从自由度为 $n$ 的 $\chi^2$ 分布，记为 $Y \sim \chi^2(n)$

$\chi^2$ 分布可加性：设 $Y_1 \sim \chi^2(m), Y_2 \sim \chi^2(n), m, n \geqslant 1$，且两者相互独立，则 $Y_1 + Y_2 \sim \chi^2(m+n)$
$E(Y) = n, Var(Y) = 2n$
$\chi^2$ 分布分位数

2.2 $t$ 分布¶

定义：

设 $X \sim N(0,1), Y \sim \chi^2(n)$，且 $X,Y$ 相互独立，则称随机变量

\[ t = \dfrac{X}{\sqrt{\dfrac{Y}{n}}} \]

服从自由度为 $n$ 的 $t$ 分布，记为 $t \sim t(n)$

$t$ 分布的密度函数 $f_t(x)$ 是偶函数，关于 $y$ 轴对称
$\lim\limits_{n \rightarrow + \infty}f_t(x) = \dfrac{1}{\sqrt{2\pi}}e^{-\frac{x^2}{2}}$ 即当 $n$ 足够大时，$t$ 分布近似于标准正态分布 $N(0,1)$
$t$ 分布分位数：$t_{1-\alpha}(n) = -t_\alpha(n)$

2.3 $F$ 分布¶

定义：

设 $U \sim \chi^2(n_1), V \sim \chi^2(n_2)$，且 $U$ 与 $V$ 相互独立，则称随机变量

\[ F = \frac{\dfrac{U}{n_1}}{\dfrac{V}{n_2}} \]

服从第一自由度为 $n_1$，第二自由度为 $n_2$ 的 $F$ 分布，记为 $F \sim F(n_1,n_2)$

若 $F \sim F(n_1,n_2)$，则 $\dfrac{1}{F} \sim F(n_2,n_1)$
若 $X \sim t(n)$，则 $X^2 \sim F(1,n)$
$F$ 分布分位数：$F_{1-\alpha}(n_1,n_2) = \dfrac{1}{F_\alpha(n_2,n_1)}$

3 正态总体下的抽样分布¶

定理：

设 $X_1, X_2,\cdots, X_n$ 为来自正态总体 $N(\mu, \sigma^2)$ 的简单随机样本， $\bar{X}$ 是样本均值，则有

\[ \bar{X} \sim N(\mu, \dfrac{\sigma^2}{n}) \]

定理：

设 $X_1, X_2,\cdots, X_n$ 为来自正态总体 $N(\mu, \sigma^2)$ 的简单随机样本， $\bar{X}$ 是样本均值，$S^2$ 是样本方差，则

$\dfrac{(n-1)S^2}{\sigma^2} \sim \chi^2(n-1)$
$\bar{X}$ 与 $S^2$ 相互独立

定理：

设 $X_1, X_2,\cdots, X_n$ 为来自正态总体 $N(\mu, \sigma^2)$ 的简单随机样本， $\bar{X}$ 是样本均值，$S^2$ 是样本方差，则有

\[ \dfrac{\bar{X} - n}{\dfrac{S}{\sqrt{n}}} \sim t(n-1) \]

定理：

设 $X_1, X_2,\cdots, X_n$ 和 $Y_1, Y_2,\cdots, Y_n$ 分别为来自正态总体 $N(\mu_1, \sigma_1^2)$ 和 $N(\mu_2, \sigma_2^2)$ 的两个相互独立的简单随机样本。记 $\bar{X},\bar{Y}$ 分别是两个样本的样本均值，$S_1^2, S_2^2$ 分别是两个样本的样本方差，则有

$\dfrac{\dfrac{S_1^2}{\sigma_1^2}}{\dfrac{S_2^2}{\sigma_2^2}} \sim F(n_1 - 1, n_2 - 1)$
当 $\sigma_1^2 = \sigma_2^2 = \sigma^2$ 时，

\[ \dfrac{(\bar{X} - \bar{Y}) - (\mu_1 - \mu_2)}{S_w \sqrt{\dfrac{1}{n_1} + \dfrac{1}{n_2}}} \sim t(n_1 + n_2 - 2) \]

其中

\[ S_w^2 = \dfrac{(n_1 - 1)S_1^2 + (n_2 - 1)S_2^2}{n_1 + n_2 -2} \]

评论区

欢迎在评论区指出文档错误，为文档提供宝贵意见，或写下你的疑问

6 统计量与抽样分布¶

1 随机样本与统计量¶

1.1 总体与样本¶

1.2 统计量¶

2 \(\chi^2\) 分布，\(t\) 分布，\(F\) 分布¶

2.1 \(\chi^2\) 分布¶

2.2 \(t\) 分布¶

2.3 \(F\) 分布¶

3 正态总体下的抽样分布¶

评论区