2019-12-10 分组方差:
有 $c$ 组样本,已知每组样本的统计量:第 $i$ 组样本的样本量 $n_i\geqslant 2$、样本均值 $\overline{X_i}=\dfrac{1}{n}\sum\limits_{j=1}^{n_i} X_{ij}$、样本方差 $S_i^2=\dfrac{1}{n-1}\sum\limits_{j=1}^{n_i}(X_{ij}-\overline{X_i})^2$,将这 $c$ 组样本合并成一个总样本,则总样本对应统计量可用每组样本统计量来计算:
$$ \begin{aligned} n&=\sum_{i=1}^{c}{n_i},\\ \overline{X}&=\frac{\sum\limits_{i=1}^{c}{n_i\overline{X_i}}}{n},\\ S^2&=\frac{\sum\limits_{i=1}^{c}{\left[(n_i-1)S_i^2+n_i\overline{X_i}^2\right]}-n\overline{X}^2}{n-1} \end{aligned} $$
这里使用了数理统计中的一个常用公式:
$$ {\color{gray}\sum_{i=1}^{n}{(x_i-\overline{x})^2}=\sum_{i=1}^{n}{x_i^2}-n\overline{x}^2} $$
为方便记忆,可将上述各统计量之间的关系记为下列对称的形式:
$$ \begin{aligned} n&=\sum_{i=1}^{c}{n_i},\\ n\overline{X}&=\sum\limits_{i=1}^{c}{n_i\overline{X_i}},\\ (n-1)S^2+n\overline{X}^2&=\sum\limits_{i=1}^{c}{\left[(n_i-1)S_i^2+n_i\overline{X_i}^2\right]} \end{aligned} $$