数字特征之方差

🔖 math

🔖 probability and statistics

Author

Guangyao Zhao

Published

Aug 11, 2022

随机变量 \(X\) 的期望是 \(a=E(X)\)，但是样本众多，不可能全部都一定恰好是 \(a\)，所以就会有所偏离，而描述这个『偏离』的程度便是方差。方差大偏离程度就大，反之小。

1 方差

方差的计算公式如下：

\[ D(X)=Var(X)=E\{[X-E(X)]^2\} \]

标准差为：\(\sigma(X)= \sqrt{D(X)}\)。方差还有一种表达方式，在之后的计算的时候也经常使用这个公式：

\[ \begin{aligned} D(X)&=E\{[X-E(X)]^2\}\\ &=E[X^2+E^2(X)-2XE(X)]\\ &=E(X^2)+E^2(X)-2E(X)E(X)\\ &=E(X^2)-E^2(X) \end{aligned} \]

还记得初中数学老师很感兴地说过这对公式：『差的平方的期望』等于『期望的平方的差』。

2 例子

2.1 0-1分布

\(X^2\)	0	1
P	p	1-p

\[ \begin{aligned} D(X)&=E(X^2)-E^2(X)\\ &=p-p^2\\ &=p(1-p) \end{aligned} \]

2.2 泊松分布

已知泊松分布的期望 \(E(X)=\lambda\)，所以只需要求出 \(E(X^2)\) 即可：

\[ \begin{aligned} E\left(X^{2}\right)&=\sum_{k=0}^{\infty} k^{2} \frac{\lambda^{k} e^{-\lambda}}{k !}\\ &=\sum_{k=1}^{\infty} k \frac{\lambda^{k} e^{-\lambda}}{(k-1) !}\\ &=\sum_{k=1}^{\infty}(k-1+1) \frac{\lambda^{k} e^{-\lambda}}{(k-1)!}\\ &=\sum_{k=2}^{\infty} \frac{\lambda^{k} e^{-\lambda}}{(k-2) !}+\sum_{k=1}^{\infty} \frac{\lambda^{k} e^{\lambda}}{(k-1) !}\\ &=\sum_{k=2}^{\infty} \frac{\lambda^{k} e^{-\lambda}}{(k-2) !}+\sum_{k=0}^{\infty} \frac{\lambda^{k+1} e^{-\lambda}}{k !}\\ &=\sum_{k=0}^{\infty} \frac{\lambda^{k+2} e^{-\lambda}}{k !}+\sum_{k=0}^{\infty} \frac{\lambda^{k+1} e^{-\lambda}}{k !}\\ &=\sum_{k=0}^{\infty} \frac{\lambda^{k}}{k !}\left(\lambda^{2} e^{-\lambda}+e^{-\lambda}\right)\\ &=\lambda^{2}+\lambda \end{aligned} \]

即：\(D(X)=E(X^2)-E^2(X)=\lambda^2+\lambda-\lambda^2=\lambda\)

2.3 均匀分布

均匀分布的期望 \(E(X)=\frac{b-a}{2}\)，所以只需要求出 \(E(X^2)\) 即可，因为均匀分布是连续变量，所以就需要使用微积分的算法了：

\[ \begin{aligned} E\left(X^{2}\right)&=\int_{a}^{b}x^2\frac{1}{b-a}dx\\ &=\frac{1}{b-a}\cdot\frac{1}{3}x^3 |^b_a\\ &=\frac{a^2+ab+ab}{3} \end{aligned} \]

即均匀分布的方差为 \(D(X)=E(X^2)-E^2(X)=\frac{a^2+ab+ab}{3}-\left(\frac{b-a}{2}\right)^2=\frac{\left(b-a\right)^2}{12}\)

2.4 指数分布

已知泊松分布的期望 \(E(X)=\theta\)，所以只需要求出 \(E(X^2)\) 即可：

\[ \begin{aligned} E\left(X^{2}\right)&=\int_{0}^{+\infty}x^2\frac{1}{\theta}e^{-\frac{x}{\theta}}dx\\ &=2\theta^2 \end{aligned} \] 即均匀分布的方差为 \(D(X)=E(X^2)-E^2(X)=2\theta^2-\theta^2=\theta^2\)

3 方差的性质

\(D(C)=0\)
\(D(C+X)=D(X)\)
\(D(CX)=C^2D(X)\)
\(D(X+Y)=D(X)+D(Y)-2E\{[X-E(X)]\cdot[Y-E{Y}]\}\)

特别的证明下最后一条性质：

\[ \begin{aligned} D(X+Y)&=E\{[X+Y-E(X+Y)]^2\}\\ &=E\{[X+Y-E(X)-E(Y)]^2\}\\ &=E\{[X-E(X)+Y-E(Y)]^2\}\\ &=E\{[X-E(X)]^2+[Y-E(Y)]^2-2[X-E(X)]\cdot[Y-E(Y)]\}\\ &=D(X)+D(Y)-2E\{[X-E(X)]\cdot[Y-E(Y)]\} \end{aligned} \]

其中对于 \(2E\{[X-E(X)]\cdot[Y-E(Y)]\}\)：

\[ \begin{aligned} E\{[X-E(X)]\cdot[Y-E(Y)]\}&=E[XY-E(X)Y-XE(Y)+E(X)E(Y)]\\ &=E(XY)-E(X)E(Y)-E(XE(Y)+E(X)E(Y)\\ &=E(XY)-E(X)(Y) \end{aligned} \]

即如果 \(X,Y\) 相互独立，则 \(D(X+Y)=D(X)+D(Y)\)