## **随机变量与概率估计**

---
---
---

### 基于Python的实现

#### 随机变量的数字特征

##### 数学期望

ex 8.6  
一民航送客车载有$20$位旅客自机场出发，旅客有$10$个车站可以下车，如到达一个车站没有旅客下车就不停车，以$X$表示停车的次数，求$E(X)$。

In [2]:
# 引入随机变量X
X=[0, 1]    #在当前车站有无人下车？
station= 10 #车站数量
passenger= 20   #旅客数量
p= 1 / station  #一位旅客在任一车站下车的概率
EX=0

for i in range(station):
    p_0= (1-p)**passenger
    EX_0= X[0] * p_0
    EX_1= X[1] * (1-p_0)
    EX+= (EX_0+EX_1)
print("E(X)={:.3f}".format(EX))

E(X)=8.784


---

##### 方差

设$X$为随机变量，如果$E\left \{ \left [ X-E(X) \right ]^{2}  \right \} $存在，则方差为：
$$D(X)=E\left [ (X-\mu)^2 \right ]=
\left\{\begin{matrix}
 \displaystyle {\sum_{k=1}^{\infty}\left [ x_k-E(X) \right ]^2 \cdot P(X=x_k)}, &离散型随机变量 \\
 \displaystyle{\int_{-\infty }^{\infty}\left [ x-E(X) \right ]^2 \cdot f(x)\mathrm{d}x}, &连续型随机变量
\end{matrix}\right.$$

方差的计算公式：
$$D(X)=E(X)-\left [ E(X) \right ]^2 $$

方差刻画了随机变量$X$的取值与数学期望的偏离程度，它的大小可以衡量随机变量取值的稳定性。  
$X$的取值越集中，方差越小  
$X$的取值越分散，方差越大  

ex 8.10  **标准化**  
设随机变量$X$具有数学期望$E(X)=\mu$，方差$D(X)=\sigma ^{2} \ne 0$。  
记$X^{\ast }=\frac{X-\mu}{\sigma } $，求$X^{\ast}$的期望和方差。

解：  
$$E(X^{\ast})=E(\frac{X-\mu}{\sigma})
=\frac{1}{\sigma}E(X-\mu)
=\frac{1}{\sigma}\left [  E(X)-\mu \right ]
=0$$  
$$D(X^{\ast})=E(X^{\ast^{2}})-\left [ E(X^{\ast}) \right ]^2
=E\left [ (\frac{X-\mu}{\sigma}^2) \right ]
=\frac{1}{\sigma^2}E\left [ (X-\mu)^2 \right ]
=\frac{\sigma^2}{\sigma^2} 
=1$$
即$X^{\ast }=\frac{X-\mu}{\sigma } $的数学期望为$0$，方差为$1$。

**一般的正态分布经标准化后，服从$N(0,1)$的标准化正态分布**

---

##### **切比雪夫不等式**

如果随机变量$X$的期望$\mu$和方差$\sigma$存在，则对任意$\varepsilon>0$，有：
$$P\left \{ \left | X-\mu \right | \ge \varepsilon  \right \} \le \frac{\sigma^2}{\varepsilon^2}  $$
等价于
$$P\left \{ \left | X-\mu \right | < \varepsilon  \right \} \ge 1- \frac{\sigma^2}{\varepsilon^2} $$

##### 常用分布的数学期望和方差

|分布类型|概率密度函数|期望$E(X)$|$方差D(X)$|
|:---:|:---:|:---:|:---:|
|两点分布|$$P\left \{ X=0 \right \}=1-p,P\left \{ X=1 \right \}=p$$|$$p$$|$$p(1-p)$$|
|泊松分布|$$P\left \{ X=k \right \}=\frac{\lambda ^k}{k!}e^{-\lambda} ,k=0,1,2,\cdots $$|$$\lambda$$|$$\lambda$$|
|二项分布|$$P\left \{ X=k \right \}=C_{n}^{k}\cdot p^k \cdot (1-p)^{n-k}  ,k=0,1,2,\cdots n$$|$$np$$|$$np(1-p)$$|
|均匀分布|$$f(x)=\left\{\begin{matrix}\displaystyle {\frac{1}{b-a}}, & a<x<b\\0,& else\end{matrix}\right.$$|$$\frac{a+b}{2}$$|$$\frac{(b-a)^2}{12}$$|
|指数分布|$$f(x)=\left\{\begin{matrix}\lambda e^{-\lambda x}, &x>0 \\0 & else\end{matrix}\right.$$|$$\frac{1}{\lambda}$$|$$\frac{1}{\lambda^2}$$|
|正态分布|$$\displaystyle {f(x)=\frac{1}{\sqrt[]{2 \pi}\sigma}e^{-\frac{(x-\mu)^2}{2\sigma^2}}},-\infty <x<\infty $$|$$\mu$$|$$\sigma^2$$|

---
---

#### 大数定律

**伯努利大数定律**：  
$设n_A是n次独立重复试验中事件A发生的次数，p是事件A在每次试验中发生的概率，则对任意正数\varepsilon，有$  
$$\lim_{n \to \infty}\left \{ \left | \frac{n_A}{n}-p \right |<\varepsilon   \right \} =1$$  
或  
$$\lim_{n \to \infty}\left \{ \left | \frac{n_A}{n}-p \right | \ge \varepsilon   \right \} =0$$  
解释：  
在实际应用中，当试验次数$n$很大时，可以利用事件A发生的概率来近似代替事件A发生的概率。  
在抽样调查中，用样本参数去估计总体参数。

**辛钦大数定律**：  
$设随机变量X_1,X_2,\cdots,X_3,\cdots相互独立，服从同一分布，且具有数学期望E(X_i)=\mu，i=1,2,\cdots则对任意给定的正数\varepsilon >0，有$  
$$\lim_{n \to \infty} \left \{ \left | \frac{1}{n}\sum_{i=1}^{n}X_i-\mu \right | < \varepsilon \right\}=1$$  
解释：  
随着样本数量$n$增大，样本均值几乎必然等于总体真实的均值。

---
---

#### 中心极限定理

**独立同分布的中心极限定理**  


设随机变量$X_1,X_2,\cdots,X_n,\cdots$相互独立，服从同一分布，且具有数学期望和$E(X_i)=\mu$，$D(X_i)=\sigma^2\ne 0$，$i=1,2,\cdots$，
则随机变量之和$\displaystyle{\sum_{i=1}^{n}X_i}$的标准化变量为
$$Y_n=\frac{\displaystyle{\sum_{i=1}^{n}X_i-n\mu}}{\sqrt[]{n}\sigma} $$  
$Y_n$的分布函数$F(x)$对于任意实数$x$满足：  
$$\lim_{n \to \infty}F_n(x)=
\lim_{n \to \infty}P\left \{ \frac{
\displaystyle{\sum_{i=1}^{n}X_i-n\mu}}{\sqrt[]{n}\sigma}\le x \right \} 
=\Phi (x)$$  
对$Y_n$分子分母同除$n$，得到：
$$Y_n= \frac{\displaystyle{\frac{1}{n}\sum_{i=1}^{n}X_i-\mu}}{\frac{\sigma}{\sqrt[]{n}}} 
=\frac{\bar{X}-\mu}{\frac{\sigma}{\sqrt[]{n}}} 
\sim N(0,1)$$  
或
$$\bar{X}\sim N(\mu,\frac{\sigma^2}{n}) $$

简化表述：  
当$n$充分大时，均值为$\mu$，方差为$\sigma^2>0$的独立同分布的随机变量$X_1,X_2,\cdots,X_n,\cdots$的算术平均值$\displaystyle{\bar{X}=\frac{1}{n}\sum_{i=1}^{n}X_i}$
近似地服从均值为$\mu$，方差为$\frac{\sigma ^2}{n}$的正态分布。  
解释：  
任何独立、同分布的大量随机变量序列和的均值也近似服从正态分布。只要样本容量够大，样本估计值就趋于正态分布。

ex 8.11  
设随机变量$X_1,X_2,\cdots,X_{20}$相互独立，且都在区间$(0,10)$上服从均匀分布，记$\displaystyle {X=\sum_{i=1}^{20}X_i}$，求$P\left\{ X>120\right\} $的近似值。

In [5]:
from scipy.stats import norm
EX= (10+0) / 2  #数学期望
DX= (10-0)**2 / 12  #方差
n=20

#标准化
def Y_n(X, n, EX, DX):
    return (X-n*EX)/((n*DX)**(0.5))

phi= Y_n(120, n, EX, DX)
print("P(X>120)的近似值为{:.3f}".format(1-norm.cdf(phi)))

P(X>120)的近似值为0.061


---
---

#### 数理统计基本概念

##### 常用统计量

---

##### 参数估计

---
---

#### 最大似然估计

##### 似然函数

---

##### 最大似然估计

---
---

#### 最大后验估计

---
---
---

### 应用

---
---
---

### 课后习题