## 导包

In [None]:
from IPython.core.interactiveshell import InteractiveShell 
InteractiveShell.ast_node_interactivity = 'all' #默认为'last'

import numpy as np
import pandas as pd
import os
import sympy 
from sympy import *
# from sympy.abc import *
# from sympy import gamma
from matplotlib import pyplot as plt
%matplotlib inline
plt.rcParams['font.sans-serif']=['SimHei'] #指定默认字体 SimHei为黑体
plt.rcParams['axes.unicode_minus']=False #用来正常显示负号
sympy.init_printing(use_latex=True)
x, y, z = symbols('x y z',real=True)

## 正态分布代码  
```
mu,sigma = symbols('mu sigma')
fx = (1/(sigma*sqrt(2*pi)))*exp(-(x-mu)**2/(2*sigma**2))
```

# 第一章 概率论的基本概念

### [exercises](Exercise_1.ipynb)

# 第二章 随机变量及其分布

### [exercises](Exercise_2.ipynb)

## 随机变量

## 离散型随机变量及其分布律

### 0-1分布  
$\begin{array}{c|cc} 
X & 0 & 1 \\
\hline
p_k & 1-p & p \\
\end{array}$

### 二项分布 (伯努利分布)  
$X\sim b(n,p) \\ 
P\{X=k\}=C_n^kp^k(1-p)^{n-k} \ (k=0,1,...,n)$

### 泊松分布  
$X\sim \pi(\lambda) \\ 
P(x=k)=\frac{\lambda^k}{k!}e^{-\lambda} \ (k=0,1,2,...)$  
```
lamda = symbols('lamda')
px = exp(-lamda)*lamda**k/factorial(k)
```

### 几何分布
$X\sim G(p) \\
P(x=k)=p(1-p)^{k-1} \ (k=1,2,...)$  
$

### 超几何分布  
$X\sim H(N,M,n)$  
$p\{x=k\}=\frac{C_M^k C_{N-M}^{n-k}}{C_N^n}$

## 随机变量的分布函数

## 连续型随机变量及其概率密度

### 均匀分布  
$X\sim U(a,b)$  

### 指数分布  
$X\sim E(\lambda)$  
$f(x)=\begin{cases} \lambda e^{- \lambda x} & x > 0 \\0 & x\le 0 \end{cases}$  
`$f(x)=\begin{cases} \lambda e^{- \lambda x} & x > 0 \\0 & x\le 0 \end{cases}$`

In [None]:
t1 = symbols('t')
t = symbols('t', positive=True)
lamda = symbols('lamda', real=True)
ft = lamda * exp(-lamda * t)
ft_ = Piecewise((lamda * exp(-lamda * t1),t1>0),(0, True))
ft_
print_latex(ft_)

### 正态分布  
$X\sim N(\mu, \sigma^2) \\ 
f(x)=\frac{1}{\sqrt{2\pi}\sigma}e^{- \frac{\left(x - \mu \right)^{2}}{2 \sigma^{2}}}$  
```
mu,sigma = symbols('mu sigma')
fx = (1/(sigma*sqrt(2*pi)))*exp(-(x-mu)**2/(2*sigma**2))
```

In [None]:
mu,sigma = symbols('mu sigma')
fx = (1/(sigma*sqrt(2*pi)))*exp(-(x-mu)**2/(2*sigma**2))
print_latex(fx)

#### 正态分布的标准化  
$若X\sim N(\mu, \sigma^2)，则Z=\frac{X-\mu}{\sigma}\sim N(0,1) \\
F(x)=\Phi(\frac{x-\mu}{\sigma})$

## 随机变量的函数的分布  
$$f_Y(y)=f_X(g^{-1}(y))|(g^{-1})\prime(y))|$$

In [None]:
# Discrete probability distribution
# 离散型随机变量函数的分布
def DPD(X, p):
    '''
    离散型随机变量函数的分布
    :param X: 离散型随机变量的取值
    :param p: 离散型随机变量的概率
    :return: 离散型随机变量函数的分布
    '''
    return pd.DataFrame(data=np.stack((X, p), axis=1),
                        columns=['X', 'p']).groupby('X').sum()# 去重
# DPD(X,p)
# DPD(Y,p)
# DPD(Z,p)

In [None]:
# 反函数inverse function
x,y = symbols('x y')
f = 1- x**(1/3)-y
def inv_func(func,x):
    '''
    计算反函数
    :param func: 原函数 
    :param x: 自变量
    :return: 
    '''
    return solve(func,x)[0]
inv_func(f,x)
type(x)
type(f)
# 计算函数的分布
a, b, x, y = symbols('a b x y')
f = a*x+b-y
def func_density(fx, func, x, y):
    '''
    已知原分布概率密度求函数的概率密度
    :param fx: 自变量的分布
    :param func: 原函数
    :param x: 原分布的自变量
    :param y: 因变量，新分布的自变量
    :return: 
    '''
    x1 = solve(func,x)[0]
    fy = fx.subs({x:x1})*Abs(diff(x1,y)) # 导数的绝对值
    return fy

# def func_dist(Fx, Func, x, y):
#     '''
#     已知原分布分布函数求函数的分布函数
#     :param Fx: 自变量的分布
#     :param Func: 原函数
#     :param x: 原分布的自变量
#     :param y: 因变量，新分布的自变量
#     :return: 
#     '''
#     x1 = solve(Func,x)[0]
#     fy = Fx.subs({x:x1})*Abs(diff(x1,y)) # 导数的绝对值
#     return fy
# func_dist(fx,f,x,y)

# 第三章 多维随机变量及其分布

### [exercises](Exercise_3.ipynb)

## 二维随机变量

## 边缘分布

## 条件分布

## 相互独立的随机变量

## 两个随机变量的函数的分布

### 连续性随机变量的函数的分布

瑞利分布

In [None]:
# 概率密度
# 瑞利分布
fz = diff(Fz,z)
fz

### 二维离散型随机变量  
方法类似于一维离散型随机变量

假设随机变量$X1,X2,X3,X4$相互独立且同分布,  
$P\{X_i=0\}=0.6, \ P\{X_i=1\}=0.4 \ (i=1,2,3,4)$  
求行列式$X = \begin{vmatrix}X_1 & X_2 \\ X_3 & X_4\\ \end{vmatrix}$的概率分布

### Z=X+Y的概率分布  
$f_Z(z)=\int_{-\infty}^{\infty}f(z-y,y)dy$  
$f_Z(z)=\int_{-\infty}^{\infty}f(x,z-x)dx$  
***
如果$X$和$Y$相互独立  
卷积公式  
$f_X*f_Y=\int_{-\infty}^{\infty}f_X(z-y)f_Y(y)dy=\int_{-\infty}^{\infty}f_X(x)f_Y(z-x)dx$  
***
$Z=aX+bY$  
$f_X*f_Y=\int_{-\infty}^{\infty}\frac{1}{|a|}f_X(\frac{z-by}{a})f_Y(y)dy=\int_{-\infty}^{\infty}\frac{1}{|b|}f_X(x)f_Y(\frac{z-ax}{b})dx$  


#### 正态分布的可加性  

$若X\sim N(0,1),Y\sim N(0,1)且X和Y相互独立 \\ 
则X+Y\sim N(0,2)$  
$若X\sim N(\mu_1,\sigma_1^2),Y\sim N((\mu_2,\sigma_2^2)且X和Y相互独立 \\ 
则X+Y\sim N(\mu_1+\mu_2,\sigma_1^2+\sigma_2^2)\\
则aX+bY\sim N(a\mu_1+b\mu_2,a^2\sigma_1^2+b^2\sigma_2^2)$  

以上结果还可以推广n个正态分布的随机变量  
***
二项分布和泊松分布也具有可加性  

$X\sim b(n,p),y\sim b(m,p)且X和Y相互独立\Rightarrow X+Y\sim b(n+m,p)$  
即：$P\{X=k\}=C_n^kp^k(1-p)^{n-k},(k=0,1,...,n)\\
P\{Y=k\}=C_m^kp^k(1-p)^{m-k},(k=0,1,...,m)\\
P\{X+Y=k\}=C_{m+n}^kp^k(1-p)^{n+m-k},(k=0,1,...,n)$  
***  
$X\sim \pi(\lambda_1),y\sim \pi(\lambda_2)且X和Y相互独立\Rightarrow X+Y\sim \pi(\lambda_1+\lambda_2)$  
即：$P\{X=k\}=\frac{\lambda_1^k}{k!}e^{-\lambda_1}\\
P\{Y=k\}=\frac{\lambda_2^k}{k!}e^{-\lambda_2}\\
P\{X+Y=k\}=\frac{(\lambda_1+\lambda_2)^k}{k!}e^{-(\lambda_1+\lambda_2)}$

In [None]:
# 设 𝑋 和 𝑌 是两个相互独立的随机变量，它们都服从标准正态分布 𝑁(0,1) ，求 𝑍=𝑋+𝑌 的概率密度
x,y,z = symbols('x y z')
mu,sigma = symbols('mu sigma')
f = (1/(sigma*sqrt(2*pi)))*exp(-(x-mu)**2/(2*sigma**2))
fx = f.subs({mu:0,sigma:1})
fy = f.subs({x:y,mu:0,sigma:1})
fx
fy
fxyz = Integral(fx*fy.subs(y,z-x),(x,-oo,+oo))
fxyz_ = simplify(fxyz.doit())
fxyz
fxyz_

#### 标准正态分布与误差函数的关系
$erf(\frac{x}{\sqrt{2}})=2\Phi(x)-1 \\
erf(x)=2\sqrt{2} \Phi(\sqrt{2}x)-1 \\
erf(ax)=2\sqrt{2}a \Phi(\sqrt{2}ax)-1 \\
\Phi(x)=\frac{erf(\frac{x}{\sqrt{2}})+1}{2} \\
\Phi(\sqrt{2} x)=\frac{erf(x)+1}{2\sqrt2} \\
\Phi(ax)=\frac{erf(a\frac{x}{\sqrt{2}})+1}{2a}$

### 积Z=XY与商Z=X/Y的分布

$设X,Y是二维连续型随机变量，其概率密度为f(x,y)\\
则随机变量Z=Y/X的概率密度为\\
f_{Y/X}(z)=\int_{-\infty}^{\infty}|x|f(x,xz)dx\\
随机变量Z=XY的概率密度为\\
f_{XY}(z)=\int_{-\infty}^{\infty}{1\over|x|}f(x,{z\over x})dx$

##### fz.args 重要属性
fz.args


### Z=max{X,Y}与Z=min{X,Y}的分布  
$F_{max}(z)=P\{max\{X,Y\}\le z\}=P\{X\le z,Y\le z\}=P\{X\le z\}P\{Y\le z\}=F_X(z)F_Y(z)\\
F_{min}(z)=P\{min\{X,Y\}\le z\}=1-P\{min\{X,Y\}>z\}=1-P\{X>z,y>z\}=\ 1-P\{X>z\}P\{y>z\}=\ 1-[1-P\{X\le z\}][1-P\{Y\le z\}]=1-[1-F_X(z)][1-F_Y(z)]
$  
以上情况可以推广到n个相互独立的随机变量

# 第四章 随机变量的数字特征

### [exercises](Exercise_4.ipynb)

## 数学期望

### 随机变量的数学期望

#### 0-1分布的数学期望

In [None]:
x, y, z = symbols('x y z')
p = symbols('p', positive=True)
n, k = symbols('n k', integer=True, positive=True)
# 0-1分布的数学期望
ex1 = 0*(1-p)+1*p
ex1 # 结果


#### 二项分布的数学期望  
$C_n^m={n\over m}C_{n-1}^{m-1}$

In [None]:
n, k = symbols('n k', integer=True, positive=True) # n设为正整数很重要
p = symbols('p', positive=True)

# 二项分布的概率
px = binomial(n, k) * p**(k) * (1 - p)**(n - k)
px
# 二项分布的全概率
summation(px, (k, 0, n)).simplify().args[0][0]
# 二项分布的数学期望
ex1 = summation(k*px, (k, 0, n)).simplify().args[0][0]
ex1 # 结果

#### 泊松分布的数学期望

In [None]:
lamda = symbols('lamda')
# 泊松分布的概率
px = exp(-lamda)*lamda**k/factorial(k)
px
# 泊松分布的全概率
summation(px, (k, 0, oo))
# 泊松分布的数学期望
ex1 = summation(k*px, (k, 0, oo))
ex1 # 结果


#### 几何分布的数学期望  


In [None]:
n, k = symbols('n k', integer=True, positive=True)
p = symbols('p', positive=True)
# 几何分布的概率
px = p * (1 - p)**(k-1)
# px = Piecewise((p * (1 - p)**(k-1), (p>0)&(p<1)),(0, True)) # 概率用分段函数表示
px
# 几何分布的全概率
summation(px, (k, 1, oo)).simplify().args[0][0]
# 几何分布的期望
ex1 = summation(k*px, (k, 1, oo)).simplify().args[0][0] 
ex1 # 结果

#### 超几何分布的数学期望   
$X\sim H(N,M,n)$   
$p\{x=k\}=\frac{C_M^k C_{N-M}^{n-k}}{C_N^n}$

In [None]:
n, k, N, M = symbols('n k N M', integer=True, positive=True)
p = symbols('p', positive=True)
# 超几何分布的概率
px = binomial(M, k) * binomial(N - M, n - k) / binomial(N, n)
px
# 超几何分布的全概率
summation(px, (k, 0, n)).simplify()
# 超几何分布的期望
ex1 = summation(k * px, (k, 0, n)).simplify()
ex1 # 结果

#### 均匀分布的数学期望

In [None]:
a, b = symbols('a b', real=True)
# a = symbols('a', real=True)
c = symbols('c', positive=True)
fx = Piecewise((1 / c, (x >= a) & (x <= a + c)), (0, True))
fx
# 均匀分布的全概率
p1 = Integral(fx, (x, a, a + c)).doit().simplify()
p1
# 均匀分布的数学期望
ex1 = Integral(x * fx, (x, a, a + c)).doit().simplify()
ex1
# 符号替换
# b = symbols('b', real=True) # b用符号替换回来
ex1.subs(c, (b - a)).simplify() # 结果

#### 指数分布的数学期望  
$f(x)=\lambda e^{-\lambda x}$

In [None]:
# 数学arg表示复数的辐角
x = symbols('x')
lamda = symbols('lamda', real=True)
fx = lamda * exp(-lamda * x)
fx_ = Piecewise((lamda * exp(-lamda * x),x>0),(0, True))
# 指数分布的概率密度
fx_
# 指数分布的全概率
Integral(fx, (x, 0, oo)).doit().args[0][0] # 如果按分段函数积不出来，所以只积0到正无穷
# 指数分布的数学期望
ex1 = Integral(x*fx, (x, 0, oo)).doit().args[0][0]
ex1 # 结果

#### 正态分布的数学期望

In [None]:
mu,sigma = symbols('mu sigma',real=True) # real设为True很重要
fx = (1/(sigma*sqrt(2*pi)))*exp(-(x-mu)**2/(2*sigma**2))
fx
# 正态分布的全概率
Integral(fx, (x, -oo, oo)).doit().args[0][0] 
# 正态分布的数学期望
ex1 = Integral(x*fx, (x, -oo, oo)).doit().args[0][0]
ex1 # 结果

### 随机变量的函数的数学期望

In [None]:
x, y, z = symbols('x y z')
p, t  = symbols('p t', positive=True)
n, k = symbols('n k', integer=True, positive=True)
lamda = symbols('lamda')

#### 定理1  
$设X是离散型随机变量，其分布律为 \\ 
P\{X=k\}=p_k \ (k=1,2,...) \\ 
设Y是随机变量X的函数：Y=g(X)，\\
则E(Y)=E(g(x)) = \sum_{k=1}^{\infty}{g(x)p_k}，要求绝对收敛
$

#### 定理2  
$设X是连续型随机变量,其概率密度为f(x)，设Y是随机变量X的函数：Y=g(X)，其中g(x)是连续函数 \\ 
则E(Y)=E(g(x)) = \int_{-\infty}^{+\infty}g(x)f(x)dx，要求绝对收敛
$

### 二维随机变量函数的数学期望

#### 命题1
$设二维离散型随机变量(X,Y)分布律为 \\ 
P\{X=x_i,Y=y_j\}=p_{ij} \ (i,j=1,2,...) \\ 
则函数Z=g(X,Y)的数学期望 \\
E(X)=E(g(X,Y)) = \sum_{j=1}^{\infty}\sum_{i=1}^{\infty}{g(x_i,y_j)p_{ij}}，要求绝对收敛
$

#### 命题2
$设二维连续型随机变量(X,Y)概率密度为地f(x,y) \\ 
则函数Z=g(X,Y)的数学期望 \\
E(X)=E(g(X,Y)) = \int_{-\infty}^{+\infty}\int_{-\infty}^{+\infty}{g(x,y)f(x,y)dxdy}，要求绝对收敛
$

### 数学期望的性质  
$性质1：常数C的数学期望就是该常数本身,即E(C)=C \\ 
 性质2：设X是随机变量C是常数，则E(CX)=CE(X) \\
 性质3：设X,Y是随机变量，则E(X+Y)=E(X)+E(Y) \\
 推广：数学期望的线性性质 \\
 性质4：设X,Y是相互独立的随机变量，则E(XY)=E(X)E(Y) \\
 推广：n个相互独立的随机变量 \\
 注意：若X与Y不相互独立，则有E(XY)=E(X)E(Y)-E[E(X-E(X))E(Y-E(Y))] \\
$


## 方差  
$方差的定义D(x)=E{[X-E(X)^2} \\
方差的计算公式：D(X)=E(X^2)-[E(X)]^2$

### 随机变量的方差

#### 0-1分布的方差

In [None]:
x, y, z = symbols('x y z')
p = symbols('p', positive=True)
n, k = symbols('n k', integer=True, positive=True)

ex1 = 0 * (1 - p) + 1 * p
# 0-1分布的方差
# 定义法
dx1 = ((0 - ex1)**2 * (1 - p) + (1 - ex1)**2 * p).simplify()
dx1 
# 公式法
dx2 = (0**2 * (1 - p) + 1**2 * p - ex1**2).simplify()
dx2

#### 二项分布的方差
$C_n^m={n\over m}C_{n-1}^{m-1}$

In [None]:
n, k = symbols('n k', integer=True, positive=True) # n设为正整数很重要
p,q= symbols('p q', positive=True)
# q = 1 - p
# 二项分布的概率
px = binomial(n, k) * p**(k) * (1 - p)**(n - k)
# px = binomial(n, k) * p**(k) * q**(n - k)
px
# 二项分布的全概率
summation(px, (k, 0, n)).simplify().args[0][0]
# 二项分布的数学期望
ex1 = summation(k*px, (k, 0, n)).simplify().args[0][0]
ex1
# 二项分布的方差
# 定义法: 太复杂，不好化简
# dx1 = summation((k-ex1)**2*px, (k, 0, n)).simplify()
# simplify(dacotx1) 
"***"
# 公式法
dx2 = summation(k**2*px, (k, 0, n)).args[0][0]-ex1**2
dx2 = simplify(dx2) 
dx2 # npq

simplify(dx2.replace((1-p),q)) # 去掉负号
dx2.replace((p-1),-q) # 结果


#### 泊松分布的方差

In [None]:
lamda = symbols('lamda')
# 泊松分布的概率
px = exp(-lamda)*lamda**k/factorial(k)
px
# 泊松分布的全概率
summation(px, (k, 0, oo))
# 泊松分布的数学期望
ex1 = summation(k*px, (k, 0, oo))
# 二项分布的方差
# 定义法: 
dx1 = summation((k-ex1)**2*px, (k, 0, oo)).simplify()
dx1 
"***"
# 公式法
dx2 = (summation(k**2*px, (k, 0, oo))-ex1**2).simplify()
dx2 

#### 几何分布的方差

In [None]:
# 特别注意var和symbols的区别
n, k = symbols('n k', integer=True, positive=True)
p = symbols('p', positive=True)
# 几何分布的概率
px = p * (1 - p)**(k-1)
# px = Piecewise((p * (1 - p)**(k-1), (p>0)&(p<1)),(0, True)) # 概率用分段函数表示
px
# 几何分布的全概率
summation(px, (k, 1, oo)).simplify().args[0][0]
# 几何分布的期望
ex1 = summation(k*px, (k, 1, oo)).simplify().args[0][0] 
ex1
# 几何分布的方差
# 定义法: 
dx1 = summation((k-ex1)**2*px, (k, 1, oo)).simplify().simplify().args[0][0] # k要从1开始
dx1 
"***"
# 公式法
dx2 = (summation(k**2*px, (k, 1, oo))-ex1**2).simplify().args[0][0].simplify()
dx2 # 结果

#### 超几何分布的方差  
$X\sim H(N,M,n)$  
$p\{x=k\}=\frac{C_M^k C_{N-M}^{n-k}}{C_N^n}$

In [None]:
n, k, N, M = symbols('n k N M', integer=True, positive=True)
p = symbols('p', positive=True)
# 超几何分布的概率
px = binomial(M, k) * binomial(N-M, n-k)/binomial(N, n) 
px
# 超几何分布的全概率
summation(px, (k, 0, n)).simplify() 
# 超几何分布的期望
ex1 = summation(k*px, (k, 0, n)).simplify() 
"*****"
# 超何分布的方差
# 定义法: 
dx1 = summation((k-ex1)**2*px, (k, 0, oo)).simplify().args[0][0].expand()
dx1 
"***"
# 公式法
dx2 = (summation(k**2*px, (k, 0, oo))-ex1**2).simplify().args[0][0]
dx2 # 结果
"*****"
# 验证
dx_ = n*M/N - (n*M/N)**2 + n*(n-1)*M*(M-1)/(N*(N-1)) # 正确结果
# dx_
dx_.simplify()

#### 均匀分布的方差

In [None]:
a,b=symbols('a b',real=True)
# a = symbols('a', real=True)
c = symbols('c', positive=True)
# b = a + c
fx = Piecewise((1 / c, (x >= a) & (x <= a + c)), (0, True))
fx
# 均匀分布的全概率
p1 = Integral(fx, (x, a, a + c)).doit().simplify()
p1
# 均匀分布的数学期望
ex1 = Integral(x * fx, (x, a, a + c)).doit().simplify()
ex1
"*****"
# 均匀分布的方差
# 定义法: 
dx1 = Integral((x-ex1)**2 * fx, (x, a, a + c)).doit().simplify()
dx1 
"***"
# 公式法
dx2 = (Integral(x**2 * fx, (x, a, a + c)).doit()-ex1**2).simplify()
dx2
# 符号替换
# b = symbols('b', real=True) # b用符号替换回来
# ex1.subs(c,(b-a)).simplify()
dx1.subs(c,(b-a)).simplify() # 结果

#### 指数分布的方差  
$f(x)=\lambda e^{-\lambda x}$

In [None]:
# 数学arg表示复数的辐角
x = symbols('x')
lamda = symbols('lamda', real=True)
fx = lamda * exp(-lamda * x)
fx_ = Piecewise((lamda * exp(-lamda * x),x>0),(0, True))
# 指数分布的概率密度
fx_
# 指数分布的全概率
Integral(fx, (x, 0, oo)).doit().args[0][0] # 如果按分段函数积不出来，所以只积0到正无穷
# 指数分布的数学期望
ex1 = Integral(x*fx, (x, 0, oo)).doit().args[0][0]

# 指数分布的方差
# 定义法: 
dx1 = Integral((x-ex1)**2 * fx, (x, 0, oo)).doit().simplify().args[0][0]
dx1 
"***"
# 公式法
dx2 = (Integral(x**2 * fx, (x, 0, oo)).doit()-ex1**2).simplify().args[0][0]
dx2 # 结果

#### 正态分布的方差

In [None]:
mu,sigma = symbols('mu sigma',real=True) # real设为True很重要
fx = (1/(sigma*sqrt(2*pi)))*exp(-(x-mu)**2/(2*sigma**2))
fx
# 指数分布的全概率
Integral(fx, (x, -oo, oo)).doit().args[0][0] 
# 指数分布的数学期望
ex1 = Integral(x*fx, (x, -oo, oo)).doit().args[0][0]
"*****"
# 正态分布的方差
# 定义法: 
dx1 = Integral((x-ex1)**2 * fx, (x, -oo, oo)).doit().simplify().args[0][0]
dx1 
"***"
# 公式法
dx2 = (Integral(x**2 * fx, (x, -oo, oo)).doit()-ex1**2).simplify().args[0][0]
dx2 # 结果

### 方差的性质  

#### 性质1  
$常数C的方差为零，即D(C)=0$


#### 性质2  
$设X是随机变量，C是常数，则D(CX)=C^2D(X),D(X+C)=D(X) \\
推论：\sigma(CX)=|C|\sigma(X)$


#### 性质3  
$设𝑋,Y是随机变量，则\\
D(X+Y)=D(X)+D(Y)+2E\{[X-E(X)][Y-E(Y)]\}=D(X)+D(Y)+2Cov(X,Y)=D(X)+D(Y)+2\rho \sqrt{D(X)}\sqrt{D(Y)}\\ 
若X,Y相互独立，则D(X+Y)=D(X)+D(Y),\ D(aX\pm bY)=a^2D(X)+b^2D(Y)$

#### 性质4  
$D(X)=0 \Leftrightarrow P\{X=E(X)\}=1$


#### 正态分布的线性组合  
$设随机变量X\sim N(\mu, \sigma^2) \\ 
则随机变量aX\sim N(a\mu, a^2\sigma^2) \\ 
若X,Y相互独立，则 \\
aX+bY\sim N(a\mu_1+b\mu_2,a^2\sigma_1^2+b^2\sigma_2^2)$

## 协方差及相关系数


### 协方差的定义

### 定义（协方差）
$
设X,Y是二维随机变量，称E\{[X-E(X)][Y-E(Y)]\}为X与Y的协方差(Covariance),记为Cov(X,Y)或\sigma(X,Y)\\
即Cov(X,Y)=E\{[X-E(X)][Y-E(Y)]\}=\sigma(X,Y)\\
-\infty<Cov(X,Y)<+\infty
$

### 定义（相关系数）  
$
设X,Y是二维随机变量，X与Y的协方差\\
Cov(X,Y)=E\{[X-E(X)][Y-E(Y)]\}=\sigma(X,Y)\\
-\infty<Cov(X,Y)<+\infty
$  
$
当D(X)和D(Y)不等于0时，定义X与Y的相关系数(Correlation Coefficient)为 \\
\rho_{XY} = \frac{Cov(X,Y)}{\sqrt{D(X)}\sqrt{D(Y)}} = \frac{\sigma(X,Y)}{\sigma(X)\sigma(Y)}\\
-1\le\rho_{XY}\le 1 \\
Cov(X,Y)=\rho_{XY}\sqrt{D(X)}\sqrt{D(Y)}
$


### 协方差的计算公式  


#### 二维离散型随机变量  
$
设X,Y是二维离散型随机变量\\
其分布律为\\
p_{ij} = P\{X=x_i,Y=y_i\},i,j=1,2\\
则X与Y的协方差\\
Cov(X,Y)=E\{[X-E(X)][Y-E(Y)]\}=\sum_{j=1}^{\infty}\sum_{i=1}^{\infty}[X_i-E(X)][Y_j-E(Y)]p_{ij}
$

#### 二维连续型随机变量
$
设X,Y是二维连续型随机变量\\
其概率密度律为f(x,y)\\
则X与Y的协方差\\
Cov(X,Y)=E\{[X-E(X)][Y-E(Y)]\}=\int_{-\infty}^{\infty}\int_{-\infty}^{\infty}[X_i-E(X)][Y_j-E(Y)]dxdy
$

#### 一个重要的计算公式  
$
Cov(X,Y)=E(XY)-E(X)E(Y) \\
X与Y相互独立时，Cov(X,Y)=0\\
X与X的协方差等于X的方差
$

### 协方差的性质  
$
设X,Y,Z为随机变量，a,b是常数 \\
(1) \ Cov(X,Y)=Cov(Y,X) \ 对称性\\
(2) \ Cov(X,a)=0 \ 随机变量与常数不相关\\
(3) \ Cov(aX,bY)=abCov(X,Y) \ 常数因子可以提出来\\
(4) \ Cov(X\pm Y,Z)=Cov(X,Z)\pm Cov(X,Z) \ 线性性质
$


### 相关系数性质
$
(1) \ \rho_{XY}=\rho_{YX} \ 对称性\\
(2) \ |\rho_{XY}|\le 1 \ 有界性\\
(3) \ |\rho_{XY}|=1 \ 的充分必要条件是存在常数a,b,(a\neq 0)，使得P\{Y=aX+b\}=1 \ Y以概率1等于X的线性函数，当a>0时，\rho_{XY}=1，当a<0时，\rho_{XY}=-1 \\
a=\pm \frac{\rho(Y)}{\rho(X)},\ b=E(Y)\mp \frac{\rho(Y)}{\rho(X)}E(X)
$

$
X的标准化X^* = \frac{X-E(X)}{\sigma(X)}
$

###  引理  
$设随机变量X和Y的数学期望和方差都存在 \\ 
令X^* = \frac{X-E(X)}{\sigma(X)},\ Y^* = \frac{Y-E(Y)}{\sigma(Y)} \\ 
则\rho_{XY} = Cov(X^*, Y^*)\\
D(X^* \pm Y^*)=2(1\pm \rho_{XY})
$

$
\rho_{XY}=1时，称X与Y正线性相关 \\
\rho_{XY}-1时，称X与Y负线性相关 \\
\rho_{XY}>0时，称X与Y正相关 \\
\rho_{XY}<0时，称X与Y负相关 \\
\rho_{XY}=0时，称X与Y不相关 \\
当|\rho_{XY}|的值从1变到0时，X与Y的相关性逐步降低 \\
相关系数是衡量X和Y之间线性关系紧密程度的一个量 \\
相关系数较大时X和Y之间线性相关程度较高 \\
相关系数较小时X和Y之间线性相关程度较低 \\
$

### 独立与不相关的关系
独立必不相关，不相关未必独立

### 不相关的等价条件
$
(1)X与Y不相关\\
(2)相关系数\rho_{XY}=0\\
(3)协方差Cov(X,Y)=0\\
(4)E(XY)=E(X)E(Y)\\
(5)D(X+Y)=D(X)+D(Y)\\
$

### 二维正态随机变量的相关系数  
$
f(x,y)= \frac{1}{2\pi\sigma_1\sigma_2\sqrt{1-\rho^2}}e^{\frac{-1}{2(1-\rho^2)}[\frac{(x-\mu_1)^2}{\sigma_1^2}-2\rho\frac{(x-\mu_1)(x-\mu_2)}{\sigma_1\sigma_2}+\frac{(y-\mu_2)^2}{\sigma_2^2}]}
$

In [None]:
# 二维正态分布的公式
mu_1, mu_2, sigma_1, sigma_2, rho = symbols('mu_1,mu_2,sigma_1,sigma_2,rho')
mu_1, mu_2, sigma_1, sigma_2, rho
f_xy = (1 / (2 * pi * sigma_1 * sigma_2 * sqrt(1 - rho**2))) * exp(
    (-1 / (2 * (1 - rho**2))) * ((x - mu_1)**2 / sigma_1**2 - 2 * rho *
                                 ((x - mu_1) * (x - mu_2) /
                                  (sigma_1 * sigma_2)) +
                                 (x - mu_2)**2 / sigma_2**2))
f_xy
print_latex(f_xy)

$\frac{e^{- \frac{- \frac{2 \rho \left(- \mu_{1} + x\right) \left(- \mu_{2} + x\right)}{\sigma_{1} \sigma_{2}} + \frac{\left(- \mu_{2} + x\right)^{2}}{\sigma_{2}^{2}} + \frac{\left(- \mu_{1} + x\right)^{2}}{\sigma_{1}^{2}}}{2 - 2 \rho^{2}}}}{2 \pi \sigma_{1} \sigma_{2} \sqrt{1 - \rho^{2}}}$

## 矩、协方差矩阵

$设随机变量X\sim N(0,\sigma^2),则X的k阶原点矩和k阶中心矩为 \\
m_k=c_k=\begin{cases} 0, & k是奇数\\ \sigma^k(k-1)!!, & k是偶数\end{cases}
$

In [None]:
mu,sigma = symbols('mu sigma')
k = symbols('k',positive=True, integer=True)
fx = (1/(sigma*sqrt(2*pi)))*exp(-(x-mu)**2/(2*sigma**2))
fx = fx.subs({mu:0})
integrate(fx*x**k,(x,-oo,oo)).simplify()
for i in range(1,9):
    i
    integrate(fx*x**i,(x,-oo,oo)).args[0][0]
    "***"

# 第五章 大数定律及中心极限定理

### [exercises](Exercise_5.ipynb)

## 大数定律

## 中心极限定理