# 概率论与数理统计
+ 概率论是数学的一个分支，研究如何定量描述随机变量及其规律
+  数理统计则是以数据为唯一研究对象，包括数据的收集、整理、分析和建模，从而对随机现象的某些规律进行预测或决策。

## 概率论的学习
1. 学思想：如何看待和处理随机事件的规律性
2. 学方法：建立统计模型
3. 学应用：各种模型的应用
4. 学工具：利用excel、python等工具，对数据进行处理和分析

# 随机实验与样本空间
## 随机实验
### 定义
对随机现象的观察、记录、实验统称为随机试验。
### 特性
+ 在相同的条件下，可以重复实现
+ 事先知道所有可能出现的结果
+ 试验前并不知道哪个结果会发生
### 随机试验的分类
随机试验有很多种，例如常出现的掷骰子，摸球，射击，抛硬币等。所有的随机试验的结果可以分为两类来表示：
+ 数量化表示：射击命中的次数，商场每个小时的客流量，每天经过某个收费站的车辆等，这些结果本身就是数字；
+ 非数量化表示：抛硬币的结果（正面/反面），化验的结果（阳性/阴性）等，这些结果是定性的，非数量化的。但是可以用示性函数来表示，例如可以规定正面（阳性）为1，反面（阴性）为0，这样就实现了非数量化结果的数量化表示。

 

# 样本空间
+ 随机试验的所有可能结果构成的集合。一般即为S（大写的S）。
+ S中的元素e称为样本点（也可以叫做基本事件）；
+ 事件是样本空间的子集，同样是一个集合

# 事件的相互关系及运算

## 事件的关系


![%E5%9B%BE%E7%89%87.png](attachment:%E5%9B%BE%E7%89%87.png)

![%E5%9B%BE%E7%89%87.png](attachment:%E5%9B%BE%E7%89%87.png)

# 频率与概率
## 频率：
### 定义:
$$f_n(A) = \frac{n_A}{n}$$
其中：$n_A$是A 发生的次数(频数)  
n是总的试验次数  
称$f_n(A)$是A在这n次试验中发生的频率
### 频率的性质：
1. $0≤f_n(A)≤1$
2. $f_n(S)=1$
3. 若$A_1,A_2,\cdots,A_K$两两不相容，则
$$f_n(\bigcup_{i=1}^{k}A_I) = \sum_{i=1}^{k}f_n(A_i)$$

4. $f_n(A)$随n的增大渐趋稳定，稳定值为p(概率)  
(相关证明参见大数定律)
 

## 概率
### 定义：
+ 当试验的次数增加时，随机事件A发生的频率的稳定值$p$称为概率.记为$P(A)=p$

+ (概率的公理化定义:简单地说就是，概率不小于0，所有事件的概率和为1)
![%E5%9B%BE%E7%89%87.png](attachment:%E5%9B%BE%E7%89%87.png)


### 性质
1. $P(\varnothing) = 0$
2. $P(A) = 1 - P(\bar{a})$
3. (有限可加性)
$$A_1,A_2,\cdots,A_n, A_iA_j = \varnothing, i≠j,\\
\Rightarrow P(\bigcup_{i=1}^{n}A_i) = \sum_{i=1}^{n}P(A_i)$$
4. 若$A \subset B$, 则有$P(B-A) = P(B) - P(A)$
5. 概率的加法公式：
$$P(A \cup B) = P(A) + P(B) - P(AB)$$  
    + 推广1：
$$P(A \cup B \cup C) = P(A) + P(B) + P(C) - P(AB) - P(AC) - P(BC) + P(ABC)$$
    + 推广2：(偶减奇加)
$$P(\bigcup_{i=1}^{n} A_i) = \sum_{i=1}^{n}P(A_i) - \sum_{1≤i＜j≤n} P(A_iA_j)
+ \sum_{1≤i＜j＜k≤n}P(A_iA_jA_k) + \cdots + (-1)^{n-1}P(A_1A_2 \cdots A_n)$$

#### 相关性质的证明


![%E5%9B%BE%E7%89%87.png](attachment:%E5%9B%BE%E7%89%87.png)

![%E5%9B%BE%E7%89%87.png](attachment:%E5%9B%BE%E7%89%87.png)

![%E5%9B%BE%E7%89%87.png](attachment:%E5%9B%BE%E7%89%87.png)

# 等可能概率(古典概型)


## 定义：若试验满足
+ 样本空间S中样本点有限(有限性)
+ 出现每一个样本点的概率相等(等可能性)称这种试验为等可能概型(或古典概型)


![%E5%9B%BE%E7%89%87.png](attachment:%E5%9B%BE%E7%89%87.png)

## 例题


![%E5%9B%BE%E7%89%87.png](attachment:%E5%9B%BE%E7%89%87.png)

自己的理解：
+ 若k=1，即第一次摸到白球，则
$$P(A_k) = P(A_1) = \frac{a}{a+b}$$
+ 若k=2，即第2次摸到白球，则  
$P(A_k)$  
$= P(A_2)$
$= P(第一次摸到白球，第二次也摸到白球)+ P(第一次摸到黄球，第二次摸到白球)$
$= \frac{a}{a+b}×\frac{a-1}{a+b-1} + \frac{b}{a+b}×\frac{a}{a+b-1}$  
$= \frac{a(a-1) + ab}{a(a+b-1)}$  
$= \frac{a}{a+b}$

同样的道理求$P(A_k)就可以推出结论$

# 条件概率
## 定义：
$$P(B|A) = \frac{P(AB)}{P(A)}, P(A)≠0$$
(定义的理解：$P(A|B)$表示在事件B发生的条件下，事件A发生的概率，相当于A在B中所占的比例。此时，样本空间从原来的完整样本空间S缩小到了B)  
由于有了条件的约束（事件B），使得原来的样本空间减小了。

![%E5%9B%BE%E7%89%87.png](attachment:%E5%9B%BE%E7%89%87.png)