# Intro to Probability

La probabilidad es una medida de la certidumbre asociada a un suceso o evento futuro y suele expresarse como un número entre 0 y 1 (o entre 0 % y 100 %). 

Se obtiene la frecuencia de un acontecimiento determinado mediante **la realización de experimentos aleatorios**, de los que **se conocen todos los resultados posibles**, bajo condiciones suficientemente estables. Un suceso puede ser improbable (con probabilidad cercana a 0), probable (probabilidad intermedia) o seguro (con probabilidad uno).


## Mutual exclusivity of Events

Two events are said to be mutually exclusive if they cannot happen at the same time.

For example, if we toss a coin, either heads or tails might turn up, but not heads and tails at the same time.

<div style="text-align:center;">
<img src="images/mutual_exclusive_1.png" style="width: 300px; display:inline;"/>
<img src="images/mutual_exclusive_3.jpg" style="width: 300px; display:inline;"/>
<img src="images/mutual_exclusive_2.png" style="width: 300px;"/>
</div>

### Regla de la suma
- Eventos `A` y `B` mutuamente excluyentes ( $ A\cap B=\varnothing $ ) entonces $P(A\cup B)=P(A)+P(B)$ 
-  Eventos `A` y `B`  NO mutuamente excluyentes ( $ A\cap B\neq\varnothing $ ) entonces: $P(A\cup B)=P(A)+P(B)-P(A\cap B)$

Siendo: $P(A)$ la probabilidad de ocurrencia del evento `A`, $P(B)$ la probabilidad de ocurrencia del evento `B`, y $P(A\cap B)$ la probabilidad de ocurrencia simultánea de los eventos A y B.

### Regla de la multiplicación

- $P(A\cap B)=P(A)P(B)$, si A y B son independientes.
- $P(A\cap B)=P(A)P(B|A)$, si A y B son dependientes.

siendo $P(B|A)$ la probabilidad de que ocurra B habiéndose dado o verificado el evento A. 

Nota: $P(B|A)$ se lee como la **probabilidad de B condicionada de A**

## Probabilidad Condicionada

- The conditional probability $P(A|B)$ is the probability of event A given that event B as occurred.

<img src="images/prob_conditional_1.png" style="width: 300px; display:inline;"/>
<img src="images/prob_conditional_table.png" style="width: 300px; display:inline;"/>
<img src="images/prob_conditional_formula_2.jpg" style="width: 300px; display:inline;"/>
<img src="images/prob_conditional_formula_1.jpg" style="width: 300px; display:inline;"/>

### Refs
- **Conditional Probability visualized** http://setosa.io/conditional/
- **Conditional Probability Explained** https://towardsdatascience.com/conditional-probability-with-a-python-example-fd6f5937cd2
- https://es.wikipedia.org/wiki/Probabilidad

## Definiciones

- **Population:** a population is a set of similar items or events which is of interest for some question or experiment
- **Sample**: A subset of the population

<img src="images/sample-size-definition.png" style="width: 400px;"/>

## Atención, simbolos:
- $\bar{X}$: Representa la media del `sample`
- $\mu$: Representa la media de la población

## Ejercicio

Un lote contiene "100" objetos de los cuales "20" son defectuosos. Los objetos son seleccionados uno después del otro para ver si ellos son defectuosos. Suponga que dos objetos son seleccionados sin reemplazo (significa que el objeto que se selecciona al azar se deja por fuera del lote). ¿Cuál es la probabilidad de que los dos objetos seleccionados sean defectuosos?

### Solución

Sea los eventos

$A_{1}=$ primer objeto defectuoso, $A_{2}=$ segundo objeto defectuoso

entonces dos objetos seleccionados serán defectuosos, cuando ocurre el evento $A_{1}\cap A_{2}$ que es la intersección entre los eventos $A_{1}$ y $A_{2}$. 

De la información dada se tiene que:

$$P(A_{1})={\frac {20}{100}}$$
$$P(A_{2}|A_{1})={\frac {19}{99}}$$


así que la probabilidad de que los dos objetos seleccionados sean defectuosos es

${\displaystyle P(A_{1}\cap A_{2})=P(A_{1})P(A_{2}|A_{1})={\frac {20}{100}}\cdot {\frac {19}{99}}={\frac {19}{495}}\simeq 0.038}$


Ahora suponga que selecciona un tercer objeto, entonces la probabilidad de que los tres objetos seleccionados sean defectuosos es

${\displaystyle P(A_{1}\cap A_{2}\cap A_{3})=P(A_{1})P(A_{2}|A_{1})P(A_{3}|A_{1}\cap A_{2})={\frac {20}{100}}\cdot {\frac {19}{99}}\cdot {\frac {18}{98}}={\frac {19}{2695}}\simeq 0.007}$



## Selection Bias (sesgo)
Se refiere al hecho de realizar un sample consciente o inconscientemente de tal modo que lleve a una conclusión engañosa o efímera.


## Variance and STD Deviation
**Variance**: The average of the squared differences from the Mean.
  1. Work out the Mean (the simple average of the numbers)
  2. Then for each number: subtract the Mean and square the result (the squared difference).
  3. Then work out the average of those squared differences.

**Standard Deviation:** Is the squared root of the variance. The Standard Deviation
    is a measure of how spread out numbers are. 
    Its symbol is σ. it is the square root of the **Variance**.
    
More: [https://www.mathsisfun.com/data/standard-deviation.html]

In [6]:
X = np.random.random(100000)
print(X.mean())
var = np.round(X.var(),decimals=3)
std = np.round(X.std(),decimals=3)

print(f"Variance:{var} Standard Deviation:{std} ")


0.5012357964230417
Variance:0.083 Standard Deviation:0.288 


## 1. Ejercicio:
Supon que el conjunto universal (un conjunto universal es un conjunto formado por todos los objetos de estudio en un contexto dado) consta de los enteros positivos del 1 al 10.

Sean:
- $A=\{2,3,4\}$
- $B=\{3,4,5\}$
- $C=\{5,6,7\}$

Anota los elementos de los siguientes conjuntos:
1. $\overline{A} \cap B$
2. $\overline{A} \cup B$
3. $\overline{\overline{A} \cap \overline{B}}$
4. $\overline{A \cap \overline{(B \cap C)}}$
5. $\overline{A \cap (B \cup C)}$

### Solución: 

`{5}`,`{1,3,4,5,6,7,8,9,10}`,`{2,3,4,5}`,`{1,5,6,7,8,9,10}`,`{1,2,5,6,7,8,8,10}`

## 2. Ejercicio

Sean `A`,`B`,`C`  tres sucesos asociados conun experimento. Exprese las siguientes proposiciones verbales en notación de conjuntos:

1. Al menos uno de los sucesos ocurre
2. Exactamente uno de los sucesos ocurre
3. Exactamente dos de los sucesos ocurren
4. No ocurren más de dos sucesos simultáneamente

### Solución

1. $A\cup B \cup C$
2. $ [A\cap \overline{B} \cap \overline{C}] \cup [\overline{A} \cap B \cap \overline{C}] \cup [\overline{A}\cap \overline{B} \cap C]$
3. up to you
4. $ \overline{A \cup B \cap C }$

## 3. Ejercicio

Un motor eléctrico puede fallar por obstrucción de los cojinetes, por combustión del embobinado o por desgaste de las escobillas.  Supóngase que la probabilidad de la obstrucción es el doble de la de combustión, la cual es cuatro veces mas probable que la inutilización de las escobillas.

¿Cuál es la probabilidad de que el fallo sea por cada uno de estos tres mecanismos?

### Solución

- `Esco: 1/13`, `Comb: 4/13`, `Obs: 8/13`