# Módulo: Teoría de Probabilidades
## Probabilidad total
## Regla de Bayes

# Objetivos de la clase
- Conocer y comprender los teoremas de probabilidad total y de Bayes.
- Aplicar estos teoremas a casos prácticos.


# Ejemplo introductorio
Supongamos los siguientes datos respecto de los adultos de un pequeño pueblo:

| Edad | Empleado | Desempleado | Total |
| --- | --- | --- |  --- |
| 30 a 50 | 460 | 40 |  500 |
| 50 a 70 | 140 | 260 |  400 |
| **Total** | **600** | **300** |  **900** |

Ademas suponemos que 36 de los empleados y 12 de los desempleados son miembros del club de caza del pueblo. Queremos encontrar la probabilidad del evento $A$ en que al elegir una persona al azar se elija un miembro del club de caza, pero usaremos un enfoque diferente.

Denotando como $E$ al evento de elegir una persona empleada, podemos escribir el evento $A$ como la unión de dos eventos mutuamente excluyentes:

\begin{align}
    A = (A \cap E) \cup (A \cap E') 
\end{align}


Luego, podemos expresar la probabilidad de $A$ como:

\begin{align}
    P(A) = P[(A \cap E) \cup (A \cap E') ] = P(A \cap E) + P(A \cap E') = P(E) P(A|E) + P(E') P(A|E')
\end{align}

A partir de los datos podemos calcular las probabilidades:

\begin{align}
    P(E) & = \frac{600}{900} = \frac{2}{3} &
    P(A|E) & = \frac{36}{600} = \frac{3}{50}
\end{align}

Además:
\begin{align}
    P(E') & = \frac{1}{3} &
    P(A|E') & = \frac{12}{300} = \frac{1}{25}
\end{align}

Entonces la probabilidad del evento $A$ es:

\begin{align}
    P(A) = \left(\frac{2}{3}\right) \left(\frac{3}{50}\right) + \left(\frac{1}{3}\right)\left(\frac{1}{25}\right) = \frac{4}{75}
\end{align}

# Teorema de probabilidad total
- El ejemplo anterior ilustra cómo es posible calcular la probabilidad de un evento a partir de particiones en el espacio muestral.

- Una **partición** son todas aquellas divisiones mutuamente excluyentes y colectivamente exhaustivas que se pueden realizar sobre un espacio muestral.

<center>
    <img src="figures/prob-total-2.png" width="400"/>
</center>

De manera generalizada, sean $B_1, B_2, ... B_n$ eventos que forman una partición de $S$ tales que $P(B_i) \neq 0$, entonces para cualquier evento $A$ dentro de $S$ se cumple que:

\begin{align}
    P(A) = \sum_{i=1}^{n} P(A \cap B_i) = \sum_{i=1}^{n} P(B_i) P(A|B_i)
\end{align}

<center>
    <img src="figures/prob-total-3.png" width="400"/>
</center>

**Ejemplo**: Tres máquinas de una planta, llamadas $B_1$, $B_2$ y $B_3$, fabrican el 30\%, 45\% y 25\% de los productos, respectivamente. Por experiencia se sabe que el 2\%, 3\% y 2\% de los productos fabricados por cada máquina, respectivamente, tienen defectos. Suponga que se selecciona al azar un producto terminado. ¿Cuál es la probabilidad de que esté defectuoso?

\begin{align}
    P(A) = P(B_1) P(A|B_1) + P(B_2) P(A|B_2) + P(B_3) P(A|B_3) \\ 
    P(A) = (0.3)(0.02) + (0.45)(0.03) + (0.25)(0.02) = 0.0245
\end{align}

<br>
<center>
    <img src="figures/machine-1.jpg" width="500"/>
</center>

# Regla de Bayes
- Considere el problema de obtener la probabilidad condicional $P(B_r|A)$ en vez de la probabilidad total $P(A)$.

- En este caso se aplica la denominada regla de Bayes, siendo $B_1, B_2, ... B_n$ una partición de $S$ y $A$ un evento en $S$:

\begin{align}
    P(B_r|A) = \frac{P(A \cap B_r)}{\sum_{i=1}^{n} P(A \cap B_i) } = \frac{P(B_r) P(A|B_r)}{\sum_{i=1}^{n} P(B_i) P(A|B_i) }
\end{align}

- Notar que la regla de Bayes "cambia" una probabilidad condicional $P(B|A)$ por la otra probabilidad condicional $P(A|B)$



**Ejemplo**: En referencia al ejemplo anterior, se elige un producto al azar y resulta defectuoso. ¿Cuál es la probabilidad que se haya fabricado con la máquina $B_3$?

\begin{align}
    P(B_3|A) = \frac{P(B_3) P(A|B_3)}{ P(B_1) P(A|B_1) + P(B_2) P(A|B_2) + P(B_3) P(A|B_3) } \\ 
    P(B_3|A) = \frac{(0.25) (0.02)}{ (0.3) (0.02) + (0.45) (0.03) + (0.25) (0.02) } = 0.2041 \\ 
\end{align}

<br>
<center>
    <img src="figures/machine-2.jpg" width="500"/>
</center>

# Ejercicios

**Ejercicio 1**: una tienda de pinturas vende pinturas al agua y al aceite. La probabilidad que un cliente compre pintura al aceite es 0.75. De los que compran pintura al aceite, el 60\% también compra rodillos. Sin embargo, solo el 30\% de los que compran pintura al agua compra rodillos. Se selecciona al azar un cliente que compra un rodillo y pintura, ¿cuál es la probabilidad que sea pintura al aceite?

<br>
<center>
    <img src="figures/pinturas-1.png" width=" 600"/>
</center>

Datos: 
- Prob. de comprar pintura al aceite: $P(C) = 0.75$
- Prob. de comprar pintura al agua: $P(G) = 1 - P(C) = 0.25$
- Prob. de comprar rodillo dado que compró pintura al aceite: $P(R|C) = 0.6$
- Prob. de comprar rodillo dado que compró pintura al agua: $P(R|G) = 0.3$

Se busca:
- Prob. de comprar pintura al aceite dado que compró rodillo: $P(C|R) = ? $

Regla de Bayes:
- Notar que la partición del espacio muestral es: pintura al agua ($G$) o pintura al aceite ($C$)
- En este caso el comprar un rodillo ($R$) sería un evento cualquiera dentro de $S$

\begin{align}
    P(C|R) = \frac{P(C) P(R|C)}{ P(G) P(R|G) + P(C) P(R|C) }
\end{align}
<br>

\begin{align}
    P(C|R) = \frac{(0.75) (0.6)}{ (0.25) (0.3) + (0.75) (0.6) } = 0.857
\end{align}

**Ejercicio 2**: En un concurso se elige una de tres puertas para intentar ganar el premio que está detrás de una de ellas. Inicialmente usted elige la puerta A. El presentador del concurso abre la puerta B y muestra que allí no está el premio. Ahora, usted tiene la opción de quedarse con la puerta A o cambiarse a la puerta C. Fundamente su decisión

<br>
<center>
    <img src="figures/monty-1.png" width="800"/>
</center>

Eventos:
- A: el jugador elige inicialmente la puerta que tiene el premio
- B: el jugador elige inicialmente la puerta que no tiene el premio
- G: el jugador gana el premio

\begin{align}
    P(G) = P(G \cap A) + P(G \cap B)
\end{align}

\begin{align}
    P(G) = P(A) P(G|A) + P(B) P(G|B)
\end{align}

\begin{align}
    P(G) = \frac{1}{3} P(G|A) + \frac{2}{3} P(G|B)
\end{align}

Si el jugador **nunca** se cambia de puerta:

\begin{align}
    P(G|A) & = 1 & 
    P(G|B) & = 0
\end{align}

Entonces: 

\begin{align}
    P(G) = \frac{1}{3} P(G|A) + \frac{2}{3} P(G|B)
\end{align}

\begin{align}
    P(G) = \frac{1}{3} (1) + \frac{2}{3} (0) = \frac{1}{3}
\end{align}

Si el jugador **siempre** se cambia de puerta:

\begin{align}
    P(G|A) & = 0 & 
    P(G|B) & = 1
\end{align}

Entonces:

\begin{align}
    P(G) = \frac{1}{3} P(G|A) + \frac{2}{3} P(G|B)
\end{align}

\begin{align}
    P(G) = \frac{1}{3} (0) + \frac{2}{3} (1) = \frac{2}{3}
\end{align}

¡Entonces es mejor siempre cambiarse de puerta!

In [14]:
import random

def run_trial(switch_doors):    
    chosen_door = random.randint(1, 3) # elige una de tres puertas
    if switch_doors:
        revealed_door = 3 if chosen_door==2 else 2
        available_doors = [dnum for dnum in range(1,4) if dnum not in (chosen_door, revealed_door)]                
        chosen_door = random.choice(available_doors)
    return chosen_door == 1 # se gana al elegir la puerta 1

def run_trials(ntrials, switch_doors):
    nwins = 0
    for i in range(ntrials):
        if run_trial(switch_doors):
            nwins += 1
    return nwins
 
ntrials = 100
nwins_without_switch = run_trials(ntrials, False)
nwins_with_switch = run_trials(ntrials, True)

print('Proporción de ganar sin cambiarse de puerta = ', nwins_without_switch/ntrials)
print('Proporción de ganar con cambiarse de puerta = ', nwins_with_switch/ntrials)

Proporción de ganar sin cambiarse de puerta =  0.4
Proporción de ganar con cambiarse de puerta =  0.72


**Ejercicio 3**: En una región de Chile se sabe que la probabilidad de seleccionar una persona con cáncer es 0.05. Si la probabilidad que un médico diagnostique correctamente a una persona con cáncer es 0.78 y la probabilidad que diagnostique incorrectamente a una persona sin cáncer es 0.06, ¿cuál es la probabilidad de que a una persona se le diagnostique cáncer?

<br>
<center>
    <img src="figures/diagnostic-1.jpg" width="500"/>
</center>

Datos:
- Prob. de tener cáncer $P(C)$ = 0.05

- Prob. de ser diagnosticado con cáncer teniéndolo $P(D|C)$ = 0.78

- Prob. de ser diagnosticado con cáncer sin tenerlo $P(D|N)$ = 0.06

Se busca:
- Prob. de un diagnóstico de cáncer $P(D)$ = ?

Expresamos la probabilidad de un diagnóstico de cáncer ($D$) mediante la partición de eventos mutuamente excluyentes de tener cáncer ($C$) y no tener cáncer ($N$):

\begin{align}
    P(D) = P(D \cap C) +  P(D \cap N)
\end{align}

\begin{align}
    P(D) = P(C)P(D|C) +  P(N) P(D|N)
\end{align}

\begin{align}
    P(D) = (0.05) (0.78) +  (0.95) (0.06) = 0.096
\end{align}

# Sumario
- El teorema de probabilidad total permite calcular la probabilidad de un evento a partir de particiones en el espacio muestral
- La regla de Bayes permite vincular la probabilidad condicional de un evento A dado un evento B, al la probabilidad condicional de un evento B dado el evento A.
- La regla de Bayes también tiene gran relevancia en estadística inferencial, tema que trataremos más adelante en el curso.