<img src="jalalogo.png">


# Semana 3: Probabilidad

### Conceptos básicos

### Espacio muestral
El espacio muestral de un experimento, representado por $\Omega$, es simplemente el conjunto que incluye todos los resultados posibles de ese experimento.

### Probabilidad Clásica o de Laplace

En un experimento aleatorio con un espacio muestral en el que todos los resultados son equiprobables, se emplea la probabilidad de Laplace para calcular la probabilidad de un evento $A$. La fórmula asociada a este enfoque es la siguiente:

$$ P(A) = \frac{\#(A)}{\#(\Omega)} $$

donde:
- $\#(A)$ representa el número de resultados favorables al evento $A$,
- $\#(\Omega)$ es el número total de resultados posibles en el espacio muestral.

### Reglas de Probabilidad
Sean $A$ y $B$ eventos:
1. $0 \leq P(A) \leq 1$.
2. $P(A \cup B) = P(A) + P(B) - P(A \cap B)$.
3. $P(A^c) = 1 - P(A)$.
4. $P(\emptyset) = 0$.

### Probabilidad Condicional
Supongamos que $P(B) > 0$. Definimos la probabilidad condicional de $A$ dado $B$ como:

$$ P(A|B) = \frac{P(A \cap B)}{P(B)} $$


### Eventos Mutuamente Excluyentes

Dos eventos son **mutuamente excluyentes** (o disjuntos) si no pueden ocurrir simultáneamente. Es decir, si un evento ocurre, el otro no puede ocurrir. La probabilidad de la intersección de dos eventos mutuamente excluyentes es cero.

Matemáticamente, dos eventos $A$ y $B$ son mutuamente excluyentes si:

$$ P(A \cap B) = 0 $$

Si A y B son eventos mutuamente excluyentes, entonces la probabilidad conjunta de A y B es la suma de las probabilidades individuales:

$$P(A \cup B)= P(A)+P(B)$$. 
 



### Eventos Independientes

Dos eventos son **independientes** si la ocurrencia de uno no afecta la ocurrencia del otro. En otras palabras, el hecho de que un evento ocurra no cambia la probabilidad de que el otro evento ocurra.

Matemáticamente, dos eventos $A$ y $B$ son independientes si:

$$P(A \cap B) = P(A) \cdot P(B) $$



Si dos eventos A y B son independientes entonces 

$$ P(A|B) = P(A)$$

La anterior se puede interpretar como: Si A y B son independientes entonces la ocurrencia de B no afecta la probabilidad de A.


### Teorema de la probabilidad total
Suponga que $A_1$ , $A_2$ y $B$ son eventos en un espacio muestral $E$ tales que $E=A_1\cup A_2$ y $A_1\cap A_2=\emptyset$. Entonces 
   
   $$P(B)=P(B|A_1)P(A_1)+P(B|A_2)P(A_2)$$




Considere la base de datos tomado de Kaggle:(Obesity Levels) sobre la cual se realizarán el siguiente ejemplo.
 

https://www.kaggle.com/datasets/fatemehmehrparvar/obesity-levels



In [1]:
#importamos librerias
import pandas as pd

#Cargamos la base de datos:
df = pd.read_csv('ObesityLevels.csv')

df.head()

Unnamed: 0,Age,Gender,Height,Weight,CALC,FAVC,FCVC,NCP,SCC,SMOKE,CH2O,family_history_with_overweight,FAF,TUE,CAEC,MTRANS,NObeyesdad
0,21.0,Female,1.62,64.0,no,no,2.0,3.0,no,no,2.0,yes,0.0,1.0,Sometimes,Public_Transportation,Normal_Weight
1,21.0,Female,1.52,56.0,Sometimes,no,3.0,3.0,yes,yes,3.0,yes,3.0,0.0,Sometimes,Public_Transportation,Normal_Weight
2,23.0,Male,1.8,77.0,Frequently,no,2.0,3.0,no,no,2.0,yes,2.0,1.0,Sometimes,Public_Transportation,Normal_Weight
3,27.0,Male,1.8,87.0,Frequently,no,3.0,3.0,no,no,2.0,no,2.0,0.0,Sometimes,Walking,Overweight_Level_I
4,22.0,Male,1.78,89.8,Sometimes,no,2.0,1.0,no,no,2.0,no,0.0,0.0,Sometimes,Public_Transportation,Overweight_Level_II


### Ejemplo 1: 

Si se selecciona un individuo que participó en el estudio de Obesity Leves, determinar

a) ¿Cuál es la probabilidad de que sea mujer?

b) ¿Cual es la probabilidad de que sea hombre?

c) ¿Cuál es la probabilidad de que fume?

d) ¿Cual es la probabilidad de que sea mujer y que fume?

e) Si del seleccionado se sabe que es mujer, ¿Cuál es la probabilidad de que fume?

#### Solución:
Denotemos como M, H y F los eventos de que al seleccionar aleatoriamente un participante en el estudio, este sea mujer, hombre, y fume respectivamente. 


a)  

$$P(M)=\frac{  No.Mujeres}{ Total participantes}= \frac{1043}{2111}=2.02$$
 
b) La probabilidad de que sea hombre se puede calcular como 

$$P(H)= 1-P(M)=$$

c)  $$P(F)=\frac{\text{Número de fumadores}}{\text{Total participantes}}$$

d) $$P(M\cap F)= \frac{\text{No de mujeres que fuman}}{\text{Total participantes}}$$

e) En este caso se trata de una probabilidad condicional:

$$ P(F|M)=\frac{P(M\cap F)}{P(M)} $$

In [56]:
# A continuación se realizan todos los cálculos necesarios para responder a 
# cada una de las preguntas anteriores.

#a)
df_female = df[df['Gender']=='Female']
n_female=df_female.shape[0]

P_M =df_female.shape[0]/df.shape[0]

print(f"La probabilidad de que sea mujer es P(M)={P_M: .2f}")

#b) P_H

P_H= 1-P_M
print(f"La probabilidad de que sea hombre es P(H)={P_H: .2f}")


#c) Filtramos el dataframe dejando solo fumadores

df_smoker = df[df['SMOKE']=='yes']
n_smoker=df_smoker.shape[0]
#Calculamos la probabilidad de ser fumador:
P_F =n_smoker/df.shape[0]

print(f"La probabilidad de que sea fumador es P(F)={P_F: .2f}")




#d) Filtramos el dataframe 
df_female_smoker = df[(df['Gender']=='Female') & (df['SMOKE']=='yes')]
n_female_smoker = df_female_smoker.shape[0]
P_MF=n_female_smoker/df.shape[0]
print(f"La probabilidad de que sea mujer y fume es P(MF)={P_MF: .3f}")


#e)
P_conditional_F_given_M = P_MF/P_M
print(f"La probabilidad de que fume dado que sea mujer es P(F|M)={P_conditional_F_given_M: .3f}")

#Notemos como esta última probabilidad aumenta ante la presencia de nueva información.

La probabilidad de que sea mujer es P(M)= 0.49
La probabilidad de que sea hombre es P(H)= 0.51
La probabilidad de que sea fumador es P(F)= 0.02
La probabilidad de que sea mujer y fume es P(MF)= 0.007
La probabilidad de que fume dado que sea mujer es P(F|M)= 0.014


### Ejemplo 2:

Una empresa ofrece a sus clientes la posibilidad de tomar un préstamo para un vehículo y un préstamo educativo. Un estudio muestra que la probabilidad de que un cliente tome un préstamo para un vehículo es 0.35, la probabilidad de que un cliente tome un préstamo educativo es 0.46 y la probabilidad de que un cliente tome al menos uno de los dos préstamos es 0.59. Encuentre la probabilidad de que un cliente tome ambos préstamos, tanto el de vehículo como el educativo.

#### Solución:

Usamos la fórmula de la probabilidad:
$$P(A\cup B)=P(A)+P(B)−P(A\cap B)$$

Despejamos $P(A \cap B)$:

$$P(A\cap B)=P(A)+P(B)−P(A\cup B)$$


In [3]:
# Probabilidades dadas
P_A = 0.35  # Probabilidad de tomar un préstamo para un vehículo
P_B = 0.46  # Probabilidad de tomar un préstamo educativo
P_A_union_B = 0.59  # Probabilidad de tomar al menos uno de los préstamos

# Calcular la probabilidad de tomar ambos préstamos
P_A_inter_B = P_A + P_B - P_A_union_B

# Mostrar el resultado
print(f"La probabilidad de que un cliente tome ambos préstamos es: {P_A_inter_B:.2f}")


La probabilidad de que un cliente tome ambos préstamos es: 0.22


### Ejemplo 3: 

En una encuesta realizada en una empresa, se consideran dos eventos independientes: A y B. Si la probabilidad de que ocurra el evento A es 0.4 y la probabilidad de que ocurra al menos uno de los eventos es 0.6, encuentra la probabilidad de que ocurra el evento B.

In [55]:
# Probabilidades dadas
P_A = 0.4  # Probabilidad de que ocurra el evento X
P_A_union_B = 0.6  # Probabilidad de que ocurra al menos uno de los eventos

# Calcular la probabilidad de que ocurra el evento Y
P_B = (P_A_union_B - P_A) / (1 - P_A)

# Mostrar el resultado
print(f"La probabilidad de que ocurra el evento B es: {P_B:.3f}")


La probabilidad de que ocurra el evento B es: 0.333


### Ejemplo 4: 

Dado que  $P(A \cup B) = 0.7$ y  $P(A\cup B^c) = 0.9$ halle $P(A)$.

#### Solución: 

Como $P(A^c \cap B^c ) =P((A\cup B)^c) = 1 - P(A\cup B) =1-0.7 = 0.3 $ y similarmente  
$P(A^c \cap B) = 1-P(A \cup B ^c) = 1-0.9 = 0.1$. 

Así  $ P(A^c ) =P(A^c \cap B^c) +P(A^c \cap  B) = 0.3 + 0.1 = 0.4$,  

$P(A) = 1-0.4 =0.6$

### Ejemplo 5:

Considere dos eventos aleatorios   A  y  B     con  $P(A)  =  1/2$,  $P(B)  =  1/3$,  $P(A\cap B)=  1/4$. Determinar

- $P(A| B)$
- $P(B| A)$
- La probabilidad conjunta de $A$ y $B$.


#### Solución:

a) $
P(A|B)=\frac{P(A\cap B)}{P(B)}=\frac{1/4}{1/3}=\frac{3}{4}
$

b) $
P(B|A)=\frac{P(A\cap B)}{P(A)}=\frac{1/4}{1/2}=\frac{1}{2}
$

c)
$
P(A\cup B)= P(A)+P(B)-P(A\cap B)=\frac{1}{2}+\frac{1}{3}-\frac{1}{4}=\frac{7}{12}
$


### Ejemplo 6:

En un colegio los alumnos pueden optar por cursar como lengua
extranjera inglés o francés. En un determinado curso, el $ 90 \% $ de los alumnos estudia inglés y el resto francés. El $30\%$ de los que estudian inglés son hombre  y de los que
estudian francés son hombre  el $40\%$. Es elegido un alumno al azar, ¿cuál es la probabilidad de que sea mujer?

#### Solución:

Sean F= el alumno estudia francés, I= el alumno estudia inglés, H= el alumno es hombre y M= el alumno es mujer. Entonces
$$P(H)=P(H|I)P(I)+P(H|F)P(F)= 0.3*0.9+0.4*0.1= 0.31$$

del complemento se sigue que $$P(M)=1-P(H)=1-0.31=0.69$$
 


### Ejemplo 7:

Considere dos eventos $A$ y $B$ tales que $P(A\cup B)=0.5$ y $P(A)=0.3$ y $P(B)=0.2$.

- Son $A$ y $B$ eventos independientes?

- Son $A$ y $B$ eventos mutuamente excluyentes?

### Ejemplo 8: 
 


<img src="meme.jpeg">


### Solución: 



Consideremos los siguientes eventos: 

**A**: Es el evento que un paciente que se somete a cirugia sobreviva. Por tanto

$$P(A) = 0.5$$

Consideremos la probabilidad de que 20 pacientes sobrevivan. Sea **B** el evento que 20 pacientes sobrevivan:

Por tanto, como la supervivencia de cada paciente es independiente del resto de pacientes, podemos aplicar la independencia de eventos para concluir
   $$
   P(B) = (0.5)^{20}\approx 9.54 \times 10^{-7} = 0.000000954
   $$

    
Esto es una probabilidad extremadamente baja.

 
### Conclusión:
Un matemático entiende que 20 pacientes hayan sobrevivido a la cirugia, no indica que el próximo paciente tenga más probabilidad de sobrevivir. De hecho, la probabilidad de que el paciente 21 sobreviva sigue siendo 0.5 

En conclusión, Mientras que una persona normal podría ver la información como tranquilizadora, un matemático ve la baja probabilidad de que 20 pacientes consecutivos sobrevivan y entiende que este hecho no cambia la probabilidad inherente de la cirugía para el próximo paciente.

### Ejemplo 9: 

 El problema de Monty Hall es un problema matemático de probabilidad que está inspirado por el concurso televisivo estadounidense *Let's Make a Deal* (Hagamos un trato). El nombre del problema tiene su origen en el nombre del presentador del concurso: Monty Hall. (Fue un programa famoso en Estados Unidos entre $1963$ y $1984$).

<img src="MontyHall.png">

El problema consiste en lo siguiente: al participante le ofrecen tres puertas para elegir una. Detrás de una de las puertas hay un auto y detrás de cada una de las otras una cabra. El participante elige una puerta, pero antes de abrirla, el presentador que sabe lo que hay detrás de cada una, abre una de las dos (que no ha elegido el participante) tras la que por supuesto hay una cabra, y entonces le da la oportunidad de cambiar la elección al participante. Naturalmente, el participante desea llevarse el carro, ¿qué se debe hacer para aumentar las probabilidades de ganar, cambiar de puerta o no cambiar? ¿Da igual?

En el siguiente link se ilustra el problema de manera didáctica: 

[$\text{El problema de Monty Hall}$](https://www.youtube.com/watch?v=aTu0gEmscVk)

Inclusive en la serie *Numbers* también se hace referencia a este problema: 

[$\text{Serie Numbers}$](http://www.youtube.com/watch?v=pqJBTWoIkbA)

### Solución:

Utilicemos probabilidad condicional para determinar si es mejor cambiar o no de puerta. Supongamos que el concursante selecciona la puerta 1.Consideremos los eventos:

- $A_1$: El concursante selecciona la puerta 1 y gana.
- $B$: El presentador abre una puerta que contiene una cabra.

#### Probabilidad de Ganar si Cambiamos o no:

 **Sabemos que:**
   -   $ P(A_1)= \frac{1}{3} $.
   - $ P(B)= 1 $.  Monty siempre abrirá una puerta con una cabra, sabiendo dónde está el coche.

 

Notemos que si el concursante no cambia de puerta después de que se abrió la puerta que contiene la cabra obtenemos que 
$$
P(A_1 | B) = \frac{P(B | A_1) \cdot P(A_1)}{P(B)} =  \frac{1 \cdot \frac{1}{3}}{1}= \frac{1}{3}
$$
La probabilidad de ganar el coche si no cambiamos es simplemente la probabilidad inicial de que elegimos correctamente, es decir:

$$
P(A_1 | B) = P(A_1)  
$$

Si el concursante   cambia de puerta después de que se abrió la puerta que contiene la cabra obtenemos que 
$$
P(A_1^c | B) = \frac{P(B | A_1^c) \cdot P(A_1^c)}{P(B)} =  \frac{1 \cdot \frac{2}{3}}{1}= \frac{2}{3}
$$
 



### Conclusión:

- La probabilidad de ganar el coche si cambiamos es $\frac{2}{3}$.
- La probabilidad de ganar el coche si no cambiamos es $\frac{1}{3}$.

Por lo tanto, **es mejor cambiar de puerta**, ya que las probabilidades de ganar el coche son el doble al cambiar (66.67%) comparado con no cambiar (33.33%).


# Tabla de Opciones para el Problema de Monty Hall

| Elección Inicial | Puerta con Premio | No Cambiar | Cambiar |
|------------------|-------------------|------------|---------|
| Puerta 1         | Puerta 1          | **Auto**   | Cabra   |
| Puerta 1         | Puerta 2          | Cabra      |**Auto**    |
| Puerta 1         | Puerta 3          | Cabra      | **Auto**    |
| Puerta 2         | Puerta 1          | Cabra      | **Auto**    |
| Puerta 2         | Puerta 2          | **Auto**       | Cabra   |
| Puerta 2         | Puerta 3          | Cabra      | **Auto**    |
| Puerta 3         | Puerta 1          | Cabra      | **Auto**    |
| Puerta 3         | Puerta 2          | Cabra      | **Auto**    |
| Puerta 3         | Puerta 3          | **Auto**       | Cabra   |
| **Total de Victorias** |  |**3 Victorias:  (1/3)**     |**6 Victorias: (2/3)**     |

 
