<a href="https://colab.research.google.com/github/mlacasa/Probabilidad/blob/main/SolucionesProbCondicionada.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# Resolución de los ejercicios

## EJERCICIO 1

Diagnóstico Médico
Contexto: Supongamos que un nuevo test ha sido desarrollado para detectar una enfermedad que afecta al 2% de la población. Este test tiene una tasa de verdadero positivo del 95% (es decir, si una persona tiene la enfermedad, el test será positivo en 95 de cada 100 casos) y una tasa de falso positivo del 5% (es decir, si una persona no tiene la enfermedad, hay un 5% de probabilidad de que el test resulte positivo).

Preguntas:

¿Cuál es la probabilidad de que una persona tenga la enfermedad dado que su resultado en el test es positivo?
¿Cuál es la probabilidad de que una persona que tiene un resultado positivo en el test no tenga la enfermedad?

**Definición de variables**

$ P(D) $: Probabilidad de tener la enfermedad. \
$ P(D) = 0.02 $  (2% de la población tiene la enfermedad).\
$ P(T^+ | D) $: Probabilidad de un test positivo dado que la persona tiene la enfermedad (tasa de verdadero positivo).

$ P(T^+ | D) = 0.95$


$P(T^+ | D') $: Probabilidad de un test positivo dado que la persona no tiene la enfermedad (tasa de falso positivo).\
 $P(T^+ | D') = 0.05 $

$ P(D') $: Probabilidad de no tener la enfermedad.
$ P(D') = 1 - P(D) = 0.98 $

**Paso 1**: Calcular la probabilidad total de obtener un resultado positivo en el test, $ P(T^+) $

Usaremos la ley de probabilidad total:

$P(T^+) = P(T^+ | D) \cdot P(D) + P(T^+ | D') \cdot P(D')$

**Paso 2**: Calcular $ P(D | T^+) $ usando el teorema de Bayes
El teorema de Bayes nos dice que:
$$ P(D | T^+) = \frac{P(T^+ | D) \cdot P(D)}{P(T^+)}$$

**Paso 3:** Calcular $ P(D' | T^+) $
Para calcular la probabilidad de que una persona tenga un resultado positivo en el test pero no tenga la enfermedad, utilizamos:
$$P(D' | T^+) = \frac{P(T^+ | D') \cdot P(D')}{P(T^+)}$$

Implementación en Python

In [3]:
# Definición de probabilidades
P_D = 0.02               # Probabilidad de tener la enfermedad
P_T_given_D = 0.95      # Probabilidad de positivo dado que tiene la enfermedad
P_T_given_D_not = 0.05  # Probabilidad de positivo dado que no tiene la enfermedad
P_D_not = 1 - P_D       # Probabilidad de no tener la enfermedad

# Paso 1: Calcular P(T^+)
P_T_plus = (P_T_given_D * P_D) + (P_T_given_D_not * P_D_not)

# Paso 2: Calcular P(D | T^+)
P_D_given_T_plus = (P_T_given_D * P_D) / P_T_plus

# Paso 3: Calcular P(D' | T^+)
P_D_not_given_T_plus = (P_T_given_D_not * P_D_not) / P_T_plus

# Resultados
P_D_given_T_plus, P_D_not_given_T_plus


(0.2794117647058823, 0.7205882352941176)

## EJERCICIO 2

Contexto: En una encuesta de preferencia de un nuevo producto, el 40% de los encuestados son hombres y el 60% son mujeres. El 70% de los hombres prefieren el producto, mientras que solo el 30% de las mujeres lo prefieren.

Preguntas:

Si una persona es elegida al azar y es conocida por preferir el producto, ¿cuál es la probabilidad de que sea un hombre?
Si se elige al azar una persona que no prefiere el producto, ¿cuál es la probabilidad de que sea mujer?

**Definición de variables**

$ P(H) $: Probabilidad de que una persona seleccionada sea hombre. ( P(H) = 0.40 ).\
$ P(M) $: Probabilidad de que una persona seleccionada sea mujer. ( P(M) = 0.60 ).\
$ P(P | H) $: Probabilidad de preferir el producto dado que la persona es hombre. ( P(P | H) = 0.70 ).\
$ P(P | M) $: Probabilidad de preferir el producto dado que la persona es mujer. ( P(P | M) = 0.30 ).\
$ P(P') $: Probabilidad de no preferir el producto, que es $ P(P') = 1 - P(P) $.


**Paso 1**: Calcular la probabilidad total de preferir el producto, $ P(P) $
Usaremos la ley de probabilidad total:
$$
P(P) = P(P | H) \cdot P(H) + P(P | M) \cdot P(M)
$$

**Paso 2**: Calcular $P(H | P)$ usando el teorema de Bayes
El teorema de Bayes nos dice que:
$$P(H | P) = \frac{P(P | H) \cdot P(H)}{P(P)}
$$

**Paso 3**: Calcular $ P(M | P') $ usando el teorema de Bayes
Primero, calcularemos $ P(P') $:
$$
P(P') = 1 - P(P)
$$

Luego, aplicando el teorema de Bayes:
$$
P(M | P') = \frac{P(P' | M) \cdot P(M)}{P(P')}
$$

Paso 4: Calcular $ P(P' | M) $
Usaremos:
$$
P(P' | M) = 1 - P(P | M)
$$

In [6]:
# Definición de probabilidades
P_H = 0.40                # Probabilidad de que sea hombre
P_M = 0.60                # Probabilidad de que sea mujer
P_P_given_H = 0.70       # Probabilidad de preferir el producto dado que es hombre
P_P_given_M = 0.30       # Probabilidad de preferir el producto dado que es mujer

# Paso 1: Calcular P(P)
P_P = (P_P_given_H * P_H) + (P_P_given_M * P_M)
print("La probabilidad P_P es", P_P)

# Paso 2: Calcular P(H | P)
P_H_given_P = (P_P_given_H * P_H) / P_P
print("La probabilidad P_H_given_P es", P_H_given_P)

# Paso 3: Calcular P(P')
P_P_not = 1 - P_P
print("La probabilidad P_P_not es", P_P_not)

# Calcular P(M | P')
P_P_given_M_not = 1 - P_P_given_M
P_M_given_P_not = (P_P_given_M_not * P_M) / P_P_not

# Resultados
P_H_given_P, P_M_given_P_not


La probabilidad P_P es 0.45999999999999996
La probabilidad P_H_given_P es 0.6086956521739131
La probabilidad P_P_not es 0.54


(0.6086956521739131, 0.7777777777777777)

## EJERCICIO 3

Un estudio de habitantes de Georgia sugiere que las personas que  trabajaron en los astilleros durante la segunda guerra mundial corrieron un mayor riesgo de padecer cáncer pulmonar (The Wall Street Journal, 21 septiembre de 1978). Se detectó que aproximadamente 22% de las personas con cáncer pulmonar trabajaron anteriormente en un astillero. Al contrario, solamente 14% de las personas sin cáncer pulmonar trabajaron en un momento dado en un astillero. Puedes suponer que la proporción de todos los habitantes de Georgia que vivieron durante la segunda guerra mundial y que
tienen o tendrán cáncer pulmonar es de 0.04%. Encontrar el porcentaje de habitantes de Georgia que vivieron durante el mismo periodo que tendrán (o tienen) cáncer pulmonar, dado que han trabajado anteriormente en un astillero.

Para resolver este problema, utilizaremos el teorema de Bayes, que nos ayudará a calcular la probabilidad solicitada de que una persona tenga cáncer pulmonar dado que ha trabajado en un astillero.

A continuación, desglosaremos el problema paso a paso y luego implementaremos la solución en código Python.

**Definición de variables**\
Sea ( P(C) ): la probabilidad de que una persona tenga cáncer pulmonar.

( P(C) = 0.0004 ) (0.04% de la población).

Sea ( P(A | C) ): la probabilidad de que una persona haya trabajado en un astillero dado que tiene cáncer pulmonar.

( P(A | C) = 0.22 ) (22% de las personas con cáncer trabajaron en un astillero).

Sea ( P(A | C') ): la probabilidad de que una persona haya trabajado en un astillero dado que no tiene cáncer pulmonar.

( P(A | C') = 0.14 ) (14% de las personas sin cáncer trabajaron en un astillero).

Sea ( P(C') ): la probabilidad de que una persona no tenga cáncer pulmonar.

( P(C') = 1 - P(C) = 1 - 0.0004 = 0.9996 ).

**Paso 1: Calcular ( P(A) )**

Usaremos la ley de probabilidad total para calcular la probabilidad de que una persona haya trabajado en un astillero, ( P(A) ):

$$
P(A) = P(A | C) \cdot P(C) + P(A | C') \cdot P(C')
$$

**Paso 2: Calcular ( P(C | A) )**\
Ahora aplicamos el teorema de Bayes para calcular la probabilidad de tener cáncer pulmonar dado que ha trabajado en un astillero:

$$
P(C | A) = \frac{P(A | C) \cdot P(C)}{P(A)}
$$

In [7]:
# Definición de probabilidades
P_C = 0.0004          # Probabilidad de tener cáncer
P_A_given_C = 0.22    # Probabilidad de trabajar en astillero dado que tiene cáncer
P_A_given_C_not = 0.14  # Probabilidad de trabajar en astillero dado que no tiene cáncer
P_C_not = 1 - P_C    # Probabilidad de no tener cáncer

# Paso 1: Calcular P(A)
P_A = (P_A_given_C * P_C) + (P_A_given_C_not * P_C_not)

# Paso 2: Calcular P(C | A)
P_C_given_A = (P_A_given_C * P_C) / P_A

# Convertir a porcentaje
P_C_given_A_percentage = P_C_given_A * 100

# Resultados
P_C_given_A_percentage


0.06284277879341865

**EJEMPLO SOBRE LA PROBABILIDAD TOTAL**

Imaginemos que hay tres clínicas (Clínica X, Clínica Y, y Clínica Z) que realizan pruebas para detectar una enfermedad. Cada clínica tiene una tasa diferente de precisión en sus pruebas.

Clínica X: Realiza 100 pruebas y en el 5% de los casos el resultado es positivo verdadero.

Clínica Y: Realiza 100 pruebas y en el 10% de los casos el resultado es positivo verdadero.

Clínica Z: Realiza 100 pruebas y en el 15% de los casos el resultado es positivo verdadero.

Queremos calcular la probabilidad de que un resultado positivo verdadero provenga de la Clínica Z si sabemos que el resultado del test es positivo.

Estudiar los resultados anteriores indicados en el foro, mediante esta tabla de contingencia:

In [8]:
import pandas as pd

# Definición de datos
clinicas = ['Clínica X', 'Clínica Y', 'Clínica Z']
numero_pruebas = 100
tasa_positivos_verdaderos = [0.05, 0.10, 0.15]  # Tasa de positivos verdaderos para cada clínica

# Cálculo de TP y TN para cada clínica
TP = [numero_pruebas * tasa for tasa in tasa_positivos_verdaderos]
TN = [numero_pruebas - tp for tp in TP]

# Crear una tabla de contingencia
data = {
    'Clínica': clinicas,
    'Positivos Verdaderos (TP)': TP,
    'Negativos (TN)': TN
}

tabla_contingencia = pd.DataFrame(data)

# Mostrar la tabla de contingencia
tabla_contingencia


Unnamed: 0,Clínica,Positivos Verdaderos (TP),Negativos (TN)
0,Clínica X,5.0,95.0
1,Clínica Y,10.0,90.0
2,Clínica Z,15.0,85.0
