# 6_PROBABILIDAD CONDICIONADA E INDEPENDENCIA. TEOREMAS DE LA PROBABILIDAD TOTA Y DE BAYES

### Control de calidad en una fábrica de componentes electrónicos

In [4]:
# Importamos las librerías
import numpy as np
import pandas as pd

# Creamos una tabla de contingencia con los datos a partir de un diccionario
data = {
    "Tipo": ["A", "B", "C"],
    "Producción": [0.40, 0.35, 0.25],
    "Tasa_Defectos": [0.02, 0.03, 0.01],
}
df = pd.DataFrame(data)
df

Unnamed: 0,Tipo,Producción,Tasa_Defectos
0,A,0.4,0.02
1,B,0.35,0.03
2,C,0.25,0.01


In [7]:
# Añadimos tres columnas más
df["Defectuosos"] = df["Producción"] * df["Tasa_Defectos"]
df["Tasa_No_Defectos"] = 1 - df["Tasa_Defectos"]
df["No_Defectuosos"] = df["Producción"] * (1 - df["Tasa_Defectos"])

print("Tabla de contingencia para el Contexto 1:")
df

Tabla de contingencia para el Contexto 1:


Unnamed: 0,Tipo,Producción,Tasa_Defectos,Defectuosos,Tasa_No_Defectos,No_Defectuosos
0,A,0.4,0.02,0.008,0.98,0.392
1,B,0.35,0.03,0.0105,0.97,0.3395
2,C,0.25,0.01,0.0025,0.99,0.2475


In [11]:
"""Pregunta 1: Probabilidad de que un componente sea defectuoso es la suma
de la columna "Defectuosos" (Teorema de la Probabilidad Total)"""

prob_defectuoso = df["Defectuosos"].sum()
print(f"La probabilidad de que un componente sea defectuoso es {prob_defectuoso:.4f}")

""" Probabilidad de que un componente defectuoso
sea del tipo A (Teorema de Bayes) """

# Buscamos en el df la intersección del tipo A con "Defectuoso"
prob_A_dado_defectuoso = (
    df.loc[df["Tipo"] == "A", "Defectuosos"].values[0] / prob_defectuoso
)
print(
    f"La probabilidad de que un componente defectuoso sea del tipo A es {prob_A_dado_defectuoso:.4f}"
)

La probabilidad de que un componente sea defectuoso es 0.0210
La probabilidad de que un componente defectuoso sea del tipo A es 0.3810


### Mantenimiento preventivo en una planta industrial

In [12]:
# Crear tabla de contingencia con los datos
data = {
    "Mantenimiento": ["Realizado", "No Realizado"],
    "Probabilidad": [1 / 7, 6 / 7],
    "Prob_Falla": [0.02, 0.05],
}

df = pd.DataFrame(data)
df

Unnamed: 0,Mantenimiento,Probabilidad,Prob_Falla
0,Realizado,0.142857,0.02
1,No Realizado,0.857143,0.05


In [13]:
# Ampliamos la tabla
df["Prob_No_Falla"] = 1 - df["Prob_Falla"]
df["Falla"] = df["Probabilidad"] * df["Prob_Falla"]
df["No_Falla"] = df["Probabilidad"] * df["Prob_No_Falla"]

print("Tabla de contingencia para el Problema 2")
df

Tabla de contingencia para el Problema 2


Unnamed: 0,Mantenimiento,Probabilidad,Prob_Falla,Prob_No_Falla,Falla,No_Falla
0,Realizado,0.142857,0.02,0.98,0.002857,0.14
1,No Realizado,0.857143,0.05,0.95,0.042857,0.814286


In [18]:
# Probabilidad de que al menos una máquina falle con mantnimiento
p_falla_con_mantenimiento = df.loc[
    df["Mantenimiento"] == "Realizado", "Prob_Falla"
].values[0]

# Que al menos una falle es lo contrario a que no fallen las tres
p_al_menos_una_falla = 1 - (1 - p_falla_con_mantenimiento) ** 3
print(
    f"La probabilidad de que al menos una máquina falle con mantenimiento es {p_al_menos_una_falla:.4f}"
)

# Probabilidad de que no se haya realizado mantenimiento dado que una máquina falló
p_falla = df["Falla"].sum()
p_no_mantenimiento_dado_falla = (
    df.loc[df["Mantenimiento"] == "No Realizado", "Falla"].values[0] / p_falla
)
print(
    f"La probabilidad de que no se haya realizado mantenimiento dado que una máquina falló es {p_no_mantenimiento_dado_falla:.4f}"
)

La probabilidad de que al menos una máquina falle con mantenimiento es 0.0588
La probabilidad de que no se haya realizado mantenimiento dado que una máquina falló es 0.9375


### Análisis de riesgos en un proyecto de construcción

In [20]:
# Crear tabla de contingencia
data = {
    "Riesgo": ["Climático", "Laboral", "Suministro"],
    "Probabilidad": [0.2, 0.15, 0.1],
    "Prob_Retraso": [0.6, 0.5, 0.4],
}
df = pd.DataFrame(data)
df

Unnamed: 0,Riesgo,Probabilidad,Prob_Retraso
0,Climático,0.2,0.6
1,Laboral,0.15,0.5
2,Suministro,0.1,0.4


In [21]:
# Ampliamos la tabla
df["Prob_No_Retraso"] = 1 - df["Prob_Retraso"]
df["Retraso"] = df["Probabilidad"] * df["Prob_Retraso"]
df["No_Retraso"] = df["Probabilidad"] * df["Prob_No_Retraso"]

print("Tabla de contingencia: ")
print()
df

Tabla de contingencia: 



Unnamed: 0,Riesgo,Probabilidad,Prob_Retraso,Prob_No_Retraso,Retraso,No_Retraso
0,Climático,0.2,0.6,0.4,0.12,0.08
1,Laboral,0.15,0.5,0.5,0.075,0.075
2,Suministro,0.1,0.4,0.6,0.04,0.06


In [23]:
# Probabilidad de que el proyecto se retrase
p_retraso = df["Retraso"].sum()
print(f"La probabilidad de que el proyecto se retrase es {p_retraso:.4f}")

# Probabilidad de que el retraso se deba a un riesgo climático
p_climatico_dado_retraso = (
    df.loc[df["Riesgo"] == "Climático", "Retraso"].values[0] / p_retraso
)
print(
    f"La probabilidad de que el retraso se deba a un riesgo climático es {p_climatico_dado_retraso:.4f}"
)

La probabilidad de que el proyecto se retrase es 0.2350
La probabilidad de que el retraso se deba a un riesgo climático es 0.5106
