# Redes Bayesianas - Ejercicios de Implementación
---

Este notebook implementa redes bayesianas para dos casos:
1. Predicción de compra de videojuegos
2. Predicción de éxito en misiones de videojuegos

## Instalación de Dependencias

In [None]:
# Instalar pgmpy si no está instalado
!pip install pgmpy --quiet

In [None]:
# Importar librerías necesarias
import numpy as np
import pandas as pd
from pgmpy.models import BayesianNetwork
from pgmpy.factors.discrete import TabularCPD
from pgmpy.inference import VariableElimination
import matplotlib.pyplot as plt
import networkx as nx
import warnings
warnings.filterwarnings('ignore')

print("Librerías importadas correctamente ✓")

---

# EJERCICIO 1: Predicción de Compra de Videojuegos

## Descripción del Problema

Queremos predecir si un jugador comprará un nuevo videojuego basándonos en diferentes factores.

### Variables:
- **Compra (C):** Variable objetivo - "Sí" o "No"
- **Precio (P):** "Alto", "Medio" o "Bajo"
- **Género (G):** "Acción", "Aventura", "Estrategia" u "Otros"
- **Críticas Positivas (CP):** "Alta" o "Baja"
- **Plataforma (Pl):** "Consola" o "PC"
- **Amigos que lo Juegan (A):** "Sí" o "No"

## 1.1 Definición de la Estructura de la Red

In [None]:
# Definir la estructura de la red bayesiana
# Todos los factores influyen directamente en la decisión de compra

modelo_compra = BayesianNetwork([
    ('Precio', 'Compra'),
    ('Genero', 'Compra'),
    ('CriticasPositivas', 'Compra'),
    ('Plataforma', 'Compra'),
    ('Amigos', 'Compra')
])

print("Estructura de la red definida:")
print("Nodos:", modelo_compra.nodes())
print("Arcos:", modelo_compra.edges())

## 1.2 Visualización de la Red

In [None]:
# Visualizar la estructura de la red
plt.figure(figsize=(12, 8))

G = nx.DiGraph()
G.add_edges_from(modelo_compra.edges())

pos = {
    'Precio': (0, 1),
    'Genero': (1, 1),
    'CriticasPositivas': (2, 1),
    'Plataforma': (3, 1),
    'Amigos': (4, 1),
    'Compra': (2, 0)
}

nx.draw(G, pos, with_labels=True, node_color='lightblue', 
        node_size=3000, font_size=10, font_weight='bold',
        arrows=True, arrowsize=20, edge_color='gray')

plt.title('Red Bayesiana - Predicción de Compra de Videojuegos', fontsize=14, fontweight='bold')
plt.tight_layout()
plt.show()

## 1.3 Tablas de Probabilidad Condicional (CPDs)

In [None]:
# CPD para Precio (variable raíz)
# Estados: Alto, Medio, Bajo
cpd_precio = TabularCPD(
    variable='Precio',
    variable_card=3,
    values=[[0.30],   # P(Precio=Alto)
            [0.40],   # P(Precio=Medio)
            [0.30]],  # P(Precio=Bajo)
    state_names={'Precio': ['Alto', 'Medio', 'Bajo']}
)

print("CPD - Precio:")
print(cpd_precio)
print()

In [None]:
# CPD para Género (variable raíz)
# Estados: Acción, Aventura, Estrategia, Otros
cpd_genero = TabularCPD(
    variable='Genero',
    variable_card=4,
    values=[[0.35],  # P(Género=Acción)
            [0.25],  # P(Género=Aventura)
            [0.20],  # P(Género=Estrategia)
            [0.20]], # P(Género=Otros)
    state_names={'Genero': ['Accion', 'Aventura', 'Estrategia', 'Otros']}
)

print("CPD - Género:")
print(cpd_genero)
print()

In [None]:
# CPD para Críticas Positivas (variable raíz)
# Estados: Alta, Baja
cpd_criticas = TabularCPD(
    variable='CriticasPositivas',
    variable_card=2,
    values=[[0.60],   # P(CP=Alta)
            [0.40]],  # P(CP=Baja)
    state_names={'CriticasPositivas': ['Alta', 'Baja']}
)

print("CPD - Críticas Positivas:")
print(cpd_criticas)
print()

In [None]:
# CPD para Plataforma (variable raíz)
# Estados: Consola, PC
cpd_plataforma = TabularCPD(
    variable='Plataforma',
    variable_card=2,
    values=[[0.55],  # P(Plataforma=Consola)
            [0.45]], # P(Plataforma=PC)
    state_names={'Plataforma': ['Consola', 'PC']}
)

print("CPD - Plataforma:")
print(cpd_plataforma)
print()

In [None]:
# CPD para Amigos que lo Juegan (variable raíz)
# Estados: Sí, No
cpd_amigos = TabularCPD(
    variable='Amigos',
    variable_card=2,
    values=[[0.40],   # P(Amigos=Sí)
            [0.60]],  # P(Amigos=No)
    state_names={'Amigos': ['Si', 'No']}
)

print("CPD - Amigos que lo Juegan:")
print(cpd_amigos)
print()

In [None]:
# CPD para Compra (variable objetivo)
# P(Compra | Precio, Género, Críticas, Plataforma, Amigos)
# Dimensiones: 2 x (3 * 4 * 2 * 2 * 2) = 2 x 96 combinaciones

# Generamos probabilidades basadas en reglas lógicas:
# - Precio bajo aumenta probabilidad de compra
# - Género Acción tiene mayor demanda
# - Críticas altas aumentan probabilidad
# - Amigos jugando aumenta probabilidad

def calcular_prob_compra(precio, genero, criticas, plataforma, amigos):
    """Calcula la probabilidad de compra basada en los factores"""
    prob = 0.3  # Probabilidad base
    
    # Efecto del precio
    if precio == 'Bajo':
        prob += 0.25
    elif precio == 'Medio':
        prob += 0.10
    # Alto no suma nada
    
    # Efecto del género
    if genero == 'Accion':
        prob += 0.10
    elif genero == 'Aventura':
        prob += 0.05
    # Estrategia y Otros no suman
    
    # Efecto de las críticas
    if criticas == 'Alta':
        prob += 0.15
    
    # Efecto de la plataforma
    if plataforma == 'Consola':
        prob += 0.05
    
    # Efecto de los amigos
    if amigos == 'Si':
        prob += 0.15
    
    # Asegurar que esté en [0.05, 0.95]
    return min(0.95, max(0.05, prob))

# Generar la tabla de probabilidades
precios = ['Alto', 'Medio', 'Bajo']
generos = ['Accion', 'Aventura', 'Estrategia', 'Otros']
criticas_vals = ['Alta', 'Baja']
plataformas = ['Consola', 'PC']
amigos_vals = ['Si', 'No']

prob_si = []
prob_no = []

for amigo in amigos_vals:
    for plat in plataformas:
        for crit in criticas_vals:
            for gen in generos:
                for prec in precios:
                    p = calcular_prob_compra(prec, gen, crit, plat, amigo)
                    prob_si.append(p)
                    prob_no.append(1 - p)

cpd_compra = TabularCPD(
    variable='Compra',
    variable_card=2,
    values=[prob_si, prob_no],
    evidence=['Precio', 'Genero', 'CriticasPositivas', 'Plataforma', 'Amigos'],
    evidence_card=[3, 4, 2, 2, 2],
    state_names={
        'Compra': ['Si', 'No'],
        'Precio': ['Alto', 'Medio', 'Bajo'],
        'Genero': ['Accion', 'Aventura', 'Estrategia', 'Otros'],
        'CriticasPositivas': ['Alta', 'Baja'],
        'Plataforma': ['Consola', 'PC'],
        'Amigos': ['Si', 'No']
    }
)

print("CPD - Compra (primeras columnas):")
print("(La tabla completa tiene 96 columnas - una por cada combinación de factores)")
print()

## 1.4 Agregar CPDs al Modelo y Validar

In [None]:
# Agregar todas las CPDs al modelo
modelo_compra.add_cpds(
    cpd_precio,
    cpd_genero,
    cpd_criticas,
    cpd_plataforma,
    cpd_amigos,
    cpd_compra
)

# Verificar que el modelo sea válido
print("¿El modelo es válido?", modelo_compra.check_model())

## 1.5 Inferencia - Consultas Probabilísticas

In [None]:
# Crear objeto de inferencia
inferencia_compra = VariableElimination(modelo_compra)

print("="*70)
print("CONSULTAS DE INFERENCIA - EJERCICIO 1")
print("="*70)

In [None]:
# Consulta 1: P(Compra) - Probabilidad marginal de compra
resultado1 = inferencia_compra.query(variables=['Compra'])
print("\n1. Probabilidad marginal de compra:")
print(resultado1)

In [None]:
# Consulta 2: P(Compra | Precio=Bajo, CríticasPositivas=Alta)
resultado2 = inferencia_compra.query(
    variables=['Compra'],
    evidence={'Precio': 'Bajo', 'CriticasPositivas': 'Alta'}
)
print("\n2. P(Compra | Precio=Bajo, Críticas=Alta):")
print(resultado2)

In [None]:
# Consulta 3: P(Compra | Precio=Alto, Amigos=No, CríticasPositivas=Baja)
resultado3 = inferencia_compra.query(
    variables=['Compra'],
    evidence={'Precio': 'Alto', 'Amigos': 'No', 'CriticasPositivas': 'Baja'}
)
print("\n3. P(Compra | Precio=Alto, Amigos=No, Críticas=Baja):")
print(resultado3)

In [None]:
# Consulta 4: Escenario óptimo para compra
resultado4 = inferencia_compra.query(
    variables=['Compra'],
    evidence={
        'Precio': 'Bajo',
        'Genero': 'Accion',
        'CriticasPositivas': 'Alta',
        'Plataforma': 'Consola',
        'Amigos': 'Si'
    }
)
print("\n4. Escenario ÓPTIMO (todos los factores favorables):")
print(resultado4)

In [None]:
# Consulta 5: Escenario desfavorable
resultado5 = inferencia_compra.query(
    variables=['Compra'],
    evidence={
        'Precio': 'Alto',
        'Genero': 'Otros',
        'CriticasPositivas': 'Baja',
        'Plataforma': 'PC',
        'Amigos': 'No'
    }
)
print("\n5. Escenario DESFAVORABLE (todos los factores en contra):")
print(resultado5)

## 1.6 Tabla de Distribución Resumen

In [None]:
# Crear tabla resumen de algunos escenarios
escenarios = [
    {'Precio': 'Bajo', 'Genero': 'Accion', 'CriticasPositivas': 'Alta', 'Plataforma': 'Consola', 'Amigos': 'Si'},
    {'Precio': 'Bajo', 'Genero': 'Accion', 'CriticasPositivas': 'Alta', 'Plataforma': 'Consola', 'Amigos': 'No'},
    {'Precio': 'Medio', 'Genero': 'Aventura', 'CriticasPositivas': 'Alta', 'Plataforma': 'PC', 'Amigos': 'Si'},
    {'Precio': 'Alto', 'Genero': 'Estrategia', 'CriticasPositivas': 'Baja', 'Plataforma': 'PC', 'Amigos': 'No'},
    {'Precio': 'Alto', 'Genero': 'Otros', 'CriticasPositivas': 'Baja', 'Plataforma': 'PC', 'Amigos': 'No'},
]

resultados = []
for esc in escenarios:
    res = inferencia_compra.query(variables=['Compra'], evidence=esc)
    prob_si = res.values[0]
    resultados.append({
        'Precio': esc['Precio'],
        'Género': esc['Genero'],
        'Críticas': esc['CriticasPositivas'],
        'Plataforma': esc['Plataforma'],
        'Amigos': esc['Amigos'],
        'P(Compra=Sí)': f"{prob_si:.2%}",
        'P(Compra=No)': f"{1-prob_si:.2%}"
    })

df_resumen1 = pd.DataFrame(resultados)
print("\n" + "="*70)
print("TABLA DE DISTRIBUCIÓN - EJERCICIO 1")
print("="*70)
print(df_resumen1.to_string(index=False))

---

# EJERCICIO 2: Predicción de Éxito en Misiones de Videojuegos

## Descripción del Problema

Queremos predecir si un personaje completará con éxito una misión basándonos en sus atributos.

### Variables:
- **Éxito de la Misión (EM):** Variable objetivo - "Sí" o "No"
- **Nivel de Experiencia (NE):** "Bajo", "Medio" o "Alto"
- **Equipamiento (EQ):** "Básico", "Intermedio" o "Avanzado"
- **Habilidades (H):** "Bajas", "Medias" o "Altas"
- **Salud (S):** "Baja", "Media" o "Alta"
- **Estado Mental (EMe):** "Positivo", "Neutral" o "Negativo"

## 2.1 Definición de la Estructura de la Red

In [None]:
# Definir la estructura de la red bayesiana
# Todos los atributos influyen en el éxito de la misión

modelo_mision = BayesianNetwork([
    ('NivelExperiencia', 'ExitoMision'),
    ('Equipamiento', 'ExitoMision'),
    ('Habilidades', 'ExitoMision'),
    ('Salud', 'ExitoMision'),
    ('EstadoMental', 'ExitoMision')
])

print("Estructura de la red definida:")
print("Nodos:", modelo_mision.nodes())
print("Arcos:", modelo_mision.edges())

## 2.2 Visualización de la Red

In [None]:
# Visualizar la estructura de la red
plt.figure(figsize=(12, 8))

G2 = nx.DiGraph()
G2.add_edges_from(modelo_mision.edges())

pos2 = {
    'NivelExperiencia': (0, 1),
    'Equipamiento': (1, 1),
    'Habilidades': (2, 1),
    'Salud': (3, 1),
    'EstadoMental': (4, 1),
    'ExitoMision': (2, 0)
}

nx.draw(G2, pos2, with_labels=True, node_color='lightgreen', 
        node_size=3000, font_size=9, font_weight='bold',
        arrows=True, arrowsize=20, edge_color='gray')

plt.title('Red Bayesiana - Predicción de Éxito en Misiones', fontsize=14, fontweight='bold')
plt.tight_layout()
plt.show()

## 2.3 Tablas de Probabilidad Condicional (CPDs)

In [None]:
# CPD para Nivel de Experiencia
cpd_nivel = TabularCPD(
    variable='NivelExperiencia',
    variable_card=3,
    values=[[0.30],   # P(NE=Bajo)
            [0.45],   # P(NE=Medio)
            [0.25]],  # P(NE=Alto)
    state_names={'NivelExperiencia': ['Bajo', 'Medio', 'Alto']}
)

print("CPD - Nivel de Experiencia:")
print(cpd_nivel)
print()

In [None]:
# CPD para Equipamiento
cpd_equipo = TabularCPD(
    variable='Equipamiento',
    variable_card=3,
    values=[[0.35],   # P(EQ=Básico)
            [0.40],   # P(EQ=Intermedio)
            [0.25]],  # P(EQ=Avanzado)
    state_names={'Equipamiento': ['Basico', 'Intermedio', 'Avanzado']}
)

print("CPD - Equipamiento:")
print(cpd_equipo)
print()

In [None]:
# CPD para Habilidades
cpd_habilidades = TabularCPD(
    variable='Habilidades',
    variable_card=3,
    values=[[0.25],   # P(H=Bajas)
            [0.50],   # P(H=Medias)
            [0.25]],  # P(H=Altas)
    state_names={'Habilidades': ['Bajas', 'Medias', 'Altas']}
)

print("CPD - Habilidades:")
print(cpd_habilidades)
print()

In [None]:
# CPD para Salud
cpd_salud = TabularCPD(
    variable='Salud',
    variable_card=3,
    values=[[0.20],   # P(S=Baja)
            [0.50],   # P(S=Media)
            [0.30]],  # P(S=Alta)
    state_names={'Salud': ['Baja', 'Media', 'Alta']}
)

print("CPD - Salud:")
print(cpd_salud)
print()

In [None]:
# CPD para Estado Mental
cpd_mental = TabularCPD(
    variable='EstadoMental',
    variable_card=3,
    values=[[0.35],   # P(EMe=Positivo)
            [0.45],   # P(EMe=Neutral)
            [0.20]],  # P(EMe=Negativo)
    state_names={'EstadoMental': ['Positivo', 'Neutral', 'Negativo']}
)

print("CPD - Estado Mental:")
print(cpd_mental)
print()

In [None]:
# CPD para Éxito de la Misión
# P(Éxito | NE, EQ, H, S, EMe)
# Dimensiones: 2 x (3 * 3 * 3 * 3 * 3) = 2 x 243 combinaciones

def calcular_prob_exito(nivel, equipo, habilidades, salud, mental):
    """Calcula la probabilidad de éxito basada en los atributos"""
    prob = 0.2  # Probabilidad base
    
    # Pesos para cada atributo
    niveles = {'Bajo': 0.0, 'Medio': 0.12, 'Alto': 0.20}
    equipos = {'Basico': 0.0, 'Intermedio': 0.10, 'Avanzado': 0.18}
    habs = {'Bajas': 0.0, 'Medias': 0.12, 'Altas': 0.20}
    saluds = {'Baja': 0.0, 'Media': 0.08, 'Alta': 0.15}
    mentales = {'Negativo': -0.05, 'Neutral': 0.05, 'Positivo': 0.12}
    
    prob += niveles[nivel]
    prob += equipos[equipo]
    prob += habs[habilidades]
    prob += saluds[salud]
    prob += mentales[mental]
    
    return min(0.95, max(0.05, prob))

# Generar la tabla de probabilidades
niveles_exp = ['Bajo', 'Medio', 'Alto']
equipamientos = ['Basico', 'Intermedio', 'Avanzado']
habilidades_vals = ['Bajas', 'Medias', 'Altas']
saluds_vals = ['Baja', 'Media', 'Alta']
mentales_vals = ['Positivo', 'Neutral', 'Negativo']

prob_exito_si = []
prob_exito_no = []

for mental in mentales_vals:
    for salud in saluds_vals:
        for hab in habilidades_vals:
            for equipo in equipamientos:
                for nivel in niveles_exp:
                    p = calcular_prob_exito(nivel, equipo, hab, salud, mental)
                    prob_exito_si.append(p)
                    prob_exito_no.append(1 - p)

cpd_exito = TabularCPD(
    variable='ExitoMision',
    variable_card=2,
    values=[prob_exito_si, prob_exito_no],
    evidence=['NivelExperiencia', 'Equipamiento', 'Habilidades', 'Salud', 'EstadoMental'],
    evidence_card=[3, 3, 3, 3, 3],
    state_names={
        'ExitoMision': ['Si', 'No'],
        'NivelExperiencia': ['Bajo', 'Medio', 'Alto'],
        'Equipamiento': ['Basico', 'Intermedio', 'Avanzado'],
        'Habilidades': ['Bajas', 'Medias', 'Altas'],
        'Salud': ['Baja', 'Media', 'Alta'],
        'EstadoMental': ['Positivo', 'Neutral', 'Negativo']
    }
)

print("CPD - Éxito de la Misión:")
print("(La tabla completa tiene 243 columnas - una por cada combinación de atributos)")

## 2.4 Agregar CPDs al Modelo y Validar

In [None]:
# Agregar todas las CPDs al modelo
modelo_mision.add_cpds(
    cpd_nivel,
    cpd_equipo,
    cpd_habilidades,
    cpd_salud,
    cpd_mental,
    cpd_exito
)

# Verificar que el modelo sea válido
print("¿El modelo es válido?", modelo_mision.check_model())

## 2.5 Inferencia - Consultas Probabilísticas

In [None]:
# Crear objeto de inferencia
inferencia_mision = VariableElimination(modelo_mision)

print("="*70)
print("CONSULTAS DE INFERENCIA - EJERCICIO 2")
print("="*70)

In [None]:
# Consulta 1: P(Éxito) - Probabilidad marginal
resultado_m1 = inferencia_mision.query(variables=['ExitoMision'])
print("\n1. Probabilidad marginal de éxito en la misión:")
print(resultado_m1)

In [None]:
# Consulta 2: P(Éxito | NE=Alto, Habilidades=Altas)
resultado_m2 = inferencia_mision.query(
    variables=['ExitoMision'],
    evidence={'NivelExperiencia': 'Alto', 'Habilidades': 'Altas'}
)
print("\n2. P(Éxito | NivelExperiencia=Alto, Habilidades=Altas):")
print(resultado_m2)

In [None]:
# Consulta 3: P(Éxito | Salud=Baja, EstadoMental=Negativo)
resultado_m3 = inferencia_mision.query(
    variables=['ExitoMision'],
    evidence={'Salud': 'Baja', 'EstadoMental': 'Negativo'}
)
print("\n3. P(Éxito | Salud=Baja, EstadoMental=Negativo):")
print(resultado_m3)

In [None]:
# Consulta 4: Escenario óptimo
resultado_m4 = inferencia_mision.query(
    variables=['ExitoMision'],
    evidence={
        'NivelExperiencia': 'Alto',
        'Equipamiento': 'Avanzado',
        'Habilidades': 'Altas',
        'Salud': 'Alta',
        'EstadoMental': 'Positivo'
    }
)
print("\n4. Escenario ÓPTIMO (todos los atributos al máximo):")
print(resultado_m4)

In [None]:
# Consulta 5: Escenario desfavorable
resultado_m5 = inferencia_mision.query(
    variables=['ExitoMision'],
    evidence={
        'NivelExperiencia': 'Bajo',
        'Equipamiento': 'Basico',
        'Habilidades': 'Bajas',
        'Salud': 'Baja',
        'EstadoMental': 'Negativo'
    }
)
print("\n5. Escenario DESFAVORABLE (todos los atributos al mínimo):")
print(resultado_m5)

## 2.6 Tabla de Distribución Resumen

In [None]:
# Crear tabla resumen de algunos escenarios
escenarios_mision = [
    {'NivelExperiencia': 'Alto', 'Equipamiento': 'Avanzado', 'Habilidades': 'Altas', 'Salud': 'Alta', 'EstadoMental': 'Positivo'},
    {'NivelExperiencia': 'Alto', 'Equipamiento': 'Avanzado', 'Habilidades': 'Altas', 'Salud': 'Alta', 'EstadoMental': 'Negativo'},
    {'NivelExperiencia': 'Medio', 'Equipamiento': 'Intermedio', 'Habilidades': 'Medias', 'Salud': 'Media', 'EstadoMental': 'Neutral'},
    {'NivelExperiencia': 'Bajo', 'Equipamiento': 'Basico', 'Habilidades': 'Medias', 'Salud': 'Alta', 'EstadoMental': 'Positivo'},
    {'NivelExperiencia': 'Bajo', 'Equipamiento': 'Basico', 'Habilidades': 'Bajas', 'Salud': 'Baja', 'EstadoMental': 'Negativo'},
]

resultados_mision = []
for esc in escenarios_mision:
    res = inferencia_mision.query(variables=['ExitoMision'], evidence=esc)
    prob_si = res.values[0]
    resultados_mision.append({
        'Nivel Exp.': esc['NivelExperiencia'],
        'Equipo': esc['Equipamiento'],
        'Habilidades': esc['Habilidades'],
        'Salud': esc['Salud'],
        'Estado Mental': esc['EstadoMental'],
        'P(Éxito=Sí)': f"{prob_si:.2%}",
        'P(Éxito=No)': f"{1-prob_si:.2%}"
    })

df_resumen2 = pd.DataFrame(resultados_mision)
print("\n" + "="*70)
print("TABLA DE DISTRIBUCIÓN - EJERCICIO 2")
print("="*70)
print(df_resumen2.to_string(index=False))

---

# Conclusiones

## Ejercicio 1 - Compra de Videojuegos
- La red bayesiana captura cómo múltiples factores influyen en la decisión de compra
- Los factores con mayor impacto son: Precio bajo (+25%), Amigos jugando (+15%), y Críticas altas (+15%)
- En el escenario óptimo, la probabilidad de compra alcanza ~95%
- En el escenario más desfavorable, la probabilidad baja a ~30%

## Ejercicio 2 - Éxito en Misiones
- Los atributos del personaje determinan significativamente el éxito
- Habilidades y Nivel de Experiencia tienen el mayor peso (+20% cada uno en nivel alto)
- El estado mental negativo puede reducir las probabilidades incluso con buenos atributos
- Con todos los atributos óptimos, la probabilidad de éxito supera el 85%
- Con atributos mínimos, la probabilidad cae a menos del 15%

In [None]:
print("\n" + "="*70)
print("FIN DEL NOTEBOOK - REDES BAYESIANAS")
print("="*70)