# 📊 Práctica: Reconocimiento de Patrones en Probabilidad

## 🎯 Objetivos
- **Identificar** cuándo usar probabilidad condicional vs Teorema de Bayes
- **Practicar** el reconocimiento de patrones en enunciados
- **Visualizar** conceptos con matrices de confusión
- **Reforzar** la comprensión mediante ejercicios progresivos

---

*Notebook diseñado para complementar las guías de estudio de probabilidad-condicional.md y teorema-bayes.md*

In [None]:
# Librerías necesarias
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
from IPython.display import display, Markdown, HTML
import warnings
warnings.filterwarnings('ignore')

# Configuración de visualización
plt.style.use('seaborn-v0_8')
sns.set_palette("husl")
plt.rcParams['figure.figsize'] = (10, 6)
plt.rcParams['font.size'] = 12

## 🔍 Parte 1: Identificación de Patrones

### ✅ Reglas de Oro para Reconocer el Método

| **Método** | **Patrón del Enunciado** | **Ejemplo** |
|------------|--------------------------|-------------|
| **Probabilidad Condicional** | "Dado que A, ¿P(B)?" | "Dado que es estudiante de ingeniería, ¿probabilidad de tener beca?" |
| **Intersección** | "¿P(A y B simultáneamente)?" | "¿Probabilidad de ser ingeniero Y tener beca?" |
| **Probabilidad Total** | "¿P(B) en general?" | "¿Probabilidad de tener beca sin importar la carrera?" |
| **🎯 Teorema de Bayes** | **"Dado que B, ¿P(A)?"** <br> *(Inversión)* | **"Dado que tiene beca, ¿probabilidad de ser ingeniero?"** |

### 🧩 Quiz Interactivo 1: Reconocimiento de Patrones

**Instrucciones**: Para cada enunciado, identifica qué método usar.

In [None]:
# Función para crear quiz interactivo
def crear_quiz_patrones():
    ejercicios = [
        {
            "enunciado": "En una empresa, 30% son ingenieros y 70% administradores. De los ingenieros, 20% tiene posgrado. Si seleccionamos un ingeniero al azar, ¿cuál es la probabilidad de que tenga posgrado?",
            "respuesta_correcta": "Probabilidad Condicional",
            "explicacion": "Patrón: 'Si seleccionamos un ingeniero (A ya dado), ¿P(posgrado)?' → P(Posgrado|Ingeniero) = 0.20"
        },
        {
            "enunciado": "Continuando el ejemplo anterior: Si una persona tiene posgrado, ¿cuál es la probabilidad de que sea ingeniero?",
            "respuesta_correcta": "Teorema de Bayes",
            "explicacion": "Patrón: 'Si tiene posgrado (efecto), ¿P(ingeniero)?' → Inversión clásica de Bayes: P(Ingeniero|Posgrado)"
        },
        {
            "enunciado": "En la misma empresa, ¿cuál es la probabilidad de que una persona sea ingeniero Y tenga posgrado?",
            "respuesta_correcta": "Intersección",
            "explicacion": "Patrón: 'A Y B simultáneamente' → P(Ingeniero ∩ Posgrado) = P(Posgrado|Ingeniero) × P(Ingeniero)"
        },
        {
            "enunciado": "¿Cuál es la probabilidad de que una persona elegida al azar tenga posgrado (sin importar si es ingeniero o administrador)?",
            "respuesta_correcta": "Probabilidad Total",
            "explicacion": "Patrón: 'En general, sin condiciones' → P(Posgrado) = Σ P(Posgrado|Carrera) × P(Carrera)"
        }
    ]
    
    for i, ejercicio in enumerate(ejercicios, 1):
        print(f"\n{'='*60}")
        print(f"EJERCICIO {i}:")
        print(f"{'='*60}")
        print(f"📝 {ejercicio['enunciado']}")
        print("\n🔍 Opciones:")
        print("   A) Probabilidad Condicional")
        print("   B) Intersección")
        print("   C) Probabilidad Total")
        print("   D) Teorema de Bayes")
        print(f"\n✅ Respuesta: {ejercicio['respuesta_correcta']}")
        print(f"💡 Explicación: {ejercicio['explicacion']}")

crear_quiz_patrones()

## 🎲 Parte 2: Ejercicios Basados en la Práctica 1

### Problema: Dados sin Reposición (Ejercicio 3)

**Enunciado**: En una caja hay 4 dados negros y 6 blancos. Se saca al azar un dado y luego otro sin reponer el primero.

In [None]:
# Análisis del problema de dados
def analizar_dados_sin_reposicion():
    print("🎲 ANÁLISIS DEL PROBLEMA DE DADOS")
    print("="*50)
    
    # Datos iniciales
    dados_negros = 4
    dados_blancos = 6
    total_dados = dados_negros + dados_blancos
    
    print(f"📊 Composición inicial:")
    print(f"   • Dados negros: {dados_negros}")
    print(f"   • Dados blancos: {dados_blancos}")
    print(f"   • Total: {total_dados}")
    
    # Probabilidades iniciales
    p_blanco_1 = dados_blancos / total_dados
    p_negro_1 = dados_negros / total_dados
    
    print(f"\n🎯 Probabilidades del primer dado:")
    print(f"   • P(1º blanco) = {dados_blancos}/{total_dados} = {p_blanco_1:.3f}")
    print(f"   • P(1º negro) = {dados_negros}/{total_dados} = {p_negro_1:.3f}")
    
    # Escenario: Primer dado blanco
    print(f"\n🔄 Después de sacar el primer dado BLANCO:")
    dados_blancos_restantes = dados_blancos - 1
    total_restante = total_dados - 1
    p_blanco_2_dado_blanco_1 = dados_blancos_restantes / total_restante
    
    print(f"   • Dados blancos restantes: {dados_blancos_restantes}")
    print(f"   • Total de dados restantes: {total_restante}")
    print(f"   • P(2º blanco | 1º blanco) = {dados_blancos_restantes}/{total_restante} = {p_blanco_2_dado_blanco_1:.3f}")
    
    # Cálculo de ambos blancos
    p_ambos_blancos = p_blanco_1 * p_blanco_2_dado_blanco_1
    
    print(f"\n🎯 RESULTADO FINAL:")
    print(f"   P(ambos blancos) = P(1º blanco) × P(2º blanco | 1º blanco)")
    print(f"   P(ambos blancos) = {p_blanco_1:.3f} × {p_blanco_2_dado_blanco_1:.3f} = {p_ambos_blancos:.3f}")
    print(f"   P(ambos blancos) = {dados_blancos}/{total_dados} × {dados_blancos_restantes}/{total_restante} = {dados_blancos * dados_blancos_restantes}/{total_dados * total_restante} = {p_ambos_blancos:.3f}")
    
    return p_ambos_blancos

resultado = analizar_dados_sin_reposicion()

### 🔍 Comprensión Conceptual: ¿Por qué multiplicamos?

La multiplicación en eventos dependientes representa un **filtrado en dos etapas**:

In [None]:
# Visualización del concepto de filtrado
def visualizar_filtrado():
    # Simulación con números grandes para mayor claridad
    experimentos = 10000
    
    dados_blancos = 6
    total_dados = 10
    
    # Etapa 1: ¿Cuántos experimentos tienen primer dado blanco?
    primer_blanco = experimentos * (dados_blancos / total_dados)
    
    # Etapa 2: De esos, ¿cuántos también tienen segundo blanco?
    ambos_blancos = primer_blanco * ((dados_blancos - 1) / (total_dados - 1))
    
    print("🔍 VISUALIZACIÓN DEL FILTRADO")
    print("="*40)
    print(f"🧪 Experimentos totales: {experimentos:,}")
    print()
    print(f"📊 ETAPA 1 - Filtro: 'Primer dado blanco'")
    print(f"   Experimentos que pasan: {experimentos:,} × {dados_blancos}/{total_dados} = {primer_blanco:,.0f}")
    print()
    print(f"📊 ETAPA 2 - Filtro: 'Segundo dado también blanco'")
    print(f"   De los {primer_blanco:,.0f} que pasaron la etapa 1:")
    print(f"   Experimentos finales: {primer_blanco:,.0f} × {dados_blancos-1}/{total_dados-1} = {ambos_blancos:,.0f}")
    print()
    print(f"🎯 RESULTADO:")
    print(f"   Probabilidad = {ambos_blancos:,.0f} / {experimentos:,} = {ambos_blancos/experimentos:.3f}")
    
    # Crear visualización
    fig, ax = plt.subplots(1, 1, figsize=(12, 6))
    
    etapas = ['Experimentos\nIniciales', 'Después de\nEtapa 1', 'Después de\nEtapa 2']
    cantidades = [experimentos, primer_blanco, ambos_blancos]
    colores = ['lightblue', 'orange', 'green']
    
    barras = ax.bar(etapas, cantidades, color=colores, alpha=0.7, edgecolor='black')
    
    # Agregar valores en las barras
    for i, (barra, cantidad) in enumerate(zip(barras, cantidades)):
        height = barra.get_height()
        ax.text(barra.get_x() + barra.get_width()/2., height + 50,
                f'{cantidad:,.0f}', ha='center', va='bottom', fontweight='bold')
        
        if i > 0:
            proporcion = cantidad / cantidades[i-1]
            ax.text(barra.get_x() + barra.get_width()/2., height/2,
                    f'{proporcion:.3f}', ha='center', va='center', 
                    fontsize=10, color='white', fontweight='bold')
    
    ax.set_ylabel('Número de Experimentos', fontsize=12)
    ax.set_title('Filtrado en Dos Etapas: ¿Por qué Multiplicamos?', fontsize=14, fontweight='bold')
    ax.grid(axis='y', alpha=0.3)
    
    plt.tight_layout()
    plt.show()

visualizar_filtrado()

## 🚗 Parte 3: Teorema de Bayes en Acción

### Problema: Vehículos en la Estación de Servicio (Ejercicio 8)

**Datos**:
- 25% de vehículos son camiones, 75% son automóviles
- Probabilidad de parar: Camiones 1%, Automóviles 2%
- **Pregunta**: Si un vehículo paró, ¿probabilidad de que sea camión?

In [None]:
# Análisis completo del problema de vehículos
def analizar_vehiculos_bayes():
    print("🚗 ANÁLISIS: VEHÍCULOS EN ESTACIÓN DE SERVICIO")
    print("="*55)
    
    # Datos del problema
    p_camion = 0.25
    p_auto = 0.75
    p_para_camion = 0.01
    p_para_auto = 0.02
    
    print("📊 DATOS DEL PROBLEMA:")
    print(f"   • P(Camión) = {p_camion}")
    print(f"   • P(Automóvil) = {p_auto}")
    print(f"   • P(Para | Camión) = {p_para_camion}")
    print(f"   • P(Para | Automóvil) = {p_para_auto}")
    
    # Reconocimiento del patrón
    print("\n🔍 RECONOCIMIENTO DEL PATRÓN:")
    print("   Pregunta: 'Si paró, ¿probabilidad de que sea camión?'")
    print("   Patrón: 'Si [efecto], ¿P(causa)?' → TEOREMA DE BAYES")
    print("   Queremos: P(Camión | Para)")
    
    # Paso 1: Probabilidad total
    print("\n📈 PASO 1: Calcular P(Para) - Probabilidad Total")
    p_para = p_para_camion * p_camion + p_para_auto * p_auto
    print(f"   P(Para) = P(Para|Camión)×P(Camión) + P(Para|Auto)×P(Auto)")
    print(f"   P(Para) = {p_para_camion}×{p_camion} + {p_para_auto}×{p_auto}")
    print(f"   P(Para) = {p_para_camion * p_camion} + {p_para_auto * p_auto} = {p_para}")
    
    # Paso 2: Aplicar Bayes
    print("\n🎯 PASO 2: Aplicar Teorema de Bayes")
    p_camion_para = (p_para_camion * p_camion) / p_para
    print(f"   P(Camión|Para) = [P(Para|Camión) × P(Camión)] / P(Para)")
    print(f"   P(Camión|Para) = [{p_para_camion} × {p_camion}] / {p_para}")
    print(f"   P(Camión|Para) = {p_para_camion * p_camion} / {p_para} = {p_camion_para:.4f}")
    
    # Interpretación
    print(f"\n✅ RESULTADO: {p_camion_para:.4f} = {p_camion_para:.2%}")
    print(f"\n💡 INTERPRETACIÓN:")
    print(f"   De cada 7 vehículos que paran, aproximadamente 1 es camión")
    print(f"   Fracción exacta: {p_camion_para:.4f} = 1/7 ≈ 0.1429")
    
    return p_camion_para, p_para

p_resultado, p_total = analizar_vehiculos_bayes()

### 📊 Matriz de Confusión: Visualización del Problema

In [None]:
# Crear matriz de confusión para el problema de vehículos
def crear_matriz_confusion_vehiculos():
    print("📊 MATRIZ DE CONFUSIÓN - VEHÍCULOS")
    print("="*40)
    
    # Simulación con 10,000 vehículos
    total_vehiculos = 10000
    
    # Distribución por tipo
    camiones = int(total_vehiculos * 0.25)
    autos = int(total_vehiculos * 0.75)
    
    # Comportamiento en la estación
    camiones_paran = int(camiones * 0.01)
    camiones_no_paran = camiones - camiones_paran
    
    autos_paran = int(autos * 0.02)
    autos_no_paran = autos - autos_paran
    
    # Para la matriz de confusión: "Para" es el resultado "positivo"
    # Verdaderos Positivos: Camiones que paran
    # Falsos Positivos: Autos que paran (no son camiones pero "dan positivo")
    vp = camiones_paran
    fp = autos_paran
    fn = camiones_no_paran
    vn = autos_no_paran
    
    # Crear la matriz como DataFrame
    matriz = pd.DataFrame({
        'Para': [vp, fp, vp + fp],
        'No Para': [fn, vn, fn + vn],
        'Total': [vp + fn, fp + vn, total_vehiculos]
    }, index=['Camión', 'Automóvil', 'Total'])
    
    print("\n📋 MATRIZ DE CONFUSIÓN:")
    print(matriz)
    
    # Métricas importantes
    vpp = vp / (vp + fp)  # Valor Predictivo Positivo (esto es lo que calcula Bayes)
    sensibilidad = vp / (vp + fn)
    especificidad = vn / (vn + fp)
    
    print(f"\n🎯 MÉTRICAS CLAVE:")
    print(f"   • Valor Predictivo Positivo (BAYES): {vp}/{vp + fp} = {vpp:.4f} ({vpp:.2%})")
    print(f"   • Sensibilidad (% camiones que paran): {vp}/{vp + fn} = {sensibilidad:.4f} ({sensibilidad:.2%})")
    print(f"   • Especificidad (% autos que no paran): {vn}/{vn + fp} = {especificidad:.4f} ({especificidad:.2%})")
    
    # Visualización
    fig, (ax1, ax2) = plt.subplots(1, 2, figsize=(15, 6))
    
    # Gráfico 1: Distribución de vehículos que paran
    tipos = ['Camiones\nque paran', 'Autos\nque paran']
    cantidades = [vp, fp]
    colores = ['orange', 'lightblue']
    
    barras1 = ax1.bar(tipos, cantidades, color=colores, alpha=0.7, edgecolor='black')
    ax1.set_title('Composición de Vehículos que Paran', fontweight='bold')
    ax1.set_ylabel('Cantidad')
    
    for barra, cantidad in zip(barras1, cantidades):
        height = barra.get_height()
        ax1.text(barra.get_x() + barra.get_width()/2., height + 1,
                f'{cantidad}', ha='center', va='bottom', fontweight='bold')
    
    # Gráfico 2: Matriz de confusión como heatmap
    matriz_nums = matriz.iloc[:-1, :-1].values
    sns.heatmap(matriz_nums, annot=True, fmt='d', cmap='Blues', 
                xticklabels=['Para', 'No Para'], 
                yticklabels=['Camión', 'Automóvil'],
                ax=ax2, cbar_kws={'label': 'Cantidad de Vehículos'})
    ax2.set_title('Matriz de Confusión', fontweight='bold')
    
    plt.tight_layout()
    plt.show()
    
    print(f"\n🔍 OBSERVACIÓN CLAVE:")
    print(f"   Los autos que paran ({fp}) superan a los camiones que paran ({vp})")
    print(f"   Por eso el VPP es {vpp:.2%}, no 50%")
    
    return matriz

matriz_vehiculos = crear_matriz_confusion_vehiculos()

## 🎯 Parte 4: Ejercicios de Autoevaluación

### 📝 Ejercicio 1: Identificación Rápida

In [None]:
# Ejercicios de autoevaluación
def ejercicios_autoevaluacion():
    ejercicios = [
        {
            "numero": 1,
            "enunciado": "En un hospital, 5% de pacientes tiene una enfermedad rara. Una prueba detecta la enfermedad en 95% de los casos y da falso positivo en 2% de personas sanas. Si la prueba es positiva, ¿probabilidad de tener la enfermedad?",
            "tipo": "Bayes",
            "datos": {"prevalencia": 0.05, "sensibilidad": 0.95, "falso_positivo": 0.02},
            "solucion": 0.7092
        },
        {
            "numero": 2,
            "enunciado": "En una universidad, 40% estudia ingeniería, 35% medicina, 25% derecho. Las probabilidades de obtener beca son 15%, 20%, 10% respectivamente. ¿Probabilidad de que un estudiante tenga beca?",
            "tipo": "Probabilidad Total",
            "datos": {"ing": 0.40, "med": 0.35, "der": 0.25, "beca_ing": 0.15, "beca_med": 0.20, "beca_der": 0.10},
            "solucion": 0.155
        },
        {
            "numero": 3,
            "enunciado": "Continuando el ejercicio anterior: Si un estudiante tiene beca, ¿probabilidad de que estudie medicina?",
            "tipo": "Bayes",
            "datos": {"P_med": 0.35, "P_beca_med": 0.20, "P_beca": 0.155},
            "solucion": 0.4516
        }
    ]
    
    print("🎯 EJERCICIOS DE AUTOEVALUACIÓN")
    print("="*50)
    
    for ejercicio in ejercicios:
        print(f"\n📋 EJERCICIO {ejercicio['numero']}:")
        print(f"{ejercicio['enunciado']}")
        print(f"\n🔍 Tipo de problema: {ejercicio['tipo']}")
        print(f"✅ Respuesta: {ejercicio['solucion']:.4f} ({ejercicio['solucion']:.2%})")
        
        if ejercicio['numero'] == 1:
            # Resolver el primer ejercicio paso a paso
            d = ejercicio['datos']
            p_pos = d['sensibilidad'] * d['prevalencia'] + d['falso_positivo'] * (1 - d['prevalencia'])
            p_enf_pos = (d['sensibilidad'] * d['prevalencia']) / p_pos
            
            print(f"\n💡 Solución detallada:")
            print(f"   P(+) = {d['sensibilidad']}×{d['prevalencia']} + {d['falso_positivo']}×{1-d['prevalencia']} = {p_pos:.4f}")
            print(f"   P(Enfermo|+) = ({d['sensibilidad']}×{d['prevalencia']}) / {p_pos:.4f} = {p_enf_pos:.4f}")
        
        print("\n" + "-"*50)

ejerccios_autoevaluacion()

### 🧠 Ejercicio 2: Creación de Matriz de Confusión

**Instrucciones**: Resuelve el ejercicio 1 creando una matriz de confusión con 10,000 pacientes.

In [None]:
# Ejercicio práctico: crear matriz de confusión
def ejercicio_matriz_hospital():
    print("🏥 EJERCICIO: MATRIZ DE CONFUSIÓN - HOSPITAL")
    print("="*50)
    
    # Datos del problema
    total_pacientes = 10000
    prevalencia = 0.05
    sensibilidad = 0.95
    falso_positivo = 0.02
    
    # Distribución de pacientes
    enfermos = int(total_pacientes * prevalencia)
    sanos = total_pacientes - enfermos
    
    # Resultados de la prueba
    vp = int(enfermos * sensibilidad)  # Enfermos detectados
    fn = enfermos - vp  # Enfermos no detectados
    fp = int(sanos * falso_positivo)  # Sanos mal clasificados
    vn = sanos - fp  # Sanos bien clasificados
    
    print(f"👥 Distribución de {total_pacientes:,} pacientes:")
    print(f"   • Enfermos: {enfermos:,} ({prevalencia:.1%})")
    print(f"   • Sanos: {sanos:,} ({(1-prevalencia):.1%})")
    
    # Crear matriz
    matriz = pd.DataFrame({
        'Prueba +': [vp, fp, vp + fp],
        'Prueba -': [fn, vn, fn + vn],
        'Total': [enfermos, sanos, total_pacientes]
    }, index=['Enfermo', 'Sano', 'Total'])
    
    print(f"\n📊 MATRIZ DE CONFUSIÓN:")
    print(matriz)
    
    # Métricas
    vpp = vp / (vp + fp)
    vpn = vn / (vn + fn)
    sens = vp / (vp + fn)
    espec = vn / (vn + fp)
    
    print(f"\n🎯 MÉTRICAS DIAGNÓSTICAS:")
    print(f"   • 🎯 VPP (Bayes): {vp:,}/{vp + fp:,} = {vpp:.4f} ({vpp:.2%})")
    print(f"   • VPN: {vn:,}/{vn + fn:,} = {vpn:.4f} ({vpn:.2%})")
    print(f"   • Sensibilidad: {vp:,}/{vp + fn:,} = {sens:.4f} ({sens:.2%})")
    print(f"   • Especificidad: {vn:,}/{vn + fp:,} = {espec:.4f} ({espec:.2%})")
    
    # Visualización comparativa
    fig, ((ax1, ax2), (ax3, ax4)) = plt.subplots(2, 2, figsize=(15, 12))
    
    # 1. Distribución de población
    ax1.pie([enfermos, sanos], labels=['Enfermos', 'Sanos'], 
            autopct='%1.1f%%', colors=['red', 'lightgreen'], startangle=90)
    ax1.set_title('Distribución de la Población')
    
    # 2. Composición de pruebas positivas
    ax2.pie([vp, fp], labels=['Verdaderos\nPositivos', 'Falsos\nPositivos'], 
            autopct='%1.1f%%', colors=['darkgreen', 'orange'], startangle=90)
    ax2.set_title('Composición de Pruebas Positivas')
    
    # 3. Matriz como heatmap
    matriz_nums = matriz.iloc[:-1, :-1].values
    sns.heatmap(matriz_nums, annot=True, fmt='d', cmap='Reds', 
                xticklabels=['Prueba +', 'Prueba -'], 
                yticklabels=['Enfermo', 'Sano'], ax=ax3)
    ax3.set_title('Matriz de Confusión')
    
    # 4. Comparación de métricas
    metricas = ['VPP\n(Bayes)', 'VPN', 'Sensibilidad', 'Especificidad']
    valores = [vpp, vpn, sens, espec]
    colores_metricas = ['red', 'blue', 'green', 'purple']
    
    barras = ax4.bar(metricas, valores, color=colores_metricas, alpha=0.7)
    ax4.set_ylim(0, 1)
    ax4.set_ylabel('Valor')
    ax4.set_title('Métricas Diagnósticas')
    
    for barra, valor in zip(barras, valores):
        height = barra.get_height()
        ax4.text(barra.get_x() + barra.get_width()/2., height + 0.01,
                f'{valor:.3f}', ha='center', va='bottom', fontweight='bold')
    
    plt.tight_layout()
    plt.show()
    
    print(f"\n💡 INTERPRETACIÓN:")
    print(f"   Si tu prueba es positiva, tienes {vpp:.1%} de probabilidad de estar enfermo")
    print(f"   Esto es MENOR que la sensibilidad ({sens:.1%}) debido a la baja prevalencia")

ejercicio_matriz_hospital()

## 🚀 Parte 5: Desafíos Avanzados

### 🔥 Desafío 1: Problema Combinado

In [None]:
# Desafío avanzado
def desafio_avanzado():
    print("🔥 DESAFÍO AVANZADO: PROBLEMA COMBINADO")
    print("="*50)
    
    problema = """
🏭 CONTEXTO: Una empresa tiene tres líneas de producción:
   • Línea A: Produce 50% del total, 3% defectuoso
   • Línea B: Produce 30% del total, 5% defectuoso  
   • Línea C: Produce 20% del total, 2% defectuoso

🔍 PREGUNTAS:
   1. ¿Cuál es la probabilidad de que un producto sea defectuoso?
   2. Si un producto es defectuoso, ¿probabilidad de que venga de línea B?
   3. ¿Cuál línea contribuye más productos defectuosos?
   4. Si seleccionamos un producto de línea A, ¿probabilidad de que sea defectuoso?
"""
    
    print(problema)
    
    # Datos
    p_a, p_b, p_c = 0.50, 0.30, 0.20
    p_def_a, p_def_b, p_def_c = 0.03, 0.05, 0.02
    
    # Respuestas
    print("\n✅ SOLUCIONES:")
    print("-" * 30)
    
    # 1. Probabilidad total
    p_def = p_def_a * p_a + p_def_b * p_b + p_def_c * p_c
    print(f"1. P(Defectuoso) = {p_def_a}×{p_a} + {p_def_b}×{p_b} + {p_def_c}×{p_c} = {p_def:.4f}")
    print(f"   Método: PROBABILIDAD TOTAL")
    
    # 2. Bayes
    p_b_def = (p_def_b * p_b) / p_def
    print(f"\n2. P(Línea B | Defectuoso) = ({p_def_b}×{p_b}) / {p_def:.4f} = {p_b_def:.4f}")
    print(f"   Método: TEOREMA DE BAYES")
    
    # 3. Contribuciones
    contrib_a = p_def_a * p_a
    contrib_b = p_def_b * p_b
    contrib_c = p_def_c * p_c
    print(f"\n3. Contribuciones a defectuosos:")
    print(f"   Línea A: {contrib_a:.4f} ({contrib_a/p_def:.1%})")
    print(f"   Línea B: {contrib_b:.4f} ({contrib_b/p_def:.1%})")
    print(f"   Línea C: {contrib_c:.4f} ({contrib_c/p_def:.1%})")
    print(f"   Mayor contribuyente: Línea A")
    
    # 4. Probabilidad condicional directa
    print(f"\n4. P(Defectuoso | Línea A) = {p_def_a:.2f}")
    print(f"   Método: PROBABILIDAD CONDICIONAL DIRECTA")
    
    # Visualización final
    fig, (ax1, ax2) = plt.subplots(1, 2, figsize=(15, 6))
    
    # Contribuciones por línea
    lineas = ['Línea A', 'Línea B', 'Línea C']
    contribuciones = [contrib_a, contrib_b, contrib_c]
    
    ax1.bar(lineas, contribuciones, color=['blue', 'red', 'green'], alpha=0.7)
    ax1.set_title('Contribución a Productos Defectuosos')
    ax1.set_ylabel('Probabilidad')
    
    for i, v in enumerate(contribuciones):
        ax1.text(i, v + 0.001, f'{v:.4f}\n({v/p_def:.1%})', 
                ha='center', va='bottom', fontweight='bold')
    
    # Comparación: Producción vs Contribución defectuosa
    x = np.arange(len(lineas))
    width = 0.35
    
    produccion = [p_a, p_b, p_c]
    contrib_pct = [c/p_def for c in contribuciones]
    
    ax2.bar(x - width/2, produccion, width, label='% Producción', alpha=0.7)
    ax2.bar(x + width/2, contrib_pct, width, label='% Defectuosos', alpha=0.7)
    
    ax2.set_title('Producción vs Contribución a Defectos')
    ax2.set_ylabel('Porcentaje')
    ax2.set_xticks(x)
    ax2.set_xticklabels(lineas)
    ax2.legend()
    
    plt.tight_layout()
    plt.show()

desafio_avanzado()

## 📚 Resumen y Checklist

### ✅ Checklist de Comprensión

**Marca cada concepto que dominas:**

□ **Reconocimiento de patrones**: Identifico cuándo usar cada método leyendo el enunciado  
□ **Probabilidad condicional**: Entiendo que es "dado A, ¿P(B)?"  
□ **Intersección**: Sé calcular P(A ∩ B) = P(B|A) × P(A)  
□ **Probabilidad total**: Puedo calcular P(B) cuando hay varias causas  
□ **Teorema de Bayes**: Entiendo la "inversión" de P(A|B) a P(B|A)  
□ **Dependencia**: Comprendo por qué se multiplican las probabilidades  
□ **Matrices de confusión**: Puedo crear e interpretar VP, FP, VN, FN  
□ **VPP**: Sé que Bayes siempre calcula el Valor Predictivo Positivo  
□ **Prevalencia**: Entiendo cómo afecta los resultados de Bayes  
□ **Interpretación**: Puedo explicar resultados en contexto real

### 🎯 Fórmulas de Referencia Rápida

In [None]:
# Tabla de referencia rápida
def mostrar_referencia_rapida():
    formulas = {
        "Probabilidad Condicional": "P(B|A) = P(A ∩ B) / P(A)",
        "Intersección": "P(A ∩ B) = P(B|A) × P(A)",
        "Probabilidad Total": "P(B) = Σ P(B|Aᵢ) × P(Aᵢ)",
        "Teorema de Bayes": "P(A|B) = [P(B|A) × P(A)] / P(B)",
        "Independencia": "P(B|A) = P(B) ⟺ A y B independientes",
        "VPP (Bayes)": "VP / (VP + FP)",
        "Sensibilidad": "VP / (VP + FN)",
        "Especificidad": "VN / (VN + FP)"
    }
    
    print("📋 FÓRMULAS DE REFERENCIA RÁPIDA")
    print("="*50)
    
    for concepto, formula in formulas.items():
        print(f"🔹 {concepto:20} → {formula}")
    
    print("\n💡 REGLA DE ORO:")
    print("   Si el enunciado pregunta por la 'causa' dado el 'efecto' → BAYES")
    print("   Si pregunta por el 'efecto' dada la 'causa' → CONDICIONAL")

mostrar_referencia_rapida()

## 🎓 Conclusiones

### 🌟 Puntos Clave Aprendidos

1. **El reconocimiento de patrones es fundamental**: Antes de calcular, identifica qué te están preguntando

2. **Bayes = Inversión**: Siempre que tengas "dado el efecto, ¿probabilidad de la causa?"

3. **Matrices de confusión visualizan todo**: VP, FP, VN, FN hacen tangibles los conceptos abstractos

4. **La prevalencia importa**: En problemas de Bayes, la frecuencia base afecta dramáticamente el resultado

5. **La multiplicación es filtrado**: En eventos dependientes, cada probabilidad "filtra" los casos

### 🚀 Próximos Pasos

- Practica identificando patrones en ejercicios nuevos
- Crea matrices de confusión para todos los problemas de Bayes
- Interpreta siempre los resultados en el contexto del problema
- Conecta estos conceptos con distribuciones de probabilidad (próxima unidad)

---

**¡Felicitaciones! 🎉 Has completado el entrenamiento en reconocimiento de patrones de probabilidad.**

*Notebook creado para reforzar conceptos de probabilidad condicional y Teorema de Bayes*