# üìä Pr√°ctica: Reconocimiento de Patrones en Probabilidad

## üéØ Objetivos
- **Identificar** cu√°ndo usar probabilidad condicional vs Teorema de Bayes
- **Practicar** el reconocimiento de patrones en enunciados
- **Visualizar** conceptos con matrices de confusi√≥n
- **Reforzar** la comprensi√≥n mediante ejercicios progresivos

---

*Notebook dise√±ado para complementar las gu√≠as de estudio de probabilidad-condicional.md y teorema-bayes.md*

In [None]:
# Librer√≠as necesarias
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
from IPython.display import display, Markdown, HTML
import warnings
warnings.filterwarnings('ignore')

# Configuraci√≥n de visualizaci√≥n
plt.style.use('seaborn-v0_8')
sns.set_palette("husl")
plt.rcParams['figure.figsize'] = (10, 6)
plt.rcParams['font.size'] = 12

## üîç Parte 1: Identificaci√≥n de Patrones

### ‚úÖ Reglas de Oro para Reconocer el M√©todo

| **M√©todo** | **Patr√≥n del Enunciado** | **Ejemplo** |
|------------|--------------------------|-------------|
| **Probabilidad Condicional** | "Dado que A, ¬øP(B)?" | "Dado que es estudiante de ingenier√≠a, ¬øprobabilidad de tener beca?" |
| **Intersecci√≥n** | "¬øP(A y B simult√°neamente)?" | "¬øProbabilidad de ser ingeniero Y tener beca?" |
| **Probabilidad Total** | "¬øP(B) en general?" | "¬øProbabilidad de tener beca sin importar la carrera?" |
| **üéØ Teorema de Bayes** | **"Dado que B, ¬øP(A)?"** <br> *(Inversi√≥n)* | **"Dado que tiene beca, ¬øprobabilidad de ser ingeniero?"** |

### üß© Quiz Interactivo 1: Reconocimiento de Patrones

**Instrucciones**: Para cada enunciado, identifica qu√© m√©todo usar.

In [None]:
# Funci√≥n para crear quiz interactivo
def crear_quiz_patrones():
    ejercicios = [
        {
            "enunciado": "En una empresa, 30% son ingenieros y 70% administradores. De los ingenieros, 20% tiene posgrado. Si seleccionamos un ingeniero al azar, ¬øcu√°l es la probabilidad de que tenga posgrado?",
            "respuesta_correcta": "Probabilidad Condicional",
            "explicacion": "Patr√≥n: 'Si seleccionamos un ingeniero (A ya dado), ¬øP(posgrado)?' ‚Üí P(Posgrado|Ingeniero) = 0.20"
        },
        {
            "enunciado": "Continuando el ejemplo anterior: Si una persona tiene posgrado, ¬øcu√°l es la probabilidad de que sea ingeniero?",
            "respuesta_correcta": "Teorema de Bayes",
            "explicacion": "Patr√≥n: 'Si tiene posgrado (efecto), ¬øP(ingeniero)?' ‚Üí Inversi√≥n cl√°sica de Bayes: P(Ingeniero|Posgrado)"
        },
        {
            "enunciado": "En la misma empresa, ¬øcu√°l es la probabilidad de que una persona sea ingeniero Y tenga posgrado?",
            "respuesta_correcta": "Intersecci√≥n",
            "explicacion": "Patr√≥n: 'A Y B simult√°neamente' ‚Üí P(Ingeniero ‚à© Posgrado) = P(Posgrado|Ingeniero) √ó P(Ingeniero)"
        },
        {
            "enunciado": "¬øCu√°l es la probabilidad de que una persona elegida al azar tenga posgrado (sin importar si es ingeniero o administrador)?",
            "respuesta_correcta": "Probabilidad Total",
            "explicacion": "Patr√≥n: 'En general, sin condiciones' ‚Üí P(Posgrado) = Œ£ P(Posgrado|Carrera) √ó P(Carrera)"
        }
    ]
    
    for i, ejercicio in enumerate(ejercicios, 1):
        print(f"\n{'='*60}")
        print(f"EJERCICIO {i}:")
        print(f"{'='*60}")
        print(f"üìù {ejercicio['enunciado']}")
        print("\nüîç Opciones:")
        print("   A) Probabilidad Condicional")
        print("   B) Intersecci√≥n")
        print("   C) Probabilidad Total")
        print("   D) Teorema de Bayes")
        print(f"\n‚úÖ Respuesta: {ejercicio['respuesta_correcta']}")
        print(f"üí° Explicaci√≥n: {ejercicio['explicacion']}")

crear_quiz_patrones()

## üé≤ Parte 2: Ejercicios Basados en la Pr√°ctica 1

### Problema: Dados sin Reposici√≥n (Ejercicio 3)

**Enunciado**: En una caja hay 4 dados negros y 6 blancos. Se saca al azar un dado y luego otro sin reponer el primero.

In [None]:
# An√°lisis del problema de dados
def analizar_dados_sin_reposicion():
    print("üé≤ AN√ÅLISIS DEL PROBLEMA DE DADOS")
    print("="*50)
    
    # Datos iniciales
    dados_negros = 4
    dados_blancos = 6
    total_dados = dados_negros + dados_blancos
    
    print(f"üìä Composici√≥n inicial:")
    print(f"   ‚Ä¢ Dados negros: {dados_negros}")
    print(f"   ‚Ä¢ Dados blancos: {dados_blancos}")
    print(f"   ‚Ä¢ Total: {total_dados}")
    
    # Probabilidades iniciales
    p_blanco_1 = dados_blancos / total_dados
    p_negro_1 = dados_negros / total_dados
    
    print(f"\nüéØ Probabilidades del primer dado:")
    print(f"   ‚Ä¢ P(1¬∫ blanco) = {dados_blancos}/{total_dados} = {p_blanco_1:.3f}")
    print(f"   ‚Ä¢ P(1¬∫ negro) = {dados_negros}/{total_dados} = {p_negro_1:.3f}")
    
    # Escenario: Primer dado blanco
    print(f"\nüîÑ Despu√©s de sacar el primer dado BLANCO:")
    dados_blancos_restantes = dados_blancos - 1
    total_restante = total_dados - 1
    p_blanco_2_dado_blanco_1 = dados_blancos_restantes / total_restante
    
    print(f"   ‚Ä¢ Dados blancos restantes: {dados_blancos_restantes}")
    print(f"   ‚Ä¢ Total de dados restantes: {total_restante}")
    print(f"   ‚Ä¢ P(2¬∫ blanco | 1¬∫ blanco) = {dados_blancos_restantes}/{total_restante} = {p_blanco_2_dado_blanco_1:.3f}")
    
    # C√°lculo de ambos blancos
    p_ambos_blancos = p_blanco_1 * p_blanco_2_dado_blanco_1
    
    print(f"\nüéØ RESULTADO FINAL:")
    print(f"   P(ambos blancos) = P(1¬∫ blanco) √ó P(2¬∫ blanco | 1¬∫ blanco)")
    print(f"   P(ambos blancos) = {p_blanco_1:.3f} √ó {p_blanco_2_dado_blanco_1:.3f} = {p_ambos_blancos:.3f}")
    print(f"   P(ambos blancos) = {dados_blancos}/{total_dados} √ó {dados_blancos_restantes}/{total_restante} = {dados_blancos * dados_blancos_restantes}/{total_dados * total_restante} = {p_ambos_blancos:.3f}")
    
    return p_ambos_blancos

resultado = analizar_dados_sin_reposicion()

### üîç Comprensi√≥n Conceptual: ¬øPor qu√© multiplicamos?

La multiplicaci√≥n en eventos dependientes representa un **filtrado en dos etapas**:

In [None]:
# Visualizaci√≥n del concepto de filtrado
def visualizar_filtrado():
    # Simulaci√≥n con n√∫meros grandes para mayor claridad
    experimentos = 10000
    
    dados_blancos = 6
    total_dados = 10
    
    # Etapa 1: ¬øCu√°ntos experimentos tienen primer dado blanco?
    primer_blanco = experimentos * (dados_blancos / total_dados)
    
    # Etapa 2: De esos, ¬øcu√°ntos tambi√©n tienen segundo blanco?
    ambos_blancos = primer_blanco * ((dados_blancos - 1) / (total_dados - 1))
    
    print("üîç VISUALIZACI√ìN DEL FILTRADO")
    print("="*40)
    print(f"üß™ Experimentos totales: {experimentos:,}")
    print()
    print(f"üìä ETAPA 1 - Filtro: 'Primer dado blanco'")
    print(f"   Experimentos que pasan: {experimentos:,} √ó {dados_blancos}/{total_dados} = {primer_blanco:,.0f}")
    print()
    print(f"üìä ETAPA 2 - Filtro: 'Segundo dado tambi√©n blanco'")
    print(f"   De los {primer_blanco:,.0f} que pasaron la etapa 1:")
    print(f"   Experimentos finales: {primer_blanco:,.0f} √ó {dados_blancos-1}/{total_dados-1} = {ambos_blancos:,.0f}")
    print()
    print(f"üéØ RESULTADO:")
    print(f"   Probabilidad = {ambos_blancos:,.0f} / {experimentos:,} = {ambos_blancos/experimentos:.3f}")
    
    # Crear visualizaci√≥n
    fig, ax = plt.subplots(1, 1, figsize=(12, 6))
    
    etapas = ['Experimentos\nIniciales', 'Despu√©s de\nEtapa 1', 'Despu√©s de\nEtapa 2']
    cantidades = [experimentos, primer_blanco, ambos_blancos]
    colores = ['lightblue', 'orange', 'green']
    
    barras = ax.bar(etapas, cantidades, color=colores, alpha=0.7, edgecolor='black')
    
    # Agregar valores en las barras
    for i, (barra, cantidad) in enumerate(zip(barras, cantidades)):
        height = barra.get_height()
        ax.text(barra.get_x() + barra.get_width()/2., height + 50,
                f'{cantidad:,.0f}', ha='center', va='bottom', fontweight='bold')
        
        if i > 0:
            proporcion = cantidad / cantidades[i-1]
            ax.text(barra.get_x() + barra.get_width()/2., height/2,
                    f'{proporcion:.3f}', ha='center', va='center', 
                    fontsize=10, color='white', fontweight='bold')
    
    ax.set_ylabel('N√∫mero de Experimentos', fontsize=12)
    ax.set_title('Filtrado en Dos Etapas: ¬øPor qu√© Multiplicamos?', fontsize=14, fontweight='bold')
    ax.grid(axis='y', alpha=0.3)
    
    plt.tight_layout()
    plt.show()

visualizar_filtrado()

## üöó Parte 3: Teorema de Bayes en Acci√≥n

### Problema: Veh√≠culos en la Estaci√≥n de Servicio (Ejercicio 8)

**Datos**:
- 25% de veh√≠culos son camiones, 75% son autom√≥viles
- Probabilidad de parar: Camiones 1%, Autom√≥viles 2%
- **Pregunta**: Si un veh√≠culo par√≥, ¬øprobabilidad de que sea cami√≥n?

In [None]:
# An√°lisis completo del problema de veh√≠culos
def analizar_vehiculos_bayes():
    print("üöó AN√ÅLISIS: VEH√çCULOS EN ESTACI√ìN DE SERVICIO")
    print("="*55)
    
    # Datos del problema
    p_camion = 0.25
    p_auto = 0.75
    p_para_camion = 0.01
    p_para_auto = 0.02
    
    print("üìä DATOS DEL PROBLEMA:")
    print(f"   ‚Ä¢ P(Cami√≥n) = {p_camion}")
    print(f"   ‚Ä¢ P(Autom√≥vil) = {p_auto}")
    print(f"   ‚Ä¢ P(Para | Cami√≥n) = {p_para_camion}")
    print(f"   ‚Ä¢ P(Para | Autom√≥vil) = {p_para_auto}")
    
    # Reconocimiento del patr√≥n
    print("\nüîç RECONOCIMIENTO DEL PATR√ìN:")
    print("   Pregunta: 'Si par√≥, ¬øprobabilidad de que sea cami√≥n?'")
    print("   Patr√≥n: 'Si [efecto], ¬øP(causa)?' ‚Üí TEOREMA DE BAYES")
    print("   Queremos: P(Cami√≥n | Para)")
    
    # Paso 1: Probabilidad total
    print("\nüìà PASO 1: Calcular P(Para) - Probabilidad Total")
    p_para = p_para_camion * p_camion + p_para_auto * p_auto
    print(f"   P(Para) = P(Para|Cami√≥n)√óP(Cami√≥n) + P(Para|Auto)√óP(Auto)")
    print(f"   P(Para) = {p_para_camion}√ó{p_camion} + {p_para_auto}√ó{p_auto}")
    print(f"   P(Para) = {p_para_camion * p_camion} + {p_para_auto * p_auto} = {p_para}")
    
    # Paso 2: Aplicar Bayes
    print("\nüéØ PASO 2: Aplicar Teorema de Bayes")
    p_camion_para = (p_para_camion * p_camion) / p_para
    print(f"   P(Cami√≥n|Para) = [P(Para|Cami√≥n) √ó P(Cami√≥n)] / P(Para)")
    print(f"   P(Cami√≥n|Para) = [{p_para_camion} √ó {p_camion}] / {p_para}")
    print(f"   P(Cami√≥n|Para) = {p_para_camion * p_camion} / {p_para} = {p_camion_para:.4f}")
    
    # Interpretaci√≥n
    print(f"\n‚úÖ RESULTADO: {p_camion_para:.4f} = {p_camion_para:.2%}")
    print(f"\nüí° INTERPRETACI√ìN:")
    print(f"   De cada 7 veh√≠culos que paran, aproximadamente 1 es cami√≥n")
    print(f"   Fracci√≥n exacta: {p_camion_para:.4f} = 1/7 ‚âà 0.1429")
    
    return p_camion_para, p_para

p_resultado, p_total = analizar_vehiculos_bayes()

### üìä Matriz de Confusi√≥n: Visualizaci√≥n del Problema

In [None]:
# Crear matriz de confusi√≥n para el problema de veh√≠culos
def crear_matriz_confusion_vehiculos():
    print("üìä MATRIZ DE CONFUSI√ìN - VEH√çCULOS")
    print("="*40)
    
    # Simulaci√≥n con 10,000 veh√≠culos
    total_vehiculos = 10000
    
    # Distribuci√≥n por tipo
    camiones = int(total_vehiculos * 0.25)
    autos = int(total_vehiculos * 0.75)
    
    # Comportamiento en la estaci√≥n
    camiones_paran = int(camiones * 0.01)
    camiones_no_paran = camiones - camiones_paran
    
    autos_paran = int(autos * 0.02)
    autos_no_paran = autos - autos_paran
    
    # Para la matriz de confusi√≥n: "Para" es el resultado "positivo"
    # Verdaderos Positivos: Camiones que paran
    # Falsos Positivos: Autos que paran (no son camiones pero "dan positivo")
    vp = camiones_paran
    fp = autos_paran
    fn = camiones_no_paran
    vn = autos_no_paran
    
    # Crear la matriz como DataFrame
    matriz = pd.DataFrame({
        'Para': [vp, fp, vp + fp],
        'No Para': [fn, vn, fn + vn],
        'Total': [vp + fn, fp + vn, total_vehiculos]
    }, index=['Cami√≥n', 'Autom√≥vil', 'Total'])
    
    print("\nüìã MATRIZ DE CONFUSI√ìN:")
    print(matriz)
    
    # M√©tricas importantes
    vpp = vp / (vp + fp)  # Valor Predictivo Positivo (esto es lo que calcula Bayes)
    sensibilidad = vp / (vp + fn)
    especificidad = vn / (vn + fp)
    
    print(f"\nüéØ M√âTRICAS CLAVE:")
    print(f"   ‚Ä¢ Valor Predictivo Positivo (BAYES): {vp}/{vp + fp} = {vpp:.4f} ({vpp:.2%})")
    print(f"   ‚Ä¢ Sensibilidad (% camiones que paran): {vp}/{vp + fn} = {sensibilidad:.4f} ({sensibilidad:.2%})")
    print(f"   ‚Ä¢ Especificidad (% autos que no paran): {vn}/{vn + fp} = {especificidad:.4f} ({especificidad:.2%})")
    
    # Visualizaci√≥n
    fig, (ax1, ax2) = plt.subplots(1, 2, figsize=(15, 6))
    
    # Gr√°fico 1: Distribuci√≥n de veh√≠culos que paran
    tipos = ['Camiones\nque paran', 'Autos\nque paran']
    cantidades = [vp, fp]
    colores = ['orange', 'lightblue']
    
    barras1 = ax1.bar(tipos, cantidades, color=colores, alpha=0.7, edgecolor='black')
    ax1.set_title('Composici√≥n de Veh√≠culos que Paran', fontweight='bold')
    ax1.set_ylabel('Cantidad')
    
    for barra, cantidad in zip(barras1, cantidades):
        height = barra.get_height()
        ax1.text(barra.get_x() + barra.get_width()/2., height + 1,
                f'{cantidad}', ha='center', va='bottom', fontweight='bold')
    
    # Gr√°fico 2: Matriz de confusi√≥n como heatmap
    matriz_nums = matriz.iloc[:-1, :-1].values
    sns.heatmap(matriz_nums, annot=True, fmt='d', cmap='Blues', 
                xticklabels=['Para', 'No Para'], 
                yticklabels=['Cami√≥n', 'Autom√≥vil'],
                ax=ax2, cbar_kws={'label': 'Cantidad de Veh√≠culos'})
    ax2.set_title('Matriz de Confusi√≥n', fontweight='bold')
    
    plt.tight_layout()
    plt.show()
    
    print(f"\nüîç OBSERVACI√ìN CLAVE:")
    print(f"   Los autos que paran ({fp}) superan a los camiones que paran ({vp})")
    print(f"   Por eso el VPP es {vpp:.2%}, no 50%")
    
    return matriz

matriz_vehiculos = crear_matriz_confusion_vehiculos()

## üéØ Parte 4: Ejercicios de Autoevaluaci√≥n

### üìù Ejercicio 1: Identificaci√≥n R√°pida

In [None]:
# Ejercicios de autoevaluaci√≥n
def ejercicios_autoevaluacion():
    ejercicios = [
        {
            "numero": 1,
            "enunciado": "En un hospital, 5% de pacientes tiene una enfermedad rara. Una prueba detecta la enfermedad en 95% de los casos y da falso positivo en 2% de personas sanas. Si la prueba es positiva, ¬øprobabilidad de tener la enfermedad?",
            "tipo": "Bayes",
            "datos": {"prevalencia": 0.05, "sensibilidad": 0.95, "falso_positivo": 0.02},
            "solucion": 0.7092
        },
        {
            "numero": 2,
            "enunciado": "En una universidad, 40% estudia ingenier√≠a, 35% medicina, 25% derecho. Las probabilidades de obtener beca son 15%, 20%, 10% respectivamente. ¬øProbabilidad de que un estudiante tenga beca?",
            "tipo": "Probabilidad Total",
            "datos": {"ing": 0.40, "med": 0.35, "der": 0.25, "beca_ing": 0.15, "beca_med": 0.20, "beca_der": 0.10},
            "solucion": 0.155
        },
        {
            "numero": 3,
            "enunciado": "Continuando el ejercicio anterior: Si un estudiante tiene beca, ¬øprobabilidad de que estudie medicina?",
            "tipo": "Bayes",
            "datos": {"P_med": 0.35, "P_beca_med": 0.20, "P_beca": 0.155},
            "solucion": 0.4516
        }
    ]
    
    print("üéØ EJERCICIOS DE AUTOEVALUACI√ìN")
    print("="*50)
    
    for ejercicio in ejercicios:
        print(f"\nüìã EJERCICIO {ejercicio['numero']}:")
        print(f"{ejercicio['enunciado']}")
        print(f"\nüîç Tipo de problema: {ejercicio['tipo']}")
        print(f"‚úÖ Respuesta: {ejercicio['solucion']:.4f} ({ejercicio['solucion']:.2%})")
        
        if ejercicio['numero'] == 1:
            # Resolver el primer ejercicio paso a paso
            d = ejercicio['datos']
            p_pos = d['sensibilidad'] * d['prevalencia'] + d['falso_positivo'] * (1 - d['prevalencia'])
            p_enf_pos = (d['sensibilidad'] * d['prevalencia']) / p_pos
            
            print(f"\nüí° Soluci√≥n detallada:")
            print(f"   P(+) = {d['sensibilidad']}√ó{d['prevalencia']} + {d['falso_positivo']}√ó{1-d['prevalencia']} = {p_pos:.4f}")
            print(f"   P(Enfermo|+) = ({d['sensibilidad']}√ó{d['prevalencia']}) / {p_pos:.4f} = {p_enf_pos:.4f}")
        
        print("\n" + "-"*50)

ejerccios_autoevaluacion()

### üß† Ejercicio 2: Creaci√≥n de Matriz de Confusi√≥n

**Instrucciones**: Resuelve el ejercicio 1 creando una matriz de confusi√≥n con 10,000 pacientes.

In [None]:
# Ejercicio pr√°ctico: crear matriz de confusi√≥n
def ejercicio_matriz_hospital():
    print("üè• EJERCICIO: MATRIZ DE CONFUSI√ìN - HOSPITAL")
    print("="*50)
    
    # Datos del problema
    total_pacientes = 10000
    prevalencia = 0.05
    sensibilidad = 0.95
    falso_positivo = 0.02
    
    # Distribuci√≥n de pacientes
    enfermos = int(total_pacientes * prevalencia)
    sanos = total_pacientes - enfermos
    
    # Resultados de la prueba
    vp = int(enfermos * sensibilidad)  # Enfermos detectados
    fn = enfermos - vp  # Enfermos no detectados
    fp = int(sanos * falso_positivo)  # Sanos mal clasificados
    vn = sanos - fp  # Sanos bien clasificados
    
    print(f"üë• Distribuci√≥n de {total_pacientes:,} pacientes:")
    print(f"   ‚Ä¢ Enfermos: {enfermos:,} ({prevalencia:.1%})")
    print(f"   ‚Ä¢ Sanos: {sanos:,} ({(1-prevalencia):.1%})")
    
    # Crear matriz
    matriz = pd.DataFrame({
        'Prueba +': [vp, fp, vp + fp],
        'Prueba -': [fn, vn, fn + vn],
        'Total': [enfermos, sanos, total_pacientes]
    }, index=['Enfermo', 'Sano', 'Total'])
    
    print(f"\nüìä MATRIZ DE CONFUSI√ìN:")
    print(matriz)
    
    # M√©tricas
    vpp = vp / (vp + fp)
    vpn = vn / (vn + fn)
    sens = vp / (vp + fn)
    espec = vn / (vn + fp)
    
    print(f"\nüéØ M√âTRICAS DIAGN√ìSTICAS:")
    print(f"   ‚Ä¢ üéØ VPP (Bayes): {vp:,}/{vp + fp:,} = {vpp:.4f} ({vpp:.2%})")
    print(f"   ‚Ä¢ VPN: {vn:,}/{vn + fn:,} = {vpn:.4f} ({vpn:.2%})")
    print(f"   ‚Ä¢ Sensibilidad: {vp:,}/{vp + fn:,} = {sens:.4f} ({sens:.2%})")
    print(f"   ‚Ä¢ Especificidad: {vn:,}/{vn + fp:,} = {espec:.4f} ({espec:.2%})")
    
    # Visualizaci√≥n comparativa
    fig, ((ax1, ax2), (ax3, ax4)) = plt.subplots(2, 2, figsize=(15, 12))
    
    # 1. Distribuci√≥n de poblaci√≥n
    ax1.pie([enfermos, sanos], labels=['Enfermos', 'Sanos'], 
            autopct='%1.1f%%', colors=['red', 'lightgreen'], startangle=90)
    ax1.set_title('Distribuci√≥n de la Poblaci√≥n')
    
    # 2. Composici√≥n de pruebas positivas
    ax2.pie([vp, fp], labels=['Verdaderos\nPositivos', 'Falsos\nPositivos'], 
            autopct='%1.1f%%', colors=['darkgreen', 'orange'], startangle=90)
    ax2.set_title('Composici√≥n de Pruebas Positivas')
    
    # 3. Matriz como heatmap
    matriz_nums = matriz.iloc[:-1, :-1].values
    sns.heatmap(matriz_nums, annot=True, fmt='d', cmap='Reds', 
                xticklabels=['Prueba +', 'Prueba -'], 
                yticklabels=['Enfermo', 'Sano'], ax=ax3)
    ax3.set_title('Matriz de Confusi√≥n')
    
    # 4. Comparaci√≥n de m√©tricas
    metricas = ['VPP\n(Bayes)', 'VPN', 'Sensibilidad', 'Especificidad']
    valores = [vpp, vpn, sens, espec]
    colores_metricas = ['red', 'blue', 'green', 'purple']
    
    barras = ax4.bar(metricas, valores, color=colores_metricas, alpha=0.7)
    ax4.set_ylim(0, 1)
    ax4.set_ylabel('Valor')
    ax4.set_title('M√©tricas Diagn√≥sticas')
    
    for barra, valor in zip(barras, valores):
        height = barra.get_height()
        ax4.text(barra.get_x() + barra.get_width()/2., height + 0.01,
                f'{valor:.3f}', ha='center', va='bottom', fontweight='bold')
    
    plt.tight_layout()
    plt.show()
    
    print(f"\nüí° INTERPRETACI√ìN:")
    print(f"   Si tu prueba es positiva, tienes {vpp:.1%} de probabilidad de estar enfermo")
    print(f"   Esto es MENOR que la sensibilidad ({sens:.1%}) debido a la baja prevalencia")

ejercicio_matriz_hospital()

## üöÄ Parte 5: Desaf√≠os Avanzados

### üî• Desaf√≠o 1: Problema Combinado

In [None]:
# Desaf√≠o avanzado
def desafio_avanzado():
    print("üî• DESAF√çO AVANZADO: PROBLEMA COMBINADO")
    print("="*50)
    
    problema = """
üè≠ CONTEXTO: Una empresa tiene tres l√≠neas de producci√≥n:
   ‚Ä¢ L√≠nea A: Produce 50% del total, 3% defectuoso
   ‚Ä¢ L√≠nea B: Produce 30% del total, 5% defectuoso  
   ‚Ä¢ L√≠nea C: Produce 20% del total, 2% defectuoso

üîç PREGUNTAS:
   1. ¬øCu√°l es la probabilidad de que un producto sea defectuoso?
   2. Si un producto es defectuoso, ¬øprobabilidad de que venga de l√≠nea B?
   3. ¬øCu√°l l√≠nea contribuye m√°s productos defectuosos?
   4. Si seleccionamos un producto de l√≠nea A, ¬øprobabilidad de que sea defectuoso?
"""
    
    print(problema)
    
    # Datos
    p_a, p_b, p_c = 0.50, 0.30, 0.20
    p_def_a, p_def_b, p_def_c = 0.03, 0.05, 0.02
    
    # Respuestas
    print("\n‚úÖ SOLUCIONES:")
    print("-" * 30)
    
    # 1. Probabilidad total
    p_def = p_def_a * p_a + p_def_b * p_b + p_def_c * p_c
    print(f"1. P(Defectuoso) = {p_def_a}√ó{p_a} + {p_def_b}√ó{p_b} + {p_def_c}√ó{p_c} = {p_def:.4f}")
    print(f"   M√©todo: PROBABILIDAD TOTAL")
    
    # 2. Bayes
    p_b_def = (p_def_b * p_b) / p_def
    print(f"\n2. P(L√≠nea B | Defectuoso) = ({p_def_b}√ó{p_b}) / {p_def:.4f} = {p_b_def:.4f}")
    print(f"   M√©todo: TEOREMA DE BAYES")
    
    # 3. Contribuciones
    contrib_a = p_def_a * p_a
    contrib_b = p_def_b * p_b
    contrib_c = p_def_c * p_c
    print(f"\n3. Contribuciones a defectuosos:")
    print(f"   L√≠nea A: {contrib_a:.4f} ({contrib_a/p_def:.1%})")
    print(f"   L√≠nea B: {contrib_b:.4f} ({contrib_b/p_def:.1%})")
    print(f"   L√≠nea C: {contrib_c:.4f} ({contrib_c/p_def:.1%})")
    print(f"   Mayor contribuyente: L√≠nea A")
    
    # 4. Probabilidad condicional directa
    print(f"\n4. P(Defectuoso | L√≠nea A) = {p_def_a:.2f}")
    print(f"   M√©todo: PROBABILIDAD CONDICIONAL DIRECTA")
    
    # Visualizaci√≥n final
    fig, (ax1, ax2) = plt.subplots(1, 2, figsize=(15, 6))
    
    # Contribuciones por l√≠nea
    lineas = ['L√≠nea A', 'L√≠nea B', 'L√≠nea C']
    contribuciones = [contrib_a, contrib_b, contrib_c]
    
    ax1.bar(lineas, contribuciones, color=['blue', 'red', 'green'], alpha=0.7)
    ax1.set_title('Contribuci√≥n a Productos Defectuosos')
    ax1.set_ylabel('Probabilidad')
    
    for i, v in enumerate(contribuciones):
        ax1.text(i, v + 0.001, f'{v:.4f}\n({v/p_def:.1%})', 
                ha='center', va='bottom', fontweight='bold')
    
    # Comparaci√≥n: Producci√≥n vs Contribuci√≥n defectuosa
    x = np.arange(len(lineas))
    width = 0.35
    
    produccion = [p_a, p_b, p_c]
    contrib_pct = [c/p_def for c in contribuciones]
    
    ax2.bar(x - width/2, produccion, width, label='% Producci√≥n', alpha=0.7)
    ax2.bar(x + width/2, contrib_pct, width, label='% Defectuosos', alpha=0.7)
    
    ax2.set_title('Producci√≥n vs Contribuci√≥n a Defectos')
    ax2.set_ylabel('Porcentaje')
    ax2.set_xticks(x)
    ax2.set_xticklabels(lineas)
    ax2.legend()
    
    plt.tight_layout()
    plt.show()

desafio_avanzado()

## üìö Resumen y Checklist

### ‚úÖ Checklist de Comprensi√≥n

**Marca cada concepto que dominas:**

‚ñ° **Reconocimiento de patrones**: Identifico cu√°ndo usar cada m√©todo leyendo el enunciado  
‚ñ° **Probabilidad condicional**: Entiendo que es "dado A, ¬øP(B)?"  
‚ñ° **Intersecci√≥n**: S√© calcular P(A ‚à© B) = P(B|A) √ó P(A)  
‚ñ° **Probabilidad total**: Puedo calcular P(B) cuando hay varias causas  
‚ñ° **Teorema de Bayes**: Entiendo la "inversi√≥n" de P(A|B) a P(B|A)  
‚ñ° **Dependencia**: Comprendo por qu√© se multiplican las probabilidades  
‚ñ° **Matrices de confusi√≥n**: Puedo crear e interpretar VP, FP, VN, FN  
‚ñ° **VPP**: S√© que Bayes siempre calcula el Valor Predictivo Positivo  
‚ñ° **Prevalencia**: Entiendo c√≥mo afecta los resultados de Bayes  
‚ñ° **Interpretaci√≥n**: Puedo explicar resultados en contexto real

### üéØ F√≥rmulas de Referencia R√°pida

In [None]:
# Tabla de referencia r√°pida
def mostrar_referencia_rapida():
    formulas = {
        "Probabilidad Condicional": "P(B|A) = P(A ‚à© B) / P(A)",
        "Intersecci√≥n": "P(A ‚à© B) = P(B|A) √ó P(A)",
        "Probabilidad Total": "P(B) = Œ£ P(B|A·µ¢) √ó P(A·µ¢)",
        "Teorema de Bayes": "P(A|B) = [P(B|A) √ó P(A)] / P(B)",
        "Independencia": "P(B|A) = P(B) ‚ü∫ A y B independientes",
        "VPP (Bayes)": "VP / (VP + FP)",
        "Sensibilidad": "VP / (VP + FN)",
        "Especificidad": "VN / (VN + FP)"
    }
    
    print("üìã F√ìRMULAS DE REFERENCIA R√ÅPIDA")
    print("="*50)
    
    for concepto, formula in formulas.items():
        print(f"üîπ {concepto:20} ‚Üí {formula}")
    
    print("\nüí° REGLA DE ORO:")
    print("   Si el enunciado pregunta por la 'causa' dado el 'efecto' ‚Üí BAYES")
    print("   Si pregunta por el 'efecto' dada la 'causa' ‚Üí CONDICIONAL")

mostrar_referencia_rapida()

## üéì Conclusiones

### üåü Puntos Clave Aprendidos

1. **El reconocimiento de patrones es fundamental**: Antes de calcular, identifica qu√© te est√°n preguntando

2. **Bayes = Inversi√≥n**: Siempre que tengas "dado el efecto, ¬øprobabilidad de la causa?"

3. **Matrices de confusi√≥n visualizan todo**: VP, FP, VN, FN hacen tangibles los conceptos abstractos

4. **La prevalencia importa**: En problemas de Bayes, la frecuencia base afecta dram√°ticamente el resultado

5. **La multiplicaci√≥n es filtrado**: En eventos dependientes, cada probabilidad "filtra" los casos

### üöÄ Pr√≥ximos Pasos

- Practica identificando patrones en ejercicios nuevos
- Crea matrices de confusi√≥n para todos los problemas de Bayes
- Interpreta siempre los resultados en el contexto del problema
- Conecta estos conceptos con distribuciones de probabilidad (pr√≥xima unidad)

---

**¬°Felicitaciones! üéâ Has completado el entrenamiento en reconocimiento de patrones de probabilidad.**

*Notebook creado para reforzar conceptos de probabilidad condicional y Teorema de Bayes*