# Cálculo de Información Mutua: Ejemplo Didáctico
Este notebook explica cómo se calcula la información mutua paso a paso usando variables categóricas en una tabla simple.

## Paso 1: Crear el conjunto de datos
Representamos 10 registros con dos variables categóricas: `Clima` y `Actividad`.

In [None]:
import pandas as pd

# Crear dataset
datos = pd.DataFrame({
    'Clima': ['Soleado', 'Soleado', 'Nublado', 'Lluvia', 'Lluvia',
              'Nublado', 'Soleado', 'Lluvia', 'Nublado', 'Soleado'],
    'Actividad': ['Playa', 'Playa', 'Cine', 'Cine', 'Cine',
                  'Cine', 'Playa', 'Cine', 'Cine', 'Playa']
})
datos

## Paso 2: Calcular las frecuencias y probabilidades

In [None]:
# Frecuencias absolutas
freq_absolutas = datos.value_counts().reset_index(name='Frecuencia')
freq_absolutas

In [None]:
# Probabilidades conjuntas
freq_absolutas['P(x,y)'] = freq_absolutas['Frecuencia'] / len(datos)
freq_absolutas

In [None]:
# Probabilidades marginales
p_clima = datos['Clima'].value_counts(normalize=True)
p_actividad = datos['Actividad'].value_counts(normalize=True)

p_clima, p_actividad

## Paso 3: Calcular la información mutua manualmente

In [None]:
import numpy as np

# Función para obtener P(x) y P(y)
def obtener_marginales(row):
    px = p_clima[row['Clima']]
    py = p_actividad[row['Actividad']]
    return px, py

# Calcular contribuciones
mi_total = 0
for idx, row in freq_absolutas.iterrows():
    px, py = obtener_marginales(row)
    pxy = row['P(x,y)']
    contribucion = pxy * np.log2(pxy / (px * py))
    mi_total += contribucion
    print(f"({row['Clima']}, {row['Actividad']}): {contribucion:.4f} bits")

print(f"\nInformación mutua total: {mi_total:.4f} bits")

## Conclusión
En este ejemplo, se muestra que la información mutua entre `Clima` y `Actividad` es significativa y refleja que existe dependencia entre ambas variables.
Este tipo de análisis es muy útil en etapas de preprocesamiento para selección de características.