
# Exploración de la tabla `competencia_02`

Este notebook analiza la evolución de los indicadores mes a mes y sus diferencias según el tipo de individuo (`target`).  
La tabla fue creada a partir de `competencia_01_crudo` + `competencia_01`.


In [None]:

import duckdb
import pandas as pd
import matplotlib.pyplot as plt

# Conexión
con = duckdb.connect(database=':memory:')

# Si ya está creada en disco, ajustar el path a tu .duckdb
# con = duckdb.connect('mi_base.duckdb')


In [None]:

# Cargar la tabla competencia_02 en un DataFrame
df = con.execute("SELECT * FROM competencia_02").fetchdf()

df.head()


In [None]:

# Info general de la tabla
df.info()


In [None]:

# Estadísticas descriptivas básicas
df.describe(include='all')


## Evolución mes a mes de algunos indicadores

In [None]:

indicadores = ['ctrx_quarter', 'cproductos', 'mcuentas_saldo', 'mpayroll']

for col in indicadores:
    df.groupby('foto_mes')[col].mean().plot(marker='o', figsize=(8,4), title=f"Evolución de {col} por mes")
    plt.xlabel("Mes")
    plt.ylabel(col)
    plt.show()


## Comparación de indicadores según target

In [None]:

import seaborn as sns

# Distribuciones comparadas
for col in indicadores:
    plt.figure(figsize=(8,4))
    sns.boxplot(x='target', y=col, data=df)
    plt.title(f"{col} según target")
    plt.show()


In [None]:

# Promedios por target y mes
tabla_resumen = df.groupby(['foto_mes', 'target'])[indicadores].mean().reset_index()
tabla_resumen.head(10)


In [None]:

# Evolución por target en gráfico
for col in indicadores:
    plt.figure(figsize=(8,4))
    sns.lineplot(x='foto_mes', y=col, hue='target', data=tabla_resumen, marker='o')
    plt.title(f"Evolución de {col} por target")
    plt.show()
