
# EDA del Comportamiento de Pagos - Proyecto Gym Master

## Introducción
Este análisis exploratorio de datos (EDA) tiene como objetivo entender el comportamiento de pagos de los socios de un gimnasio.
Analizamos patrones temporales, retrasos en los pagos, métodos de pago más utilizados y la relación entre descuentos y la puntualidad.
Además, realizamos una segmentación visual para entender mejor los perfiles de pago.


In [None]:

import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
from datetime import datetime

# Configuraciones generales
sns.set(style="whitegrid")
plt.rcParams['figure.figsize'] = (12, 6)

# Cargar dataset
pagos_df = pd.read_csv('../../Data_Lake/pagos_simulados.csv')

# Vista general del dataset
pagos_df.head()


In [None]:

# --- Distribución de pagos por mes y día ---
pagos_df['fecha_pago'] = pd.to_datetime(pagos_df['fecha_pago'])
pagos_df['mes_pago'] = pagos_df['fecha_pago'].dt.to_period('M')
pagos_df['dia_pago'] = pagos_df['fecha_pago'].dt.day

pagos_df['mes_pago'].value_counts().sort_index().plot(kind='bar')
plt.title('Cantidad de Pagos por Mes')
plt.xlabel('Mes')
plt.ylabel('Cantidad de pagos')
plt.show()

sns.histplot(pagos_df['dia_pago'], bins=31, kde=False)
plt.title('Distribución de Pagos por Día del Mes')
plt.xlabel('Día del mes')
plt.ylabel('Cantidad de pagos')
plt.show()


In [None]:

# --- Análisis de retrasos por perfil ---
sns.boxplot(data=pagos_df, x='perfil_pago', y='dias_retraso')
plt.title('Días de Retraso por Perfil de Pago')
plt.show()

sns.histplot(data=pagos_df, x='dias_retraso', hue='perfil_pago', multiple='stack')
plt.title('Distribución de Días de Retraso por Perfil')
plt.show()


In [None]:

# --- Métodos de pago más utilizados ---
pagos_df['metodo_pago'].value_counts().plot(kind='bar')
plt.title('Métodos de Pago Más Utilizados')
plt.xlabel('Método de pago')
plt.ylabel('Cantidad de pagos')
plt.show()


In [None]:

# --- Relación entre descuentos y puntualidad ---
sns.boxplot(data=pagos_df, x='perfil_pago', y='descuento')
plt.title('Distribución de Descuentos por Perfil de Pago')
plt.show()


In [None]:

# --- Segmentación visual de perfiles ---
sns.scatterplot(data=pagos_df, x='dias_retraso', y='monto', hue='perfil_pago')
plt.title('Segmentación Visual: Días de Retraso vs Monto por Perfil')
plt.show()



## Conclusiones

- La mayoría de los pagos se concentran en los primeros días del mes.
- Los perfiles morosos tienen una mayor dispersión y severidad en los días de retraso.
- El método de pago más frecuente es la tarjeta, seguido de efectivo.
- Los descuentos se concentran en perfiles puntuales.
- Existe una clara segmentación visual entre puntuales, leves retrasados y morosos en función de los días de retraso.

Este EDA servirá de base para modelos de segmentación, predicción de ingresos y estrategias de fidelización.
