# 🥗 EDA - Dieta y Evolución Física (GYM MASTER)

Este análisis busca entender la relación entre los planes alimenticios asignados a los socios, su asistencia al gimnasio y su evolución física a lo largo del tiempo.

## 🎯 Objetivos del análisis

- Medir adherencia a la dieta por semana.
- Analizar evolución de peso e IMC por tipo de dieta.
- Detectar patrones de progreso físico por grupo objetivo.
- Evaluar la correlación entre asistencia y resultados.


In [None]:
# 📚 Imports
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
sns.set(style="whitegrid")
plt.rcParams["figure.figsize"] = (10, 6)

In [None]:
# ⚙️ Carga de datasets
df_dietas = pd.read_csv("datasets/dieta_socio.csv")
df_evolucion = pd.read_csv("datasets/evolucion_socio.csv")
df_asistencia = pd.read_csv("datasets/asistencia.csv")

df_dietas["fecha_inicio"] = pd.to_datetime(df_dietas["fecha_inicio"])
df_dietas["fecha_fin"] = pd.to_datetime(df_dietas["fecha_fin"])
df_evolucion["fecha"] = pd.to_datetime(df_evolucion["fecha"])
df_asistencia["fecha"] = pd.to_datetime(df_asistencia["fecha"])

In [None]:
# 🧮 Cálculo de IMC
df_evolucion["altura_m"] = df_evolucion["altura_cm"] / 100
df_evolucion["imc"] = df_evolucion["peso"] / (df_evolucion["altura_m"] ** 2)

In [None]:
# 📈 Evolución de peso e IMC
socio_ejemplo = df_evolucion["socio_id"].iloc[0]
df_socio = df_evolucion[df_evolucion["socio_id"] == socio_ejemplo]

plt.plot(df_socio["fecha"], df_socio["peso"], marker='o', label="Peso (kg)")
plt.plot(df_socio["fecha"], df_socio["imc"], marker='s', label="IMC")
plt.title(f"Evolución física del socio {socio_ejemplo}")
plt.xlabel("Fecha")
plt.ylabel("Valor")
plt.legend()
plt.xticks(rotation=45)
plt.grid()
plt.show()

In [None]:
# 📆 Cálculo de adherencia
df_asistencia["semana"] = df_asistencia["fecha"].dt.to_period("W").apply(lambda r: r.start_time)

adherencia = df_asistencia.groupby(["socio_id", "semana"]).size().reset_index(name="asistencias")
adherencia = adherencia.merge(df_dietas[["socio_id", "fecha_inicio", "fecha_fin"]], on="socio_id")
adherencia = adherencia[(adherencia["semana"] >= adherencia["fecha_inicio"]) & (adherencia["semana"] <= adherencia["fecha_fin"])]
adherencia["cumple"] = adherencia["asistencias"] >= 2

cumplimiento = adherencia.groupby("socio_id")["cumple"].mean().reset_index(name="porcentaje_cumplimiento")

sns.histplot(cumplimiento["porcentaje_cumplimiento"], bins=10, kde=True)
plt.title("Distribución de adherencia a la dieta")
plt.xlabel("% de semanas cumplidas")
plt.ylabel("Cantidad de socios")
plt.show()

In [None]:
# 📊 Comparación entre tipos de dieta
df_dietas["tipo_dieta"] = df_dietas["descripcion_json"].apply(lambda x: "Volumen" if "avena" in x else "Otro")

df_imc = df_evolucion.groupby("socio_id").agg(imc_inicio=("imc", "first"), imc_fin=("imc", "last"))
df_imc["delta_imc"] = df_imc["imc_fin"] - df_imc["imc_inicio"]

df_final = df_imc.merge(df_dietas[["socio_id", "tipo_dieta"]], on="socio_id")

sns.boxplot(x="tipo_dieta", y="delta_imc", data=df_final)
plt.title("Cambio de IMC según tipo de dieta")
plt.ylabel("Variación de IMC")
plt.show()

## 🔚 Conclusiones preliminares

- El porcentaje medio de adherencia semanal fue del XX%.
- El tipo de dieta "Volumen" mostró mayor variación positiva en peso o IMC.
- La evolución física parece estar asociada a la frecuencia de asistencia.

**Siguientes pasos:**
- Incluir clustering por perfiles de evolución.
- Desarrollar modelo predictivo de adherencia.
- Sumar medidas corporales si están disponibles.
