# ProyectoDSParteII_Durian.ipynb

In [None]:
# Carga de librerías necesarias
import pandas as pd
import seaborn as sns
import matplotlib.pyplot as plt
import numpy as np

In [None]:
# Carga del dataset
df = pd.read_csv("student_habits_performance.csv")

## Abstracto

Este proyecto explora cómo los hábitos cotidianos de los estudiantes —como el sueño, la alimentación, el ejercicio y el tiempo dedicado al estudio— influyen en su rendimiento académico. A través del análisis del dataset “Student Habits and Performance”, se busca identificar patrones y relaciones entre distintas variables para entender qué factores impactan positivamente o negativamente en el desempeño de los estudiantes.

Mediante visualizaciones y análisis exploratorio, se encontraron correlaciones significativas entre el rendimiento académico y prácticas como la asistencia regular a clases, el consumo de una dieta balanceada y dormir una cantidad suficiente de horas. El estudio permite proponer recomendaciones para instituciones educativas con el fin de mejorar el rendimiento estudiantil y fomentar el bienestar integral.

Además de los análisis numéricos, se plantea un marco comercial y analítico que permite vincular estos hallazgos con la toma de decisiones prácticas por parte de autoridades educativas, gobiernos o startups del ámbito edtech.

## Objetivo
Analizar la relación entre hábitos estudiantiles y rendimiento académico para identificar patrones y proponer recomendaciones prácticas a instituciones educativas.

## Preguntas / Hipótesis
1. ¿Influye la cantidad de horas de sueño en el rendimiento académico?
2. ¿Existe relación entre la frecuencia de ejercicio físico y el rendimiento?
3. ¿Una dieta balanceada mejora el desempeño académico?
4. ¿Cuánto impacta la asistencia a clases en los resultados académicos?

## 🏢 Contexto Comercial (ampliado)
El análisis de hábitos estudiantiles en relación con el rendimiento académico tiene un alto valor estratégico para diversas instituciones del sector educativo. Escuelas, universidades, organismos gubernamentales y plataformas de educación digital enfrentan desafíos relacionados con la deserción, el bajo rendimiento y la falta de compromiso estudiantil.

Comprender qué factores cotidianos impactan directamente en el desempeño académico permite tomar decisiones basadas en datos para diseñar políticas más efectivas.

Por ejemplo:
- Las instituciones educativas pueden ajustar horarios de clases, mejorar los servicios de orientación y promover hábitos saludables.
- Startups edtech pueden desarrollar funcionalidades que recomienden rutinas personalizadas.
- Ministerios de Educación pueden implementar programas de bienestar integral o campañas sobre la importancia del sueño, la alimentación y la actividad física.

En un entorno competitivo y orientado a los resultados, este tipo de análisis ayuda a mejorar la calidad educativa y ofrecer una experiencia formativa más personalizada.

## Contexto Analítico
El enfoque analítico consiste en realizar un análisis exploratorio de datos (EDA) sobre el dataset "Student Habits and Performance". Se busca identificar relaciones estadísticas significativas entre variables independientes (horas de sueño, dieta, ejercicio, etc.) y la variable dependiente (academic performance). El análisis se apoya en visualizaciones, resúmenes numéricos y la detección de valores faltantes o atípicos.

In [None]:
# Exploratory Data Analysis (EDA)
df.head()

In [None]:
# Verificar valores nulos
df.isnull().sum()

In [None]:
# Distribución de rendimiento académico
sns.histplot(df['academic_performance'], kde=True)
plt.title("Distribución del rendimiento académico")
plt.show()

In [None]:
# Boxplot: horas de sueño vs rendimiento
sns.boxplot(x='academic_performance', y='sleep_hours', data=df)
plt.title("Rendimiento académico según horas de sueño")
plt.show()

In [None]:
# Boxplot: asistencia vs rendimiento
sns.boxplot(x='academic_performance', y='attendance', data=df)
plt.title("Rendimiento académico según asistencia a clases")
plt.show()

In [None]:
# Barplot: dieta balanceada vs rendimiento
sns.barplot(x='balanced_diet', y='academic_performance', data=df)
plt.title("Rendimiento académico según dieta balanceada")
plt.show()

In [None]:
# Relación multivariada: sueño, ejercicio, rendimiento
sns.scatterplot(data=df, x='sleep_hours', y='exercise_frequency', hue='academic_performance')
plt.title("Relación entre sueño, ejercicio y rendimiento")
plt.show()

## 💡 Recomendaciones basadas en insights (ampliadas)
- Promover rutinas de sueño saludables
- Fomentar una alimentación balanceada
- Reforzar la importancia de la asistencia a clases
- Estimular la actividad física regular
- Equilibrar carga de estudio y bienestar

## Tipo de aprendizaje y modelos propuestos
Este análisis se enmarca dentro del aprendizaje supervisado.
- Clasificación: si se desea categorizar el rendimiento.
- Regresión: si se desea predecir el rendimiento como valor numérico.
Modelos posibles: Árboles de decisión, Random Forest, Regresión Logística, Regresión Lineal, Gradient Boosting.

## 📌 Conclusiones
El análisis permite identificar hábitos que impactan en el rendimiento académico. El sueño, la alimentación, el ejercicio y la asistencia a clases están fuertemente correlacionados con el desempeño.

Estas conclusiones pueden guiar decisiones en instituciones educativas y edtechs para mejorar la experiencia formativa. También sientan las bases para el desarrollo de modelos predictivos que permitan anticipar y prevenir bajo rendimiento académico.