# Análisis exploratorio del rendimiento académico por jornada

Este notebook presenta un ejemplo aplicado del uso de análisis descriptivo en el contexto de ciencia de datos, utilizando datos simulados sobre el rendimiento académico de estudiantes.

---

## 1. Cargar los datos

Se trabajará con un archivo simulado que contiene calificaciones de estudiantes en dos jornadas: mañana y tarde.


In [None]:
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns

# Cargar el dataset
df = pd.read_csv("datos_rendimiento.csv")

# Vista previa
df.head()

---

## 2. Descripción general de los datos

Vamos a examinar estadísticas básicas y la estructura del conjunto de datos.


In [None]:
# Resumen estadístico
df.describe()

# Ver distribución por jornada
df['Jornada'].value_counts()

---

## 3. Visualización con histogramas

El histograma permite observar la concentración de calificaciones para cada jornada.


In [None]:
# Configuración visual
sns.histplot(data=df, x='Calificación', hue='Jornada', kde=True, element='step', palette='Set2')
plt.title("Distribución de calificaciones por jornada")
plt.xlabel("Calificación")
plt.ylabel("Frecuencia")
plt.grid(True)
plt.show()

---

## 4. Comparación de dispersión y mediana con boxplot

El boxplot permite visualizar la mediana, los cuartiles y posibles valores atípicos de forma comparativa.


In [None]:
sns.boxplot(data=df, x='Jornada', y='Calificación', palette='Set2')
plt.title("Boxplot de calificaciones por jornada")
plt.ylabel("Calificación")
plt.grid(True)
plt.show()

---

## 5. Interpretación de resultados

- Las **calificaciones** del grupo **mañana** se concentran alrededor de **3.5**, mientras que las del grupo **tarde** lo hacen en torno a **4.0**.
- Ambas distribuciones muestran un comportamiento **simétrico**.
- El **boxplot** indica que la mediana es más alta en la jornada de la tarde y permite observar que la **dispersión es ligeramente mayor** en el grupo de la mañana.
- Estos hallazgos podrían ser el punto de partida para una investigación más profunda sobre si existen diferencias sistemáticas de rendimiento según la jornada.

---

## ✅ Conclusión

Este análisis exploratorio es útil para formular hipótesis y diseñar estudios comparativos con fundamentos estadísticos.

