# Taller Práctico: Estadística Descriptiva y Visualización
Este notebook es un taller práctico para aplicar conceptos de estadística descriptiva y reforzarlos con visualizaciones usando Matplotlib y Seaborn.

### 1. Configuración Inicial
**Tarea:** Importa las librerías necesarias: `pandas`, `numpy`, `matplotlib.pyplot`, `seaborn` y `scipy.stats`.

In [None]:
# Tu código aquí


### 2. Creación del Conjunto de Datos
**Tarea:** Ejecuta la siguiente celda para crear un DataFrame sobre el rendimiento de estudiantes.

In [None]:
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns
from scipy import stats

sns.set_theme(style='whitegrid')
np.random.seed(42)

n_estudiantes = 100
data = {
    'Horas_Estudio': np.random.normal(15, 5, n_estudiantes).clip(2, 30),
    'Calificacion_Anterior': np.random.normal(70, 10, n_estudiantes).clip(40, 100),
    'Faltas_Asistencia': np.random.randint(0, 10, n_estudiantes),
    'Usa_Tutor': np.random.choice(['Sí', 'No'], n_estudiantes, p=[0.35, 0.65])
}
df_estudiantes = pd.DataFrame(data)

# Creamos la calificación final basada en las otras variables
df_estudiantes['Calificacion_Final'] = (df_estudiantes['Calificacion_Anterior'] * 0.5 + 
                                       df_estudiantes['Horas_Estudio'] * 1.5 - 
                                       df_estudiantes['Faltas_Asistencia'] * 2 + 
                                       np.random.normal(0, 5, n_estudiantes)).clip(0, 100)

print('DataFrame de estudiantes creado:')
df_estudiantes.head()

### 3. Medidas de Tendencia Central y su Visualización
**Tarea:**
1. Calcula la **media**, **mediana** y **moda** de la columna `Calificacion_Final`.
2. Crea un histograma de `Calificacion_Final` usando `sns.histplot`.
3. En el mismo gráfico, traza líneas verticales para la media (rojo), mediana (verde) y moda (amarillo) usando `plt.axvline()`.

In [None]:
# Tu código aquí


### 4. Medidas de Dispersión y su Visualización
**Tarea:**
1. Calcula la **varianza** y la **desviación estándar** de `Calificacion_Final`.
2. Crea un histograma de `Calificacion_Final`.
3. Añade una línea vertical para la media.
4. Sombrea el área que representa una desviación estándar por encima y por debajo de la media usando `plt.axvspan()`.

In [None]:
# Tu código aquí


### 5. Test de Normalidad (Analítico y Visual)
**Tarea:**
1. Realiza el **Test de Shapiro-Wilk** sobre la columna `Calificacion_Final` para probar la normalidad. Interpreta el p-valor.
2. Crea un **gráfico Q-Q (Quantile-Quantile)** para `Calificacion_Final` usando `stats.probplot`. Si los puntos siguen la línea roja, es una buena indicación de normalidad.

In [None]:
# Tu código aquí


### 6. Correlación entre Dos Variables
**Tarea:**
1. Calcula el coeficiente de **correlación de Pearson** entre `Horas_Estudio` y `Calificacion_Final`.
2. Crea un gráfico de dispersión (`scatterplot`) para estas dos variables.
3. Usa `sns.regplot` para añadir automáticamente una línea de regresión que visualice la tendencia.

In [None]:
# Tu código aquí


### 7. Matriz de Correlación Completa
**Tarea:**
1. Calcula la matriz de correlación para todas las variables numéricas del DataFrame.
2. Visualiza esta matriz usando un **heatmap** de Seaborn (`sns.heatmap`). Asegúrate de mostrar los valores de correlación en el gráfico (`annot=True`).

In [None]:
# Tu código aquí


### 8. Análisis Descriptivo por Categorías
**Tarea:**
1. Usa `.groupby()` para agrupar los datos por la columna `Usa_Tutor`.
2. Calcula las estadísticas descriptivas (`.describe()`) de `Calificacion_Final` para cada grupo (Sí y No).
3. Crea un **Box Plot** (`sns.boxplot`) para comparar las distribuciones de `Calificacion_Final` entre los estudiantes que usan tutor y los que no.

In [None]:
# Tu código aquí


## ¡Excelente Trabajo!
Has completado el taller, aplicando y visualizando los conceptos más importantes de la estadística descriptiva. Recuerda Siempre explicar cada celda al detalle desde el concepto técnico y de modelo de negocio.