# Taller MEP — Live Coding (Colab)

Este cuaderno guía un análisis básico con el archivo `datos_taller_mep.csv`.

**Pasos:**
1) Ejecuta la celda de carga de datos.
2) Explora descripciones y visualizaciones.
3) Identifica estudiantes/grupos en riesgo y piensa una intervención.


In [None]:
# 1) Carga de librerías
import pandas as pd
import matplotlib.pyplot as plt
import numpy as np

# En Colab, asegúrate de usar: Runtime -> Change runtime type -> Python 3 (CPU)


In [None]:
# 2) Cargar datos
# Opción A (Colab): subir el archivo manualmente
try:
    from google.colab import files
    uploaded = files.upload()
    fname = list(uploaded.keys())[0]
    df = pd.read_csv(fname)
except Exception:
    # Opción B: si ya tienes una ruta local o en Drive, edítala aquí
    df = pd.read_csv('datos_taller_mep.csv')  # Cambia a la ruta donde lo guardaste

df.head()

In [None]:
# 3) Exploración rápida
display(df.describe(include='all'))
print('\nDistribución por sección:')
print(df['seccion'].value_counts())
print('\nDistribución por sexo:')
print(df['sexo'].value_counts())

In [None]:
# 4) Visualizaciones básicas (una por celda)
# Histograma de nota final
plt.figure()
plt.hist(df['nota_final'].dropna(), bins=10)
plt.title('Histograma de nota final')
plt.xlabel('Nota final')
plt.ylabel('Frecuencia')
plt.show()

In [None]:
# Barras: promedio de nota por sección
prom_seccion = df.groupby('seccion')['nota_final'].mean().sort_index()
plt.figure()
prom_seccion.plot(kind='bar')
plt.title('Promedio de nota final por sección')
plt.xlabel('Sección')
plt.ylabel('Promedio nota final')
plt.show()

In [None]:
# Dispersión: asistencia vs. nota final
plt.figure()
plt.scatter(df['asistencia_pct'], df['nota_final'])
plt.title('Asistencia vs. Nota final')
plt.xlabel('% Asistencia')
plt.ylabel('Nota final')
plt.show()

In [None]:
# 5) Indicadores sencillos
umbral_asistencia = 80
umbral_nota = 65
df['en_riesgo'] = ((df['asistencia_pct'] < umbral_asistencia) | (df['nota_final'] < umbral_nota)).astype(int)
print('Porcentaje en riesgo:', round(100*df['en_riesgo'].mean(), 1), '%')

print('\nPromedio por sexo:')
print(df.groupby('sexo')['nota_final'].mean())

print('\nPromedio por sección:')
print(df.groupby('seccion')['nota_final'].mean())

In [None]:
# 6) Top-N y casos para intervención
print('Top 5 notas más bajas:')
display(df.sort_values('nota_final').head(5))

print('\nEstudiantes con asistencia < 80%:')
display(df[df['asistencia_pct'] < 80].sort_values('asistencia_pct').head(10))

## 7) Sugerencias de uso responsable de IA
- Usar IA para *resumir* hallazgos, *redactar* comunicaciones a familias o *sugerir* estrategias de apoyo.
- **No** delegar decisiones sensibles (promoción/reprobación) a la IA.
- Cuidar privacidad: no cargar datos con identificadores reales.
