<a href="https://colab.research.google.com/github/HesusG/diagnostico-lineas-accion/blob/main/Semana0/analizar_quiz_diagnostico.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# üìä Analizador de Quiz Diagn√≥stico - CD2001B

**Curso:** Diagn√≥stico para L√≠neas de Acci√≥n  
**Prop√≥sito:** Analizar resultados del quiz diagn√≥stico de Semana 0 para adaptar el curso al nivel del grupo

---

## üéØ Objetivo

Este notebook permite al profesor:
- üìà Generar estad√≠sticas descriptivas autom√°ticas
- üìä Crear visualizaciones del nivel del grupo
- üéì Identificar perfiles (principiantes/intermedios/avanzados)
- üí° Recibir recomendaciones pedag√≥gicas

---

## üìã Requisitos

**Antes de comenzar:**
1. Tus estudiantes completaron el **quiz diagn√≥stico** (Markdown o Notebook)
2. Exportaste las respuestas de Google Forms/Microsoft Forms a **CSV**
3. Tienes el archivo CSV accesible (Drive, GitHub, o local)

**Formato del CSV:**
- Debe tener columnas con nombres espec√≠ficos (ver celda de abajo)
- Una fila por estudiante
- Respuestas en formato texto (ej: "A) Nunca he tomado estad√≠stica")

---

## üì¶ Paso 1: Instalaci√≥n de Librer√≠as

Instalamos las librer√≠as necesarias (solo si no est√°n instaladas).

In [None]:
# Instalar librer√≠as (solo si es necesario)
!pip install pandas matplotlib seaborn --quiet

print("‚úÖ Librer√≠as instaladas correctamente")

## üì• Paso 2: Importar Librer√≠as

In [None]:
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
import warnings

# Configuraci√≥n de visualizaciones
sns.set_style('whitegrid')
plt.rcParams['figure.figsize'] = (14, 10)
plt.rcParams['font.size'] = 10
warnings.filterwarnings('ignore')

print("‚úÖ Librer√≠as importadas exitosamente")

## üìÇ Paso 3: Cargar Datos

### **Opci√≥n A: Cargar desde Google Drive (Colab)**

Si est√°s en Colab y tu CSV est√° en Drive:

In [None]:
# Montar Google Drive (solo en Colab)
from google.colab import drive
drive.mount('/content/drive')

# Ruta a tu archivo CSV en Drive
# Ejemplo: '/content/drive/MyDrive/CD2001B/respuestas_quiz.csv'
archivo_csv = '/content/drive/MyDrive/RUTA/A/TU/respuestas_quiz.csv'

# Cargar datos
df = pd.read_csv(archivo_csv)
print(f"‚úÖ Datos cargados: {len(df)} estudiantes")

### **Opci√≥n B: Cargar desde GitHub**

Si subiste el CSV al repositorio del curso:

In [None]:
# URL del archivo en GitHub (raw)
url_csv = 'https://raw.githubusercontent.com/TU_USUARIO/TU_REPO/main/ruta/respuestas_quiz.csv'

# Cargar datos
df = pd.read_csv(url_csv)
print(f"‚úÖ Datos cargados: {len(df)} estudiantes")

### **Opci√≥n C: Cargar archivo local**

Si ejecutas localmente (no en Colab):

In [None]:
# Ruta local a tu archivo CSV
archivo_csv = 'respuestas_quiz.csv'

# Cargar datos
df = pd.read_csv(archivo_csv)
print(f"‚úÖ Datos cargados: {len(df)} estudiantes")

### **Opci√≥n D: Subir archivo manualmente (Colab)**

Si tienes el CSV en tu computadora:

In [None]:
from google.colab import files

# Subir archivo
uploaded = files.upload()

# Obtener nombre del archivo
archivo_csv = list(uploaded.keys())[0]
print(f"Archivo subido: {archivo_csv}")

# Cargar datos
df = pd.read_csv(archivo_csv)
print(f"‚úÖ Datos cargados: {len(df)} estudiantes")

---

## üîç Paso 4: Verificar Estructura del Dataset

### Columnas Esperadas:

El CSV debe tener estas columnas (los nombres exactos dependen de c√≥mo exportaste de Google Forms):

| Columna | Pregunta del Quiz |
|---------|-------------------|
| `nivel_estadistica` | Pregunta 1: Nivel actual en estad√≠stica |
| `nivel_python` | Pregunta 7: Nivel de experiencia con Python |
| `uso_colab` | Pregunta 10: Has usado Google Colab |
| `frecuencia_ia` | Pregunta 12: Frecuencia de uso de IA |
| `uso_apis_agentes` | Pregunta 15: Uso de APIs/agentes de IA |
| `situacion_actual` | Pregunta 20: Situaci√≥n actual del estudiante |

**Nota:** Si tus columnas tienen nombres diferentes, aj√∫stalas en la siguiente celda.

In [None]:
# Ver primeras filas del dataset
print("üìä Primeras 5 filas del dataset:\n")
display(df.head())

print("\nüìã Columnas disponibles:")
print(df.columns.tolist())

print(f"\n‚úÖ Total de estudiantes: {len(df)}")
print(f"‚úÖ Total de columnas: {len(df.columns)}")

### üîß Renombrar Columnas (si es necesario)

Si tus columnas tienen nombres largos de Google Forms, ren√≥mbralas aqu√≠:

In [None]:
# Ejemplo de renombrado (ajusta seg√∫n tus columnas reales)
mapeo_columnas = {
    '¬øCu√°l es tu nivel actual de conocimiento en estad√≠stica?': 'nivel_estadistica',
    '¬øCu√°l es tu nivel de experiencia con Python?': 'nivel_python',
    '¬øHas usado Google Colab (Colaboratory)?': 'uso_colab',
    '¬øCon qu√© frecuencia usas herramientas de IA (ChatGPT, Gemini, etc.) para tareas acad√©micas o proyectos?': 'frecuencia_ia',
    '¬øHas usado modelos de IA m√°s all√° de interfaces de chat (como APIs, agentes aut√≥nomos, o integraci√≥n en c√≥digo)?': 'uso_apis_agentes',
    '¬øCu√°l de estas afirmaciones describe mejor tu situaci√≥n actual?': 'situacion_actual'
}

# Renombrar (solo las columnas que existen)
df = df.rename(columns={k: v for k, v in mapeo_columnas.items() if k in df.columns})

print("‚úÖ Columnas renombradas")
print("\nüìã Nuevas columnas:")
print(df.columns.tolist())

---

## üìä Paso 5: An√°lisis Estad√≠stico

### SECCI√ìN 1: Conocimientos de Estad√≠stica

In [None]:
print("="*70)
print("üìà SECCI√ìN 1: CONOCIMIENTOS DE ESTAD√çSTICA")
print("="*70)

if 'nivel_estadistica' in df.columns:
    print("\nüîç Nivel actual de conocimiento en estad√≠stica:\n")
    
    # Frecuencias absolutas
    nivel_stats = df['nivel_estadistica'].value_counts().sort_index()
    print(nivel_stats)
    
    # Porcentajes
    print("\nüìä Porcentajes:")
    porcentajes = df['nivel_estadistica'].value_counts(normalize=True).sort_index() * 100
    for nivel, pct in porcentajes.items():
        print(f"   {nivel}: {pct:.1f}%")
else:
    print("‚ö†Ô∏è  Columna 'nivel_estadistica' no encontrada")

### SECCI√ìN 2: Experiencia con Python

In [None]:
print("="*70)
print("üíª SECCI√ìN 2: EXPERIENCIA CON PYTHON")
print("="*70)

# Nivel de Python
if 'nivel_python' in df.columns:
    print("\nüêç Nivel de experiencia con Python:\n")
    python_stats = df['nivel_python'].value_counts().sort_index()
    print(python_stats)
    
    print("\nüìä Porcentajes:")
    porcentajes_py = df['nivel_python'].value_counts(normalize=True).sort_index() * 100
    for nivel, pct in porcentajes_py.items():
        print(f"   {nivel}: {pct:.1f}%")
else:
    print("‚ö†Ô∏è  Columna 'nivel_python' no encontrada")

# Uso de Google Colab
if 'uso_colab' in df.columns:
    print("\n‚òÅÔ∏è Experiencia con Google Colab:\n")
    colab_stats = df['uso_colab'].value_counts().sort_index()
    print(colab_stats)
    
    print("\nüìä Porcentajes:")
    porcentajes_colab = df['uso_colab'].value_counts(normalize=True).sort_index() * 100
    for nivel, pct in porcentajes_colab.items():
        print(f"   {nivel}: {pct:.1f}%")
else:
    print("‚ö†Ô∏è  Columna 'uso_colab' no encontrada")

### SECCI√ìN 3: Uso de Inteligencia Artificial

In [None]:
print("="*70)
print("ü§ñ SECCI√ìN 3: USO DE INTELIGENCIA ARTIFICIAL")
print("="*70)

# Frecuencia de uso de IA
if 'frecuencia_ia' in df.columns:
    print("\nüìä Frecuencia de uso de IA:\n")
    ia_freq = df['frecuencia_ia'].value_counts().sort_index()
    print(ia_freq)
    
    print("\nüìä Porcentajes:")
    porcentajes_ia = df['frecuencia_ia'].value_counts(normalize=True).sort_index() * 100
    for nivel, pct in porcentajes_ia.items():
        print(f"   {nivel}: {pct:.1f}%")
else:
    print("‚ö†Ô∏è  Columna 'frecuencia_ia' no encontrada")

# Uso de APIs/agentes
if 'uso_apis_agentes' in df.columns:
    print("\nüîß Uso de APIs/agentes de IA:\n")
    apis_stats = df['uso_apis_agentes'].value_counts().sort_index()
    print(apis_stats)
    
    # Calcular porcentaje avanzado
    total = len(df)
    solo_chat = df['uso_apis_agentes'].str.contains('A\)', na=False).sum()
    avanzados = total - solo_chat
    
    print(f"\nüìå Estudiantes que solo usan chat: {solo_chat}/{total} ({solo_chat/total*100:.1f}%)")
    print(f"üìå Estudiantes con experiencia en APIs/agentes: {avanzados}/{total} ({avanzados/total*100:.1f}%)")
else:
    print("‚ö†Ô∏è  Columna 'uso_apis_agentes' no encontrada")

---

## üë• Paso 6: Clasificaci√≥n de Perfiles

Clasificamos a los estudiantes en 3 perfiles seg√∫n su situaci√≥n actual (Pregunta 20).

In [None]:
print("="*70)
print("üìã RESUMEN EJECUTIVO PARA EL PROFESOR")
print("="*70)

# Clasificar estudiantes en perfiles
perfiles = {
    'principiantes': 0,
    'intermedios': 0,
    'avanzados': 0
}

if 'situacion_actual' in df.columns:
    for idx, row in df.iterrows():
        sit = str(row['situacion_actual'])
        if 'A)' in sit:  # Principiante total
            perfiles['principiantes'] += 1
        elif 'E)' in sit:  # Conocimientos s√≥lidos en los tres
            perfiles['avanzados'] += 1
        else:
            perfiles['intermedios'] += 1
    
    print("\nüë• PERFILES DE ESTUDIANTES:\n")
    print(f"   Principiantes: {perfiles['principiantes']} ({perfiles['principiantes']/len(df)*100:.1f}%)")
    print(f"   Intermedios: {perfiles['intermedios']} ({perfiles['intermedios']/len(df)*100:.1f}%)")
    print(f"   Avanzados: {perfiles['avanzados']} ({perfiles['avanzados']/len(df)*100:.1f}%)")
else:
    print("‚ö†Ô∏è  Columna 'situacion_actual' no encontrada")
    print("No se puede generar clasificaci√≥n de perfiles")

---

## üí° Paso 7: Recomendaciones Pedag√≥gicas

Basadas en la composici√≥n del grupo.

In [None]:
print("\nüí° RECOMENDACIONES:\n")

if 'situacion_actual' in df.columns:
    total_estudiantes = len(df)
    
    # Grupo mayormente principiante
    if perfiles['principiantes'] > total_estudiantes * 0.5:
        print("   ‚ö†Ô∏è  M√°s del 50% son principiantes - considerar:\n")
        print("      ‚Ä¢ Hacer Semana 0 OBLIGATORIA (no opcional)")
        print("      ‚Ä¢ Sesiones de nivelaci√≥n en Python (2-3 horas extra)")
        print("      ‚Ä¢ Material introductorio adicional (videos, tutoriales)")
        print("      ‚Ä¢ Mentor√≠as peer-to-peer (estudiantes avanzados ayudan)")
        print("      ‚Ä¢ Ritmo m√°s lento en Semanas 1-2\n")
    
    # Grupo mayormente intermedio
    elif perfiles['intermedios'] > total_estudiantes * 0.5:
        print("   ‚úÖ Grupo mayormente INTERMEDIO - considerar:\n")
        print("      ‚Ä¢ Mantener ritmo est√°ndar del curso")
        print("      ‚Ä¢ Ofrecer ejercicios opcionales desafiantes")
        print("      ‚Ä¢ Semana 0 como repaso recomendado\n")
    
    # Hay estudiantes avanzados
    if perfiles['avanzados'] > total_estudiantes * 0.3:
        print("   üöÄ Hay estudiantes avanzados (>30%) - considerar:\n")
        print("      ‚Ä¢ Ejercicios desafiantes opcionales en cada semana")
        print("      ‚Ä¢ Roles de TA/mentor en equipos")
        print("      ‚Ä¢ Proyectos de mayor complejidad")
        print("      ‚Ä¢ Permitir saltar Semana 0 si dominan quiz\n")
    
    # Grupo mixto
    if perfiles['principiantes'] > 0.2 * total_estudiantes and perfiles['avanzados'] > 0.2 * total_estudiantes:
        print("   üéØ Grupo MIXTO (principiantes + avanzados) - considerar:\n")
        print("      ‚Ä¢ Diferenciaci√≥n en ejercicios (b√°sicos + desaf√≠o)")
        print("      ‚Ä¢ Equipos balanceados (1 avanzado + 2 intermedios + 1 principiante)")
        print("      ‚Ä¢ Material de nivelaci√≥n para principiantes")
        print("      ‚Ä¢ Contenido extra opcional para avanzados\n")
else:
    print("‚ö†Ô∏è  No se pudieron generar recomendaciones (falta columna 'situacion_actual')")

---

## üìä Paso 8: Visualizaciones

Generamos 4 gr√°ficos para presentar en clase.

In [None]:
fig, axes = plt.subplots(2, 2, figsize=(14, 10))
fig.suptitle('üìä An√°lisis del Quiz Diagn√≥stico - CD2001B', fontsize=16, fontweight='bold', y=1.00)

# Gr√°fico 1: Nivel de estad√≠stica
if 'nivel_estadistica' in df.columns:
    df['nivel_estadistica'].value_counts().sort_index().plot(
        kind='bar', ax=axes[0, 0], color='steelblue', edgecolor='black'
    )
    axes[0, 0].set_title('Nivel de Conocimiento en Estad√≠stica', fontweight='bold', fontsize=12)
    axes[0, 0].set_ylabel('N√∫mero de Estudiantes', fontsize=10)
    axes[0, 0].set_xlabel('')
    axes[0, 0].tick_params(axis='x', rotation=45, labelsize=8)
    axes[0, 0].grid(axis='y', alpha=0.3)
else:
    axes[0, 0].text(0.5, 0.5, 'Datos no disponibles', ha='center', va='center')
    axes[0, 0].set_title('Nivel de Estad√≠stica')

# Gr√°fico 2: Nivel de Python
if 'nivel_python' in df.columns:
    df['nivel_python'].value_counts().sort_index().plot(
        kind='bar', ax=axes[0, 1], color='orange', edgecolor='black'
    )
    axes[0, 1].set_title('Nivel de Experiencia con Python', fontweight='bold', fontsize=12)
    axes[0, 1].set_ylabel('N√∫mero de Estudiantes', fontsize=10)
    axes[0, 1].set_xlabel('')
    axes[0, 1].tick_params(axis='x', rotation=45, labelsize=8)
    axes[0, 1].grid(axis='y', alpha=0.3)
else:
    axes[0, 1].text(0.5, 0.5, 'Datos no disponibles', ha='center', va='center')
    axes[0, 1].set_title('Nivel de Python')

# Gr√°fico 3: Frecuencia de uso de IA
if 'frecuencia_ia' in df.columns:
    df['frecuencia_ia'].value_counts().sort_index().plot(
        kind='bar', ax=axes[1, 0], color='green', edgecolor='black'
    )
    axes[1, 0].set_title('Frecuencia de Uso de IA', fontweight='bold', fontsize=12)
    axes[1, 0].set_ylabel('N√∫mero de Estudiantes', fontsize=10)
    axes[1, 0].set_xlabel('')
    axes[1, 0].tick_params(axis='x', rotation=45, labelsize=8)
    axes[1, 0].grid(axis='y', alpha=0.3)
else:
    axes[1, 0].text(0.5, 0.5, 'Datos no disponibles', ha='center', va='center')
    axes[1, 0].set_title('Frecuencia de Uso de IA')

# Gr√°fico 4: Uso de Google Colab
if 'uso_colab' in df.columns:
    df['uso_colab'].value_counts().sort_index().plot(
        kind='bar', ax=axes[1, 1], color='purple', edgecolor='black'
    )
    axes[1, 1].set_title('Experiencia con Google Colab', fontweight='bold', fontsize=12)
    axes[1, 1].set_ylabel('N√∫mero de Estudiantes', fontsize=10)
    axes[1, 1].set_xlabel('')
    axes[1, 1].tick_params(axis='x', rotation=45, labelsize=8)
    axes[1, 1].grid(axis='y', alpha=0.3)
else:
    axes[1, 1].text(0.5, 0.5, 'Datos no disponibles', ha='center', va='center')
    axes[1, 1].set_title('Experiencia con Google Colab')

plt.tight_layout()
plt.savefig('analisis_quiz_diagnostico.png', dpi=300, bbox_inches='tight')
print("\nüìä Gr√°ficos guardados en: analisis_quiz_diagnostico.png")
plt.show()

---

## üì• Paso 9: Descargar Reporte (Opcional)

Si quieres descargar el gr√°fico generado:

In [None]:
# Solo en Colab
try:
    from google.colab import files
    files.download('analisis_quiz_diagnostico.png')
    print("‚úÖ Gr√°fico descargado")
except:
    print("‚ÑπÔ∏è  Si est√°s en Colab, el gr√°fico se descargar√° autom√°ticamente")
    print("‚ÑπÔ∏è  Si ejecutas localmente, el archivo ya est√° guardado en la carpeta actual")

---

## üìä Paso 10: Resumen para Presentar en Clase

Genera un resumen ejecutivo que puedes proyectar.

In [None]:
print("="*70)
print("üìã RESUMEN EJECUTIVO PARA PRESENTAR")
print("="*70)
print(f"\nüìä Total de estudiantes: {len(df)}\n")

if 'situacion_actual' in df.columns:
    print("üë• Composici√≥n del Grupo:\n")
    print(f"   ‚Ä¢ Principiantes: {perfiles['principiantes']} ({perfiles['principiantes']/len(df)*100:.0f}%)")
    print(f"   ‚Ä¢ Intermedios: {perfiles['intermedios']} ({perfiles['intermedios']/len(df)*100:.0f}%)")
    print(f"   ‚Ä¢ Avanzados: {perfiles['avanzados']} ({perfiles['avanzados']/len(df)*100:.0f}%)")

print("\nüìà Hallazgos Clave:\n")

# Estad√≠stica
if 'nivel_estadistica' in df.columns:
    nivel_bajo_stats = df['nivel_estadistica'].str.contains('A\)|B\)', na=False).sum()
    print(f"   ‚Ä¢ Estad√≠stica: {nivel_bajo_stats}/{len(df)} ({nivel_bajo_stats/len(df)*100:.0f}%) tienen poco/nulo conocimiento")

# Python
if 'nivel_python' in df.columns:
    nivel_bajo_py = df['nivel_python'].str.contains('A\)|B\)', na=False).sum()
    print(f"   ‚Ä¢ Python: {nivel_bajo_py}/{len(df)} ({nivel_bajo_py/len(df)*100:.0f}%) tienen poco/nulo conocimiento")

# IA
if 'frecuencia_ia' in df.columns:
    uso_frecuente_ia = df['frecuencia_ia'].str.contains('D\)|E\)', na=False).sum()
    print(f"   ‚Ä¢ IA: {uso_frecuente_ia}/{len(df)} ({uso_frecuente_ia/len(df)*100:.0f}%) usan IA frecuentemente")

# APIs/Agentes
if 'uso_apis_agentes' in df.columns:
    uso_avanzado = df['uso_apis_agentes'].str.contains('C\)|D\)|E\)', na=False).sum()
    print(f"   ‚Ä¢ IA Avanzada: {uso_avanzado}/{len(df)} ({uso_avanzado/len(df)*100:.0f}%) han usado APIs/agentes")

print("\n" + "="*70)
print("‚úÖ An√°lisis completado exitosamente")
print("="*70)

---

## üéì Conclusi√≥n

**Pr√≥ximos pasos:**

1. ‚úÖ Revisa las visualizaciones y estad√≠sticas
2. ‚úÖ Considera las recomendaciones pedag√≥gicas
3. ‚úÖ Adapta el ritmo del curso seg√∫n el perfil del grupo
4. ‚úÖ Comparte hallazgos con estudiantes (opcional)
5. ‚úÖ Forma equipos balanceados usando esta informaci√≥n

**Recuerda:**
- Este es solo un diagn√≥stico inicial
- Los estudiantes pueden mejorar durante el curso
- La diversidad de niveles puede ser una fortaleza (peer learning)

---

## üìö Referencias

- [Quiz Diagn√≥stico (Markdown)](quiz_diagnostico.md)
- [Quiz Diagn√≥stico (Notebook)](quiz_diagnostico.ipynb)
- [Gu√≠a para Profesores](GUIA_PROFESOR_QUIZ.md)
- [Semana 0 README](README.md)

---

**Desarrollado para CD2001B - Diagn√≥stico para L√≠neas de Acci√≥n**  
Tec de Monterrey ¬© 2025