<a href="https://colab.research.google.com/github/apchavezr/Fundamentos-de-Estad-stica---Ciencia-de-Datos/blob/main/ejercicio_guiado_prueba_t_pareada_completo.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>


### Ejercicio 3. Comparación del desempeño académico antes y después de una intervención educativa

En este ejercicio se analiza una muestra simulada de estudiantes a quienes se les aplicó una prueba antes y después de participar en una intervención educativa (como un taller o curso de refuerzo). El objetivo es ilustrar cómo el uso de la prueba t pareada permite evaluar si existen diferencias estadísticamente significativas en las medias de dos mediciones relacionadas.

La prueba t pareada es adecuada en situaciones en las que las observaciones están emparejadas o son dependientes, como ocurre con medidas repetidas sobre los mismos sujetos. En este caso, se busca identificar si el cambio observado en el rendimiento académico puede atribuirse al efecto de la intervención, más allá de la variabilidad aleatoria.

A través de este ejercicio, se espera que el estudiante sea capaz de:

- Calcular la diferencia entre dos mediciones relacionadas y verificar su distribución.
- Aplicar correctamente la prueba t para muestras pareadas.
- Interpretar el valor-p obtenido y tomar una decisión basada en la evidencia.
- Comprender cuándo es apropiado el uso de esta prueba en contextos reales de análisis educativo.


# Ejercicio guiado con datos reales: Prueba t pareada

Este notebook realiza una prueba t para muestras relacionadas utilizando datos reales simulados de tiempos de atención al cliente antes y después de implementar un chatbot.

In [None]:
import pandas as pd
import numpy as np
from scipy import stats

### Paso 1: Cargar los datos desde el archivo CSV

In [None]:
df = pd.read_csv('datos_tiempos_atencion.csv')
df.head()

Unnamed: 0,Tiempo_antes,Tiempo_despues
0,13.241785,9.296587
1,11.654339,14.204556
2,13.619221,10.473006
3,15.807575,8.384578
4,11.414617,12.14509


### Paso 2: Estadísticas descriptivas

In [None]:
print("Resumen estadístico:")
print(df.describe())

Resumen estadístico:
       Tiempo_antes  Tiempo_despues
count     30.000000       30.000000
mean      11.529633       10.257675
std        2.250016        1.862204
min        7.216799        6.580660
25%       10.522373        9.081773
50%       11.414637       10.370854
75%       12.900838       11.589324
max       15.948032       14.204556


### Paso 3: Formulación de hipótesis

- \( H_0 \): No hay diferencia en los tiempos de atención (media de diferencias = 0)
- \( H_1 \): Hay una diferencia significativa en los tiempos de atención antes y después.

### Paso 4: Cálculo del estadístico t para muestras pareadas

In [None]:
t_stat, p_valor = stats.ttest_rel(df['Tiempo_antes'], df['Tiempo_despues'])
print(f"Estadístico t: {t_stat:.4f}")
print(f"p-valor: {p_valor:.4f}")

Estadístico t: 2.5103
p-valor: 0.0179


### Paso 5: Toma de decisión (α = 0.05)

In [None]:
alpha = 0.05
decision = "Rechazar H0" if p_valor < alpha else "No rechazar H0"
print(f"Decisión: {decision}")

Decisión: Rechazar H0



### Conclusiones

Los resultados obtenidos en este ejercicio muestran cómo la prueba t pareada puede ser una herramienta útil para comparar el rendimiento de los estudiantes antes y después de una intervención pedagógica. Si el valor-p es menor que el nivel de significancia adoptado (por ejemplo, 0.05), se puede concluir que hay evidencia estadística suficiente para afirmar que la intervención tuvo un efecto significativo en los resultados académicos.

Esta técnica permite evaluar el impacto de programas educativos, cambios metodológicos o intervenciones individuales, siempre que las mediciones se realicen en los mismos individuos. Es importante verificar también los supuestos de normalidad de las diferencias para validar la aplicación de esta prueba.

El ejercicio contribuye al desarrollo de habilidades analíticas para la toma de decisiones basadas en evidencia y refuerza la importancia de contar con diseños de medición adecuados para realizar inferencias válidas.
