<a href="https://colab.research.google.com/github/apchavezr/Fundamentos-de-Estad-stica---Ciencia-de-Datos/blob/main/ejercicio_prueba_t_estrategia_digital_final.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

**Ejercicio 4. Prueba t para muestras pareadas.**

### Contexto

En este ejercicio se analiza una muestra simulada de tiempos de respuesta (en minutos) a solicitudes ciudadanas, registrados por una entidad antes y después
de implementar una nueva estrategia digital orientada a mejorar la eficiencia de los procesos administrativos. Se recolectaron 30 observaciones pareadas,
lo que significa que cada observación representa el tiempo de respuesta de una misma unidad o proceso en dos momentos distintos: antes y después de la intervención.

Este tipo de diseño es frecuente en estudios de evaluación de impacto, donde se espera que la intervención tenga un efecto medible sobre una variable de interés.
La prueba t para muestras pareadas permite determinar si la diferencia promedio entre los tiempos previos y posteriores a la intervención es significativa
desde el punto de vista estadístico, lo cual puede respaldar decisiones de implementación o ajuste de políticas públicas.


### Propósito del ejercicio

El propósito de este ejercicio es aplicar una prueba t para muestras pareadas con el objetivo de evaluar si la implementación de una nueva estrategia digital
ha generado una reducción estadísticamente significativa en el tiempo promedio de respuesta a solicitudes ciudadanas. A través del análisis comparativo de
datos recolectados antes y después de la intervención, se busca que el estudiante fortalezca su comprensión del uso de pruebas paramétricas, el análisis de
diferencias de medias en diseños dependientes, y la interpretación crítica de los resultados obtenidos en un contexto de mejora organizacional.


In [None]:
import pandas as pd
from scipy import stats
import numpy as np

### Paso 1: Cargar los datos

In [None]:
df = pd.read_csv('datos_estrategia_digital.csv')
df.head()

Unnamed: 0,Antes,Despues
0,15.993428,15.695988
1,14.723471,10.745054
2,16.295377,15.115623
3,18.04606,18.432626
4,14.531693,12.097876


### Paso 2: Estadísticas descriptivas

In [None]:
df.describe()

Unnamed: 0,Antes,Despues
count,30.0,30.0
mean,14.623706,13.60545
std,1.800013,2.166507
min,11.17344,10.032989
25%,13.817898,12.098864
50%,14.53171,13.231382
75%,15.720671,14.999021
max,18.158426,18.432626


### Paso 3: Formulación de hipótesis
- H0: No hay diferencia en los tiempos medios de respuesta
- H1: Sí hay una diferencia significativa

### Paso 4: Realizar prueba t pareada

In [None]:
t_stat, p_valor = stats.ttest_rel(df['Antes'], df['Despues'])
print(f"Estadístico t: {t_stat:.4f}")
print(f"p-valor: {p_valor:.4f}")

Estadístico t: 3.9933
p-valor: 0.0004


### Paso 5: Toma de decisión con α = 0.05

In [None]:
alpha = 0.05
if p_valor < alpha:
    print("Conclusión: Rechazar H0. Existe diferencia significativa en los tiempos de respuesta.")
else:
    print("Conclusión: No se rechaza H0. No hay evidencia suficiente de diferencia.")

Conclusión: Rechazar H0. Existe diferencia significativa en los tiempos de respuesta.


### Paso 6: Conclusión

Los resultados de la prueba t para muestras pareadas indican que existe evidencia estadísticamente significativa para afirmar que la implementación de la nueva
estrategia digital ha tenido un impacto sobre el tiempo promedio de respuesta a las solicitudes ciudadanas.

Dado que el p-valor obtenido es menor al nivel de significancia convencional (α = 0.05), se rechaza la hipótesis nula y se concluye que la diferencia observada
en los tiempos antes y después de la intervención no es atribuible al azar.

Este tipo de análisis resulta útil para evaluar la eficacia de estrategias de transformación digital en el sector público, y refuerza la necesidad de fundamentar
las decisiones organizacionales con evidencia empírica derivada del análisis estadístico riguroso.