<a href="https://colab.research.google.com/github/apchavezr/Fundamentos-de-Estad-stica---Ciencia-de-Datos/blob/main/ejercicio_guiado_prueba_t_visitas_completo.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

### Ejercicio 2: Prueba t de una muestra en Python

En este ejercicio se analiza una muestra simulada del número de visitas diarias a un sitio web, con el objetivo de evaluar si el promedio diario de tráfico recibido difiere significativamente de un umbral de referencia preestablecido (por ejemplo, 1.000 visitas por día). Este tipo de análisis es común en entornos digitales donde el monitoreo del comportamiento de usuarios permite tomar decisiones estratégicas de negocio.

En particular, se utiliza una prueba t de una muestra para determinar si la media observada de visitas diarias es estadísticamente diferente del valor esperado. Esta herramienta es útil cuando se desea validar hipótesis sobre comportamientos promedio bajo incertidumbre y variabilidad natural en los datos recolectados.

A través de este ejercicio, se espera que el estudiante sea capaz de:

- Aplicar correctamente una prueba t de una muestra en un contexto realista de analítica web.
- Formular hipótesis estadísticas de manera adecuada.
- Calcular e interpretar el valor p y tomar decisiones con base en un nivel de significancia.
- Comprender cómo este análisis puede aportar información útil para la gestión del rendimiento digital de un sitio web.


# Ejercicio guiado: Prueba t de una muestra en Python

En este ejercicio se evalúa si el número promedio de visitas diarias a un sitio web ha cambiado respecto al promedio histórico de 150 visitas diarias.

In [None]:
import numpy as np
from scipy import stats

### Paso 1: Definición de hipótesis y datos muestrales

In [None]:
# Datos del problema
media_hipotetica = 150   # Media poblacional conocida (H0)
datos_muestra = [160, 152, 158, 149, 151, 155, 162, 148, 154, 157]  # Visitas diarias observadas
n = len(datos_muestra)
media_muestral = np.mean(datos_muestra)
desviacion = np.std(datos_muestra, ddof=1)

print(f"Media muestral: {media_muestral:.2f}")
print(f"Desviación estándar muestral: {desviacion:.2f}")
print(f"Tamaño de muestra: {n}")

Media muestral: 154.60
Desviación estándar muestral: 4.67
Tamaño de muestra: 10


### Paso 2: Cálculo del estadístico t

In [None]:
t_stat = (media_muestral - media_hipotetica) / (desviacion / np.sqrt(n))
print(f"Estadístico t calculado: {t_stat:.4f}")

Estadístico t calculado: 3.1139


### Paso 3: Cálculo del p-valor (prueba bilateral)

In [None]:
p_valor = stats.t.sf(np.abs(t_stat), df=n-1) * 2
print(f"p-valor: {p_valor:.4f}")

p-valor: 0.0124


### Paso 4: Toma de decisión (con α = 0.05)

In [None]:
alpha = 0.05
decision = "Rechazar H0" if p_valor < alpha else "No rechazar H0"
print(f"Decisión: {decision}")

Decisión: Rechazar H0


### Resultado

Se aplica una prueba t para una muestra para determinar si hay evidencia suficiente para afirmar que el número promedio de visitas ha cambiado respecto al valor histórico de 150 visitas diarias.

- Estadístico t y p-valor calculados con base en los datos muestrales.
- Comparación con nivel de significancia de 0.05.

**Conclusión:** se toma una decisión con base en la evidencia estadística obtenida.


### Conclusiones

A partir del análisis realizado con la prueba t de una muestra, se obtuvo un valor p que permite evaluar si la diferencia entre el número promedio de visitas observadas y el umbral de referencia es estadísticamente significativa.

Si el valor p es menor que el nivel de significancia (por ejemplo, 0.05), se puede concluir que existe evidencia suficiente para afirmar que el promedio de visitas diarias difiere del valor esperado. Esto puede reflejar un cambio significativo en el comportamiento del usuario, el impacto de una campaña digital, o una alteración en la dinámica del sitio web.

Por el contrario, si el valor p es mayor al nivel de significancia, no se rechaza la hipótesis nula, lo que implica que no hay evidencia estadística suficiente para afirmar que el promedio ha cambiado respecto al valor de referencia.

Este tipo de pruebas permite tomar decisiones informadas en contextos donde es necesario monitorear metas de tráfico, evaluar efectividad de estrategias digitales y justificar acciones de mejora continua. Además, resalta la importancia de combinar análisis estadísticos con el conocimiento del dominio para una interpretación crítica y contextualizada de los resultados.
