### ¿Qué es una prueba t de una muestra?

Una prueba t de una muestra es un método estadístico que se utiliza para determinar si la media de una sola muestra es significativamente diferente de una media poblacional conocida o hipotética. A menudo se utiliza cuando se desconoce la desviación estándar de la población y el tamaño de la muestra es pequeño, lo que hace necesario utilizar la distribución t en lugar de la distribución normal.

### Objetivo

La prueba t de una muestra se utiliza normalmente en los siguientes escenarios:

- Para probar si el promedio de una muestra difiere de un valor específico (por ejemplo, ¿la puntuación promedio de los estudiantes en una clase difiere significativamente de un promedio nacional conocido?).
- Hacer inferencias sobre la media poblacional cuando sólo se dispone de datos muestrales.

### Formulas

Dada una muestra $X = \{x_1, x_2, \dots, x_n\}$ con media muestral $\bar{x}$ y desviación estándar muestral $s$, el estadístico de prueba $t$ se calcula como:

$$
t = \frac{\bar{x} - \mu_0}{\frac{s}{\sqrt{n}}}
$$

Dónde:
- $\bar{x}$ es la media muestral.
- $\mu_0$ es la media poblacional hipotética.
- $s$ es la desviación estándar de la muestra, calculada como:

$$
s = \sqrt{\frac{1}{n-1} \sum_{i=1}^{n} (x_i - \bar{x})^2}
$$

- $n$ es el tamaño de la muestra.

Los grados de libertad (gl) para esta prueba son $n-1$.

### Ejemplo

Supongamos que una maestra cree que el puntaje promedio de los estudiantes de su clase es 75. Se selecciona aleatoriamente una muestra de 10 estudiantes y sus puntajes son: 78, 74, 80, 72, 76, 73, 79, 77, 81 y 74. .

Probemos si la puntuación promedio de los estudiantes difiere significativamente de 75 utilizando una prueba t de una muestra con un nivel de significancia de 0,05.

1. **Paso 1: Calcular la media muestral ($\bar{x}$)**

$$
\bar{x} = \frac{78 + 74 + 80 + 72 + 76 + 73 + 79 + 77 + 81 + 74}{10} = \frac{764}{10} = 76,4
$$

2. **Paso 2: Calcular la desviación estándar de la muestra ($s$)**

$$
s = \sqrt{\frac{1}{n-1} \sum_{i=1}^{n} (x_i - \bar{x})^2}
$$

$$
s = \sqrt{\frac{1}{9} \left[(78 - 76.4)^2 + (74 - 76.4)^2 + \dots + (74 - 76.4)^2\right]}
$$

$$
s \approx \sqrt{\frac{1}{9} \times 86.4} \approx 3.098
$$

3. **Paso 3: Calcular el estadístico t**

$$
t = \frac{\bar{x} - \mu_0}{\frac{s}{\sqrt{n}}} = \frac{76,4 - 75}{\frac{3.098}{\sqrt{10}}} \approx \frac{1.4}{0.844} \approx 1.429
$$

4. **Paso 4: Determinar el valor crítico y comparar**

Utilizando una tabla de distribución t o un software, encuentre el valor t crítico para $df = 9$ con un nivel de significancia de 0,05 (una cola).

<img src="https://www.scribbr.com/wp-content/uploads/2022/06/Critical-values-of-t-for-one-tailed-tests-s.webp" width=400>

El valor crítico es aproximadamente 1.833.

Desde $ |1.429| < 1.833 $, no podemos rechazar la hipótesis nula. No hay evidencia suficiente para decir que la puntuación promedio difiera significativamente de 75.

Este ejemplo muestra cómo se realiza una prueba t de una muestra, incluido el cálculo del estadístico de prueba y la comparación con el valor crítico.

In [43]:
import numpy as np
import pandas as pd
from scipy import stats

# === Crear dataframe ===
data = {'scores': [78, 74, 80, 72, 76, 73, 79, 77, 81, 74]}
df = pd.DataFrame(data)
display(df)

# === Calcular media ===
sample_mean = df['scores'].mean()

# === Calcular desviacion estandar ===
sample_std = df['scores'].std(ddof=1)

# === Definir media poblacional ===
population_mean = 75

# === Calcular t-statistic y p-value ===
t_statistic, p_value = stats.ttest_1samp(df['scores'], population_mean)

# === Mostrar resultados
print(f"Sample Mean: {sample_mean:.2f}")
print(f"Sample Standard Deviation: {sample_std:.2f}")
print(f"t-statistic: {t_statistic:.2f}")
print(f"p-value: {p_value:.4f}")

alpha = 0.05
if p_value < alpha:
    print(f"Reject the null hypothesis: The average score significantly differs from {population_mean}.")
else:
    print(f"Fail to reject the null hypothesis: There is not enough evidence to say that the average score significantly differs from {population_mean}.")

Unnamed: 0,scores
0,78
1,74
2,80
3,72
4,76
5,73
6,79
7,77
8,81
9,74


Sample Mean: 76.40
Sample Standard Deviation: 3.10
t-statistic: 1.43
p-value: 0.1868
Fail to reject the null hypothesis: There is not enough evidence to say that the average score significantly differs from 75.
