El test T de student es un metodo estadistico que se usa para determinar si hay una diferencia significativa entre la media de una muestra de datos y una media teorica (o conocida). Es especialmente util cuando se tiene una muestra pequenia y se quiere hacer inferencias sobre una poblacion mas grande basandose en esa muestra.

Imagina que eres un maestro y has implementado un nuevo metodo de ensenianza. Quieres saber si este nuevo metodo ha mejorado realmente las calificaciones de los estudiantes. Conoces la media historica de las calificaciones, y despues de aplicar el nuevo metodo, tomas una muestra de las calificaciones de tus estudiantes.

Paso 1: Establecer las hipotesis

- Hipotesis nula (H0): No hay diferencia entre la media de las calificaciones de la muestra y la media historica. Esto significaria que el nuevo metodo no tuvo efecto.

- Hipotesis alternativa (H1): Hay una diferencia entre la media de la muestra y la media historica. Esto sugiere que el metodo podria hacer tenido un efecto.

Paso 2: Recolectar datos

Supon que la media historica de las calificaciones es de 75. Despues del nuevo metodo, tomas una muestra de calificaciones de 30 estudiantes.

Paso 3: Calcular el estadistivo T

Usas la formula del test T, que compara cuanto se desvia la media de tu muestra de la media conocida, ajustada por la variabilidad de los datos y el tamanio de la muestra.

![image.png](attachment:image.png)

Paso 4: Comparar el valor T con un valor critico

Calculas o buscas en una tabla el valor T critico para un nivel de confiaza especifico (usualmente 95%). Si el valor T calculado es mayor que el valor T critico, rechazas la hipotesis nula.

Paso 5: Interpretacion de los resultados

- Si el valor T es mayor que el valor critico (y el p-valor es menor que 0.05), concluyes que hay una diferencia estadisticamente significativa, sugiriendo que el metodo de enesenianza podria haber sido efectivo.

- Si no, concluyes que no hay suficiente evidencia para decir que el metodo de ensenianza podria haber sido efectivo.

Contraste de Hipotesis: T-Student de dos muestras

Utilziado para derterminar si las medias de dos grupos independientes son significativamente diferentes. Es importante en estudios experimentales donde se comparan dos condiciones o tratamientos diferentes.

Hipotesis:

- Hipotesis Nula (H0): Las medias de las dos poblaciones son iguales, u1 = u2
- Hipotesis Alternativa (H1): Las medias de las dos poblaciones son diferentes, u1 != u2

Estadistica de prueba:

![image-2.png](attachment:image-2.png)

Distribucion de la estadistica de prueba:

La estadisitca t sigue una distribucion t de studen con n1 + n2 - 2 grados de libertad bajo la hipotesis nula.




In [2]:
import numpy as np
from scipy import stats

def mean(data):
    return sum(data) / len(data)

def std_dev(data, mean_data):
    return (sum((x - mean_data) ** 2 for x in data) / (len(data) - 1)) ** 0.5

def t_statistic(data1, data2):
    mean1, mean2 = mean(data1), mean(data2)
    std1, std2 = std_dev(data1, mean1), std_dev(data2, mean2)
    n1, n2 = len(data1), len(data2)
    
    # Calculando el estadístico T
    numerator = mean1 - mean2
    denominator = ((std1**2 / n1) + (std2**2 / n2)) ** 0.5
    t_stat = numerator / denominator

    # Calculando los grados de libertad
    df = n1 + n2 - 2

    # Calculando el p-value para un test de dos colas
    p_value = 2 * stats.t.sf(np.abs(t_stat), df)

    return t_stat, p_value

# Datos de ejemplo
data1 = [23, 21, 22, 20, 23, 25, 21]
data2 = [26, 22, 21, 23, 24, 25, 26]

# Calcular el estadístico T y el p-value
t_value, p_value = t_statistic(data1, data2)
print("T-statistic:", t_value)
print("p-value:", p_value)


T-statistic: -1.7629275847478114
p-value: 0.10333642235940099


Este codigo compara dos grupos de datos generados aleatoriamente, calculando la estadistica t y el p-valor para evaluar si existen diferencias significativas entre sus medias.

Consideraciones

Es crucial verificar que los datos cumplen con las suposiciones necesarias para aplicar el test T-Student:

- Las muestras deben provenir de distribuciones aproximadamente normales.
- Las muestras deben ser independientes entre si.
- En el caso de dos muestras, se asume que las varianzas de las poblaciones son iguales (homocedasticidad).