# Pruebas de Hipótesis y Significación Estadística

## Objetivos de la Lección

En esta lección aprenderemos los fundamentos de las pruebas de hipótesis y la significación estadística.

## Introducción

Muchas veces en el mundo real nos gustaría resolver una pregunta que requiere la comparación de dos cantidades. Por ejemplo, ¿dejar la luz encendida causa que las personas tarden más en dormirse, o los libros con más páginas venden más copias? Usando algunas suposiciones básicas, podemos usar la inferencia estadística para llegar a una conclusión y determinar una respuesta para estas preguntas. Las hipótesis nos permiten comparar dos muestras y, usando ciertas suposiciones, podemos rechazar o no rechazar nuestra hipótesis (como verdaderos estadísticos nunca decimos que aceptamos una hipótesis, solo rechazar o no rechazar).

## Conceptos Clave

### Población

La población incluye todos los elementos en un conjunto de datos. Por ejemplo, la población de todos los estudiantes de una cierta universidad incluye a todos los estudiantes matriculados en esa universidad.

### Muestra

Una muestra es un subconjunto de la población. Por ejemplo, una muestra de estudiantes universitarios de una cierta universidad puede ser un grupo seleccionado aleatoriamente de estudiantes que están matriculados en la universidad.

### Hipótesis Nula

Una hipótesis nula es lo que consideramos el estado actual de las cosas. Estamos tratando de refutar esta hipótesis nula. Por ejemplo, una hipótesis nula podría ser que todos los estudiantes matriculados en una universidad tienen un promedio de calificaciones similar. Denotamos la hipótesis nula como H0.

La notación típica para una hipótesis nula sería: H0: μ ≤ 85

Donde μ es la media y nuestra suposición inicial es que es menor o igual a 85.

### Hipótesis Alternativa

Una hipótesis alternativa es una hipótesis rival a la hipótesis nula. Comparamos esta hipótesis con la hipótesis nula para decidir si rechazamos o no la hipótesis nula.

Denotamos la hipótesis alternativa con H1 o Ha.

La notación típica para una hipótesis alternativa es H1: μ > 85.

Nos gustaría probar que μ es de hecho menos de 85.

### Tipos de Hipótesis

Hay 3 tipos de hipótesis:

- H0: μ ≤ k
- H1: μ > k
- H0: μ ≥ k
- H1: μ < k
- H0: μ = k
- H1: μ ≠ k

Los primeros dos tipos son pruebas de hipótesis unilaterales mientras que el tercero es bilateral. Una prueba de hipótesis unilateral solo mira si el estadístico de prueba tiene un valor positivo o negativo muy grande. Una prueba bilateral mira ambos. En el caso bilateral, rechazaremos la hipótesis nula en el caso de que el estadístico de prueba sea un valor positivo o negativo muy grande.

### Suposiciones de la Prueba

Para llevar a cabo una prueba de hipótesis necesitamos cumplir ciertas suposiciones:

- Nuestras observaciones deben ser independientes entre sí. Por ejemplo, si tenemos personas que viven en el mismo hogar participando en un ensayo médico, podrían estar expuestas a las mismas condiciones ambientales o comer la misma comida. Esto puede sesgar nuestros resultados.
- Normalidad de los datos - Asumimos que la muestra proviene de datos distribuidos normalmente.
- Tamaño de muestra adecuado. Para realizar una prueba usando la distribución normal y no aproximarnos a la distribución t, nuestro tamaño de muestra debe ser mayor de 30.
- Para usar la distribución normal para nuestra prueba de hipótesis, debemos asumir que la desviación estándar de la población es conocida. Si la desviación estándar de la población no se conoce, entonces usamos la distribución t para la prueba de hipótesis.

### Estadístico de Prueba

Una vez que determinamos el tipo de prueba de hipótesis y que nuestras suposiciones se han cumplido, usamos nuestros datos para decidir si rechazar o no rechazar la hipótesis nula.

Esto significa que nuestro estadístico de prueba es igual a la diferencia entre la media de la muestra y nuestra constante dividida por la desviación estándar sobre la raíz cuadrada del tamaño de la muestra.

Comparamos el valor z o t encontrado en la prueba con el límite que determinamos para la prueba usando la significancia que elegimos para la prueba y determinamos el resultado de nuestra prueba.

# Significancia de la Prueba

Típicamente, cuando realizamos una prueba de hipótesis, no podemos estar 100% seguros del resultado. Sin embargo, podemos determinar el porcentaje de certeza en nuestro resultado. Para un 95% de confianza, miramos un 5% de significancia en nuestra prueba.

Tener un 95% de confianza significa que partimos de la hipótesis nula como el status quo. Calculamos nuestro estadístico de prueba dado que pensamos que la hipótesis nula es verdadera. La significancia que producimos del estadístico de prueba es la probabilidad de que obtuvimos nuestro resultado debido al azar. Si hay menos de un 5% de probabilidad de que obtuvimos nuestro resultado debido al azar, entonces esa es una probabilidad muy pequeña de que este resultado sea aleatorio y es más probable que esté ocurriendo debido a algo en el experimento. Entonces podemos rechazar la hipótesis nula.

# Intervalos de Confianza

Usando el valor crítico que hemos calculado para nuestro estadístico de prueba, podemos construir un intervalo de confianza. Calculamos el intervalo de confianza para una prueba de dos lados:

¿Qué significan los intervalos de confianza?

Para un intervalo de confianza del 95% significa que si tomamos nuestra población y la muestreamos 100 veces, en 95 de esas cien veces, produciremos un intervalo de confianza que contiene la media verdadera de la población (recuerda que no conocemos la media verdadera de la población, la estamos estimando usando la muestra). Si una gran parte de nuestros intervalos de confianza no contiene lo que nuestra hipótesis afirma que es la media, entonces podemos rechazar la hipótesis nula.

## Realizando una Prueba de Hipótesis

Explorar un ejemplo más concreto ayudará a integrar estos conceptos. Una compañía farmacéutica está probando un medicamento para reducir el azúcar en la sangre y manejar la diabetes. Se sabe que cualquier nivel de Hemoglobina A1c por debajo del 5.7% se considera normal. La compañía farmacéutica ha tratado a 100 voluntarios del estudio con este medicamento y le gustaría probar que después del tratamiento su media de A1c es inferior al 5.7%.

Nuestra hipótesis será:

    H0: μ ≥ 5.7
    H1: μ < 5.7

La compañía farmacéutica informa una media de A1c del 5.1% con una desviación estándar de muestra de 1.6.

Nos gustaría usar nuestra muestra para hacer inferencias respecto a la población. Si rechazamos la hipótesis nula, esto podría proporcionarnos alguna evidencia de que los niveles promedio de A1c están dentro del rango normal.

Para realizar una prueba de hipótesis, primero verificamos nuestras suposiciones. No sabemos nada sobre la desviación estándar de la población, así que, aunque el tamaño de la muestra es suficientemente grande, utilizaremos la prueba t. Podemos asumir que la compañía farmacéutica utilizó prácticas adecuadas al seleccionar a sus sujetos de estudio de tal manera que evite la dependencia y que también son conscientes de que los datos provienen de una población normalmente distribuida.

Dado que tenemos 100 sujetos, utilizamos 99 grados de libertad para calcular el estadístico de prueba. El estadístico de prueba para 99 grados de libertad se traduce en un valor p de menos de 0.0005. Esto es menor que 0.05 y, por lo tanto, rechazamos la hipótesis nula. ¡Esto es una excelente noticia para nuestros pacientes!

# Pruebas de Hipótesis en Python

Podemos usar la biblioteca Scipy para realizar pruebas de hipótesis. Scipy tiene una función para pruebas de hipótesis de una muestra llamada ttest_1samp. Esta prueba toma un conjunto de datos y una constante para comparación y devuelve el estadístico de prueba y el valor p para una prueba de dos lados.

Nuestra prueba es de un solo lado, por lo que solo observaremos el estadístico de prueba. Para usar el valor p tenemos que dividir el valor p por 2.

In [None]:
import numpy as np
from scipy.stats import ttest_1samp
patients = np.random.normal(5.1, 1.6, 100)
ttest_1samp(patients, 5.7)

En este ejemplo, generamos datos aleatorios con una media de 5.1 y una desviación estándar de 1.6 para simular a nuestros pacientes. Nuestro estadístico de prueba es cercano pero no exactamente igual, ya que la media de la muestra no es exactamente 5.1 como en el ejemplo, sino de hecho:

In [None]:
np.mean(patients)

Esto explica la pequeña discrepancia en el estadístico de prueba. Sin embargo, el resultado es el mismo: rechazamos la hipótesis nula.