# Prueba de hipotesis en Python

En Python, existen funciones que podemos utilizar para comprobar hipótesis. No es necesario que elijas un nivel de significación o que averigües si un valor se encuentra o no dentro de un intervalo crítico. Una función devuelve la estadística de diferencia entre la media y el valor con el que lo estás comparando, y la importancia estadística de esta estadística es el valor p (de la palabra probabilidad).

Es razonable usar el valor p para decidir si aceptar o rechazar la hipótesis nula. El valor p es la probabilidad de obtener un resultado al menos tan extremo como el que estás considerando, suponiendo que la hipótesis nula sea correcta. El valor p está indicado como porcentaje e indica el área bajo la curva que corresponde a una probabilidad.

Si este valor es superior al 10%, definitivamente no debes rechazar la hipótesis nula. Si el valor p es más bajo, es posible que debas rechazar la hipótesis nula. Los valores de umbral convencionales son 5% y 1%.

> **Recordar que siempre dependerá del analista cuál será el valor suficiente a considerar y validar o no una hipótesis**

### La función que utilizaremos:

>  **scipy.stats.ttest_1samp (array, popmean)**

se usa para probar hipótesis del tipo "la media de la población es igual a x".

ttest significa prueba t, del inglés t-test; 1samp significa que estamos trabajando con una muestra y comparándola con un valor dado.

Pasamos estos parámetros a la función:

- array es una matriz que contiene la muestra.
- popmean es la media propuesta que estamos probando.

Cuando se llama, la función devuelve la estadística de diferencia entre popmean y la media muestral de array. 



In [2]:
from scipy import stats
import numpy as np

# Generar una muestra de alturas (en cm)
muestra_alturas = np.array([160, 165, 170, 168, 172, 162, 166, 169, 167, 171])

# Altura promedio en la población general (la que esperamos)
altura_promedio_poblacion = 165

# Realizar la prueba t de una muestra
resultado_t_test, valor_p = stats.ttest_1samp(muestra_alturas, altura_promedio_poblacion)

# Imprimir el resultado
print(f"Estadística t: {resultado_t_test}")
print(f"Valor p: {valor_p}")


Estadística t: 1.6390750941244592
Valor p: 0.1356201035284866
