In [6]:
from scipy.stats import norm, t, chi2

# Introducción

Es común, interpretar los resultados de los test de hipótesis haciendo uso del p-valor. No todas las implementaciones de test estadísticos retornan p-valores. En algunos casos, se deben usar alternativas, tales como los valores críticos. Además, los valores críticos son usados cuando estimamos los intervalos esperados para observaciones de una población, tales como los intervalos de tolerancia.

# ¿Por qué necesitamos los valores críticos?

Muchos test de hipótesis estadísticos retornan un p-valor que es usado para interpretar los resultados de dicho test. Algunos test no retornan un p-valor, por lo tanto requieren de un método alternativo para interpretar los resultados del test estadístico, es aquí donde entran los valores críticos. Algunos ejemplos de test de hipótesis estadísticos y sus distribuciones a partir de las cuales se pueden calcular los valores críticos son:

* **Z-Test:** Distribución Gaussiana

* **Student's t-Test:** Student's t-distribution

* **Chi-Squared Test:** Chi-Squared distribution

* **Anova:** F-distribution

Los valores críticos son también usados cuando definimos intervalos de observaciones esperadas (o inesperadas). El cálculo y el uso de valores críticos puede ser apropiado al cuantificar la incertidumbre de estadísticos estimados o intervalos tales como intervalos de confianza y intervalos de tolerancia. Notar que el p-valor puede ser calculado a partir de un test estadístico recuperando la probabilidad de la CDF.

# ¿Qué es un valor crítico?

Un valor crítico es definido en el contexto de la distribución de población y probabilidad. Se define como la probabilidad de que una observación sea menor a un valor determinado.

$$Pr[x <= Critical Value] = probability$$

Donde **Pr** es el cálculo de probabilidad, **x** son observaciones de una población, **Critical Value** es el valor crítico y **probability** es la probabilidad elegida. Los valores críticos son calculados haciendo uso de funciones matemáticas donde la probabilidad es proporcionada como un argumento.

Para las distribuciones más comunes, el valor no puede ser calculado de forma analítica, en su lugar debe ser estimado usando métodos numéricos. Históricamente se tienen tablas pre-calculadas de valores críticos. La probabilidad a menudo es expresada como una significancia, denotada por alfa:

$$probability = 1 - alpha$$

Existen valores estándar de alpha que son usados a la hora de calcular valores críticos, estos valores son usados por razones consistentes. Estos valores de alpha son:

* 1% (alpha = 0.01)

* 5% (alpha = 0.05)

* 10% (alpha = 0.1)

Los valores críticos proporcionan una forma alternativa y equivalente para interpretar hipótesis estadísticas al p-valor.

# Test de una cola

Un test one-tailed (una cola) tiene un valor crítico único, a la izquierda o a la derecha de la distribución. A menudo, un test one-tailed tiene un valor crítico a la derecha de la distribución para distribuciones no simétricas (tales como la distribución Chi-Squared). El estadístico es comparado con el valor crítico. Si el estadístico es menor o igual que el valor crítico, la hipótesis nula no es rechazada.

* ** Test Statistic < Critical Value:** resultado estadísticamente no significativo, no rechazamos la hipótesis nula (H0).

* **Test Statistic >= Critical Value:** resultado significativo, rechazamos la hipótesis nula (H0).

# Test de doble cola 

Un test two-tailed (doble cola) tiene dos valores críticos, una a cada lado de la distribución, a menudo se asume que estos valores son simétricos (distribución Gaussianna o T-Student's). Cuando usamos test de tipo doble cola, el valor de significancia (alpha) debe de ser dividio entre 2. El valor crítico utilizará una parte de este alfa en cada lado de la distribución. Si consideramos un alpha del 5%, este debería ser dividido en dos valores de alpha de 2.5% en cada lado de la distribución con un área de aceptación del 95%. Nos podemos referir a cada valor crítico como el vaor crítico inferior y superior. Los valores del test estadístico mayores o iguales al valor crítico inferior y menores que el valor crítico superior indican que la hipótesis nula no puede ser rechazada. Sin embargo, valores por debajo del valor crítico y mayores que el valor crítico superior indican que podemos rechazar la hipótesis nula. Esto puede resumirse en:

* **Lower CR < Test Statistic > Upper CR:** resultado no significativo, no podemos rechazar la hipótesis nula.

* **Test Statistic <= Lower CR or Test Statistic >= Upper CR:** resultado significativo, rechazamos la hipótesis nula.

Si la distribución del test estadístico es simétrico entorno a una media cero, podemos chequear y comprobar el valor absoluto del test con el valor crítico positivo:

* **|Test Statistic| < Upper Critical Value:** resultado no significativo, no rechazamos H0.

* **|Test Statistic| > Upper Critical Value:** resultado significativo, rechazamos H0.

# ¿Cómo calcular valores críticos?

Las funciones de densidad retornan la probabilidad de una observación en la distribución.

* **Función Densidad de Probabilidad (PDF):** probabilidad de que una observación tenga un valor específico.

* **Función Densidad Acumulada (CDF):** probabilidad de que una observación sea menor o igual que un valor específico.

Con el objetivo de calcular el valor crítico, se requiere una función que, dada una probabilidad (o significancia), nos retorne la observación para la distribución que cumple que es menor o igual a la probabilidad indicada. Esta función es conocida como función cuantil:

* **Percent Poit Function (PPF):** retorna el valor de la observación para una probabilidad que es menor o igual a la probabilidad proporcionada.

Es decir, un valor de la distribución sera menor o igual que el valor devuelto por la PPF con la probabilidad especificada. Scipy dispone de la función **ppf()** que nos permite obtener dicho punto para una distribución dada. Esta función también puede ser obtenida haciendo uso de la función **isf()**.

## Valores crítcos para una gausiana

In [3]:
#Definimos la probabilidad
p = 0.95

#Obtenemos el valor crítico
critical_value = norm.ppf(p)
print(critical_value)

#Confirmamos con la cdf
p = norm.cdf(critical_value)
print(p)

1.6448536269514722
0.95


## Valores críticos Student's test

In [5]:
#Definimos los grados de libertad y la probabilidad
p = 0.95
df = 10

#Obtenemos el valor crítico
value = t.ppf(p, df)
print(value)

#Confirmamos con la cdf
p = t.cdf(critical_value, df)
print(p)

1.8124611228107335
0.9344872058225152


## Valores críticos chi-cuadrado

In [8]:
#Definimos la probabilidad y los grados de libertad
p = 0.95
df = 10

#Obtenemos el valor crítico
critical_value = chi2.ppf(p, df)
print(value)

#Confirmamos con la cdf
p = chi2.cdf(critical_value, df)
print(p)

18.307038053275143
0.95
