# Test NO paramétricos:

Son aquellos test que **no** hacen supuestos sobre la distribución de los datos o varianzas iguales. En lugar de ello, `utilizan rangos o posiciones ordenadas` para hacer las comparaciones.

![img](img/img5.jpeg)

Estos tests son útiles cuando no se cumplen los supuestos requeridos para los tests paramétricos, como la normalidad, la homogeneidad de las varianzas o la independencia de las observaciones.

Algunos de los *test no paramétricos más comunes* son:

- **Prueba U de Mann-Whitney**: se utiliza para comparar las medianas de dos grupos independientes.

- **Prueba de Wilcoxon**: se utiliza para comparar las medianas de dos grupos pareados.

- **Prueba de Kruskal-Wallis**: se utiliza para comparar las medianas de tres o más grupos independientes.

- Prueba de Friedman: se utiliza para comparar las medianas de tres o más grupos pareados.


Los test no paramétricos no requieren los mismos supuestos que los test paramétricos, pero aún así tienen ciertas **consideraciones que deben ser tomadas en cuenta** al elegir y realizar la prueba. A continuación, se presentan algunos supuestos necesarios en algunos de los test no paramétricos más comunes:

- ***Prueba U de Mann-Whitney***: Los dos grupos independientes deben ser independientes y se supone que se extraen de poblaciones con la misma forma de distribución y la misma variabilidad.

- ***Prueba de Wilcoxon***: Los dos grupos pareados deben ser independientes y se supone que se extraen de poblaciones con la misma forma de distribución y la misma variabilidad.

- ***Prueba de Kruskal-Wallis***: Los grupos independientes deben ser independientes y se supone que se extraen de poblaciones con la misma forma de distribución y la misma variabilidad.

- *Prueba de Friedman*: Los grupos pareados deben ser independientes y se supone que se extraen de poblaciones con la misma forma de distribución y la misma variabilidad.


## Prueba U de Mann-Whitney

El U-test es una prueba no paramétrica que se utiliza para comparar dos grupos independientes y determinar si las `medianas de ambas muestras son estadísticamente diferentes`.

Hipótesis nula y alternativa: 

- H0: las medianas de ambos grupos son iguales
- H1: es que las medianas son diferentes

Datos de entrada: dos muestras independientes de diferentes tamaños.

In [11]:
import seaborn as sns
from scipy.stats import mannwhitneyu

tips = sns.load_dataset("tips")

In [12]:
propina_hombres = tips[tips["sex"]=="Male"]["tip"]
propina_mujeres = tips[tips["sex"]=="Female"]["tip"]

In [13]:
U, p_valor = mannwhitneyu(propina_hombres, propina_mujeres)

print("Estadístico U: ", U)
print("P-valor: ", p_valor)

Estadístico U:  7289.5
P-valor:  0.38335449359363927


In [16]:
# Seleccion del nivel de significancia
alpha = 0.05

# Decisión en función del p-valor y el nivel de significación
if p_valor < alpha:
    print("Rechazar la hipótesis nula: las medianas de ambos grupos son diferentes (p-value: {:.4f})".format(p_valor))
else:
    print("No se puede rechazar la hipótesis nula: las medianas de ambos grupos son iguales (p-value: {:.4f})".format(p_valor))


No se puede rechazar la hipótesis nula: las medianas de ambos grupos son iguales (p-value: 0.3834)


## Prueba de Wilcoxon

Es una prueba no paramétrica que se utiliza para comparar `dos muestras relacionadas` o medidas repetidas en la misma unidad experimental.

Hipótesis nula y alternativa:

- H0: no hay diferencia significativa entre las medianas de las dos muestras relacionadas.
- H1: hay diferencia significativa entre las medianas de las dos muestras relacionadas.

In [52]:
import seaborn as sns
from scipy.stats import wilcoxon

tips = sns.load_dataset("tips")

In [53]:
tips.head()

Unnamed: 0,total_bill,tip,sex,smoker,day,time,size
0,16.99,1.01,Female,No,Sun,Dinner,2
1,10.34,1.66,Male,No,Sun,Dinner,3
2,21.01,3.5,Male,No,Sun,Dinner,3
3,23.68,3.31,Male,No,Sun,Dinner,2
4,24.59,3.61,Female,No,Sun,Dinner,4


> Comparar el precio de los diamantes en función de si son de corte "Ideal" o no.

- H0: los precios de los diamantes no son diferentes entre los dos grupos
- H1: los precios de los diamantes son diferentes entre los dos grupos

In [76]:
lunch = tips[tips['time'] == 'Lunch']['total_bill']
dinner = tips[tips['time'] == 'Dinner']['total_bill']


In [77]:
lunch=lunch.reset_index(drop=True)
dinner=dinner.reset_index(drop=True)

In [83]:
dinner=[dinner[i]for i in range(len(lunch))]

In [85]:
len(lunch)==len(dinner)

True

In [86]:
stat,p_valor = wilcoxon(lunch, dinner)
print("Estadístico: ", stat)
print("P-valor: ", p_valor)

Estadístico:  836.5
P-valor:  0.039768681878979494


In [87]:
# Seleccion del nivel de significancia
alpha = 0.05

# Decisión en función del p-valor y el nivel de significación
if p_valor < alpha:
    print("Rechazar la hipótesis nula: las medianas de ambos grupos son diferentes (p-value: {:.4f})".format(p_valor))
else:
    print("No se puede rechazar la hipótesis nula: las medianas de ambos grupos son iguales (p-value: {:.4f})".format(p_valor))


Rechazar la hipótesis nula: las medianas de ambos grupos son diferentes (p-value: 0.0398)


## Prueba de Kruskal-Wallis

## Chi cuadrado

La prueba chi-cuadrado se utiliza para evaluar si hay una `asociación entre dos variables categóricas`. Para poder realizar esta prueba, es necesario que los datos estén en forma de tabla de contingencia, es decir, una tabla que muestra la frecuencia de cada combinación posible de las dos variables categóricas.

Además, se deben cumplir las siguientes *condiciones*:

- Las observaciones deben ser **independientes** entre sí.

- La muestra debe ser **aleatoria**.

- El **tamaño de la muestra** debe ser suficientemente grande para que las frecuencias esperadas sean al menos 5 en la mayoría de las celdas de la tabla de contingencia.

Si se cumplen estas condiciones, se puede realizar la prueba chi-cuadrado para evaluar si existe una asociación estadísticamente significativa entre las dos variables categóricas.

### Prueba de independencia chi-cuadrado:

In [1]:
import numpy as np
import pandas as pd
import seaborn as sns
from scipy.stats import chi2_contingency

penguins = sns.load_dataset("penguins").dropna()
cross_tab = pd.crosstab(index = penguins.species, columns=penguins.sex)
cross_tab_matrix = np.array(cross_tab)

In [2]:
cross_tab

sex,Female,Male
species,Unnamed: 1_level_1,Unnamed: 2_level_1
Adelie,73,73
Chinstrap,34,34
Gentoo,58,61


In [3]:
# Realizar la prueba chi-cuadrado
estadistico, p_valor, grados_libertad, esperados = chi2_contingency(cross_tab_matrix)

# Mostrar los resultados
print("Estadístico chi-cuadrado:", estadistico)
print("Valor p:", p_valor)
print("Grados de libertad:", grados_libertad)
print("Tabla de frecuencias esperadas:\n", esperados)

Estadístico chi-cuadrado: 0.04860717014078318
Valor p: 0.9759893689765846
Grados de libertad: 2
Tabla de frecuencias esperadas:
 [[72.34234234 73.65765766]
 [33.69369369 34.30630631]
 [58.96396396 60.03603604]]


In [7]:
# Seleccionamos el grado de significancia
alpha = 0.05

# Evaluación de p-valor en función del nivel de significación elegido
if p_valor < alpha:
    print("Rechazar la hipótesis nula: no hay diferencia significativa entre las frecuencias esperadas y las observadas en las tablas de contingencia.")
else:
    print("No se puede rechazar la hipótesis nula: no hay diferencia significativa entre las frecuencias esperadas y las observadas en las tablas de contingencia.")


No se puede rechazar la hipótesis nula: no hay diferencia significativa entre las frecuencias esperadas y las observadas en las tablas de contingencia.


### Prueba de bondad del ajuste chi-cuadrado:

In [8]:
import seaborn as sns
from scipy.stats import chisquare

# Cargamos el dataset de los pingüinos
df = sns.load_dataset('penguins')

# Contamos el número de machos y hembras
n_machos = df['sex'].value_counts()[0]
n_hembras = df['sex'].value_counts()[1]

# Calculamos la proporción de machos y hembras esperada bajo una distribución aleatoria
proporcion_aleatoria = 0.5
n_total = n_machos + n_hembras
n_aleatoria_machos = n_total * proporcion_aleatoria
n_aleatoria_hembras = n_total * (1 - proporcion_aleatoria)

# Realizamos la prueba de bondad de ajuste chi-cuadrado
observados = [n_machos, n_hembras]
esperados = [n_aleatoria_machos, n_aleatoria_hembras]
estadistico, p_valor = chisquare(observados, f_exp=esperados)

print('Estadístico de prueba:', estadistico)
print('p-valor:', p_valor)

Estadístico de prueba: 0.02702702702702703
p-valor: 0.8694170607412391


In [10]:
# Seleccionamos el grado de significancia
alpha = 0.05

# Evaluación de p-valor en función del nivel de significación elegido
if p_valor < alpha:
    print("Rechazar la hipótesis nula: la proporción de sexos NO es la misma que la esperada bajo una distribución aleatoria")
else:
    print("No se puede rechazar la hipótesis nula: la proporción de sexos es la misma que la esperada bajo una distribución aleatoria.")


No se puede rechazar la hipótesis nula: la proporción de sexos es la misma que la esperada bajo una distribución aleatoria.
