# Prueba de Mann-Whitney

## Objeto
Comprobar si hay diferencias significativas entre **dos grupos**.
Restricciones:
* La distribución es **NO paramétrica**
* Los grupos son **independientes**
* Los datos son ordinales o coninuos

Ho: No hay diferencia significativa;

H1: Hay diferencia

<a href="https://docs.scipy.org/doc/scipy/reference/generated/scipy.stats.mannwhitneyu.html">Scypy Mannwhitneyu</a>

## 0.Preparación librerias y definición de fórmulas# 

In [1]:
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
from scipy import stats
from scipy.stats import mannwhitneyu
from statsmodels.stats.diagnostic import normal_ad
from scipy.stats import shapiro

In [27]:
#Comprobación de Ho

def checkho(p_value_thresh, p_value):
    print("Para un p_value=",p_value)
    if p_value < p_value_thresh:
        print('Se rechaza la hipótesis nula, podemos asumir diferencias significativas')
    else:
        print('Se acepta la hipótesis nula, no podemos asumir diferencias significativas')

## 1.Preanalisis de los datos


In [2]:
file = './Datos/homogeneidad3grupos.csv'

In [3]:
# Carga de datos
df_data=pd.read_csv(file)

In [6]:
df_data.head()

Unnamed: 0,salary,position
0,57727.0,2.0
1,39907.0,1.0
2,46659.0,2.0
3,40233.0,1.0
4,42198.0,1.0


## 2.Cálculo de la diferencia significativa 

In [8]:
group1=df_data[df_data.position==1.0]
group2=df_data[df_data.position==2.0]
group1.head()

Unnamed: 0,salary,position
1,39907.0,1.0
3,40233.0,1.0
4,42198.0,1.0
6,40324.0,1.0
8,36792.0,1.0


### Pregunta 1: ¿Cobran significativamente menos el grupo1 frente al 2?


In [28]:
#Aplicación de la prueba MannWhitneyu
#Utilizamos como alternativa "less" porque queremos saber si el grupo1 cobra significativamente
#menos que el grupo 2
stat, p_value = mannwhitneyu(group1.salary, group2.salary,alternative='less')

p_value_thresh=0.05
checkho(p_value_thresh, p_value)

Para un p_value= 0.0014136360455584039
Se rechaza la hipótesis nula, podemos asumir diferencias significativas


**Explicación**: Como rechazamos la Ho (No hay diferecias siginificativa) y como la **alternativa** es 'less'; la conclusión es que el grupo 1 cobra significativamente menos que el grupo 2

### Pregunta 2: ¿Cobran significativamente menos el grupo2 frente al 1?


In [29]:
#Aplicación de la prueba MannWhitneyu
#Utilizamos como alternativa "less" porque queremos saber si el grupo1 cobra significativamente
#menos que el grupo 2
stat, p_value = mannwhitneyu(group2.salary, group1.salary,alternative='less')

p_value_thresh=0.05
checkho(p_value_thresh, p_value)

Para un p_value= 0.9988988900287514
Se acepta la hipótesis nula, no podemos asumir diferencias significativas


**Explicación**: Como no rechazamos la Ho (Ho=No hay diferecias siginificativa) y como la **alternativa** es 'less'; la conclusión es que el grupo 2 no cobra significativamente menos que el grupo 1

### Pregunta 3: ¿Hay diferencia significativa entre lo que cobra el grupo2 frente al 1?


In [32]:
#Aplicación de la prueba MannWhitneyu
#Utilizamos como alternativa "less" porque queremos saber si el grupo1 cobra significativamente
#menos que el grupo 2
stat, p_value = mannwhitneyu(group2.salary, group1.salary,alternative='two-sided')

p_value_thresh=0.05
checkho(p_value_thresh, p_value)

Para un p_value= 0.0028272720911168077
Se rechaza la hipótesis nula, podemos asumir diferencias significativas


**Explicación**: Como no rechazamos la Ho (Ho=No hay diferecias siginificativa) y como la **alternativa** es 'two-sided'; la conclusión es que encontramos diferencias significativas entre lo que cobran ambos grupos, pero no sabemos quien cobra más o menos.

### Pregunta 4: ¿Cobra significativamente más el grupo2 frente al 1?

In [33]:
#Aplicación de la prueba MannWhitneyu
#Utilizamos como alternativa "less" porque queremos saber si el grupo1 cobra significativamente
#menos que el grupo 2
stat, p_value = mannwhitneyu(group2.salary, group1.salary,alternative='greater')

p_value_thresh=0.05
checkho(p_value_thresh, p_value)

Para un p_value= 0.0014136360455584039
Se rechaza la hipótesis nula, podemos asumir diferencias significativas


**Explicación**: Como no rechazamos la Ho (Ho=No hay diferecias siginificativa) y como la **alternativa** es 'greater'; la conclusión es que encontramos diferencias significativas entre lo que cobran ambos grupos, concretamente se cumple que el grupo 2 cobra significativamente más que el grupo 1.