## Test no paramétricos (Mann-Whitney U, Wilcoxon, Kruskal-Wallis y Spearman o Kendall)

In [1]:
import numpy as np
import matplotlib.pyplot as plt
import pandas as pd
import seaborn as sns
from scipy.optimize import minimize
from scipy.stats import jarque_bera
import cvxpy as cp
from cvxopt import matrix, solvers
import requests
import json
import urllib3
urllib3.disable_warnings()
from datetime import datetime
import pytz

### Prueba de Mann-Whitney U

Este test es útil cuando se desea comparar la distribución de dos grupos independientes para ver si provienen de la misma población.

Supongamos que quieres comparar los precios de dos acciones específicas, como ALUA y GGAL.

In [None]:
from scipy.stats import mannwhitneyu

# Selección de dos series de datos (por ejemplo, ALUA y GGAL)
data1 = data['ALUA']
data2 = data['GGAL']

# Prueba de Mann-Whitney U
stat, p_value = mannwhitneyu(data1, data2)

print(f'Estadístico U: {stat}')
print(f'P-valor: {p_value}')

La Prueba de Mann-Whitney U ha arrojado los siguientes resultados:

- Estadístico U: 74,000.0
- P-valor: 4.848 x $10^{−35}$

El p-valor es extremadamente bajo, lo que sugiere que hay una diferencia significativa entre las distribuciones de los precios de las acciones ALUA y GGAL. Esto indica que es muy poco probable que ambas series de datos provengan de la misma población.

### Prueba de Wilcoxon

Se utiliza para comparar dos muestras relacionadas o pareadas. En el contexto de los precios de las acciones, se aplicaría si tienes dos series de datos relacionadas, como precios de una acción en dos momentos diferentes.

Para realizar esta prueba, ambas series deben tener el mismo número de observaciones. Si estás comparando la misma acción en dos momentos diferentes, asegúrate de que las series están alineadas correctamente.

Consideraciones:
- Asegúrate de que las dos series tengan el mismo tamaño.
- Si las dos series no tienen la misma longitud, no se puede realizar esta prueba sin recortar o ajustar los datos.

Supongamos que quieres comparar los precios de la acción ALUA en dos días específicos:

In [None]:
from scipy.stats import wilcoxon

# Ejemplo: comparar los precios de ALUA en dos fechas diferentes
# Supongamos que quieres comparar los primeros 100 registros con los siguientes 100 registros
data1 = data['ALUA'].iloc[:100]
data2 = data['ALUA'].iloc[100:200]

# Prueba de Wilcoxon
stat, p_value = wilcoxon(data1, data2)

print(f'Estadístico W: {stat}')
print(f'P-valor: {p_value}')

La Prueba de Wilcoxon ha arrojado los siguientes resultados:

- Estadístico W: 2067.0
- P-valor: 0.1153
  
En este caso, el p-valor es mayor que el umbral típico de 0.05, lo que indica que no hay suficiente evidencia para rechazar la hipótesis nula. Esto sugiere que no hay una diferencia significativa en los precios de la acción ALUA entre los dos segmentos de tiempo que hemos comparado.

### Prueba de Kruskal-Wallis

Se utiliza para comparar tres o más grupos independientes para determinar si al menos uno de los grupos difiere significativamente de los demás. Es una alternativa no paramétrica al ANOVA y no requiere que los datos sigan una distribución normal.

Voy a realizar la Prueba de Kruskal-Wallis para comparar tres series de datos de diferentes acciones. Supongamos que queremos comparar ALUA, GGAL, y YPFD.

In [None]:
from scipy.stats import kruskal

# Seleccionar tres series de datos de diferentes acciones
data1 = data['ALUA']
data2 = data['GGAL']
data3 = data['YPFD']

# Prueba de Kruskal-Wallis
stat, p_value = kruskal(data1, data2, data3)

print(f'Estadístico H: {stat}')
print(f'P-valor: {p_value}')

La Prueba de Kruskal-Wallis ha arrojado los siguientes resultados:

- Estadístico H: 952.66
- P-valor: 1.355 x $10^{−207}$
 
El p-valor es extremadamente bajo, lo que sugiere que hay diferencias significativas entre las distribuciones de los precios de las acciones ALUA, GGAL, y YPFD. Esto indica que al menos uno de los grupos difiere significativamente de los demás.

### Prueba de Spearman o Kendall

Es una medida no paramétrica de la correlación (dependencia estadística) entre dos variables. Esta prueba evalúa cómo una variable se ordena respecto a otra, lo que es útil cuando las relaciones no son lineales o cuando los datos no siguen una distribución normal.

Voy a calcular la correlación de Spearman entre dos series de precios, por ejemplo, ALUA y GGAL.

In [None]:
from scipy.stats import spearmanr

# Seleccionar dos series de datos
data1 = data['ALUA']
data2 = data['GGAL']

# Prueba de Correlación de Spearman
corr, p_value = spearmanr(data1, data2)

print(f'Coeficiente de Correlación de Spearman: {corr}')
print(f'P-valor: {p_value}')

La Prueba de Correlación de Spearman ha arrojado los siguientes resultados:

- Coeficiente de Correlación de Spearman: 0.925
- P-valor: 5.105 x $10^{−218}$
 
El coeficiente de correlación de Spearman es muy alto (cerca de 1), lo que indica una fuerte correlación positiva entre los precios de las acciones ALUA y GGAL. El p-valor extremadamente bajo sugiere que esta correlación es estadísticamente significativa.

Esto significa que, en general, cuando los precios de ALUA suben, los precios de GGAL también tienden a subir, y viceversa.