## Test de normalidad (Shapiro-Wilk y Kolmogorov-Smirnov)

In [2]:
import numpy as np
import matplotlib.pyplot as plt
import pandas as pd
import seaborn as sns
from scipy.optimize import minimize
from scipy.stats import jarque_bera
import cvxpy as cp
from cvxopt import matrix, solvers
import requests
import json
import urllib3
urllib3.disable_warnings()
from datetime import datetime
import pytz

### Shapiro-Wilk Test:

Este test verifica si una muestra proviene de una distribución normal. Un p-valor bajo (menor a 0.05) sugiere que la hipótesis nula de normalidad debe ser rechazada.

En este caso, todos los p-valores son muy bajos, lo que indica que ninguna de las series de precios sigue una distribución normal.

### Kolmogorov-Smirnov Test:

El test K-S compara la distribución de los datos con una distribución de referencia (en este caso, una distribución normal con la misma media y desviación estándar).

Los resultados indican que para todas las acciones, los p-valores también son extremadamente bajos, reforzando la evidencia de que los datos no siguen una distribución normal.

In [4]:
import pandas as pd
from scipy.stats import kstest, shapiro
import matplotlib.pyplot as plt
import seaborn as sns

# Cargar el DataFrame
data = pd.read_csv('/Users/juanpablomigani/Desktop/Facultad/Trabajo final Diplomatura Data Science/Trabajo/Datos/Datos.csv')

# Función para realizar el Test de Normalidad de Shapiro-Wilk y Kolmogorov-Smirnov para todas las columnas
def normality_tests(data):
    results = {}
    for column in data.columns:
        shapiro_test = shapiro(data[column])
        ks_test = kstest(data[column], 'norm', args=(data[column].mean(), data[column].std()))
        results[column] = {'Shapiro-Wilk Test Statistic': shapiro_test[0], 
                           'Shapiro-Wilk p-value': shapiro_test[1],
                           'K-S Test Statistic': ks_test[0],
                           'K-S p-value': ks_test[1]}
    return pd.DataFrame(results)

# Realizar los tests de normalidad
normality_results = normality_tests(data)

# Visualización de la distribución para cada columna
plt.figure(figsize=(14, 10))
for i, column in enumerate(data.columns, 1):
    plt.subplot(5, 4, i)
    sns.histplot(data[column], kde=True)
    plt.title(column)

plt.tight_layout()
plt.show()

# Mostrar los resultados
print(normality_results)

ValueError: could not convert string to float: '2024-08-23'

Estos resultados sugieren que las series de precios de las acciones en este conjunto de datos no siguen una distribución normal, lo cual es un hallazgo común en datos financieros de alta frecuencia por lo que lo más adecuado sería optar por test no paramétricos para los análisis estadísticos.