In [1]:
import pandas as pd
from scipy.stats import anderson
import numpy as np

def anderson_darling_p_value(statistic):
    """Calcula el valor p aproximado para el estadístico de Anderson-Darling."""
    if statistic < 0.2:
        return 1 - np.exp(-13.436 + 101.14 * statistic - 223.73 * statistic**2)
    elif statistic < 0.34:
        return 1 - np.exp(-8.318 + 42.796 * statistic - 59.938 * statistic**2)
    elif statistic < 0.6:
        return np.exp(0.9177 - 4.279 * statistic - 1.38 * statistic**2)
    elif statistic < 10:
        return np.exp(1.2937 - 5.709 * statistic + 0.0186 * statistic**2)
    else:
        return np.exp(1.2937 - 5.709 * 10 + 0.0186 * 10**2)

# Cargar el archivo CSV
df = pd.read_csv("TempMax.csv")

# Obtener la lista de estaciones únicas
estaciones = df['ID_CIDERH'].unique()

# Nivel de significancia para la prueba de Anderson-Darling
significance_level = 0.05

# Iterar sobre cada estación
for estacion_id in estaciones:
    # Filtrar los datos para la estación ID_CIDERH específica
    estacion_data = df[df['ID_CIDERH'] == estacion_id]

    # Seleccionar la variable de interés (TEMP_MAX_RBE)
    temp_min_data = estacion_data['TEMP_MAX_RBE']

    # Eliminar valores NaN si es necesario
    temp_min_data = temp_min_data.dropna()

    # Calcular la prueba de Anderson-Darling
    result = anderson(temp_min_data, dist='norm')

    print("Resultados de la prueba de Anderson-Darling para la estación", estacion_id)
    print("Estadístico de Anderson-Darling:", result.statistic)

    # Calcular el valor p aproximado
    p_value = anderson_darling_p_value(result.statistic)
    print("Valor p aproximado: {:.2e}".format(p_value))

    # Evaluar si se rechaza la hipótesis nula al nivel de significancia dado
    if p_value < significance_level:
        print(f"La hipótesis nula se rechaza al nivel de significancia {significance_level}.")
    else:
        print(f"No se puede rechazar la hipótesis nula al nivel de significancia {significance_level}.")

Resultados de la prueba de Anderson-Darling para la estación M_017_A_II
Estadístico de Anderson-Darling: 19.330704601522484
Valor p aproximado: 3.76e-24
La hipótesis nula se rechaza al nivel de significancia 0.05.
Resultados de la prueba de Anderson-Darling para la estación M_024_A_II
Estadístico de Anderson-Darling: 14.20686757320982
Valor p aproximado: 3.76e-24
La hipótesis nula se rechaza al nivel de significancia 0.05.
Resultados de la prueba de Anderson-Darling para la estación M_023_A_II
Estadístico de Anderson-Darling: 16.84239258100206
Valor p aproximado: 3.76e-24
La hipótesis nula se rechaza al nivel de significancia 0.05.
Resultados de la prueba de Anderson-Darling para la estación M_027_A_II
Estadístico de Anderson-Darling: 17.727149261914747
Valor p aproximado: 3.76e-24
La hipótesis nula se rechaza al nivel de significancia 0.05.


In [2]:
from statsmodels.stats.diagnostic import lilliefors

# Cargar datos desde el archivo CSV
archivo_csv = "TempMax.csv"
datos = pd.read_csv(archivo_csv, low_memory=False)

# Filtrar datos para la variable TEMP_MIN_RBE
variable_interes = 'TEMP_MAX_RBE'

# Iterar sobre cada estación meteorológica
estaciones = datos['ID_CIDERH'].unique()

for estacion in estaciones:
    # Filtrar datos para la estación actual
    datos_estacion = datos[datos['ID_CIDERH'] == estacion][variable_interes]

    # Realizar prueba de normalidad de Lilliefors
    estadistico, p_valor = lilliefors(datos_estacion)

    # Imprimir resultados
    print(f"Estación: {estacion}")
    print(f"Estadístico de prueba: {estadistico}")
    print(f"P-valor: {p_valor}")

Estación: M_017_A_II
Estadístico de prueba: 0.04371423755318793
P-valor: 0.0009999999999998899
Estación: M_024_A_II
Estadístico de prueba: 0.0361689977041586
P-valor: 0.0009999999999998899
Estación: M_023_A_II
Estadístico de prueba: 0.05687367292243517
P-valor: 0.0009999999999998899
Estación: M_027_A_II
Estadístico de prueba: 0.04127708884455239
P-valor: 0.0009999999999998899


In [3]:
import pandas as pd
from scipy.stats import kstest, norm

# Cargar el archivo CSV
df = pd.read_csv("TempMax.csv")

# Obtener la lista de estaciones únicas
estaciones = df['ID_CIDERH'].unique()

# Iterar sobre cada estación
for estacion_id in estaciones:
    # Filtrar los datos para la estación ID_CIDERH específica
    estacion_data = df[df['ID_CIDERH'] == estacion_id]

    # Seleccionar la variable de interés (TEMP_MAX_RBE)
    temp_min_data = estacion_data['TEMP_MAX_RBE']

    # Eliminar valores NaN si es necesario
    temp_min_data = temp_min_data.dropna()

    # Normalizar los datos a una distribución normal estándar
    mean = temp_min_data.mean()
    std = temp_min_data.std()
    standardized_data = (temp_min_data - mean) / std

    # Calcular la prueba de Kolmogorov-Smirnov
    statistic, p_value = kstest(standardized_data, 'norm')

    print("Resultados de la prueba de Kolmogorov-Smirnov para la estación", estacion_id)
    print("Estadístico de prueba:", statistic)
    print("Valor p: {:.2e}".format(p_value))

    # Evaluar si se rechaza la hipótesis nula al nivel de significancia dado
    if p_value < significance_level:
        print(f"La hipótesis nula se rechaza al nivel de significancia {significance_level}.")
    else:
        print(f"No se puede rechazar la hipótesis nula al nivel de significancia {significance_level}.")

Resultados de la prueba de Kolmogorov-Smirnov para la estación M_017_A_II
Estadístico de prueba: 0.04371423755318804
Valor p: 9.52e-11
La hipótesis nula se rechaza al nivel de significancia 0.05.
Resultados de la prueba de Kolmogorov-Smirnov para la estación M_024_A_II
Estadístico de prueba: 0.0361689977041586
Valor p: 1.71e-07
La hipótesis nula se rechaza al nivel de significancia 0.05.
Resultados de la prueba de Kolmogorov-Smirnov para la estación M_023_A_II
Estadístico de prueba: 0.05687367292243495
Valor p: 8.50e-15
La hipótesis nula se rechaza al nivel de significancia 0.05.
Resultados de la prueba de Kolmogorov-Smirnov para la estación M_027_A_II
Estadístico de prueba: 0.04127708884455217
Valor p: 1.25e-09
La hipótesis nula se rechaza al nivel de significancia 0.05.
