## Spearman's Correlation

In [1]:
def import_csv(file):
    import pandas as pd
    return pd.read_csv(file)

path="Terminos_lagoon_TA_DIC_2023_RawData.csv"

data=import_csv(path)

In [2]:
from scipy import stats

def test_spearman(x, y, alpha=0.05):
    if len(x) != len(y):
        raise ValueError("Las variables deben tener la misma longitud.")

    rho, pval = stats.spearmanr(x, y)

    print(f"Spearman's correlation coefficient (rho): {rho:.3f}")
    print(f"p-value: {pval:.4f}")

    if pval < alpha:
        print(f"✔️ Significant relationship (p < {alpha:.3f})")
    else:
        print(f"⚠️ No significant relationship (p ≥ {alpha:.3f})")

    if rho > 0:
        print("📈 Positive correlation")
    else:
        print("📉 Negative correlation")

In [4]:
test_spearman(data["ta_micromol_kg"], data["dic_micromol_kg"])

Spearman's correlation coefficient (rho): 0.838
p-value: 0.0000
✔️ Significant relationship (p < 0.050)
📈 Positive correlation


## Exercise: Create a function to compute the Pearson correlation.

In [11]:
def pearson_correlation(x, y):
    if len(x) != len(y):
        raise ValueError("Las dos listas deben tener la misma longitud")
    
    n = len(x)
    mean_x = sum(x) / n
    mean_y = sum(y) / n
    
    numerator = sum((x[i] - mean_x) * (y[i] - mean_y) for i in range(n))
    denominator = (sum((x[i] - mean_x) ** 2 for i in range(n)) ** 0.5) * \
                  (sum((y[i] - mean_y) ** 2 for i in range(n)) ** 0.5)
    
    if denominator == 0:
        return 0
    
    return numerator / denominator

# Extraer las dos variables de interés como listas
x = data["temp_c"].dropna().tolist()
y = data["do_mg_l"].dropna().tolist()

# Asegurar que ambas listas tengan la misma longitud
min_len = min(len(x), len(y))
x = x[:min_len]
y = y[:min_len]

# Calcular Pearson
r = pearson_correlation(x, y)
print("Correlación de Pearson entre Temp y DO(mg/L):", r)

# Función de interpretación
def interpret_correlation(r):
    if abs(r) < 0.1:
        return "muy débil o inexistente"
    elif abs(r) < 0.3:
        return "débil"
    elif abs(r) < 0.5:
        return "moderada"
    elif abs(r) < 0.7:
        return "fuerte"
    else:
        return "muy fuerte"

# Imprimir resultado con interpretación
print(f"Correlación de Pearson entre TA y DIC: {r:.3f}")
print(f"Interpretación: La relación es {interpret_correlation(r)} "
    f"y de dirección {'positiva' if r > 0 else 'negativa'}.")

Correlación de Pearson entre Temp y DO(mg/L): -0.061786122147790605
Correlación de Pearson entre TA y DIC: -0.062
Interpretación: La relación es muy débil o inexistente y de dirección negativa.
