# Análisis de correlación

En este cuaderno se genera un conjunto de datos aleatorio y se calcula su matriz de correlación. Se visualiza la matriz de correlación con un mapa de calor sencillo utilizando matplotlib. Este análisis es útil para identificar relaciones lineales entre variables numéricas.


In [None]:

import numpy as np
import pandas as pd
import matplotlib.pyplot as plt

# Generar datos aleatorios
data = pd.DataFrame({
    'Variable_A': np.random.randn(100),
    'Variable_B': np.random.randn(100) * 0.5 + 1,
    'Variable_C': np.random.randn(100) * 2 - 1
})

# Calcular matriz de correlación
corr_matrix = data.corr()
print("Matriz de correlación:
", corr_matrix)

# Visualizar la matriz de correlación
def plot_corr_matrix(corr):
    fig, ax = plt.subplots(figsize=(5, 4))
    cax = ax.matshow(corr, cmap='coolwarm')
    plt.xticks(range(len(corr.columns)), corr.columns, rotation=45)
    plt.yticks(range(len(corr.columns)), corr.columns)
    fig.colorbar(cax)
    for (i, j), val in np.ndenumerate(corr.values):
        ax.text(j, i, f"{val:.2f}", ha='center', va='center', color='white' if abs(val) > 0.5 else 'black')
    plt.title("Mapa de calor de correlación")
    plt.show()

plot_corr_matrix(corr_matrix)
