In [3]:
import pandas as pd
import numpy as np
# Configuração para desabilitar a notação científica no Pandas
pd.set_option('display.float_format', lambda x: '%.3f' % x)
np.set_printoptions(suppress=True)

data = pd.read_csv("../dataset/dados_k_means_2.csv",sep=";")

# Separando as features (atributos) dos rótulos (se houver)
X = data.drop(["Census tract"],axis=1)

# Normalizando os dados
X_centered = X - X.mean(axis=0)

# Calculando a matriz de covariância
covariance_matrix = np.cov(X_centered, rowvar=False)

# Calculando os autovetores (eigenvectors) e autovalores (eigenvalues) da matriz de covariância
eigenvalues, eigenvectors = np.linalg.eig(covariance_matrix)

# Ordenando os autovetores de acordo com os autovalores
sorted_indices = eigenvalues.argsort()[::-1]
eigenvectors_sorted = eigenvectors[:, sorted_indices]
eigenvalues_sorted = eigenvalues[sorted_indices]

# Calculando a variância explicada por cada componente principal
explained_variance_ratio = eigenvalues_sorted / np.sum(eigenvalues_sorted)

# Exibindo a variância explicada por cada componente principal
print("Variância explicada por cada componente principal:")
for i, var in enumerate(explained_variance_ratio):
    print(f"Componente Principal {i+1}: {var:.6f}")

# Exibindo os autovetores (componentes principais)
print("\nAutovetores (Componentes Principais):")
for i, vec in enumerate(eigenvectors_sorted.T):
    print(f"Componente Principal {i+1}: {vec}")

Variância explicada por cada componente principal:
Componente Principal 1: 0.692723
Componente Principal 2: 0.134226
Componente Principal 3: 0.075134
Componente Principal 4: 0.045171
Componente Principal 5: 0.019257
Componente Principal 6: 0.017599
Componente Principal 7: 0.010157
Componente Principal 8: 0.002496
Componente Principal 9: 0.001117
Componente Principal 10: 0.000834
Componente Principal 11: 0.000762
Componente Principal 12: 0.000462
Componente Principal 13: 0.000047
Componente Principal 14: 0.000015
Componente Principal 15: 0.000001

Autovetores (Componentes Principais):
Componente Principal 1: [ 0.00255881  0.00053141  0.05618445  0.00365121  0.03113817 -0.01965171
  0.25479923  0.0011621   0.0454721  -0.00021402 -0.05010109 -0.95768575
  0.03878525 -0.08543394  0.00050773]
Componente Principal 2: [ 0.00500194 -0.00490746  0.10866497  0.00571826  0.03097137 -0.07666309
  0.58590759  0.00370908  0.07533563 -0.00252261 -0.15555518  0.20397156
  0.75186641  0.03442529  0.000