In [1]:
import matplotlib.pyplot as plt
from sklearn.decomposition import PCA
from sklearn.datasets import load_iris
import pandas as pd



In [2]:
# Carregar dataset
iris = load_iris()
X = iris.data
y = iris.target
target_names = iris.target_names



In [None]:
# ---------- Visualização em 4 dimensões (scatter matrix) ----------
df = pd.DataFrame(X, columns=iris.feature_names)
df['target'] = y

pd.plotting.scatter_matrix(
    df.iloc[:, :-1],
    c=df['target'],
    figsize=(8, 8),
    diagonal='hist',
    marker='o',
    alpha=0.8
)
plt.suptitle("Visualização em 4 dimensões (scatter matrix)", y=1.02)
plt.show()


In [None]:
# ---------- PCA para 2 dimensões ----------
pca_2d = PCA(n_components=2)
X_pca = pca_2d.fit_transform(X)

plt.figure(figsize=(8,6))
colors = ['navy', 'turquoise', 'darkorange']
for color, i, target_name in zip(colors, [0, 1, 2], target_names):
    plt.scatter(
        X_pca[y == i, 0],
        X_pca[y == i, 1],
        alpha=0.7,
        color=color,
        label=target_name
    )

plt.xlabel("Componente Principal 1")
plt.ylabel("Componente Principal 2")
plt.title("PCA - Redução de 4 para 2 dimensões")
plt.legend()
plt.grid(True)
plt.show()

print("Variância explicada (2D):", pca_2d.explained_variance_ratio_)

In [None]:
# ---------- Scree Plot (variância explicada por componente) ----------
pca_full = PCA(n_components=4)
pca_full.fit(X)

plt.figure(figsize=(8,6))
plt.bar(range(1, 5), pca_full.explained_variance_ratio_, alpha=0.7, color='skyblue')
plt.plot(range(1, 5), pca_full.explained_variance_ratio_, marker='o', color='red')
plt.xticks(range(1, 5))
plt.xlabel("Componente Principal")
plt.ylabel("Proporção da Variância Explicada")
plt.title("Scree Plot - PCA no dataset Iris")
plt.grid(True)
plt.show()

print("Variância explicada (4D):", pca_full.explained_variance_ratio_)