In [None]:
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
from sklearn.datasets import fetch_covtype
from sklearn.manifold import TSNE
from sklearn.preprocessing import StandardScaler

# Carregar o conjunto de dados Forest covertypes
data = fetch_covtype()
X = data.data
y = data.target

# Padronizar os dados
X_standardized = StandardScaler().fit_transform(X)

# Aplicar t-SNE para redução de dimensionalidade
tsne = TSNE(n_components=2, random_state=42)
X_tsne = tsne.fit_transform(X_standardized)

# Criar DataFrame com as duas primeiras componentes e os rótulos
df = pd.DataFrame(data=X_tsne, columns=['Componente 1', 'Componente 2'])
df['Rótulo'] = y

# Visualizar os resultados
plt.figure(figsize=(10, 8))
colors = [plt.cm.Paired(i) for i in df['Rótulo']]
plt.scatter(df['Componente 1'], df['Componente 2'], c=colors, alpha=0.5)
plt.title('Redução de Dimensionalidade t-SNE para Forest Covertype Dataset')
plt.xlabel('Componente 1')
plt.ylabel('Componente 2')
plt.show()
