In [None]:
import pandas as pd
from sklearn.decomposition import PCA
from sklearn.preprocessing import StandardScaler
import os

# Caminho para o CSV com os nomes dos top 6 (ajuste se precisar)
top6_csv_path = 'top6_knn.csv'

def aplicar_pca(nome_arquivo):
    # Remove possíveis espaços e sufixos extras
    nome_limpo = nome_arquivo.strip().split(' - ')[0]

    if not os.path.isfile(nome_limpo):
        print(f"Aviso: arquivo {nome_limpo} não encontrado, pulando.")
        return

    # Lê o CSV original
    df = pd.read_csv(nome_limpo)

    # Separa features e labels (assume última coluna é a classe)
    X = df.iloc[:, :-1]
    y = df.iloc[:, -1]

    # Normaliza os dados antes do PCA
    scaler = StandardScaler()
    X_norm = scaler.fit_transform(X)

    # Aplica PCA com 10 componentes
    pca = PCA(n_components=10)
    X_pca = pca.fit_transform(X_norm)

    # Cria DataFrame com PCs + classe
    df_pca = pd.DataFrame(X_pca, columns=[f'PC{i+1}' for i in range(10)])
    df_pca['class'] = y

    # Salva novo CSV com sufixo "_pca10"
    novo_nome = nome_limpo.replace('.csv', '_pca10.csv')
    df_pca.to_csv(novo_nome, index=False)

    print(f"PCA aplicado e salvo em: {novo_nome}")

def main():
    top6_df = pd.read_csv(top6_csv_path)

    # Assume que a primeira coluna do top6_knn.csv tem os nomes dos arquivos
    for nome_arquivo in top6_df.iloc[:, 0]:
        aplicar_pca(nome_arquivo)

if __name__ == "__main__":
    main()
