In [None]:
# Uniform Manifold Approximation and Projection
# Change the NAME.csv

!pip install umap-learn

import pandas as pd
import umap
import matplotlib.pyplot as plt

# Carregar o arquivo CSV
df = pd.read_csv('NAME.csv')

# Separar os dados dos espectros e as classes
# Assumindo que a primeira coluna é a classe e as demais são os espectros
X = df.iloc[:, 1:]  # Dados dos espectros (da segunda coluna em diante)
y = df.iloc[:, 0]   # Classes (primeira coluna)

# Inicializar e aplicar UMAP
reducer = umap.UMAP(random_state=42) # random_state para reprodutibilidade
embedding = reducer.fit_transform(X)

# Criar um DataFrame com o resultado do UMAP e as classes
embedding_df = pd.DataFrame(embedding, columns=['UMAP1', 'UMAP2'])
embedding_df['Classe'] = y

# Visualizar os resultados
plt.figure(figsize=(10, 8))
for classe in embedding_df['Classe'].unique():
    subset = embedding_df[embedding_df['Classe'] == classe]
    plt.scatter(subset['UMAP1'], subset['UMAP2'], label=classe)

plt.title('Projeção UMAP dos Espectros FTIR')
plt.xlabel('Componente UMAP 1')
plt.ylabel('Componente UMAP 2')
plt.legend()
plt.grid(True)
plt.show()


In [None]:
# Classifiaction Report

import pandas as pd
import umap
import matplotlib.pyplot as plt
from sklearn.model_selection import train_test_split
from sklearn.ensemble import RandomForestClassifier
from sklearn.metrics import classification_report, accuracy_score
import seaborn as sns


# Carregar o arquivo CSV
df = pd.read_csv('NAME.csv')

# Separar os dados dos espectros e as classes
# Assumindo que a primeira coluna é a classe e as demais são os espectros
X = df.iloc[:, 1:]  # Dados dos espectros (da segunda coluna em diante)
y = df.iloc[:, 0]   # Classes (primeira coluna)

# Dividir os dados em conjuntos de treino e teste
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

# Treinar um classificador (usando RandomForest como exemplo)
model = RandomForestClassifier(n_estimators=100, random_state=42)
model.fit(X_train, y_train)

# Fazer previsões no conjunto de teste
y_pred = model.predict(X_test)

# Calcular a acurácia
accuracy = accuracy_score(y_test, y_pred)
print(f"Acurácia do modelo: {accuracy:.4f}")

# Gerar o Classification Report
report = classification_report(y_test, y_pred, output_dict=True)

# Converter o report para um DataFrame para visualização em tabela
report_df = pd.DataFrame(report).transpose()

# Remover as linhas 'accuracy', 'macro avg' e 'weighted avg' se desejar focar nas classes
report_df = report_df.drop(['accuracy', 'macro avg', 'weighted avg'], errors='ignore')

# Criar a figura e o eixo para a tabela
fig, ax = plt.subplots(figsize=(8, len(report_df) * 0.5 + 1)) # Ajustar tamanho da figura
ax.axis('off') # Ocultar os eixos

# Criar a tabela a partir do DataFrame
table = ax.table(cellText=report_df.values,
                 colLabels=report_df.columns,
                 rowLabels=report_df.index,
                 cellLoc='center',
                 loc='center')

# Estilizar a tabela
table.auto_set_font_size(False)
table.set_fontsize(10)
table.scale(1.2, 1.2) # Escalar a tabela para melhor visualização

# Adicionar título
ax.set_title('Classification Report em Tabela', fontsize=14, pad=20)

plt.show()
