In [6]:
# Importação de bibliotecas
import pandas as pd
from sklearn.metrics import f1_score, accuracy_score
from sklearn.ensemble import RandomForestClassifier
from sklearn.svm import SVC

# Base de treino e teste sendo carregada
X_train = pd.read_csv("train_features.csv")
y_train = pd.read_csv("train_labels.csv").squeeze()
X_test = pd.read_csv("test_features.csv")
y_test = pd.read_csv("test_labels.csv").squeeze()

# Resultados do Greedy Search sendo carregados
results_df = pd.read_csv("hyperparameter_search_results.csv")

# DataFrame SyskillWebert.csv com os resultados
print("Resultados do Greedy Search:")
display(results_df)

# Identificando os melhores hiperparâmetros para cada modelo
best_rf_params = results_df[results_df["Model"] == "RandomForest"].iloc[0]["Params"]
best_svm_params = results_df[results_df["Model"] == "SVM"].iloc[0]["Params"]

# Treinando os modelos com os melhores hiperparâmetros
print("Treinando RandomForest com os melhores hiperparâmetros!")
rf = RandomForestClassifier(**eval(best_rf_params), random_state=42)
rf.fit(X_train, y_train)

print("Treinando SVM com os melhores hiperparâmetros!")
svm = SVC(**eval(best_svm_params), random_state=42)
svm.fit(X_train, y_train)

# Avaliando os modelos
rf_preds = rf.predict(X_test)
svm_preds = svm.predict(X_test)

rf_f1_macro = f1_score(y_test, rf_preds, average="macro")
rf_f1_micro = f1_score(y_test, rf_preds, average="micro")
rf_accuracy = accuracy_score(y_test, rf_preds)

svm_f1_macro = f1_score(y_test, svm_preds, average="macro")
svm_f1_micro = f1_score(y_test, svm_preds, average="micro")
svm_accuracy = accuracy_score(y_test, svm_preds)

# Exibindo as métricas
print("\nMetricas - RandomForest:")
print(f"F1 Score (Macro): {rf_f1_macro}")
print(f"F1 Score (Micro): {rf_f1_micro}")
print(f"Accuracia: {rf_accuracy}")

print("\nMetricas - SVM:")
print(f"F1 Score (Macro): {svm_f1_macro}")
print(f"F1 Score (Micro): {svm_f1_micro}")
print(f"Accuracia: {svm_accuracy}")

# Interpretando os resultados
print("\nInterpretação:")
if rf_accuracy > svm_accuracy:
    print(f"O modelo RandomForest apresentou melhor desempenho geral com acurácia de {rf_accuracy}.")
else:
    print(f"O modelo SVM apresentou melhor desempenho geral com acurácia de {svm_accuracy}.")
print("Os melhores hiperparâmetros foram selecionados com base na validação cruzada durante o Greedy Search.")



Resultados do Greedy Search:


Unnamed: 0,Model,Params,CV_Score
0,RandomForest,"{'max_depth': None, 'min_samples_split': 2, 'n...",0.408316
1,RandomForest,"{'max_depth': None, 'min_samples_split': 2, 'n...",0.41188
2,RandomForest,"{'max_depth': None, 'min_samples_split': 2, 'n...",0.419357
3,RandomForest,"{'max_depth': None, 'min_samples_split': 5, 'n...",0.404542
4,RandomForest,"{'max_depth': None, 'min_samples_split': 5, 'n...",0.415584
5,RandomForest,"{'max_depth': None, 'min_samples_split': 5, 'n...",0.419357
6,RandomForest,"{'max_depth': None, 'min_samples_split': 10, '...",0.408316
7,RandomForest,"{'max_depth': None, 'min_samples_split': 10, '...",0.419357
8,RandomForest,"{'max_depth': None, 'min_samples_split': 10, '...",0.419357
9,RandomForest,"{'max_depth': 10, 'min_samples_split': 2, 'n_e...",0.408246


Treinando RandomForest com os melhores hiperparâmetros!
Treinando SVM com os melhores hiperparâmetros!

Metricas - RandomForest:
F1 Score (Macro): 0.14893617021276595
F1 Score (Micro): 0.417910447761194
Accuracia: 0.417910447761194

Metricas - SVM:
F1 Score (Macro): 0.14736842105263157
F1 Score (Micro): 0.417910447761194
Accuracia: 0.417910447761194

Interpretação:
O modelo SVM apresentou melhor desempenho geral com acurácia de 0.417910447761194.
Os melhores hiperparâmetros foram selecionados com base na validação cruzada durante o Greedy Search.
