In [None]:
import pandas as pd
import numpy as np
from sklearn.model_selection import train_test_split
from sklearn.metrics import accuracy_score, classification_report
from sklearn.linear_model import LogisticRegression
from sklearn.tree import DecisionTreeClassifier
from sklearn.ensemble import RandomForestClassifier
from sklearn.svm import SVC
import matplotlib.pyplot as plt
import seaborn as sns

# Caminho para o arquivo de dados processados
file_path = 'data/processed_dataset.csv'

# Carregar os dados
df = pd.read_csv(file_path)

# Exibir as primeiras linhas do dataframe
df.head()

# Dividir os dados em características (X) e rótulo (y)
X = df[['feature1', 'feature2', 'feature_sum', 'feature_diff']]
y = df['label']

# Dividir os dados em conjuntos de treino e teste
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

# Inicializar o modelo de Regressão Logística
logreg = LogisticRegression(max_iter=1000)

# Treinar o modelo
logreg.fit(X_train, y_train)

# Fazer previsões
y_pred_logreg = logreg.predict(X_test)

# Avaliar o modelo
print("Regressão Logística")
print("Accuracy:", accuracy_score(y_test, y_pred_logreg))
print(classification_report(y_test, y_pred_logreg))

# Inicializar o modelo de Árvore de Decisão
decision_tree = DecisionTreeClassifier()

# Treinar o modelo
decision_tree.fit(X_train, y_train)

# Fazer previsões
y_pred_tree = decision_tree.predict(X_test)

# Avaliar o modelo
print("Árvore de Decisão")
print("Accuracy:", accuracy_score(y_test, y_pred_tree))
print(classification_report(y_test, y_pred_tree))

# Inicializar o modelo de Random Forest
random_forest = RandomForestClassifier()

# Treinar o modelo
random_forest.fit(X_train, y_train)

# Fazer previsões
y_pred_forest = random_forest.predict(X_test)

# Avaliar o modelo
print("Random Forest")
print("Accuracy:", accuracy_score(y_test, y_pred_forest))
print(classification_report(y_test, y_pred_forest))

# Inicializar o modelo de SVM
svm = SVC()

# Treinar o modelo
svm.fit(X_train, y_train)

# Fazer previsões
y_pred_svm = svm.predict(X_test)

# Avaliar o modelo
print("Support Vector Machine (SVM)")
print("Accuracy:", accuracy_score(y_test, y_pred_svm))
print(classification_report(y_test, y_pred_svm))
# Comparar a acurácia dos modelos
results = pd.DataFrame({
    'Modelo': ['Regressão Logística', 'Árvore de Decisão', 'Random Forest', 'SVM'],
    'Acurácia': [
        accuracy_score(y_test, y_pred_logreg),
        accuracy_score(y_test, y_pred_tree),
        accuracy_score(y_test, y_pred_forest),
        accuracy_score(y_test, y_pred_svm)
    ]
})

# Plotar a comparação de acurácia
plt.figure(figsize=(10, 6))
sns.barplot(x='Modelo', y='Acurácia', data=results)
plt.title('Comparação de Modelos')
plt.xticks(rotation=45)
plt.ylim(0, 1)
plt.show()


