In [None]:
import pandas as pd
from sklearn.model_selection import cross_val_predict
from sklearn.metrics import f1_score, confusion_matrix
from sklearn.tree import DecisionTreeClassifier
from sklearn.naive_bayes import GaussianNB
from sklearn.neural_network import MLPClassifier

# Carregar os dados
x = pd.read_csv('Processed_data.csv')
y = pd.read_csv("grupos.csv")["group"]

# Criar os modelos
treeModel = DecisionTreeClassifier(random_state=42)
NBModel = GaussianNB()
MLPModel = MLPClassifier(random_state=42,max_iter=1500)


# Função para calcular o F1-score e a matriz de confusão
def evaluate_model(model, x, y):
    # Realizar a validação cruzada com 10 folds e prever as classes
    y_pred = cross_val_predict(model, x, y, cv=10)
    # Calcular o F1-score
    f1 = f1_score(y, y_pred, average='weighted')
    # Calcular a matriz de confusão
    cm = confusion_matrix(y, y_pred)
    return f1, cm

# Avaliar o modelo de árvore de decisão
tree_f1, tree_cm = evaluate_model(treeModel, x, y)
print("Árvore de Decisão:")
print("F1-score:", tree_f1)
print("Matriz de Confusão:")
print(tree_cm)

# Avaliar o modelo Naive Bayes
NB_f1, NB_cm = evaluate_model(NBModel, x, y)
print("\nNaive Bayes:")
print("F1-score:", NB_f1)
print("Matriz de Confusão:")
print(NB_cm)

# Avaliar o modelo MLP
MLP_f1, MLP_cm = evaluate_model(MLPModel, x, y)
print("\nMLP:")
print("F1-score:", MLP_f1)
print("Matriz de Confusão:")
print(MLP_cm)


In [None]:
import pandas as pd
import matplotlib.pyplot as plt
from sklearn.cluster import KMeans
from sklearn.preprocessing import StandardScaler

# Carregar os dados
x = pd.read_csv('Processed_data.csv')

# Normalizar os dados
scaler = StandardScaler()
x_scaled = scaler.fit_transform(x)

# Calcular a soma dos quadrados das distâncias para diferentes números de clusters
wcss = []
for i in range(1,9):
    kmeans = KMeans(n_clusters=i, init='k-means++', random_state=42)
    kmeans.fit(x_scaled)
    wcss.append(kmeans.inertia_)

# Plotar o gráfico do teste do cotovelo
plt.plot(range(1, 9), wcss, marker='o', linestyle='--')
plt.title('Teste do Cotovelo')
plt.xlabel('Número de Clusters')
plt.ylabel('Soma dos Quadrados das Distâncias')
plt.show()
