In [3]:
# Importando as bibliotecas
import pandas as pd
from sklearn.model_selection import train_test_split
from sklearn.tree import DecisionTreeClassifier
from sklearn.neighbors import KNeighborsClassifier
from sklearn.metrics import accuracy_score
from sklearn.preprocessing import StandardScaler

In [5]:
# Base de dados
dados = {
'idade': [22, 25, 28, 35, 40, 45, 50, 55, 60, 65],
'renda': [1500, 2000, 2500, 4000, 5000, 6000, 7000, 8000, 10000, 12000],
'historico_bom': [0, 0, 1, 1, 1, 1, 1, 1, 1, 1],
'aprovado': [0, 0, 1, 1, 1, 1, 1, 1, 1, 1] # 1 = aprovado, 0 = negado
}

df = pd.DataFrame(dados)

# Separar X e y
X = df[['idade', 'renda', 'historico_bom']]
y = df['aprovado']

# Dividir os dados em treino e teste (80% treino, 20% teste)
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

# Escalonamento dos dados (importante para o KNN)
scaler = StandardScaler()
X_train_scaled = scaler.fit_transform(X_train)
X_test_scaled = scaler.transform(X_test)

# Treinar o modelo Decision Tree
dt_model = DecisionTreeClassifier(random_state=42)
dt_model.fit(X_train, y_train)

# Treinar o modelo KNN com k=3
knn_model = KNeighborsClassifier(n_neighbors=3)
knn_model.fit(X_train_scaled, y_train)

# Fazer previsões
dt_predictions = dt_model.predict(X_test)
knn_predictions = knn_model.predict(X_test_scaled)

# Calcular a acurácia de cada modelo
dt_accuracy = accuracy_score(y_test, dt_predictions)
knn_accuracy = accuracy_score(y_test, knn_predictions)

# Exibir os resultados
print(f"Acurácia da Decision Tree: {dt_accuracy:.2f}")
print(f"Acurácia do KNN (k=3): {knn_accuracy:.2f}")

# Comparar e dizer qual foi melhor
if dt_accuracy > knn_accuracy:
    melhor = "Decision Tree"
    motivo = "porque obteve uma acurácia maior no conjunto de teste."
elif knn_accuracy > dt_accuracy:
    melhor = "KNN (k=3)"
    motivo = "Porque obteve uma acurácia maior no conjunto de teste."
else:
    melhor = "Ambos os modelos tiveram o mesmo desempenho"
    motivo = "Pois suas acurácias foram iguais."

print(f"\nModelo com melhor desempenho: {melhor}")
print(f"Motivo: {motivo}")

Acurácia da Decision Tree: 1.00
Acurácia do KNN (k=3): 0.50

Modelo com melhor desempenho: Decision Tree
Motivo: porque obteve uma acurácia maior no conjunto de teste.
