In [1]:
import numpy as np
from sklearn.neighbors import KNeighborsClassifier
from sklearn.preprocessing import StandardScaler
from sklearn.model_selection import train_test_split
from sklearn.metrics import accuracy_score

# --- Dados de Exemplo ---
# Clientes existentes (Treinamento)
# Características: [Idade, Salário Anual em milhares de R$]
# Rótulos (classes): 0 = Standard, 1 = Premium
X_treino = np.array([
    [25, 40], # Cliente A
    [30, 60], # Cliente B
    [22, 35], # Cliente C
    [50, 120],# Cliente D
    [45, 100],# Cliente E
    [35, 70], # Cliente F
    [60, 150],# Cliente G
    [28, 45]  # Cliente H
])
y_treino = np.array([0, 0, 0, 1, 1, 0, 1, 0]) # Classes correspondentes

# Novo Cliente para Classificar
novo_cliente = np.array([[38, 90]]) # Idade 38, Salário 90 mil

print("--- Dados Iniciais ---")
print(f"Dados de Treino (X):\n{X_treino}")
print(f"Rótulos de Treino (y): {y_treino}")
print(f"Novo Cliente: {novo_cliente}\n")

# --- 1. Escolha do Valor de K ---
# Para este exemplo, vamos escolher K = 3
k_vizinhos = 3
print(f"Valor de K escolhido: {k_vizinhos}\n")

# --- 2. Escalonamento dos Dados (Crucial para KNN!) ---
# Para que 'Idade' e 'Salário' não influenciem desproporcionalmente a distância.
scaler = StandardScaler()
X_treino_escalado = scaler.fit_transform(X_treino)
novo_cliente_escalado = scaler.transform(novo_cliente) # Escala o novo cliente com o MESMO scaler

print("--- Dados Escalonados ---")
print(f"Dados de Treino Escalonados:\n{X_treino_escalado}")
print(f"Novo Cliente Escalonado: {novo_cliente_escalado}\n")

# --- 3. Criar e "Treinar" o Modelo KNN ---
# 'Treinar' no KNN significa que o modelo memoriza os dados.
knn_model = KNeighborsClassifier(n_neighbors=k_vizinhos)
knn_model.fit(X_treino_escalado, y_treino)

print("--- Modelo KNN 'Treinado' ---\n")

# --- 4. Fazer a Previsão ---
# O modelo calcula distâncias, encontra os K vizinhos e vota.
previsao = knn_model.predict(novo_cliente_escalado)
probabilidades = knn_model.predict_proba(novo_cliente_escalado) # Probabilidade para cada classe

# Mapear o resultado numérico para texto
mapeamento_classe = {0: "Standard", 1: "Premium"}
resultado_final = mapeamento_classe[previsao[0]]

print(f"Previsão para o Novo Cliente: {resultado_final}")
print(f"Probabilidades (Standard, Premium): {probabilidades[0]}\n")

# --- Detalhes dos Vizinhos (Para Entender a Previsão) ---
# k_neighbors retorna as distâncias e os índices dos K vizinhos mais próximos
distancias, indices = knn_model.kneighbors(novo_cliente_escalado)

print(f"--- Os {k_vizinhos} Vizinhos Mais Próximos ---")
for i in range(k_vizinhos):
    idx_vizinho = indices[0][i]
    distancia = distancias[0][i]
    caracteristicas_vizinho = X_treino[idx_vizinho]
    classe_vizinho = mapeamento_classe[y_treino[idx_vizinho]]
    print(f"Vizinho {i+1}: Características {caracteristicas_vizinho}, Classe '{classe_vizinho}', Distância {distancia:.2f}")

# Contagem de votos para confirmar a previsão
votos = [mapeamento_classe[y_treino[idx]] for idx in indices[0]]
from collections import Counter
contagem_votos = Counter(votos)
print(f"\nContagem de Votos dos Vizinhos: {contagem_votos}")
print(f"Classe com mais votos: {contagem_votos.most_common(1)[0][0]}")

--- Dados Iniciais ---
Dados de Treino (X):
[[ 25  40]
 [ 30  60]
 [ 22  35]
 [ 50 120]
 [ 45 100]
 [ 35  70]
 [ 60 150]
 [ 28  45]]
Rótulos de Treino (y): [0 0 0 1 1 0 1 0]
Novo Cliente: [[38 90]]

Valor de K escolhido: 3

--- Dados Escalonados ---
Dados de Treino Escalonados:
[[-0.94439745 -0.9602766 ]
 [-0.54675642 -0.44812908]
 [-1.18298207 -1.08831348]
 [ 1.04380771  1.08831348]
 [ 0.64616668  0.57616596]
 [-0.14911539 -0.19205532]
 [ 1.83908978  1.85653476]
 [-0.70581283 -0.83223972]]
Novo Cliente Escalonado: [[0.08946923 0.3200922 ]]

--- Modelo KNN 'Treinado' ---

Previsão para o Novo Cliente: Standard
Probabilidades (Standard, Premium): [0.66666667 0.33333333]

--- Os 3 Vizinhos Mais Próximos ---
Vizinho 1: Características [35 70], Classe 'Standard', Distância 0.56
Vizinho 2: Características [ 45 100], Classe 'Premium', Distância 0.61
Vizinho 3: Características [30 60], Classe 'Standard', Distância 1.00

Contagem de Votos dos Vizinhos: Counter({'Standard': 2, 'Premium': 1})
Cl