# kNN Classificador do Zero
# Este notebook implementa um classificador k-Nearest Neighbors (kNN) sem usar bibliotecas como scikit-learn.

In [None]:
import numpy as np
from collections import Counter


In [None]:
class KNNClassifier:
    def __init__(self, k=3, distance_metric="euclidean"):
        """
        Inicializa o classificador k-NN com um número específico de vizinhos (k) e
        a métrica de distância escolhida.
        """
        self.k = k
        self.distance_metric = distance_metric

    def fit(self, X_train, y_train):
        """
        Armazena os dados de treino no classificador.
        """
        self.X_train = np.array(X_train)
        self.y_train = np.array(y_train)

    def euclidean_distance(self, x1, x2):
        """
        TODO: Complete este método para calcular a distância euclidiana entre dois pontos x1 e x2.
        Fórmula: sqrt(sum((x1 - x2)²))
        """
        # Alunos devem completar!

    def manhattan_distance(self, x1, x2):
        """
        TODO: Complete este método para calcular a distância de Manhattan.
        Fórmula: sum(|x1 - x2|)
        """
        # Alunos devem completar!

    def minkowski_distance(self, x1, x2, p=3):
        """
        TODO: Complete este método para calcular a distância de Minkowski.
        Fórmula: (sum(|x1 - x2|^p))^(1/p)
        """
        # Alunos devem completar!


    def compute_distance(self, x1, x2):
        """
        Chama a função de distância correta baseada na métrica escolhida.
        Utilize o atributo `distance_metric` para saber qual métrica é.
        """
        # Alunos devem completar!

    def predict(self, X_test):
        """
        Realiza a predição de classe para um conjunto de dados de teste.
        """
        predictions = []
        for x in X_test:
            distances = [self.compute_distance(x, x_train) for x_train in self.X_train]
            k_neighbors_idx = np.argsort(distances)[:self.k]
            k_neighbor_labels = [self.y_train[i] for i in k_neighbors_idx]
            most_common = Counter(k_neighbor_labels).most_common(1)[0][0]
            predictions.append(most_common)

        return np.array(predictions)




📌 🔥 Atividade 1: Testar o Código com Dados de Treinamento


In [None]:
X_train = np.array([
    [1, 2], [2, 3], [3, 3],
    [5, 5], [6, 7], [7, 8]
])
y_train = np.array(["A", "A", "A", "B", "B", "B"])

X_test = np.array([[4, 4], [6, 6]])


📌 🔥 Atividade 2: Testar Diferentes Valores de k

In [None]:
k_value = 3
knn = KNNClassifier(k=k_value)
knn.fit(X_train, y_train)
predictions = knn.predict(X_test)
print("Previsões:", predictions)


Previsões: ['A' 'B']


📌 🔥 Atividade 3: Testar Diferentes Métricas de Distância

In [None]:
distance_metrics = ["euclidean", "manhattan", "minkowski"]

# Alunos devem completar! Fazer um loop, variar o k

📌 🔥 Atividade 4: Testar com Novos Dados
python

In [None]:
# Substitua os valores em X_train e X_test para testar com um novo conjunto de dados!
X_train_novo = np.array([
    [1, 1], [2, 1], [3, 2],
    [6, 7], [7, 8], [8, 9]
])
y_train_novo = np.array(["A", "A", "A", "B", "B", "B"])

X_test_novo = np.array([[4, 3], [7, 6]])

knn_novo = KNNClassifier(k=3, distance_metric="euclidean")
knn_novo.fit(X_train_novo, y_train_novo)
predictions_novo = knn_novo.predict(X_test_novo)

print("Previsões para os novos dados:", predictions_novo)


Previsões para os novos dados: ['A' 'B']


# Atividade 5

In [None]:
import numpy as np
import random
from sklearn.model_selection import train_test_split

# 🔹 Gerando o dataset artificialmente
np.random.seed(42)

# 🔹 Criando 100 amostras simuladas
n_amostras = 100

# 🔹 Recursos (features)
experiencia = np.random.randint(0, 10, n_amostras)  # Anos de experiência (0 a 10)
projetos = np.random.randint(0, 20, n_amostras)  # Número de projetos concluídos (0 a 20)
nota_teste = np.random.randint(50, 100, n_amostras)  # Nota de teste técnico (50 a 100)

# 🔹 Definindo a regra para a contratação (rótulo)
contratado = np.array(["Sim" if (exp >= 3 and proj >= 5 and nota >= 75) else "Não"
                        for exp, proj, nota in zip(experiencia, projetos, nota_teste)])

# 🔹 Criando a matriz de características
X = np.column_stack((experiencia, projetos, nota_teste))
y = contratado

# 🔹 Dividindo em treino e teste (80% treino, 20% teste)
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

# 🔥 ATIVIDADE:
# 1️⃣ Treinar o modelo kNN com esse dataset.
# 2️⃣ Testar diferentes valores de k e diferentes métricas de distância.
# 3️⃣ Avaliar a precisão do modelo comparando y_test com as previsões.
# 4️⃣ Discutir os resultados e pensar em melhorias no modelo.

# Importar e treinar o modelo
knn = KNNClassifier(k=5, distance_metric="euclidean")
knn.fit(X_train, y_train)
predictions = knn.predict(X_test)

# Exibir as previsões e a realidade
print("Previsões:", predictions)
print("Valores Reais:", y_test)


Previsões: ['Não' 'Não' 'Não' 'Não' 'Sim' 'Não' 'Sim' 'Não' 'Não' 'Não' 'Não' 'Sim'
 'Não' 'Não' 'Não' 'Não' 'Não' 'Não' 'Sim' 'Sim']
Valores Reais: ['Não' 'Não' 'Não' 'Não' 'Sim' 'Sim' 'Sim' 'Não' 'Não' 'Não' 'Não' 'Sim'
 'Não' 'Não' 'Não' 'Não' 'Não' 'Não' 'Sim' 'Não']
