
# Classificador do Vizinho Mais Próximo (k-NN)

O classificador do vizinho mais próximo é um dos métodos mais simples de classificação. A ideia é muito intuitiva: dado um item novo, comparamos suas características com os itens conhecidos (dados de treino) e escolhemos aquele que é mais parecido. O novo item herda a classe (ou valor) do vizinho mais próximo.

## Como medir "proximidade"?
Para medir quão próximos dois itens estão, utilizamos uma métrica de distância. Uma das mais conhecidas é a **distância Euclidiana**, que calcula a raiz quadrada da soma das diferenças ao quadrado entre dois pontos em um espaço n-dimensional.

No entanto, para dados categóricos (como listas de produtos comprados), podemos usar uma métrica mais simples: **número de itens em comum**.

## Aplicação prática
Vamos aplicar o k-NN para prever qual produto um cliente provavelmente comprará em seguida, com base em usuários semelhantes e seus históricos de compra.


In [None]:

# Dicionário com os dados dos usuários
usuarios = {
    'Carlos': ['luvas de boxe', 'Dom Casmurro (livro)', 'fones de ouvido', 'óculos escuros', 'café em grão'],
    'Ana': ['camiseta', 'café em grão', 'máquina de café', 'café em grão', 'café em grão'],
    'Bruna': ['óculos escuros', 'tênis', 'camiseta', 'tênis', 'meias de lã'],
    'Diego': ['2001: Uma Odisseia no Espaço (dvd)', 'fones de ouvido', 'camiseta', 'luvas de boxe', 'chinelos'],
    'Fernanda': ['camiseta', 'chinelos', 'óculos escuros', 'Dom Casmurro (livro)', 'protetor solar'],
    'Eduardo': ['Dom Casmurro (livro)', 'café em grão', '2001: Uma Odisseia no Espaço (dvd)', 'fones de ouvido', 'café em grão'],
}

joao_historico = ['chá verde', 'camiseta', 'óculos escuros', 'chinelos']


In [None]:

# Função para calcular similaridade entre João e outro usuário
def calcular_similaridade(historico1, historico2):
    return len(set(historico1) & set(historico2))

# Dicionário para armazenar as similaridades
similaridades = {}

# Comparando João com cada usuário
for usuario, compras in usuarios.items():
    historico_treino = compras[:-1]  # ignorar a última compra (usada como rótulo)
    similaridade = calcular_similaridade(joao_historico, historico_treino)
    similaridades[usuario] = similaridade

# Exibir similaridades
similaridades


In [None]:

# Encontrar o usuário mais semelhante
vizinho_mais_proximo = max(similaridades, key=similaridades.get)
print(f'Usuário mais semelhante ao João: {vizinho_mais_proximo}')


In [None]:

# Prever próxima compra com base no vizinho mais próximo
previsao = usuarios[vizinho_mais_proximo][-1]
print(f'Previsão de próxima compra para João: {previsao}')



## Conclusão

Com base no histórico de compras, o usuário mais parecido com **João** foi o usuário identificado como o mais semelhante na análise anterior.
Portanto, prevemos que a próxima compra de João será o mesmo item da última compra feita por esse usuário.

### Observações:
- Esse método simples pode ser bastante útil em sistemas de recomendação.
- Com mais dados, poderíamos usar variações como k-vizinhos (k-NN), onde usamos os k usuários mais próximos em vez de apenas 1.
- A definição de "distância" ou "semelhança" pode variar conforme o contexto (texto, imagem, número, etc).
