# K-Nearest Neighbor Practica
El algoritmo de K-Nearest Neighbor (KNN) es uno de los métodos más simples y populares de aprendizaje automático. Se basa en la idea de que los objetos similares tienden a estar cerca unos de otros en el espacio de características. KNN puede utilizarse tanto para clasificación como para regresión, dependiendo de si la variable objetivo es categórica o numérica. En este artículo, voy a explicar un poco sobre cómo funciona KNN y voy a hacer un ejercicio de reconocimiento de un animal a partir de sus caracteristicas de peso, altura y longitud del pelaje


**Ejemplo:** Un gran ejemplo del uso de KNN es el sistema de recomendaciones de TikTok el cual funciona a partir de los videos vistos y las busquedas para mostrar otros similares a estos

## Problema
En una tienda de mascotas se tiene una base de datos de animales disponibles, que incluye perros, gatos y pájaros. Se Desea crear un sistema que, dada la información sobre un animal desconocido, prediga si es un perro, un gato o un pájaro. Para ello, se decide utilizar el algoritmo KNN.

Se tiene un conjunto de datos con las siguientes características:
1. weight (en kilogramos)
2. height (en centímetros)
3. fur_length (en centímetros)

Además, hay información sobre las especies de los animales en la base de datos: dog (D), cat (C) o bird (B).

Aquí hay algunos datos de ejemplo:

| weight | height  | fur_length | species |
|------|--------|---------------------|---------|
| 4.0  | 25.0   | 4.5                 | C       |
| 30.0 | 60.0   | 8.0                 | D       |
| 1.0  | 10.0   | 0.2                 | B       |
| 8.0  | 30.0   | 3.0                 | C       |
| 25.0 | 55.0   | 7.5                 | D       |
| 0.5  | 8.0    | 0.1                 | B       |

Ahora, supongamos que hay un animal desconocido con las siguientes características:
- weight: 3.0 kg
- height: 15.0 cm
- fur_length: 2.0 cm

El objetivo es predecir si este animal es un perro, un gato o un pájaro utilizando el algoritmo KNN.

Pasos para resolver el problema:

1. Elegir un valor para K. 
2. Calcular la distancia entre el animal desconocido y todos los animales en el conjunto de datos.
3. Seleccionar los K animales más cercanos (K=3 en este caso) y observar las especies de esos animales.
4. Predecir la especie del animal desconocido basándose en la especie mayoritaria entre los K animales más cercanos.


## Solución
Primero se crean 200 datos aleatorios de acuerdo a los lineamientos

In [1]:
import numpy as np

n_samples = 200
n_species = 3

species_params = {
    "C": {"weight": (3, 6), "height": (20, 30), "fur_length": (3, 6)},
    "D": {"weight": (20, 40), "height": (40, 70), "fur_length": (5, 10)},
    "B": {"weight": (0.1, 1.5), "height": (5, 15), "fur_length": (0, 0.5)}
}

def generate_animal_data(species, n_samples):
    weight_range = species_params[species]["weight"]
    height_range = species_params[species]["height"]
    fur_lenght_range = species_params[species]["fur_length"]
    
    weights = np.random.uniform(weight_range[0], weight_range[1], n_samples)
    heights = np.random.uniform(height_range[0], height_range[1], n_samples)
    fur_lengths = np.random.uniform(fur_lenght_range[0], fur_lenght_range[1], n_samples)
    
    return [
        {"weight": w, "height": h, "fur_length": f, "species": species}
        for w, h, f in zip(weights, heights, fur_lengths)
    ]
    
data = []
samples_per_species = n_samples // n_species
for species in species_params.keys():
    data.extend(generate_animal_data(species, samples_per_species))


Ahora se procede a entrenar el modelo

In [28]:
import pandas as pd
from sklearn.neighbors import KNeighborsClassifier
from sklearn.model_selection import train_test_split

df = pd.DataFrame(data)

X = df.drop("species", axis=1).values
y = df["species"].values

X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=21, stratify=y)

knn = KNeighborsClassifier(n_neighbors=3)
knn.fit(X_train, y_train)
print(knn.score(X_test, y_test))

1.0


Con un accuracy del 100% buscamos la especie de las caracteristicas nuevas

In [30]:
X_new = [[3.0, 15.0, 2.0]]
predictions = knn.predict(X_new)
print('Prediction: ' + predictions)

['Prediction: B']


Segun el modelo, un animal con esas caracteristicas se puede clasificar como un ave