### **K-Nearest Neighbors (KNN)**

Es un algoritmo muy utilizado en IA, especialmente para tareas de clasificación y regresión. Se usa con un conjunto de datos que ya han sido clasificados en diferentes categorías, KNN se para clasificar un nuevo punto de datos en función de sus vecinos más cercanos en el conjunto de datos.

`Pasos a seguir:`
<br>
Seleccionar el valor de K: K representa el número de vecinos más cercanos que se considerarán para la clasificación.<br>
Calcular la distancia: Se calcula la distancia entre el nuevo punto de datos y cada uno de los puntos del conjunto de datos.<br>
Identificar los vecinos más cercanos: Se seleccionan los K puntos más cercanos al nuevo punto de datos.<br>
Asignar una clase: Se asigna al nuevo punto de datos la clase más común entre sus K vecinos más cercanos.<br>

`EJEMPLOS DE USO`
<br>
Recomendación de productos: Un sitio web de comercio electrónico podría utilizar KNN para recomendar productos a un usuario en función de los productos que ha comprado o visto anteriormente.

In [None]:
!pip3 install numpy pandas matplotlib scikit-learn imbalanced-learn

In [None]:
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
from sklearn.datasets import load_iris
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import StandardScaler
from sklearn.decomposition import PCA
from sklearn.neighbors import KNeighborsClassifier
from sklearn.metrics import accuracy_score, confusion_matrix, classification_report

In [None]:
iris = load_iris()
X = iris.data  # Usar las cuatro características
y = iris.target

# Crear un DataFrame para visualizar mejor
df = pd.DataFrame(X, columns=iris.feature_names)
df['target'] = y
df.head()

In [None]:
# Normalizar los datos
scaler = StandardScaler()
X_scaled = scaler.fit_transform(X)

# Mostrar las primeras filas de los datos escalados
pd.DataFrame(X_scaled, columns=iris.feature_names).head()

# Dividir los datos en conjuntos de entrenamiento y prueba
X_train, X_test, y_train, y_test = train_test_split(X_scaled, y, test_size=0.3, random_state=42)

In [None]:
# Definir el modelo KNN
knn = KNeighborsClassifier(n_neighbors=5)

# Entrenar el modelo
knn.fit(X_train, y_train)

In [None]:
# Predecir con el conjunto de prueba
y_pred = knn.predict(X_test)

# Evaluar la precisión
accuracy = accuracy_score(y_test, y_pred)
print(f'Precisión: {accuracy:.2f}')

# Matriz de confusión
conf_matrix = confusion_matrix(y_test, y_pred)
print('Matriz de Confusión:\n', conf_matrix)

# Informe de clasificación
class_report = classification_report(y_test, y_pred, target_names=iris.target_names)
print('Informe de Clasificación:\n', class_report)

In [None]:
# Aplicar PCA para reducir la dimensionalidad a 2D para visualización
pca = PCA(n_components=2)
X_pca = pca.fit_transform(X_scaled)

# Entrenar el modelo KNN nuevamente con los datos transformados para la visualización
X_train_pca, X_test_pca, _, _ = train_test_split(X_pca, y, test_size=0.3, random_state=42)
knn_pca = KNeighborsClassifier(n_neighbors=5)
knn_pca.fit(X_train_pca, y_train)

# Crear una malla de puntos para dibujar el contorno
x_min, x_max = X_pca[:, 0].min() - 1, X_pca[:, 0].max() + 1
y_min, y_max = X_pca[:, 1].min() - 1, X_pca[:, 1].max() + 1
xx, yy = np.meshgrid(np.arange(x_min, x_max, 0.01), np.arange(y_min, y_max, 0.01))

# Predecir en toda la malla
Z = knn_pca.predict(np.c_[xx.ravel(), yy.ravel()])
Z = Z.reshape(xx.shape)

# Dibujar el contorno y puntos
plt.figure(figsize=(8, 6))
plt.contourf(xx, yy, Z, alpha=0.3, cmap=plt.cm.RdYlBu)
scatter = plt.scatter(X_pca[:, 0], X_pca[:, 1], c=y, s=30, edgecolor='k', cmap=plt.cm.RdYlBu)

# Añadir etiquetas
plt.xlabel('Componente Principal 1')
plt.ylabel('Componente Principal 2')
plt.title('KNN: Contorno de Decisión (PCA)')

print(scatter.legend_elements()[0])
# plt.legend(handles=scatter.legend_elements()[0], labels=iris.target_names)
plt.show()


In [None]:
# Importar librerías necesarias
import numpy as np
import pandas as pd
from sklearn.neighbors import NearestNeighbors

# Crear un conjunto de datos de ejemplo
productos = {
    'Producto': ['Laptop', 'Teléfono', 'Tablet', 'Smartwatch', 'Auriculares', 'TV'],
    'Precio': [1000, 800, 500, 300, 200, 150],
    'Popularidad': [10, 8, 6, 4, 2, 1]
}
df_productos = pd.DataFrame(productos)

# Crear un conjunto de datos de ejemplo de compras del usuario
compras_usuario = {
    'Producto': ['Laptop', 'Teléfono', 'Auriculares']
}
df_compras_usuario = pd.DataFrame(compras_usuario)

# Definir una función para recomendar productos al usuario utilizando KNN
def recomendar_productos(df_productos, df_compras_usuario, k=3):
    # Preprocesamiento de datos
    X = df_productos[['Precio', 'Popularidad']]
    y = df_productos['Producto']
    X_usuario = df_compras_usuario.merge(df_productos, on='Producto', how='left')[['Precio', 'Popularidad']].fillna(0)
    
    # Entrenar el modelo KNN
    modelo_knn = NearestNeighbors(n_neighbors=k)
    
    modelo_knn.fit(X)
    
    # Encontrar los k vecinos más cercanos
    _, indices = modelo_knn.kneighbors(X_usuario)
    print(modelo_knn.kneighbors(X_usuario))
    
    # Mostrar los productos recomendados
    print("Productos recomendados:")
    for i in indices[0]:
        print("- {}".format(df_productos.iloc[i]['Producto']))

# Llamar a la función de recomendación de productos
recomendar_productos(df_productos, df_compras_usuario, k=3)