# k-NN

Código para visualizar número de clusters óptimos con KNN y guarda los clusters en un archivo aparte

In [None]:
import numpy as np
import pandas as pd
from sklearn.cluster import KMeans
from sklearn.metrics import silhouette_score
import matplotlib.pyplot as plt

Leer datos del archivo CSV

data = pd.read_csv('data11_s_nutrisa.csv')

Convertir las coordenadas en un array de numpy

In [None]:
X = data[['Latitud', 'Longitud']].values

Método del codo (Elbow Method)

In [None]:
def elbow_method(X, max_clusters=10):
    wcss = []
    for i in range(1, max_clusters + 1):
        kmeans = KMeans(n_clusters=i, random_state=0)
        kmeans.fit(X)
        wcss.append(kmeans.inertia_)
    plt.plot(range(1, max_clusters + 1), wcss, marker='o')
    plt.title('Elbow Method')
    plt.xlabel('Number of clusters')
    plt.ylabel('WCSS')
    plt.show()

Método de la silueta (Silhouette Method)

In [None]:
def silhouette_method(X, max_clusters=10):
    silhouette_avg = []
    for i in range(2, max_clusters + 1):
        kmeans = KMeans(n_clusters=i, random_state=0)
        kmeans.fit(X)
        cluster_labels = kmeans.labels_
        silhouette_avg.append(silhouette_score(X, cluster_labels))
    plt.plot(range(2, max_clusters + 1), silhouette_avg, marker='o')
    plt.title('Silhouette Method')
    plt.xlabel('Number of clusters')
    plt.ylabel('Silhouette Score')
    plt.show()

Ejecutar el método del codo

In [None]:
elbow_method(X)

Ejecutar el método de la silueta

In [None]:
silhouette_method(X)

Elegir el número óptimo de clusters según los métodos anteriores

In [None]:
# Aquí el número se elige manualmente basado en las gráficas anteriores, por ejemplo 5 clusters
n_clusters_optimo = 11

Aplicar K-Means con el número óptimo de clusters

In [None]:
kmeans_optimo = KMeans(n_clusters=n_clusters_optimo, random_state=0)
kmeans_optimo.fit(X)
labels_optimo = kmeans_optimo.labels_

Añadir los labels al DataFrame original

In [None]:
data['Cluster'] = labels_optimo
print("\nDatos con clusters asignados:")
print(data)

Guardar el DataFrame con los clusters asignados en un nuevo archivo CSV

In [None]:
data.to_csv('Coordenadas_con_Clusters_Optimos8.csv', index=False)

Graficar los puntos y los centroides de los clusters

In [None]:
plt.scatter(data['Latitud'], data['Longitud'], c=data['Cluster'], cmap='viridis', marker='o')
centroids = kmeans_optimo.cluster_centers_
plt.scatter(centroids[:, 0], centroids[:, 1], c='red', marker='x')
plt.xlabel('Latitud')
plt.ylabel('Longitud')
plt.title('K-Means Clustering with Optimal Clusters')
plt.show()