In [2]:
import numpy as np

# Función para calcular la distancia euclidiana entre dos puntos
def euclidean_distance(point1, point2):
    return np.sqrt(np.sum((point1 - point2) ** 2))

# Implementación del algoritmo de K-means
def kmeans(X, k, max_iterations=100):
    # Inicialización: seleccionar k puntos aleatorios como centroides iniciales
    centroids = X[np.random.choice(range(len(X)), k, replace=False)]
    
    for _ in range(max_iterations):
        # Paso 1: asignación de puntos al clúster más cercano
        clusters = [[] for _ in range(k)]
        for point in X:
            distances = [euclidean_distance(point, centroid) for centroid in centroids]
            closest_centroid = np.argmin(distances)
            clusters[closest_centroid].append(point)
        
        # Paso 2: recálculo de centroides
        new_centroids = []
        for cluster in clusters:
            new_centroid = np.mean(cluster, axis=0)
            new_centroids.append(new_centroid)
        
        # Verificar si los centroides ya no cambian
        if np.array_equal(centroids, new_centroids):
            break

        
        centroids = new_centroids
    
    return centroids, clusters

# Ejemplo de uso
X = np.array([[1, 2], [1.5, 1.8], [5, 8], [8, 8], [1, 0.6], [9, 11]])

k = 2
centroids, clusters = kmeans(X, k)

# Imprimir los centroides y los puntos en cada clúster
print("Centroides:")
print(centroids)
print("Clústeres:")
for i, cluster in enumerate(clusters):
    print(f"Clúster {i}:")
    print(cluster)


Centroides:
[array([7.33333333, 9.        ]), array([1.16666667, 1.46666667])]
Clústeres:
Clúster 0:
[array([5., 8.]), array([8., 8.]), array([ 9., 11.])]
Clúster 1:
[array([1., 2.]), array([1.5, 1.8]), array([1. , 0.6])]
