In [81]:
import numpy as np
import matplotlib.pyplot as plt
import pandas as pd

In [77]:
# Cargar los datos
base_path = "../../BaseLD.xlsx"
data = pd.read_excel(base_path).to_numpy()

In [78]:
class KMeans:
    def __init__(self, n_clusters, max_iters=100):
        self.n_clusters = n_clusters
        self.max_iters = max_iters
    
    def fit(self, X):
        # Asignar los centroides aleatoriamente
        random_indices = np.random.choice(X.shape[0], self.n_clusters,
            replace=False)
        self.centroids = X[random_indices]

        for _ in range(self.max_iters):
            # Calcular las distancias y asignar los núcleos
            distances = np.linalg.norm(X[:, np.newaxis] - self.centroids,
                axis=2)
            self.labels = np.argmin(distances, axis=1)

            # Actualizar centroides
            new_centroids = np.array([X[self.labels == i].mean(axis=0)
                for i in range(self.n_clusters)])
            
            # Verificar la convergencia
            if np.all(self.centroids == new_centroids):
                break

            self.centroids = new_centroids
        
        return self.labels

In [110]:
# Aplicar algoritmo de k medias
kmeans = KMeans(n_clusters=3)
labels = kmeans.fit(data)

# Contar la cantidad de puntos en cada núcleo
unique_labels, counts = np.unique(labels, return_counts=True)
label_counts = {int(label): int(count)
    for label, count in zip(unique_labels, counts)}

# Mostrar resultados
print("Cantidad de puntos por etiqueta:")
for label, count in label_counts.items():
    print(f"Etiqueta {label}: {count} puntos")

Cantidad de puntos por etiqueta:
Etiqueta 0: 8162 puntos
Etiqueta 1: 14642 puntos
Etiqueta 2: 4947 puntos


In [111]:
class NeuralGas:
    def __init__(self, n_nodes=10, learning_rate = 0.1, max_iters=100):
        self.n_nodes = n_nodes
        self.learning_rate = learning_rate
        self.max_iters = max_iters
        self.nodes = None
    
    def train(self, data):
        # Asdignar los nodos aleatoriamente
        self.nodes = np.random.rand(self.n_nodes, data.shape[1])

        for _ in range(self.max_iters):
            for x in data:
                # Calcular la distancia de x a todos los nodos
                distances = np.linalg.norm(self.nodes - x, axis=1)

                # Obtener el índice de los nodos en orden de proximidad
                sorted_indices = np.argsort(distances)

                # Actualizar los nodos según la distancia
                for rank, idx in enumerate(sorted_indices):
                    # Calcular el factor de aprendizaje
                    learning_rate = self.learning_rate * np.exp(-rank / 2)
                    self.nodes[idx] += learning_rate * (x - self.nodes[idx])

In [112]:
ng = NeuralGas()
ng.train(data)