In [None]:
import numpy as np

class KMeans:
    def __init__(self, k=3, max_iteracoes=100):
        self.k = k
        self.max_iteracoes = max_iteracoes
        self.centroides = None
    
    def ajustar(self, dados):
        # 1. Inicializar centróides aleatoriamente (seleciona k pontos de dados)
        self.centroides = dados[np.random.choice(len(dados), self.k, replace=False)]
        
        for _ in range(self.max_iteracoes):
            # 2. Atribuir clusters
            clusters = self._atribuir_clusters(dados)
            
            # 3. Atualizar centróides (Função a ser completada)
            novos_centroides = self._atualizar_centroides(dados, clusters)
            
            # 4. Verificar convergência
            # Se a mudança nos centróides for muito pequena (np.allclose), pare.
            if self.centroides is not None and np.allclose(self.centroides, novos_centroides):
                break
            
            self.centroides = novos_centroides
            
        return self # Retorna o objeto ajustado
    
    def _atribuir_clusters(self, dados):
        # Calcula a distância euclidiana de cada ponto de dado para cada centróide.
        # distancias tem forma (k, num_dados, num_dimensoes) -> (num_dados, k) após a soma.
        
        # O np.newaxis transforma self.centroides de (k, d) para (k, 1, d) para habilitar a subtração.
        distancias = np.sqrt(((dados - self.centroides[:, np.newaxis])**2).sum(axis=2))
        
        # Retorna o índice (o ID do cluster, de 0 a k-1) do centróide mais próximo.
        return np.argmin(distancias, axis=0)

    # O método
    def _atualizar_centroides(self, dados, clusters):
        # Inicializa a matriz para os novos centróides
        novos_centroides = np.zeros(self.centroides.shape)
        
        # Para cada cluster (de 0 a k-1)
        for i in range(self.k):
            # Encontra todos os pontos de dados que foram atribuídos ao cluster 'i'
            pontos_cluster_i = dados[clusters == i]
            
            if len(pontos_cluster_i) > 0:
                # O novo centróide é a média (centro) de todos os pontos de dados no cluster.
                novos_centroides[i] = pontos_cluster_i.mean(axis=0)
            else:
                # Caso um cluster fique vazio, mantém o centróide anterior (ou reinicia aleatoriamente, dependendo da estratégia).
                novos_centroides[i] = self.centroides[i]
                
        return novos_centroides

    def prever(self, dados):
        # Usa a mesma lógica de atribuição para prever o cluster de novos dados
        return self._atribuir_clusters(dados)