# FCM - Fuzzy C-Means

O algoritmo Fuzzy C-Means (FCM) foi proposto pela primeira vez por Dunn em 1973 em um artigo intitulado "A Fuzzy Relative of the ISODATA Process and Its Use in Detecting Compact Well-Separated Clusters" ("Um Parente Difuso do Processo ISODATA e seu Uso na Detecção de Clusters Compactos e Bem Separados"). 

Este artigo foi publicado na revista Journal of Cybernetics, Volume 3, Número 3, de 1973. Dunn introduziu o algoritmo FCM como uma extensão do algoritmo K-Means, permitindo que cada ponto de dados pertença parcialmente a cada cluster, em vez de pertencer exclusivamente a apenas um cluster, como no K-Means.

Desde então, o algoritmo FCM tem sido amplamente estudado e aplicado em diversas áreas, como mineração de dados, reconhecimento de padrões e aprendizado de máquina. Muitos artigos subsequentes aprimoraram e estenderam o algoritmo original para atender a diferentes necessidades e cenários de aplicação.

In [None]:
import numpy as np

class FuzzyCMeans:
    def __init__(self, n_clusters=2, max_iter=100, m=2, error=1e-5):
        self.n_clusters = n_clusters
        self.max_iter = max_iter
        self.m = m
        self.error = error
        
    def fit(self, X):
        self.centroids = self._initialize_centroids(X)
        for i in range(self.max_iter):
            prev_centroids = self.centroids
            
            # Calculating membership matrix
            membership_mat = self._calculate_membership(X)
            
            # Updating centroids
            self.centroids = self._update_centroids(X, membership_mat)
            
            # Checking convergence
            if np.linalg.norm(self.centroids - prev_centroids) < self.error:
                break
                
        return membership_mat
    
    def predict(self, X):
        membership_mat = self.fit(X)
        return np.argmax(membership_mat, axis=1)
    
    def _initialize_centroids(self, X):
        indices = np.random.choice(len(X), self.n_clusters, replace=False)
        return X[indices]
    
    def _calculate_membership(self, X):
        distances = np.linalg.norm(X[:, np.newaxis] - self.centroids, axis=2)
        inv_dist = 1.0 / distances ** (2 / (self.m - 1))
        return inv_dist / np.sum(inv_dist, axis=1)[:, np.newaxis]
    
    def _update_centroids(self, X, membership_mat):
        um_power = membership_mat ** self.m
        return np.dot(um_power.T, X) / np.sum(um_power, axis=0)[:, np.newaxis]

# Example usage:
if __name__ == "__main__":
    # Generate sample data
    np.random.seed(42)
    X = np.random.rand(100, 2)
    
    # Initialize and fit Fuzzy C-Means
    fcm = FuzzyCMeans(n_clusters=3)
    membership_mat = fcm.fit(X)
    
    # Predict clusters
    labels = fcm.predict(X)
    print(labels)


References:

- [Fuzzy C-Means Clustering (FCM) Algorithm](https://medium.com/geekculture/fuzzy-c-means-clustering-fcm-algorithm-in-machine-learning-c2e51e586fff)

https://chat.openai.com/c/5fe68db4-2d71-4eae-86c1-2d9764bee1f2

https://chat.openai.com/c/7a7bac88-00c3-49d2-a8d9-4a58eeb54c59