# FCM - Fuzzy C-Means

O algoritmo Fuzzy C-Means (FCM) foi proposto pela primeira vez por Dunn em 1973 em um artigo intitulado "A Fuzzy Relative of the ISODATA Process and Its Use in Detecting Compact Well-Separated Clusters" ("Um Parente Difuso do Processo ISODATA e seu Uso na Detecção de Clusters Compactos e Bem Separados"). 

Este artigo foi publicado na revista Journal of Cybernetics, Volume 3, Número 3, de 1973. Dunn introduziu o algoritmo FCM como uma extensão do algoritmo K-Means, permitindo que cada ponto de dados pertença parcialmente a cada cluster, em vez de pertencer exclusivamente a apenas um cluster, como no K-Means.

Desde então, o algoritmo FCM tem sido amplamente estudado e aplicado em diversas áreas, como mineração de dados, reconhecimento de padrões e aprendizado de máquina. Muitos artigos subsequentes aprimoraram e estenderam o algoritmo original para atender a diferentes necessidades e cenários de aplicação.

In [None]:
import numpy as np

def initialize_membership_matrix(n_samples, n_clusters):
    return np.random.rand(n_samples, n_clusters)

def update_cluster_centers(data, membership_matrix, m):
    numerator = np.dot(data.T, membership_matrix**m)
    denominator = np.sum(membership_matrix**m, axis=0)
    return numerator / denominator

def update_membership_matrix(data, cluster_centers, m):
    distances = np.linalg.norm(data[:, None] - cluster_centers, axis=2)**2
    distances[distances == 0] = np.finfo(float).eps
    return 1 / np.sum((distances[:, :, None] / distances[:, :, None].swapaxes(1, 2))**(1 / (m - 1)), axis=2)

def fuzzy_cmeans(data, n_clusters, m, max_iter=100, tol=1e-4):
    n_samples = data.shape[0]
    
    # Inicialização dos centróides
    cluster_centers = data[np.random.choice(n_samples, n_clusters, replace=False)]
    
    # Inicialização da matriz de pertinência
    membership_matrix = initialize_membership_matrix(n_samples, n_clusters)
    
    for _ in range(max_iter):
        # Atualização dos centróides
        new_cluster_centers = update_cluster_centers(data, membership_matrix, m)
        
        # Atualização da matriz de pertinência
        new_membership_matrix = update_membership_matrix(data, new_cluster_centers, m)
        
        # Verificação da convergência
        if np.linalg.norm(new_membership_matrix - membership_matrix) < tol:
            break
        
        cluster_centers = new_cluster_centers
        membership_matrix = new_membership_matrix
    
    return cluster_centers, membership_matrix

# Exemplo de uso
if __name__ == "__main__":
    # Dados de exemplo
    np.random.seed(0)
    n_samples = 100
    n_features = 2
    data = np.random.rand(n_samples, n_features)
    
    # Número de clusters
    n_clusters = 3
    
    # Parâmetro de "fuzziness"
    m = 2
    
    # Executando o algoritmo
    cluster_centers, membership_matrix = fuzzy_cmeans(data, n_clusters, m)
    
    # Exibindo os resultados
    print("Cluster centers:")
    print(cluster_centers)
    print("\nMembership matrix:")
    print(membership_matrix)


References:

- [Fuzzy C-Means Clustering (FCM) Algorithm](https://medium.com/geekculture/fuzzy-c-means-clustering-fcm-algorithm-in-machine-learning-c2e51e586fff)