## Algortimo  Fuzzy C-modes
#### por  Javier Vallejos

### 1. Descripción

The Fuzzy C-Modes (FCM) algorithm is a variant of the Fuzzy C-Means (FCM) clustering algorithm designed to handle categorical data, making it suitable for scenarios where the attributes are non-numeric or discrete in nature. FCM is primarily used for clustering data points into groups, but FCM specifically accommodates categorical data by introducing a mode concept for each cluster.

### 2. Birtex y Referencias

* https://www.researchgate.net/publication/328639277_Fuzzy_Clustering_Algorithm_Efficient_Implementation_Using_Centre_of_Centres

### 3. Tipo de Modelo

El algoritmo Fuzzy C-Modes (FCM) suele ser:

* Supervisado o no supervisado: FCM es principalmente un algoritmo de agrupación en clústeres no supervisado. No requiere conocimiento previo de las etiquetas de clase ni supervisión para agrupar puntos de datos en grupos. Sin embargo, se puede adaptar a escenarios semisupervisados incorporando información de clase en los cálculos de membresía si es necesario.

* Aprendizaje por lotes o en línea: FCM suele ser un algoritmo de aprendizaje por lotes. Procesa todos los puntos de datos en un lote en cada iteración para actualizar los centroides del clúster y los valores de membresía. Existen variaciones de FCM que se pueden adaptar para el aprendizaje en línea, pero el algoritmo FCM clásico está diseñado para el procesamiento por lotes.

* Basado en instancias o basado en modelos: FCM se considera un algoritmo de agrupación basado en modelos. Construye un modelo de centroides de clústeres y membresías difusas para representar la estructura de datos subyacente. Por el contrario, los métodos basados en instancias, como K-Nearest Neighbors (K-NN), clasifican puntos de datos según las instancias más cercanas en el conjunto de entrenamiento sin crear explícitamente un modelo.

* Paramétrico o no paramétrico: FCM se considera un algoritmo paramétrico. Se supone que los datos pueden representarse mediante un conjunto de parámetros, específicamente los centroides del grupo y los valores de membresía. Esto contrasta con los métodos no paramétricos como la estimación de densidad del núcleo (KDE) o la agrupación jerárquica, que no hacen suposiciones específicas sobre la forma o el número de agrupaciones en los datos y pueden adaptarse a distribuciones de datos complejas.

### 4. Algoritmos de entrenamiento

El algoritmo de entrenamiento para Fuzzy C-Modes (FCM) implica actualizar iterativamente los modos de clúster y los valores de membresía hasta la convergencia. Aquí hay un desglose más detallado del proceso de capacitación:

Inicialización:
    Determine la cantidad de clústeres (K) que desea crear.
    Inicializar modos de clúster: para cada clúster, asigne un modo inicial, normalmente seleccionando aleatoriamente una categoría del atributo categórico de cada clúster.

1. Asignación de membresía:
    Calcule el grado de membresía (u_ik) para cada punto de datos (i) de cada grupo (k). Este grado de membresía representa la similitud del punto de datos con el modo de clúster.
    El valor de membresía a menudo se calcula utilizando una medida de similitud o disimilitud apropiada para datos categóricos. Las medidas comunes incluyen la similitud de Jaccard, el coeficiente de Dice o el coeficiente de coincidencia simple.
    La fórmula para calcular los valores de membresía puede variar, pero normalmente implica comparar la categoría del punto de datos con la categoría del modo de clúster. Una mayor similitud da como resultado un mayor valor de membresía.

2. Actualización de modo:
    Actualice los modos del clúster según los valores de membresía calculados. El nuevo modo de conglomerado se calcula para cada conglomerado (k) encontrando la categoría que maximiza la suma ponderada de los valores de membresía para los puntos de datos en ese conglomerado.
    La suma ponderada se calcula multiplicando el valor de membresía de cada punto de datos (u_ik) al grupo (k) con el valor de categoría correspondiente para el atributo de ese punto de datos.

3. Verificación de convergencia:
    Verifique la convergencia midiendo cuánto han cambiado los modos de clúster y los valores de membresía desde la iteración anterior. Un criterio de convergencia común es monitorear el cambio en los modos del clúster y detener la iteración cuando cae por debajo de un umbral predefinido o cuando se alcanza un número máximo de iteraciones.

4. Iteración:
    Si no se cumple el criterio de convergencia, regrese al paso 2 y repita los pasos de asignación de membresía y actualización de modo hasta que se logre la convergencia.

5. Asignación final del grupo:
    Después de la convergencia, asigne puntos de datos a los grupos según sus valores de membresía más altos. Los puntos de datos pueden pertenecer a varios grupos con distintos grados de membresía, lo que refleja el grado de asociación con cada grupo.

6. Producción:
    El resultado final del algoritmo FCM es un conjunto de modos de conglomerado y la asignación de puntos de datos a los conglomerados, junto con sus grados de membresía.

### 5. Supuestos y restricciones

El algoritmo Fuzzy C-Modes (FCM), como cualquier algoritmo de agrupación, viene con ciertas suposiciones y restricciones que influyen en su aplicabilidad y rendimiento. A continuación se presentan algunas suposiciones y restricciones clave de FCM:

Supuestos:

Independencia de los datos: FCM asume que los puntos de datos son independientes entre sí, lo que significa que la agrupación de un punto de datos no afecta directamente la agrupación de otros. Esta es una suposición común en muchos algoritmos de agrupamiento.

Forma del grupo: FCM supone que los grupos tienen una forma aproximadamente esférica o convexa en el espacio de características. Si los grupos reales tienen formas complejas o no convexas, es posible que FCM no funcione bien, ya que optimiza los modos de grupo basados en centroides y puede tener dificultades para capturar grupos de formas irregulares.

Tamaños de conglomerados homogéneos: FCM supone que los conglomerados tienen tamaños aproximadamente iguales. Si hay variaciones significativas en el tamaño de los grupos, esto puede afectar la calidad de los resultados de la agrupación, ya que el algoritmo trata a todos los grupos por igual.

Restricciones:

Limitado a datos categóricos: FCM está diseñado específicamente para datos categóricos o binarios. No es adecuado para datos numéricos, ya que carece del marco matemático para manejar variables continuas.

Sensibilidad a la inicialización: al igual que otros algoritmos de agrupación en clústeres iterativos, el rendimiento de FCM puede ser sensible a la ubicación inicial de los modos de agrupación. Diferentes inicializaciones pueden conducir a diferentes soluciones, incluidos los óptimos locales. Por lo tanto, pueden ser necesarias estrategias de inicialización cuidadosas o ejecuciones múltiples con diferentes inicializaciones para obtener resultados sólidos.

Dificultad con datos de alta dimensión: FCM puede enfrentar desafíos cuando se aplica a datos de alta dimensión debido a la "maldición de la dimensionalidad". En espacios de alta dimensión, los puntos de datos pueden volverse escasos y las medidas de similitud utilizadas para los atributos categóricos pueden perder su eficacia. Es posible que se necesiten técnicas de reducción de dimensionalidad o selección de características para mitigar este problema.

Escalabilidad: la complejidad computacional de FCM aumenta con la cantidad de puntos y grupos de datos. Para grandes conjuntos de datos o una gran cantidad de clústeres, FCM puede volverse computacionalmente intensivo. Puede ser necesario considerar técnicas de optimización o paralelización para manejar datos a gran escala de manera eficiente.

Falta de manejo de valores atípicos: FCM no maneja inherentemente valores atípicos. Los valores atípicos pueden afectar significativamente la formación de grupos, especialmente si se les asignan valores altos de membresía a múltiples grupos. Puede ser necesario un procesamiento previo para detectar y manejar valores atípicos.

Determinación manual del número de grupos: como muchos algoritmos de agrupación, FCM requiere que el usuario especifique el número de grupos (K) de antemano. Seleccionar una K adecuada puede ser un desafío y puede requerir conocimiento del dominio o técnicas adicionales como el método del codo o el análisis de la silueta.

### 6. Ejemplo

In [15]:
import numpy as np

def initialize_membership(data_size, num_clusters):
    return np.random.rand(data_size, num_clusters)

def update_cluster_modes(data, membership, num_clusters):
    modes = []
    for k in range(num_clusters):
        mode = np.sum(membership[:, k] * data.T, axis=1) / np.sum(membership[:, k])
        modes.append(mode)
    return np.array(modes)

def calculate_membership(data, modes, m):
    distances = np.linalg.norm(data[:, np.newaxis] - modes, axis=2)
    return 1.0 / (distances ** (2 / (m - 1)))

def fcm(data, num_clusters, max_iters=100, m=2, error_threshold=1e-5):
    data_size = data.shape[0]
    
    # Initialize membership matrix randomly
    membership = initialize_membership(data_size, num_clusters)
    
    for iteration in range(max_iters):
        # Store previous membership for convergence check
        prev_membership = np.copy(membership)
        
        # Update cluster modes
        modes = update_cluster_modes(data, membership, num_clusters)
        
        # Calculate new membership values
        membership = calculate_membership(data, modes, m)
        
        # Check for convergence
        diff = np.linalg.norm(membership - prev_membership)
        if diff < error_threshold:
            break
    
    # Assign data points to clusters based on highest membership
    cluster_assignments = np.argmax(membership, axis=1)
    
    return cluster_assignments, modes

if __name__ == "__main__":
    # Generate some sample categorical data (replace with your own data)
    num_data_points = 100
    num_categories = 3
    data = np.random.randint(0, num_categories, size=(num_data_points, 2))
    
    num_clusters = 3
    cluster_assignments, cluster_modes = fcm(data, num_clusters)
    
    print("Cluster Assignments:")
    print(cluster_assignments)
    print("\nCluster Modes:")
    print(cluster_modes)



Cluster Assignments:
[0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0]

Cluster Modes:
[[1. 1.]
 [1. 1.]
 [1. 1.]]
