Este algoritmo é projetado para fornecer uma partição fuzzy e um protótipo para cada cluster fuzzy, além de aprender um peso de relevância para cada matriz de dissimilaridade que muda na iteração de cada algoritmo e é diferente de um cluster fuzzy para outro.

In [39]:
# PARÂMETROS INICIAIS

K = 10 # Número de classes
N = 2000 # Número de objetos

In [40]:
import numpy as np
import pandas as pd

matrizU_3M =  pd.read_csv('/content/drive/My Drive/data/Melhores resultados/3_matrizes-matriz_U_q2-16.csv', sep = ",")
matrizU_fac = pd.read_csv('/content/drive/My Drive/data/Melhores resultados/FAC-matriz_U_q2-6.csv', sep = ",")
matrizU_fou = pd.read_csv('/content/drive/My Drive/data/Melhores resultados/FOU-matriz_U_q2-2.csv', sep = ",")
matrizU_kar = pd.read_csv('/content/drive/My Drive/data/Melhores resultados/KAR-matriz_U_q2-20.csv', sep = ",")

print("Matriz U - 3 views")
M3_D = matrizU_3M.to_numpy()
print(matrizU_3M.shape)

print("Matriz U - Fac")
MFac = matrizU_fac.to_numpy()
print(matrizU_fac.shape)

print("Matriz U - Fou")
MFou = matrizU_fou.to_numpy()
print(MFou.shape)

print("Matriz U - Kar")
MKar = matrizU_kar.to_numpy()
print(MKar.shape)

Matriz U - 3 views
(2000, 10)
Matriz U - Fac
(2000, 10)
Matriz U - Fou
(2000, 10)
Matriz U - Kar
(2000, 10)


# **Modified Partition Entropy & Partition Entropy**
- O Coeficiente de Partição Modificado é usado para medir a quantidade de sobreposição entre os grupos.
- O Partition Entropy mede a imprecisão de uma partição do grupo. O índice PE é uma medida escalar da quantidade de imprecisão em um determinado U. O intervalo de valores do índice PE em [0, log (C)], quanto mais próximo o valor de PE de 0, mais nítido é o agrupamento. O valor do índice próximo ao limite superior indica a ausência de qualquer estrutura de agrupamento nos conjuntos de dados ou a incapacidade do algoritmo de extraí-la.

In [41]:
import math 

# Modified Partition Entropy
def mpc(matrizU, N):
  MPC = (sum(sum(matrizU**2)))/N
  return MPC

# Partition Entropy
def part_Entropy(MatrizU, N):
  pe = 0
  for i in range(0,N):
    for j in range(0,K):
      Log = math.log(MatrizU[i][j])
      pe += MatrizU[i][j]*Log
  PE = -pe/N
  return PE

print("MPC-3VW:", mpc(M3_D, N))
print("MPC-FAC:", mpc(MFac, N))
print("MPC-FOU:", mpc(MFou, N))
print("MPC-KAR:", mpc(MKar, N))
print()
print("PE-3VW:", part_Entropy(M3_D, N))
print("PE-FAC:", part_Entropy(MFac, N))
print("PE-FOU:", part_Entropy(MFou, N))
print("PE-KAR:", part_Entropy(MKar, N))

MPC-3VW: 0.10568117339993069
MPC-FAC: 0.1150740083273594
MPC-FOU: 0.10186428044141335
MPC-KAR: 0.10326436663482357

PE-3VW: 2.2784820821453873
PE-FAC: 2.237726079414474
PE-FOU: 2.2949176681606733
PE-KAR: 2.288498112024681


# **Criando uma Partição Crispy**

Cada linha da matriz é um Cluster k e está representado pelos objetos/exemplos pertencentes ao Cluster k.

In [42]:
# Partição Crispy
def cluster_objeto(P_C_K, K):
  partition_crispy = []
  for clt in range(1, K+1):
    partition = []
    for i in P_C_K:
      if i[1] == clt:
        partition.append(i[0])
    partition_crispy.append(partition)
  return partition_crispy

def crispyPartition(matrizU, K):
  crispy_partition = []
  i = 0
  for linha in matrizU:
    i += 1
    crispy_partition.append([i, (np.argmax(linha)+1)])
  partition_crispy = cluster_objeto(crispy_partition, K)
  return partition_crispy

crispy_3m = crispyPartition(M3_D, K)
crispy_fac = crispyPartition(MFac, K)
crispy_fou = crispyPartition(MFou, K)
crispy_kar = crispyPartition(MKar, K)
print("Partição Crispy-3views", crispy_3m)
print("Partição Crispy - FAC", crispy_fac)
print("Partição Crispy - FOU", crispy_fou)
print("Partição Crispy - KAR", crispy_kar)

Partição Crispy-3views [[1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99, 100, 101, 103, 104, 105, 106, 107, 109, 110, 111, 112, 113, 114, 115, 116, 117, 118, 119, 120, 121, 122, 123, 124, 125, 126, 127, 128, 129, 130, 131, 132, 133, 134, 135, 137, 138, 139, 140, 141, 142, 143, 144, 145, 146, 147, 148, 149, 150, 151, 152, 153, 154, 155, 156, 157, 158, 160, 161, 162, 163, 164, 165, 166, 167, 168, 169, 170, 171, 172, 173, 174, 175, 176, 177, 178, 179, 180, 181, 182, 183, 184, 185, 186, 187, 188, 189, 190, 191, 192, 193, 194, 195, 196, 197, 198, 199, 200, 816, 876, 981, 1001, 1019, 1032, 1037, 1059, 1071, 1113, 1128, 1138, 1181, 1198, 1288, 1605, 1614, 1619

**Contar o número de exemplos contidos em cada Cluster.**

In [43]:
# Contar quantos objetos existem em cada Cluster criado
def contagem(partição):
  lista_N = []
  for linha in partição:
    lista_N.append(len(linha))
  return lista_N

contagem_crispy_3m = contagem(crispy_3m)
contagem_crispy_fac = contagem(crispy_fac)
contagem_crispy_fou = contagem(crispy_fou)
contagem_crispy_kar = contagem(crispy_kar)
print("Quantidade de objetos para 3 matrizes:", contagem_crispy_3m)
print("Quantidade de objetos para m_fac", contagem_crispy_fac)
print("Quantidade de objetos para m_fou:", contagem_crispy_fou)
print("Quantidade de objetos para m_kar:", contagem_crispy_kar)

# Apenas verificando que contém N objetos no total:
def total(lista_contagem_por_cluster):
  cont = 0
  for i in lista_contagem_por_cluster:
    cont += i
  return cont
print("3 matrizes:", total(contagem_crispy_3m))
print("Fac", total(contagem_crispy_fac))
print("Fou", total(contagem_crispy_fou))
print("Kar", total(contagem_crispy_kar))

Quantidade de objetos para 3 matrizes: [221, 300, 272, 282, 249, 63, 14, 345, 141, 113]
Quantidade de objetos para m_fac [90, 243, 269, 120, 124, 234, 61, 258, 383, 218]
Quantidade de objetos para m_fou: [200, 262, 77, 224, 106, 246, 263, 195, 157, 270]
Quantidade de objetos para m_kar: [211, 373, 296, 101, 135, 135, 82, 252, 310, 105]
3 matrizes: 2000
Fac 2000
Fou 2000
Kar 2000
