Este algoritmo é projetado para fornecer uma partição fuzzy e um protótipo para cada cluster fuzzy, além de aprender um peso de relevância para cada matriz de dissimilaridade que muda na iteração de cada algoritmo e é diferente de um cluster fuzzy para outro.

In [1]:
# PARÂMETROS INICIAIS

K = 10 # Número de classes
N = 2000 # Número de objetos

In [2]:
import numpy as np
import pandas as pd

matrizU_3M =  pd.read_csv('/content/drive/My Drive/data/Melhores resultados/3views-matriz_U.csv', sep = ",")
matrizU_fac = pd.read_csv('/content/drive/My Drive/data/Melhores resultados/FAC-matriz_U.csv', sep = ",")
matrizU_fou = pd.read_csv('/content/drive/My Drive/data/Melhores resultados/FOU-matriz_U.csv', sep = ",")
matrizU_kar = pd.read_csv('/content/drive/My Drive/data/Melhores resultados/KAR-matriz_U.csv', sep = ",")

print("Matriz U - 3 views")
M3_D = matrizU_3M.to_numpy()
print(matrizU_3M.shape)

print("Matriz U - Fac")
MFac = matrizU_fac.to_numpy()
print(matrizU_fac.shape)

print("Matriz U - Fou")
MFou = matrizU_fou.to_numpy()
print(MFou.shape)

print("Matriz U - Kar")
MKar = matrizU_kar.to_numpy()
print(MKar.shape)

Matriz U - 3 views
(2000, 10)
Matriz U - Fac
(2000, 10)
Matriz U - Fou
(2000, 10)
Matriz U - Kar
(2000, 10)


# **Modified Partition Entropy & Partition Entropy**
- O Coeficiente de Partição Modificado é usado para medir a quantidade de sobreposição entre os grupos.
-- Range: [0,1]. O valor máximo de MPC é usado para localizar o número ótimo de grupos.

- O Partition Entropy mede a imprecisão de uma partição do grupo. O índice PE é uma medida escalar da quantidade de imprecisão em um determinado U. O intervalo de valores do índice PE em [0, log (C)], quanto mais próximo o valor de PE de 0, mais nítido é o agrupamento. O valor do índice próximo ao limite superior indica a ausência de qualquer estrutura de agrupamento nos conjuntos de dados ou a incapacidade do algoritmo de extraí-la.
-- Faixa: [0; log_a(c)]; O valor mínimo de VPE é usado para localizar o número ótimo de clusters.

In [3]:
import math 

# Modified Partition Entropy
def mpc(c, matrizU, N):
  MPC = (c/(c-1)) * (1-((sum(sum(matrizU**2)))/N))
  return 1 - MPC

# Partition Entropy
def part_Entropy(MatrizU, N):
  pe = 0
  for i in range(0,N):
    for j in range(0,K):
      Log = math.log(MatrizU[i][j])
      pe += MatrizU[i][j]*Log
  PE = -pe/N
  return PE

print("MPC-3VW:", mpc(K, M3_D, N))
print("MPC-FAC:", mpc(K, MFac, N))
print("MPC-FOU:", mpc(K, MFou, N))
print("MPC-KAR:", mpc(K, MKar, N))
print()
print("PE-3VW:", part_Entropy(M3_D, N))
print("PE-FAC:", part_Entropy(MFac, N))
print("PE-FOU:", part_Entropy(MFou, N))
print("PE-KAR:", part_Entropy(MKar, N))

MPC-3VW: 0.006312414888811846
MPC-FAC: 0.01674889814151037
MPC-FOU: 0.002071422712681459
MPC-KAR: 0.003627074038692779

PE-3VW: 2.2784820821453873
PE-FAC: 2.237726079414474
PE-FOU: 2.2949176681606733
PE-KAR: 2.288498112024681


# **Criando uma Partição Crispy**

Cada linha da matriz é um Cluster k e está representado pelos objetos/exemplos pertencentes ao Cluster k.

In [4]:
def crispy_Partition(matrizU):
  crispy_partition = []
  i = 0
  for linha in matrizU:
    i += 1
    crispy_partition.append(np.argmax(linha))
  return crispy_partition

crispy_3m = crispy_Partition(M3_D)
crispy_fac = crispy_Partition(MFac)
crispy_fou = crispy_Partition(MFou)
crispy_kar = crispy_Partition(MKar)

print("VIEW0 =", crispy_3m)
print("VIEW1 =", crispy_fac)
print("VIEW2 =", crispy_fou)
print("VIEW3 =", crispy_kar)
print("")

VIEW0 = [0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 4, 0, 0, 0, 0, 0, 5, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 8, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 6, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 2, 7, 2, 1, 9, 1, 7, 1, 1, 1, 1, 3, 1, 2, 7, 1, 1, 1, 1, 1, 1, 1, 7, 1, 3, 1, 1, 1, 1, 1, 7, 1, 1, 3, 1, 9, 3, 3, 1, 1, 9, 1, 3, 1, 1, 1, 7, 7, 1, 1, 1, 1, 9, 1, 1, 6, 1, 7, 1, 1, 7, 7, 1, 1, 4, 1, 2, 7, 7, 1, 1, 1, 1, 1, 3, 7, 1, 1, 1, 1, 1, 7, 7, 7, 7, 1, 1, 7, 7, 1, 1, 1, 9, 1, 1, 1, 4, 1, 1, 7, 1, 1, 1, 1, 3, 7, 1, 1, 7, 1, 1, 1, 2, 1, 1, 7, 9, 1, 7, 1, 1, 1, 3, 1, 7, 3, 1, 1, 7, 3, 1

Precisão

In [5]:
from  sklearn.metrics import accuracy_score

y_true = np.empty(2000)
y_true[0:200] = 0
y_true[200:400] = 1
y_true[400:600] = 2
y_true[600:800] = 3
y_true[800:1000] = 4
y_true[1000:1200] = 5
y_true[1200:1400] = 6
y_true[1400:1600] = 7
y_true[1600:1800] = 8
y_true[1800:2000] = 9
print(y_true)

def acuracia(y_true, partition):
   acerto = accuracy_score(y_true, partition)
   return acerto

print("VIEW0:", acuracia(y_true, crispy_3m))
print("VIEW1:", acuracia(y_true, crispy_fac))
print("VIEW2:", acuracia(y_true, crispy_fou))
print("VIEW3:", acuracia(y_true, crispy_kar))

[0. 0. 0. ... 9. 9. 9.]
VIEW0: 0.5345
VIEW1: 0.239
VIEW2: 0.108
VIEW3: 0.086
