# Práctica 2. Soft Computing: Classificación Fuzzy 

**Objetivos**

El objetivo de esta práctica es saber implementar un sistema difuso completo, específicamente, un Sistema de Clasificación Basado en Reglas Difusas (SCBRDs). La práctica comprenderá todas las etapas de este, desde la generación de reglas a partir de un conjunto de datos (aprendizaje del clasificador), a la realización del código del algoritmo de clasificación.

**Enunciado de la práctica**

Los Sistemas Basados en Reglas Difusas son aplicaciones típicas de los sistemas difusos, bien conocidas por su capacidad expresiva o de interpretabilidad, y por poder mezclar el conocimiento aportado por el experto con el obtenido o aprendido por métodos automáticos. 

Trabajaremos con un conjunto de datos o ejemplos (*dataset*) típico de un respositorio reconocido, aprenderemos el conjunto de reglas mediante la adaptación de un algoritmo derivado de uno de los clásicos, implementaremos la clasificación y verificaremos su comportamiento. 

***Implementación de un Algoritmo de Clasificación Difuso***

Se trata de implementar el algoritmo de clasificación *fuzzy* completo, es decir, con capacidad de clasificar instancias nuevas empleando su Base de Conocimiento previamente aprendida mediante los algoritmos estudiados en las sesiones teóricas. 

Los operadores y mecanismos que se deben implementar son:
* el mínimo (i.e. *t-norma* del *producto lógico*) para el *matching*,
* el *producto algebraico* para la *función de ponderación*, 
* el método de *Regla Ganadora*. 

***Aprendizaje del Clasificador***

El conjunto de ejemplos que debe emplear es el Glass1, con 9 variables, 7 clases y 214 ejemplo, que se pueden descargar de este [link](https://sci2s.ugr.es/keel/category.php?cat=clas).

El universo de las variables (antecedentes) lo particionará en 3 y 5 etiquetas, para comparar los resultados. 

La base de reglas debe aprenderse con el algoritmo estudiado en las sesiones de teoría, conocico como método *Chi*, derivado del archiconocido *Método de Wang y Mendel*, que encuentra las reglas por un criterio de cubrimiento y calidad individual de cada regla. 

El conjunto de datos se dividirá en partes, como se explicará en la sección sobre la experimentación. 

## Variables:

Variables de entrada: 
* RI --> [1.51115,1.53393]
* Na --> [10.73,17.38] 
* Mg --> [0.0,4.49]
* Al --> [0.29,3.5]
* Si --> [69.81,75.41]
* K --> [0.0,6.21]
* Ca --> [5.43,16.19]
* Ba --> [0.0,3.15]
* Fe --> [0.0,0.51]

Variable de salida:
* TypeGlass: {1, 2, 3, 4, 5, 6, 7}

In [90]:
!pip install scikit-fuzzy 

Looking in indexes: https://pypi.org/simple, https://us-python.pkg.dev/colab-wheels/public/simple/


Montamos el drive en el cuaderno para poder tener acceso a los ficheros *Glass1* de train y de test

In [91]:
from google.colab import drive
drive.mount('/content/drive')

Drive already mounted at /content/drive; to attempt to forcibly remount, call drive.mount("/content/drive", force_remount=True).


Importación de las librerías necesarias

In [92]:
import pandas as pd
import numpy as np
import numpy as np
import pandas as pd
import skfuzzy as fuzz
from skfuzzy import control as ctrl
from sklearn.metrics import accuracy_score, confusion_matrix

Lectura de los archivos train y test 

In [93]:
training1 = pd.read_csv('/content/drive/MyDrive/CI/Datasets/glass/glass-5dobscv-1tra.dat')
test1 = pd.read_csv('/content/drive/MyDrive/CI/Datasets/glass/glass-5dobscv-1tst.dat')

training2 = pd.read_csv('/content/drive/MyDrive/CI/Datasets/glass/glass-5dobscv-2tra.dat')
test2 = pd.read_csv('/content/drive/MyDrive/CI/Datasets/glass/glass-5dobscv-2tst.dat')

training3 = pd.read_csv('/content/drive/MyDrive/CI/Datasets/glass/glass-5dobscv-3tra.dat')
test3 = pd.read_csv('/content/drive/MyDrive/CI/Datasets/glass/glass-5dobscv-3tst.dat')

training4 = pd.read_csv('/content/drive/MyDrive/CI/Datasets/glass/glass-5dobscv-4tra.dat')
test4 = pd.read_csv('/content/drive/MyDrive/CI/Datasets/glass/glass-5dobscv-4tst.dat')

training5 = pd.read_csv('/content/drive/MyDrive/CI/Datasets/glass/glass-5dobscv-5tra.dat')
test5 = pd.read_csv('/content/drive/MyDrive/CI/Datasets/glass/glass-5dobscv-5tst.dat')

Definimos el universo de discurso de cada variable

In [94]:
Universo_RI = np.arange(1.51115,1.53393,0.00001)
Universo_Na = np.arange(10.73,17.38,0.01)
Universo_Mg = np.arange(0.0,4.49,0.01)
Universo_Al = np.arange(0.29,3.5,0.01)
Universo_Si = np.arange(69.81,75.41,0.01)
Universo_K = np.arange(0.0,6.21,0.01)
Universo_Ca = np.arange(5.43,16.19,0.01)
Universo_Ba = np.arange(0.0,3.15,0.01)
Universo_Fe = np.arange(0.0,0.51,0.01)

Antecedentes

In [95]:
RI = ctrl.Antecedent(Universo_RI, 'RI') 
Na = ctrl.Antecedent(Universo_Na, 'Na') 
Mg = ctrl.Antecedent(Universo_Mg, 'Mg') 
Al = ctrl.Antecedent(Universo_Al, 'Al') 
Si = ctrl.Antecedent(Universo_Si, 'Si') 
K = ctrl.Antecedent(Universo_K, 'K') 
Ca = ctrl.Antecedent(Universo_Ca, 'Ca') 
Ba = ctrl.Antecedent(Universo_Ba, 'Ba') 
Fe = ctrl.Antecedent(Universo_Fe, 'Fe') 

Consecuente

In [96]:
TypeGlass = ctrl.Consequent(np.arange(1, 8, 1), 'TypeGlass')

Creación de las etiquetas

## 3 Etiquetas

In [97]:
RI.automf(3)
Na.automf(3) 
Mg.automf(3) 
Al.automf(3) 
Si.automf(3)
K.automf(3) 
Ca.automf(3) 
Ba.automf(3) 
Fe.automf(3) 

clases = ['1','2','3','4','5','6','7']
TypeGlass.automf(names = clases)

### Funciones creadas 

In [99]:
def gradoPertenencia(rango, elemento, valor):
  membresiaBaja = fuzz.interp_membership(rango, elemento['poor'].mf, valor)
  membresiaMedia = fuzz.interp_membership(rango, elemento['average'].mf, valor)
  membresiaAlta = fuzz.interp_membership(rango, elemento['good'].mf, valor)

  membresias = [membresiaBaja, membresiaMedia, membresiaAlta]

  m = np.argmax(membresias)

  if(m==0):
    etiqueta = 'poor'
  
  if(m==1):
    etiqueta = 'average'

  if(m==2):
    etiqueta = 'good'

  return etiqueta, membresias[m]

In [100]:
def gradoPertenenciaClasificacion(rango, elemento, valor, clase):
  membresiaBaja = fuzz.interp_membership(rango, elemento['poor'].mf, valor)
  membresiaMedia = fuzz.interp_membership(rango, elemento['average'].mf, valor)
  membresiaAlta = fuzz.interp_membership(rango, elemento['good'].mf, valor)

  if(clase=='poor'):
    etiqueta = membresiaBaja

  if(clase=='average'):
    etiqueta = membresiaMedia

  if(clase=='good'):
    etiqueta = membresiaAlta

  return etiqueta

In [101]:
def generadorDeReglas(dataframe):
  #Dataframe de reglas
  reglas = pd.DataFrame()
  reglas[['RI', 'Na', 'Mg', 'Al', 'Si', 'K', 'Ca', 'Ba', 'Fe', 'TypeGlass']] = None
  reglasRI, reglasNa, reglasMg, reglasAl, reglasSi, reglasK, reglasCa, reglasBa, reglasFe = [],[],[],[],[],[],[],[],[]

  #Dataframe grados de pertenencia
  gradosPertenencia = pd.DataFrame()
  gradosPertenencia[['RI', 'Na', 'Mg', 'Al', 'Si', 'K', 'Ca', 'Ba', 'Fe', 'TypeGlass']] = None
  gradoPertenenciaRI, gradoPertenenciaNa, gradoPertenenciaMg, gradoPertenenciaAl, gradoPertenenciaSi, gradoPertenenciaK, gradoPertenenciaCa, gradoPertenenciaBa, gradoPertenenciaFe = [],[],[],[],[],[],[],[],[]

  for i in range(len(dataframe)):
    valorRI = dataframe.iloc[i]['RI']
    reg, gp = gradoPertenencia(Universo_RI, RI, valorRI)
    reglasRI.append(reg)
    gradoPertenenciaRI.append(gp)

    valorNa = dataframe.iloc[i]['Na']
    reg, gp = gradoPertenencia(Universo_Na, Na, valorNa)
    reglasNa.append(reg)
    gradoPertenenciaNa.append(gp)

    valorMg = dataframe.iloc[i]['Mg']
    reg, gp = gradoPertenencia(Universo_Mg, Mg, valorMg)
    reglasMg.append(reg)
    gradoPertenenciaMg.append(gp)

    valorAl = dataframe.iloc[i]['Al']
    reg, gp = gradoPertenencia(Universo_Al, Al, valorAl)
    reglasAl.append(reg)
    gradoPertenenciaAl.append(gp)

    valorSi = dataframe.iloc[i]['Si']
    reg, gp = gradoPertenencia(Universo_Si, Si, valorSi)
    reglasSi.append(reg)
    gradoPertenenciaSi.append(gp)

    valorK = dataframe.iloc[i]['K']
    reg, gp = gradoPertenencia(Universo_K, K, valorK)
    reglasK.append(reg)
    gradoPertenenciaK.append(gp)

    valorCa = dataframe.iloc[i]['Ca']
    reg, gp = gradoPertenencia(Universo_Ca, Ca, valorCa)
    reglasCa.append(reg)
    gradoPertenenciaCa.append(gp)

    valorBa = dataframe.iloc[i]['Ba']
    reg, gp = gradoPertenencia(Universo_Ba, Ba, valorBa)
    reglasBa.append(reg)
    gradoPertenenciaBa.append(gp)

    valorFe = dataframe.iloc[i]['Fe']
    reg, gp = gradoPertenencia(Universo_Fe, Fe, valorFe)
    reglasFe.append(reg)
    gradoPertenenciaFe.append(gp)

  reglas['RI'] = reglasRI
  reglas['Na'] = reglasNa
  reglas['Mg'] = reglasMg
  reglas['Al'] = reglasAl
  reglas['Si'] = reglasSi
  reglas['K'] = reglasK
  reglas['Ca'] = reglasCa
  reglas['Ba'] = reglasBa
  reglas['Fe'] = reglasFe
  reglas['TypeGlass'] = dataframe['TypeGlass']

  gradosPertenencia['RI'] = gradoPertenenciaRI
  gradosPertenencia['Na'] = gradoPertenenciaNa
  gradosPertenencia['Mg'] = gradoPertenenciaMg
  gradosPertenencia['Al'] = gradoPertenenciaAl
  gradosPertenencia['Si'] = gradoPertenenciaSi
  gradosPertenencia['K'] = gradoPertenenciaK
  gradosPertenencia['Ca'] = gradoPertenenciaCa
  gradosPertenencia['Ba'] = gradoPertenenciaBa
  gradosPertenencia['Fe'] = gradoPertenenciaFe
  gradosPertenencia['TypeGlass'] = dataframe['TypeGlass']

  return reglas, gradosPertenencia

In [102]:
def generaGC(reglas, gradosPertenencia):
  reglas_aux = reglas.drop(['TypeGlass'], axis=1)
  gradosPertenencia_aux = gradosPertenencia.drop(['TypeGlass'], axis=1)

  GCs = []

  for i in range(len(reglas_aux)):
    # Calculamos Sj agrupando las filas con los mismos antecedentes y los mismos consecuentes
    fila_Sj = reglas.iloc[i,:]
    count = (reglas == fila_Sj).all(axis=1)
    indices = [i for i, x in enumerate(count.tolist()) if x == True]
    Sj = 0

    for index in indices:
      f = gradosPertenencia_aux.iloc[index,:].tolist()
      Sj = Sj + sum(f)

    #Calculamos S
    fila = reglas_aux.iloc[i,:]
    count = (reglas_aux == fila).all(axis=1)
    indices = [i for i, x in enumerate(count.tolist()) if x == True]
    S = 0
    for index in indices:
      f = gradosPertenencia_aux.iloc[index,:].tolist()
      S = S + sum(f)

    #Finalmente con Sj y S podemos calcular el grado de certeza
    gc = round(Sj/S,6)
    GCs.append(gc)

  reglas["GradoCerteza"] = GCs

In [103]:
def limpiaReglas(reglas):
  #Eliminamos reglas duplicadas
  reglas = reglas.drop_duplicates()

  #Además eliminamos las reglas que no tienen suficiente calidad
  reglas = reglas[~(reglas['GradoCerteza']<0.5)]

  print("Número de reglas: " + str(len(reglas))) # esto nos interesa para rellenar el número de reglas utilizado de la tabla (#R)

  return reglas

In [104]:
def clasificador(reglas, test):
  etiquetasTest = test['TypeGlass']
  test = test.drop(['TypeGlass'], axis=1)

  predicciones = []

  for i in range(len(test)):
    tmp = test.iloc[i, :]

    #Extraemos los valores de cada fila cuando la vayamos recorriendo
    tmpRI = tmp['RI']
    tmpNa = tmp['Na']
    tmpMg = tmp['Mg']
    tmpAl = tmp['Al']
    tmpSi = tmp['Si']
    tmpK = tmp['K']
    tmpCa = tmp['Ca']
    tmpBa = tmp['Ba']
    tmpFe = tmp['Fe']

    # Lista para almacenar el grado de emparejamiento para cada regla
    hi = []

    for j in range(len(reglas)):
      gradoEmparejamiento = []
      tmpReglas = reglas.iloc[j, :]

      # Obtener el grado de pertenencia para cada característica
      gradoEmparejamiento.append(gradoPertenenciaClasificacion(Universo_RI, RI, tmpRI, tmpReglas['RI']))
      gradoEmparejamiento.append(gradoPertenenciaClasificacion(Universo_Na, Na, tmpNa, tmpReglas['Na']))
      gradoEmparejamiento.append(gradoPertenenciaClasificacion(Universo_Mg, Mg, tmpMg, tmpReglas['Mg']))
      gradoEmparejamiento.append(gradoPertenenciaClasificacion(Universo_Al, Al, tmpAl, tmpReglas['Al']))
      gradoEmparejamiento.append(gradoPertenenciaClasificacion(Universo_Si, Si, tmpSi, tmpReglas['Si']))
      gradoEmparejamiento.append(gradoPertenenciaClasificacion(Universo_K, K, tmpK, tmpReglas['K']))
      gradoEmparejamiento.append(gradoPertenenciaClasificacion(Universo_Ca, Ca, tmpCa, tmpReglas['Ca']))
      gradoEmparejamiento.append(gradoPertenenciaClasificacion(Universo_Ba, Ba, tmpBa, tmpReglas['Ba']))
      gradoEmparejamiento.append(gradoPertenenciaClasificacion(Universo_Fe, Fe, tmpFe, tmpReglas['Fe']))

      hi.append(min(gradoEmparejamiento))

    reglas['hi'] = hi
    reglas['ga'] = reglas['GradoCerteza'] * reglas['hi']

    predicciones.append(reglas['TypeGlass'].loc[reglas['ga'].idxmax()]) 

  accuracy = accuracy_score(etiquetasTest, predicciones)

  return accuracy

Creación de reglas

In [105]:
reglasTraining1,gradosPertenenciaTraining1 = generadorDeReglas(training1)
reglasTraining2,gradosPertenenciaTraining2 = generadorDeReglas(training2)
reglasTraining3,gradosPertenenciaTraining3 = generadorDeReglas(training3)
reglasTraining4,gradosPertenenciaTraining4 = generadorDeReglas(training4)
reglasTraining5,gradosPertenenciaTraining5 = generadorDeReglas(training5)

Calculamos el grado de certeza para cada regla

In [106]:
generaGC(reglasTraining1,gradosPertenenciaTraining1)
generaGC(reglasTraining2,gradosPertenenciaTraining2)
generaGC(reglasTraining3,gradosPertenenciaTraining3)
generaGC(reglasTraining4,gradosPertenenciaTraining4)
generaGC(reglasTraining5,gradosPertenenciaTraining5)

Limpieza de reglas

In [107]:
print("Partición 1/5")
reglasTraining1 = limpiaReglas(reglasTraining1)

print("Partición 2/5")
reglasTraining2 = limpiaReglas(reglasTraining2)

print("Partición 3/5")
reglasTraining3 = limpiaReglas(reglasTraining3)

print("Partición 4/5")
reglasTraining4 = limpiaReglas(reglasTraining4)

print("Partición 5/5")
reglasTraining5 = limpiaReglas(reglasTraining5)

Partición 1/5
Número de reglas: 34
Partición 2/5
Número de reglas: 38
Partición 3/5
Número de reglas: 39
Partición 4/5
Número de reglas: 39
Partición 5/5
Número de reglas: 39


Entrenamiento

In [108]:
acc = clasificador(reglasTraining1,training1)
print("Accuracy de la particion 1: " + str(acc))

acc = clasificador(reglasTraining2,training2)
print("Accuracy de la particion 2: " + str(acc))

acc = clasificador(reglasTraining3,training3)
print("Accuracy de la particion 3: " + str(acc))

acc = clasificador(reglasTraining4,training4)
print("Accuracy de la particion 4: " + str(acc))

acc = clasificador(reglasTraining5,training5)
print("Accuracy de la particion 5: " + str(acc))

Accuracy de la particion 1: 0.5680473372781065
Accuracy de la particion 2: 0.5470588235294118
Accuracy de la particion 3: 0.5146198830409356
Accuracy de la particion 4: 0.5930232558139535
Accuracy de la particion 5: 0.5402298850574713


Test

In [109]:
acc = clasificador(reglasTraining1,test1)
print("Accuracy de la particion 1: " + str(acc))

acc = clasificador(reglasTraining2,test2)
print("Accuracy de la particion 2: " + str(acc))

acc = clasificador(reglasTraining3,test3)
print("Accuracy de la particion 3: " + str(acc))

acc = clasificador(reglasTraining4,test4)
print("Accuracy de la particion 4: " + str(acc))

acc = clasificador(reglasTraining5,test5)
print("Accuracy de la particion 5: " + str(acc))

Accuracy de la particion 1: 0.4666666666666667
Accuracy de la particion 2: 0.4772727272727273
Accuracy de la particion 3: 0.4883720930232558
Accuracy de la particion 4: 0.42857142857142855
Accuracy de la particion 5: 0.625


## 5 Etiquetas

Creación de las etiquetas

In [110]:
RI.automf(5)
Na.automf(5) 
Mg.automf(5) 
Al.automf(5) 
Si.automf(5)
K.automf(5) 
Ca.automf(5) 
Ba.automf(5) 
Fe.automf(5) 

clases = ['1','2','3','4','5','6','7']
TypeGlass.automf(names = clases)

### Funciones creadas

*Nótese que solo se han redefinido las funciones que han supuesto un cambio con el incremento de etiquetas a 5 para evitar la escritura de código redundante*

In [112]:
def gradoPertenencia(rango, elemento, valor):
  membresiaBaja = fuzz.interp_membership(rango, elemento['poor'].mf, valor)
  membresiaBajaMedia = fuzz.interp_membership(rango, elemento['mediocre'].mf, valor)
  membresiaMedia = fuzz.interp_membership(rango, elemento['average'].mf, valor)
  membresiaMediaAlta = fuzz.interp_membership(rango, elemento['decent'].mf, valor)
  membresiaAlta = fuzz.interp_membership(rango, elemento['good'].mf, valor)

  membresias = [membresiaBaja, membresiaBajaMedia, membresiaMedia, membresiaMediaAlta, membresiaAlta]

  m = np.argmax(membresias)

  if(m==0):
    etiqueta = 'poor'
  
  if(m==1):
    etiqueta = 'mediocre'

  if(m==2):
    etiqueta = 'average'

  if(m==3):
    etiqueta = 'decent'

  if(m==4):
    etiqueta = 'good'

  return etiqueta, membresias[m]

In [113]:
def gradoPertenenciaClasificacion(rango, elemento, valor, clase):
  membresiaBaja = fuzz.interp_membership(rango, elemento['poor'].mf, valor)
  membresiaBajaMedia = fuzz.interp_membership(rango, elemento['mediocre'].mf, valor)
  membresiaMedia = fuzz.interp_membership(rango, elemento['average'].mf, valor)
  membresiaMediaAlta = fuzz.interp_membership(rango, elemento['decent'].mf, valor)
  membresiaAlta = fuzz.interp_membership(rango, elemento['good'].mf, valor)

  if(clase=='poor'):
    etiqueta = membresiaBaja

  if(clase=='mediocre'):
    etiqueta = membresiaBajaMedia

  if(clase=='average'):
    etiqueta = membresiaMedia

  if(clase=='decent'):
    etiqueta = membresiaMediaAlta

  if(clase=='good'):
    etiqueta = membresiaAlta

  return etiqueta

Creación de reglas

In [114]:
reglasTraining1,gradosPertenenciaTraining1 = generadorDeReglas(training1)
reglasTraining2,gradosPertenenciaTraining2 = generadorDeReglas(training2)
reglasTraining3,gradosPertenenciaTraining3 = generadorDeReglas(training3)
reglasTraining4,gradosPertenenciaTraining4 = generadorDeReglas(training4)
reglasTraining5,gradosPertenenciaTraining5 = generadorDeReglas(training5)

Calculamos el grado de certeza para cada regla

In [115]:
generaGC(reglasTraining1,gradosPertenenciaTraining1)
generaGC(reglasTraining2,gradosPertenenciaTraining2)
generaGC(reglasTraining3,gradosPertenenciaTraining3)
generaGC(reglasTraining4,gradosPertenenciaTraining4)
generaGC(reglasTraining5,gradosPertenenciaTraining5)

Limpieza de reglas

In [116]:
print("Partición 1/5")
reglasTraining1 = limpiaReglas(reglasTraining1)

print("Partición 2/5")
reglasTraining2 = limpiaReglas(reglasTraining2)

print("Partición 3/5")
reglasTraining3 = limpiaReglas(reglasTraining3)

print("Partición 4/5")
reglasTraining4 = limpiaReglas(reglasTraining4)

print("Partición 5/5")
reglasTraining5 = limpiaReglas(reglasTraining5)

Partición 1/5
Número de reglas: 71
Partición 2/5
Número de reglas: 73
Partición 3/5
Número de reglas: 76
Partición 4/5
Número de reglas: 79
Partición 5/5
Número de reglas: 79


Entrenamiento

In [117]:
acc = clasificador(reglasTraining1,training1)
print("Accuracy de la particion 1: " + str(acc))

acc = clasificador(reglasTraining2,training2)
print("Accuracy de la particion 2: " + str(acc))

acc = clasificador(reglasTraining3,training3)
print("Accuracy de la particion 3: " + str(acc))

acc = clasificador(reglasTraining4,training4)
print("Accuracy de la particion 4: " + str(acc))

acc = clasificador(reglasTraining5,training5)
print("Accuracy de la particion 5: " + str(acc))

Accuracy de la particion 1: 0.7869822485207101
Accuracy de la particion 2: 0.7588235294117647
Accuracy de la particion 3: 0.783625730994152
Accuracy de la particion 4: 0.7790697674418605
Accuracy de la particion 5: 0.7816091954022989


Test

In [118]:
acc = clasificador(reglasTraining1,test1)
print("Accuracy de la particion 1: " + str(acc))

acc = clasificador(reglasTraining2,test2)
print("Accuracy de la particion 2: " + str(acc))

acc = clasificador(reglasTraining3,test3)
print("Accuracy de la particion 3: " + str(acc))

acc = clasificador(reglasTraining4,test4)
print("Accuracy de la particion 4: " + str(acc))

acc = clasificador(reglasTraining5,test5)
print("Accuracy de la particion 5: " + str(acc))

Accuracy de la particion 1: 0.5333333333333333
Accuracy de la particion 2: 0.6136363636363636
Accuracy de la particion 3: 0.6744186046511628
Accuracy de la particion 4: 0.6428571428571429
Accuracy de la particion 5: 0.625
