# Práctica 1: Clasificación multi-etiqueta

## Ejercicio 8

Escribe un script en Python (cl-cv.py) seleccionando al menos 3 métodos (que NO pertenezcan todos a la misma categoría) para evaluarlos con 5 de los datasets que recopilaste anteriormente y calcula las métricas resultantes mediante validación cruzada. El script mostrará el resultado de las métricas anteriores.

### Enfoque

Para facilitar la explicación del código se va a realizar un Jupyter Notebook como en apartados anteriores. Los algoritmos seleccionados son:
- Transformación: BinaryRelevance
- Transformación: LabelPowerset
- Adaptación: MLkNN

Como clasificador base se utilizará RandomForest, en apartados anteriores se ha estado utilizando GaussianNB, sin embargo, en otras asignaturas y proyectos RandomForest suele ser un algoritmo que obtiene buenos resultados. Por eso se ha decidido probar con este clasificador esta vez.

Los datasets utilizados serán los ya implementados en la librería scikit-multilearn:
- scene
- bibtex
- birds
- emotions
- medical

Para realizar la validación cruzada, se utilizará `cross_val_predict`. En este caso se ha optado por esta opción ya que lo que se quiere obtener son directamente las métricas y no experimentar con la validación cruzada.

In [1]:
import numpy as np
from sklearn.model_selection import cross_val_predict
from sklearn.ensemble import RandomForestClassifier
from skmultilearn.problem_transform import BinaryRelevance, LabelPowerset
from skmultilearn.adapt import MLkNN
from skmultilearn.dataset import load_dataset
from sklearn import metrics
from sklearn.model_selection import cross_val_score

import time

Como las métricas a evaluar son las explicadas en el ejercicio anterior, que incluyen HammingLoss y esta no se encuentra implementada en `classification_report` se va a realizar una función con las métricas a analizar.

Al tener que realizar lo mismo sobre 5 conjuntos de datos diferentes, también se va a realizar el código de una función que implemente la carga del conjunto de datos especificado, la clasificación, la validación cruzada y que muestre las métricas.

In [2]:
def evaluate_metrics(y_true, y_pred):
    accuracy = metrics.accuracy_score(y_true, y_pred)
    hamming_loss = metrics.hamming_loss(y_true, y_pred)
    precision = metrics.precision_score(y_true, y_pred, average='weighted')
    recall = metrics.recall_score(y_true, y_pred, average='weighted')
    f1_score = metrics.f1_score(y_true, y_pred, average='weighted')
    return accuracy, hamming_loss, precision, recall, f1_score

In [3]:
def cl_cv(dataset):
    print(f"Dataset: {dataset}\n========================")
    # Cargar los datos de entrenamiento y prueba
    X, y, _, _ = load_dataset(dataset, 'undivided')

    base_classifier = RandomForestClassifier()
    
    print(f"\nBinary Relevance - Dataset: {dataset}")
    start_time = time.time()
    # Binary Relevance
    br_classifier = BinaryRelevance(base_classifier)
    br_predictions = cross_val_predict(br_classifier, X, y, cv=5)
    br_metrics = evaluate_metrics(y, br_predictions)
    print(f"Accuracy: {br_metrics[0]}")
    print(f"Hamming Loss: {br_metrics[1]}")
    print(f"Precision: {br_metrics[2]}")
    print(f"Recall: {br_metrics[3]}")
    print(f"F1 Score: {br_metrics[4]}")
    end_time = time.time()
    print(f"Tiempo de ejecucion: {end_time - start_time}")

    # Label Powerset
    print(f"\nLabel Powerset - Dataset: {dataset}")
    start_time = time.time()
    lp_classifier = LabelPowerset(base_classifier)
    lp_predictions = cross_val_predict(lp_classifier, X, y, cv=5)
    lp_metrics = evaluate_metrics(y, lp_predictions)
    print(f"Accuracy: {lp_metrics[0]}")
    print(f"Hamming Loss: {lp_metrics[1]}")
    print(f"Precision: {lp_metrics[2]}")
    print(f"Recall: {lp_metrics[3]}")
    print(f"F1 Score: {lp_metrics[4]}")
    end_time = time.time()
    print(f"Tiempo de ejecucion: {end_time - start_time}")

    # MLkNN
    print(f"\nMLkNN - Dataset: {dataset}")
    start_time = time.time()
    mlknn_classifier = MLkNN(k=3)
    mlknn_predictions = cross_val_predict(mlknn_classifier, X, y, cv=5)
    mlknn_metrics = evaluate_metrics(y, mlknn_predictions)
    print(f"Accuracy: {mlknn_metrics[0]}")
    print(f"Hamming Loss: {mlknn_metrics[1]}")
    print(f"Precision: {mlknn_metrics[2]}")
    print(f"Recall: {mlknn_metrics[3]}")
    print(f"F1 Score: {mlknn_metrics[4]}")
    end_time = time.time()
    print(f"Tiempo de ejecucion: {end_time - start_time}")

### Scene

In [9]:
dataset = "scene"
cl_cv(dataset)

scene:undivided - exists, not redownloading



Binary Relevance - Dataset: scene
Accuracy: 0.45741587037806397
Hamming Loss: 0.10926464478604071
Precision: 0.7964165723484602
Recall: 0.4796905222437137
F1 Score: 0.5821461373279341
Tiempo de ejecucion: 122.95795750617981

Label Powerset - Dataset: scene
Accuracy: 0.6319069380972164
Hamming Loss: 0.11535798365877302
Precision: 0.6856624911067063
Recall: 0.6460348162475822
F1 Score: 0.6649079330895887
Tiempo de ejecucion: 26.66493058204651





MLkNN - Dataset: scene
Accuracy: 0.5429995845450769
Hamming Loss: 0.11570419609472372
Precision: 0.6964661727550745
Recall: 0.6181818181818182
F1 Score: 0.652343852968069
Tiempo de ejecucion: 44.30159306526184


### Bibtex

In [4]:
dataset = "bibtex"
cl_cv(dataset)

Dataset: bibtex
bibtex:undivided - exists, not redownloading

Binary Relevance - Dataset: bibtex


  _warn_prf(average, modifier, msg_start, len(result))


Accuracy: 0.11061528059499662
Hamming Loss: 0.013058287726281143
Precision: 0.49295198253380135
Recall: 0.1566265060240964
F1 Score: 0.18500963142908738
Tiempo de ejecucion: 4417.840320825577

Label Powerset - Dataset: bibtex
Accuracy: 0.22866801893171063
Hamming Loss: 0.015545945118450763
Precision: 0.4380060672648085
Recall: 0.31815110910933453
F1 Score: 0.33087537342724305
Tiempo de ejecucion: 375.2458019256592

MLkNN - Dataset: bibtex




Accuracy: 0.07491548343475321
Hamming Loss: 0.016876948133406476
Precision: 0.35528730165508837
Recall: 0.2141087715347371
F1 Score: 0.24392267904555184
Tiempo de ejecucion: 144.12352108955383


  _warn_prf(average, modifier, msg_start, len(result))


### Birds

In [4]:
dataset = "birds"
cl_cv(dataset)

Dataset: birds
birds:undivided - exists, not redownloading

Binary Relevance - Dataset: birds


  _warn_prf(average, modifier, msg_start, len(result))


Accuracy: 0.5209302325581395
Hamming Loss: 0.04112607099143207
Precision: 0.7497556904329705
Recall: 0.26605504587155965
F1 Score: 0.3662781109426311
Tiempo de ejecucion: 59.37385845184326

Label Powerset - Dataset: birds


  _warn_prf(average, modifier, msg_start, len(result))


Accuracy: 0.5565891472868217
Hamming Loss: 0.03778049775601795
Precision: 0.6933583282955649
Recall: 0.47706422018348627
F1 Score: 0.5557442811555947
Tiempo de ejecucion: 10.4437837600708

MLkNN - Dataset: birds




Accuracy: 0.4604651162790698
Hamming Loss: 0.06283149734802121
Precision: 0.22293064988019115
Recall: 0.12996941896024464
F1 Score: 0.16012818406494783
Tiempo de ejecucion: 6.051087856292725


  _warn_prf(average, modifier, msg_start, len(result))


### Emotions

In [5]:
dataset = "emotions"
cl_cv(dataset)

Dataset: emotions
emotions:undivided - exists, not redownloading

Binary Relevance - Dataset: emotions
Accuracy: 0.30522765598650925
Hamming Loss: 0.18858909499718943
Precision: 0.7415660923641287
Recall: 0.6010830324909747
F1 Score: 0.6438915901496678
Tiempo de ejecucion: 16.69721221923828

Label Powerset - Dataset: emotions
Accuracy: 0.36930860033726814
Hamming Loss: 0.1919617762788083
Precision: 0.6792776133944929
Recall: 0.7220216606498195
F1 Score: 0.6969326070299952
Tiempo de ejecucion: 3.1954779624938965

MLkNN - Dataset: emotions




Accuracy: 0.20404721753794267
Hamming Loss: 0.2844294547498595
Precision: 0.5353317022281302
Recall: 0.48194945848375453
F1 Score: 0.5053481690919257
Tiempo de ejecucion: 2.7963788509368896


### Medical

In [6]:
dataset = "medical"
cl_cv(dataset)

Dataset: medical
medical:undivided - exists, not redownloading

Binary Relevance - Dataset: medical


  _warn_prf(average, modifier, msg_start, len(result))


Accuracy: 0.5255623721881391
Hamming Loss: 0.013406044080890706
Precision: 0.7782285660192457
Recall: 0.5878489326765188
F1 Score: 0.6489336871614803
Tiempo de ejecucion: 108.72602343559265

Label Powerset - Dataset: medical


  _warn_prf(average, modifier, msg_start, len(result))


Accuracy: 0.6789366053169734
Hamming Loss: 0.012042717564189957
Precision: 0.760183094447943
Recall: 0.7274220032840722
F1 Score: 0.7256367509352682
Tiempo de ejecucion: 5.462723731994629

MLkNN - Dataset: medical




Accuracy: 0.4703476482617587
Hamming Loss: 0.017836855260168143
Precision: 0.6730857813145774
Recall: 0.6239737274220033
F1 Score: 0.6316597648544444
Tiempo de ejecucion: 12.956944465637207


  _warn_prf(average, modifier, msg_start, len(result))
