# Tutorial de scikit-multilearn

Scikit-multilearn es una biblioteca con licencia BSD para clasificación multietiqueta construida sobre el ecosistema de scikit-learn.

## Instalación

Para instalar scikit-multilearn, ejecute el siguiente comando:

In [None]:
!pip install scikit-multilearn

## Cargando el conjunto de datos

En este tutorial, utilizaremos el conjunto de datos 'emotions'.

In [None]:
from skmultilearn.dataset import load_dataset

X_train, y_train, feature_names, label_names = load_dataset('emotions', 'train')
X_test, y_test, _, _ = load_dataset('emotions', 'test')

## Explorando las características y etiquetas

Veamos las primeras características y etiquetas del conjunto de datos.

In [None]:
print("Primeras 10 características:")
print(feature_names[:10])

print("\nEtiquetas:")
print(label_names)

## Entrenando un clasificador multietiqueta

Utilizaremos el método Binary Relevance con un clasificador SVM.

In [None]:
from skmultilearn.problem_transform import BinaryRelevance
from sklearn.svm import SVC

clf = BinaryRelevance(classifier=SVC(), require_dense=[False, True])
clf.fit(X_train, y_train)

## Realizando predicciones

Utilizaremos el clasificador entrenado para predecir las etiquetas del conjunto de prueba.

In [None]:
predictions = clf.predict(X_test)
print(predictions)

## Evaluando el modelo

Mediremos la calidad del modelo utilizando métricas como Hamming Loss y Accuracy.

In [None]:
from sklearn.metrics import hamming_loss, accuracy_score

h_loss = hamming_loss(y_test, predictions)
accuracy = accuracy_score(y_test, predictions)

print(f"Hamming Loss: {h_loss}")
print(f"Accuracy: {accuracy}")