# 4.3.9 Hinge loss

In [None]:
%load_ext autoreload
%autoreload 2

In [None]:
from sklearn import svm
from sklearn.metrics import hinge_loss

import warnings
warnings.filterwarnings("ignore")

Computa la distancia promedio entre el modelo y los datos usando la función de pérdida de hinge.

## 4.3.9.1 Caso binario

Si $y_i$ es la clase verdadera en un problema de clasificación binario codificada como $y_i={−1,+1}$ para cada muestra $i$, y $w_i$ es la predicción de la decisión, esta función se define como:

$$ L_{Hinge}(y,w) = \frac{1}{n_{samples}}  \sum_{i=0}^{n_{samples}-1} max\{1 - w_i y_1, 0\}$$

In [None]:
#   Train set         Test set
#  ------------    --------------
#   X     y         X      y_true
#   [0]   -1        [-2]   -1
#   [1]   +1        [3]    +1
#                   [0.5]  +1
X = [[0], [1]]
y = [-1, 1]

est = svm.LinearSVC(random_state=0)
est.fit(X, y)

In [None]:
pred_decision = est.decision_function([[-2], [3], [0.5]])
pred_decision

In [None]:
#               decision   y_true
#    max(1 - -2.18177944 *     -1, 0) = max(-1.181779, 0) = 0
#    max(1 - +2.36355888 *     +1, 0) = max(-1.363558, 0) = 0
#    max(1 - +0.09088972 *     +1, 0) = max(+0.909110, 0) = 0.909110
#
#   (0 + 0 + 0.909110) / 3 = 0.303036
#
hinge_loss([-1, 1, 1], pred_decision)

## 4.3.9.2 Caso con múltiple clases

Si $w_i,y_i$ es la predicción para la etiqueta verdadera $y_i$ de la $i-ésima$ muestra, y $\hat{w_i},y_i = max\{w_i,y_i|y_j \not= y_i, 0\}$ es el máximo de las decisiones pronosticadas para todas las otras etiquetas, entonces esta función se define como:




In [None]:
X = [[0], [1], [2], [3]]
Y = [0, 1, 2, 3]
labels = [0, 1, 2, 3]
est = svm.LinearSVC()
est.fit(X, Y)

In [None]:
#                              y_true = [0,   2,   3]
pred_decision = est.decision_function([[-1], [2], [3]])
pred_decision

In [None]:
#
# max(0, 1 - (+1.2727241) + max(+0.03420421, -0.68377149, -1.40167018))
# max(0, 1 - (-0.3760998) + max(-1.45454482, -0.58120684, -0.17100248))
# max(0, 1 - (+0.2392200) + max(-2.36363446, -0.78634386, -0.27354264))
#
# max(0, 1 - 1.2727241 + 0.03420421) = 0
# max(0, 1 + 0.3760998 - 0.17100248) = 1.20509732
# max(0, 1 - 0.2392200 - 0.27354264) = 0.48723736
#
# (0 + 1.20509732 + 0.48723736) / 3 = 0.56411154
#
y_true = [0, 2, 3]
hinge_loss(y_true, pred_decision, labels=labels)

In [None]:
print('ok_')