# Домашняя работа по регуляризации и оптимизации

Ниже приводится корпус данных с двумя метками: 1 и -1. К данным применяется линейная модель классификации:

$f(x, \theta) = x_1 \theta_1 + x_2 \theta_2 + \theta_3.$

Предлагается подобрать параметры $\theta$ минимизируя следующую функцию ошибки:

$\mathcal{L}(\theta) = 0.1 \|\theta\|^2 + \frac{1}{N}\sum\limits_{i=1}^N \max(0, 1 - y_i f(x_i, \theta)).$

Для оптимизации предлагается использовать метод градиентного спуска с 1000 шагами размера $0.1$ из начальной точки $(1, 1, 0)$.

In [1]:
import numpy as np
import yaml

In [2]:
X = np.array([[0, 1], [1, 1], [1, 0], [-0.5, 0.5], [0, -0.5]])

y = np.array([1, 1, 1, -1, -1])

theta0 = np.array([1.0, 1.0, 0.0])

lr = 0.1

def f(X, theta):
    theta = np.asarray(theta)
    return (X * theta[:2]).sum(axis=-1) + theta[2]

def loss(X, y, theta):
    theta = np.asarray(theta)
    norm = (theta ** 2).sum()
    delta_s = y * f(X, theta)
    return lr * norm + np.mean(np.maximum(0, 1 - delta_s))

print("Prediction:", f(X, theta0))
print("Loss:", loss(X, y, theta0))

Prediction: [ 1.   2.   1.   0.  -0.5]
Loss: 0.5


In [24]:
def func(X, y, theta):
    res = np.array([0.0, 0.0, 0.0])
    theta = np.asarray(theta)
    for i in range(5):
        if 1 - y[i] * f(X[i], theta) > 0:
            res -= y[i] * np.array([X[i][0], X[i][1], 1])
    res /= len(y)
    res += lr * 2 * theta
    return res

theta = theta0
for i in range(1000):
    theta -= lr * func(X, y, theta)

In [25]:
print("Prediction:", f(X, theta))
print("Loss:", loss(X, y, theta))

with open("submission.yaml", "w") as fp:
    yaml.safe_dump({"tasks": [{"task1": {"answer": theta.tolist()}}]}, fp)

Prediction: [ 0.7427965   1.985593    0.985593   -0.37860175 -0.7572035 ]
Loss: 0.48823072809111295
