# Домашняя работа по регуляризации и оптимизации

Ниже приводится корпус данных с двумя метками: 1 и -1. К данным применяется линейная модель классификации:

$f(x, \theta) = x_1 \theta_1 + x_2 \theta_2 + \theta_3.$

Предлагается подобрать параметры $\theta$ минимизируя следующую функцию ошибки:

$\mathcal{L}(\theta) = 0.1 \|\theta\|^2 + \frac{1}{N}\sum\limits_{i=1}^N \max(0, 1 - y_i f(x_i, \theta)).$

Для оптимизации предлагается использовать метод градиентного спуска с 1000 шагами размера $0.1$ из начальной точки $(1, 1, 0)$.

In [2]:
import numpy as np
import yaml

In [3]:
X = np.array([
    [0, 1],
    [1, 1],
    [1, 0],
    [-0.5, 0.5],
    [0, -0.5]
])

y = np.array([1, 1, 1, -1, -1])

theta0 = np.array([1.0, 1.0, 0.0])

lr = 0.1

def f(X, theta):
    theta = np.asarray(theta)
    return (X * theta[:2]).sum(axis=-1) + theta[2]

def loss(X, y, theta):
    theta = np.asarray(theta)
    norm = (theta ** 2).sum()
    deltas = y * f(X, theta)
    return 0.1 * norm + np.mean(np.maximum(0, 1 - deltas))

print("Prediction:", f(X, theta0))
print("Loss:", loss(X, y, theta0))

Prediction: [ 1.   2.   1.   0.  -0.5]
Loss: 0.5


Необходимо вычислить производную функции ошибки (l_diff) и после применить, сказанные в условии шаги: \\

$  \frac{d}{d\theta_k}  {f(x,\theta)} = x_1 + x_2 + 1 $ \\

$\frac{d}{d\theta_k} {\mathcal{L}(\theta)} =  2*0.1*\theta_k + \frac{1}{N}\sum\limits_{i=1}^N\begin{cases}
  0 & \text{if  }  (1 - y_i f(x_i, \theta)) \leq 0 \\
  -y_i * \frac{\mathrm d}{\mathrm d \theta_k}f(x_i, \theta)& \text{else}
\end{cases}$


In [4]:
def f_diff(X):    #Изначальная функция
    np.array
    return np.array([X[:, 0], X[:, 1], [1] * len(X)])
    # X[:, 0] = [0, 1, 1, -0.5, 0]    

    # X[:, 1] = [1, 1, 0, 0.5, -0.5]
    
    # [1] * len(X) = [1, 1, 1, 1, 1] 

def l_diff(X, y, theta):     #Фунция ошибки
    theta = np.asarray(theta)
    
    first_diff = 0.1 * 2 * theta
    
    S = np.maximum(0, 1 - y * f(X, theta))       
    check = (S != 0).astype(int)
    S_diff = check * (-1 * y * f_diff(X))
    second_diff = np.mean(S_diff, axis = 1)
    
    return first_diff + second_diff   

def step(X, y, theta, lr):         #Функция "шагов"
    return theta - lr * l_diff(X, y, theta)

theta = theta0

for i in range(1000):         #Выполнение 1000 шагов
    theta = step(X, y, theta, lr)

In [5]:
print("Prediction:", f(X, theta))
print("Loss:", loss(X, y, theta))

with open("submission.yaml", "w") as fp:
    yaml.safe_dump({"tasks": [{"task1": {"answer": theta.tolist()}}]}, fp)

Prediction: [-0.11008599  1.09487102  0.50991401 -1.00504299 -0.9875215 ]
Loss: 0.5502481804822255
