# Домашняя работа по регуляризации и оптимизации

Ниже приводится корпус данных с двумя метками: 1 и -1. К данным применяется линейная модель классификации:

$f(x, \theta) = x_1 \theta_1 + x_2 \theta_2 + \theta_3.$

Предлагается подобрать параметры $\theta$ минимизируя следующую функцию ошибки:

$\mathcal{L}(\theta) = 0.1 \|\theta\|^2 + \frac{1}{N}\sum\limits_{i=1}^N \max(0, 1 - y_i f(x_i, \theta)).$

Для оптимизации предлагается использовать метод градиентного спуска с 1000 шагами размера $0.1$ из начальной точки $(1, 1, 0)$.

In [2]:
import numpy as np
import yaml

In [10]:
X = np.array([
    [0, 1],
    [1, 1],
    [1, 0],
    [-0.5, 0.5],
    [0, -0.5]
])

y = np.array([1, 1, 1, -1, -1])

theta0 = np.array([1.0, 1.0, 0.0])

lr = 0.1

def f(X, theta):
    return (X * theta[:2]).sum(axis=-1) + theta[2]

def loss(X, y, theta):
    norm = (theta ** 2).sum()
    deltas = y * f(X, theta)
    return 0.1 * norm + np.mean(np.maximum(0, 1 - deltas))

print("Prediction:", f(X, theta0))
print("Loss:", loss(X, y, theta0))

Prediction: [ 1.   2.   1.   0.  -0.5]
Loss: 0.5


In [44]:
# Ваш код оптимизации.

def f0(X, theta):
    return X[:,0] * theta
def f1(X, theta):
    return X[:,1] * theta
def f2(X, theta):
    return theta

def loss_(theta):
    norm = (theta ** 2).sum()
    deltas = y * f(X, theta)
    return 0.1 * norm + np.mean(np.maximum(0, 1 - deltas))

def loss0(theta):
    norm = theta ** 2
    deltas = y * f0(X, theta)
    return 0.1 * norm + np.mean(np.maximum(0, 1 - deltas))
def loss1(theta):
    norm = theta ** 2
    deltas = y * f1(X, theta)
    return 0.1 * norm + np.mean(np.maximum(0, 1 - deltas))
def loss2(theta):
    norm = theta ** 2
    deltas = y * f2(X, theta)
    return 0.1 * norm + np.mean(np.maximum(0, 1 - deltas))

def deriv(f, theta):
  eps = 1e-9
  return ( ( f(theta + eps) - f(theta - eps) ) / (2 * eps) )

def step(theta, lr=0.1):
  return theta - lr * deriv(loss_, theta)
  # theta0 = theta[0]
  # theta1 = theta[1]
  # theta2 = theta[2]

  # theta0 -= lr * deriv(loss0, theta0)
  # theta1 -= lr * deriv(loss1, theta1)
  # theta2 -= lr * deriv(loss2, theta2)

  # return np.array([theta0, theta1, theta2])

theta = theta0
for _ in range(1000):
  theta = step(theta)

In [45]:
print("theta:", theta)
print("Prediction:", f(X, theta))
print("Loss:", loss(X, y, theta))

# with open("submission.yaml", "w") as fp:
    # yaml.safe_dump({"tasks": [{"task1": {"answer": theta.tolist()}}]}, fp)

theta: [ 0.95273998  0.95273998 -0.04726002]
Prediction: [ 0.90547995  1.85821993  0.90547995 -0.04726002 -0.52363001]
Loss: 0.5053960553184793
