In [None]:
import numpy as np

import matplotlib.pyplot as plt
plt.rcParams.update({'font.size': 22})

from kachmarz import kaczmarz_alg
from utils import generate_train_set, get_squared_error, get_x

# Общие настройки
Задаем размеры обучающей выборки, кол-во фичей

In [None]:
sample_size = 200  # размер выборки
num_of_features = 4 # кол-во признаков - кол-во столбцов в матр. x и размер вектора w

w = np.array([0.1, 0.2, 0.3, 0.4]) # это будет истинным значением памяти модели y = x * w
                                   # x - array of shape (sample_size, num_of_features)
                                   # w - array of shape (num_of_features, 1)

# Без шума
находим веса w для линейной модели y = x * w

In [None]:
sigma = 0 # дисперсия ошибки(она накладывается на y)

In [None]:
x, y = generate_train_set(w, sigma, sample_size, num_of_features)  

gen = kaczmarz_alg(x, y, gamma=0.6)
print(x.shape, y.shape)
w_estiomation_prev_step = next(gen)


squared_error_prev_step = get_squared_error(w_estiomation_prev_step, w)
errors = squared_error_prev_step
weights = np.array([])

for iteration_num, w_estimation in enumerate(gen):
    print(iteration_num)
    squared_error_current_step = get_squared_error(w_estimation, w)

    w_estimation = w_estimation.reshape((-1,1))
    print(w_estimation, w_estimation.shape, weights.shape)
    if weights.size == 0:
        weights = w_estimation
    else:
        weights = np.hstack((weights, w_estimation))
    errors = np.append(errors, squared_error_current_step)

## Графики изменения квадратичной ошибки весов и сходимости компонентов вектора весов

In [None]:
def plot_error_and_convergence(errors, weights):
    fig = plt.figure(figsize=(20,20))

    ax1 = fig.add_subplot(211)
    ax1.plot(errors);
    plt.xlabel('Номер итерации алгоритма Качмажа')
    plt.ylabel('Квадратичная ошибка')
    plt.title('Квадратичная ошибка: (w - w_estimation)^T * (w - w_estimation)')

    ax2 = fig.add_subplot(212)
    ax2.plot(weights.T)
    plt.title('Как сходятся компоненты вектора w_estimation к w')
    plt.xlabel('Номер итерации')
    plt.ylabel('Численное значение компоненты вектора весов w')

def plot_true_weights(weights, true_weights):
    # Указываем истинные веса на графике: компоненты вектора w 
    for index, w_component in enumerate(np.asarray(true_weights).reshape((-1))):
        plt.axhline(w_component, color='r', linestyle='--', label='{}: {}-ая компонента вектора w'.format(
            w_component, index), alpha=0.5)

    plt.legend(loc='center left', bbox_to_anchor=(1, 0.5))
    plt.show()
    
plot_error_and_convergence(errors, weights)
plot_true_weights(weights, w)

# C шумом
теперь ищем веса w для модели y = x * w + epsilon,
где epsilon - случайная ошибка(она накладывается в момент генерации обучающей выборки
и регулируется параметром sigma)

In [None]:
sigma = 0.2

In [None]:
x, y = generate_train_set(w, sigma, sample_size, num_of_features)  

gen = kaczmarz_alg(x, y, gamma=0.6)
w_estiomation_prev_step = next(gen)


squared_error_prev_step = get_squared_error(w_estiomation_prev_step, w)
errors = squared_error_prev_step
weights = np.array([])

for iteration_num, w_estimation in enumerate(gen):
    print(iteration_num)
    squared_error_current_step = get_squared_error(w_estimation, w)

    w_estimation = w_estimation.reshape((-1,1))
    print(w_estimation, w_estimation.shape, weights.shape)
    if weights.size == 0:
        weights = w_estimation
    else:
        weights = np.hstack((weights, w_estimation))
    errors = np.append(errors, squared_error_current_step)

In [None]:
plot_error_and_convergence(errors, weights)
plot_true_weights(weights, w)

# Теперь веса w будут линейно изменяться во времени

In [None]:
sample_size = 200  # размер выборки
num_of_features = 4 # кол-во признаков - кол-во столбцов в матр. x и размер вектора w

# веса меняются через равные промежутки, на одинаковое кол-во для каждого примера в выборке
w = np.linspace(-0.4, 0.4, sample_size)


sigma = 0.2

### генерация выборки

In [None]:
x = np.linspace(-10, 10, sample_size).reshape((-1,1))
y = np.array([])

for w_example, _x in zip(w, x):
    w_example = np.asarray(w_example).reshape((-1,))
    y = np.append(y, w_example * _x)

y = y.reshape((-1,1))

In [None]:
plt.scatter(x, y);
plt.xlabel('x');
plt.ylabel('y');

In [None]:
gen = kaczmarz_alg(x, y, gamma=0.6)
w_estiomation_prev_step = next(gen)

squared_error_prev_step = get_squared_error(w_estiomation_prev_step, np.asarray(w[0]).reshape((-1,1)))
errors = squared_error_prev_step
weights = np.array([])

for iteration_num, w_estimation in enumerate(gen):
    print(iteration_num)
    w_example = np.asarray(w[iteration_num]).reshape((-1,1))
    print('w...',w_example)
    squared_error_current_step = get_squared_error(w_estimation, w_example)

    w_estimation = w_estimation.reshape((-1,1))
    print(w_estimation, w_estimation.shape, weights.shape)
    if weights.size == 0:
        weights = w_estimation
    else:
        weights = np.hstack((weights, w_estimation))
    errors = np.append(errors, squared_error_current_step)

In [None]:
plot_error_and_convergence(errors, weights)