### ДЗ 5.8
Функции для работы с векторами и матрицами:

In [49]:
import numpy as np

def get_scalar_product(x, y):
    return sum(x_i * y_i for x_i, y_i in zip(x, y))  # <x; y>

def matrix_transposition(A):
    return [[A[j][i] for j in range(len(A))] for i in range(len(A[0]))]  # A^T

def get_matrix_addition(A, B):
    return np.array(A) + np.array(B) # A + B

def matrix_vector_product(A, y):
    return [sum(A[i][j] * y[j] for j in range(len(y))) for i in range(len(A))]  # A * y

Определим функцию и её градиент в общем виде:
$$f(y) = \langle Ay; y \rangle - 2\langle b; y \rangle$$
$$\nabla f(y) = (A + A^T)y - 2b$$

In [50]:
def function(y, A, b):
    return get_scalar_product(matrix_vector_product(A, y), y) - 2 * get_scalar_product(b, y)  # f(y) = <A * y; y> - 2 * <b; y>


def gradient(y, A, b):
    At = matrix_transposition(A)  # A^T
    A_p_At = get_matrix_addition(A, At)  # A + A^T
    A_p_At_y_product = matrix_vector_product(A_p_At, y)  # (A + A^T) * y
    return [x_i - 2 * b_i for x_i, b_i in zip(A_p_At_y_product, b)]  # grad f(y) = (A + A^T) * y - 2 * b

In [51]:
def learning_rate(y_k, A, b):
    grad = gradient(y_k, A, b)  # grad f(y)
    num = get_scalar_product(grad, grad)  # <grad f(y), grad f(y)>
    At = matrix_transposition(A)  # A^T
    A_p_At = get_matrix_addition(A, At)  # A + A^T
    A_p_At_grad_product = matrix_vector_product(A_p_At, grad)  # (A + A^T) * grad f(y)
    den = get_scalar_product(A_p_At_grad_product, grad)  # <(A + A^T) * grad f(y), grad f(y)>
    return num / den

Определим функцию градиентного спуска:

In [52]:
def gradient_descent(func, grad, y_0, A, b, epsilon=0.0000000001):
    y_k = y_0
    for k in range(1000):
        grad_f_k = grad(y_k, A, b)
        alpha_k = learning_rate(y_k, A, b)
        y_kp1 = [y_k[j] - alpha_k * grad_f_k[j] for j in range(len(y_k))]
        if abs(func(y_kp1, A, b) - func(y_k, A, b)) < epsilon:
            break
        y_k = y_kp1
    return y_k, func(y_k, A, b)

Проинициализируем матрицу **A**, вектор **b** и нулевую начальную точку **Y0**:

In [53]:
A = [[4, -1, 0, -1, 0, 0],
     [-1, 4, -1, 0, -1, 0],
     [0, -1, 4, 0, 0, -1],
     [-1, 0, 0, 4, -1, 0],
     [0, -1, 0, -1, 4, -1],
     [0, 0, -1, 0, -1, 4]]

b = [0, 5, 0, 6, -2, 6]

y_0 = [0, 0, 0, 0, 0, 0]

С помощью метода градиентого спуска найдём точку локального минимума, значение функции в ней, а также Евклидову норму радиус-вектора этой точки:

In [54]:
from math import sqrt

y_min, f_min = gradient_descent(function, gradient, y_0, A, b)
y_norm = sqrt(sum([y_i ** 2 for y_i in y_min]))

print(f"Точка лок. минимума Y*: {[round(y_i, 3) for y_i in y_min]}, значение функции f(Y*): {round(f_min, 3)}")
print(f"Евклидова норма радиус-вектора Y*: {round(y_norm, 3)}")

Точка лок. минимума Y*: [np.float64(1.0), np.float64(2.0), np.float64(1.0), np.float64(2.0), np.float64(1.0), np.float64(2.0)], значение функции f(Y*): -32.0
Евклидова норма радиус-вектора Y*: 3.873
