# Градиентные методы. Метод наискорейшего спуска.

## Импорт модулей

In [1]:
import numpy as np        # для работы с матрицами и веторами
import warnings           # для работы с ошибками
import sympy as sp        # для красивого вывода промежуточных результатов
from IPython.display import Markdown, display  # для красивого вывода текста

## Входные данные

In [2]:
A = np.matrix([[4.33, -1.12, -1.08, 1.14],
               [-1.12, 4.33, 0.24, -1.22],
               [-1.08, 0.24, 7.21, -3.22],
               [1.14, -1.22, -3.22, 5.43]],
               dtype=np.dtype(np.float64))

In [3]:
f = np.array([0.3, 0.5, 0.7, 0.9],
             dtype=np.dtype(np.float64))

## Тестовые наборы данных

In [111]:
test_A1_Err = np.matrix([[1.00, 0.17, -0.25, 0.54],
                         [0.47, 1.00, 0.67, -0.32],
                         [-0.11, 0.35, 1.00, -0.74],
                         [0.55, 0.43, 0.36, 1.00]],
                         dtype=np.dtype(np.float64))

In [125]:
test_A2_Err = np.matrix([[-11.00, 6.00],
                         [6.00, -11.00]],
                         dtype=np.dtype(np.float64))
test_f2_Err = np.array([0.3, 0.5],
             dtype=np.dtype(np.float64))

## Проверяет положительно определённая ли матрица

In [17]:
def is_positive_definite(A: np.matrix) -> bool:
    return np.all(np.linalg.eigvals(A) > 0)  # считаем собственные числа и проверяет, что все они больше 0

In [18]:
is_positive_definite(A)

True

## Проверяет симметричная ли матрица

In [20]:
def is_symmetric(A: np.matrix) -> bool:
    return np.allclose(A, A.T)  # сравниваем обычную матрицу и транспонированную
                                # если они совпадают, то матрица симметричная

In [23]:
is_symmetric(A)

True

## Алгоритм

In [127]:
def steepest_descent_method(A_arg: np.matrix, f_arg: np.array, K_max: int) -> np.array:
    A, f = np.copy(A_arg), np.copy(f_arg)  # копируем аргументы, чтобы их не 'пачкать'
    display(Markdown('<text style=font-weight:bold;font-size:16px;font-family:serif>Исходные данные<text>'),
        sp.BlockMatrix([sp.Matrix(A.round(decimals=10)), sp.Matrix(f.round(decimals=10))]))
    if not is_positive_definite(A):  # проверяем положительна ли определена матрица `A`
        warnings.warn("Матрица не является положительно определённой")  # печатаем ошибку
        return
    elif not is_symmetric(A):  # проверям симметричная ли матрица `A`
        warnings.warn("Матрица не является симметричной")  # печатаем ошибку
        return
    elif K_max < 0:  # проверяем `K_max`
        warnings.warn("Количество итераций не может быть отрицательным числом")  # печатаем ошибку
        return
    x = np.zeros(f.shape, dtype=np.dtype(np.float64))  # начальное приблежение
    for k in range(K_max):  # итерируемся до `K_max`
        display(Markdown(f'<text style=font-weight:bold;font-size:16px;font-family:serif>{k+1} итерация<text>'),
                sp.Matrix(x.round(decimals=10)))
        r = np.squeeze(np.asarray(f - np.matmul(A, x)))  # находим вектор невязки
        alpha = (np.dot(r, r)/np.dot(np.matmul(A, r), r)).item(0)  # находим alpha
        x = x + alpha*r  # находим `k`-ое приблежённое решение
    display(Markdown(f'<text style=font-weight:bold;font-size:16px;font-family:serif>Ответ<text>'),
            sp.Matrix(x.round(decimals=10)))
    return x

## Тесты

In [128]:
x = steepest_descent_method(A, f, 10)

<text style=font-weight:bold;font-size:16px;font-family:serif>Исходные данные<text>

Matrix([[Matrix([
[ 4.33, -1.12, -1.08,  1.14],
[-1.12,  4.33,  0.24, -1.22],
[-1.08,  0.24,  7.21, -3.22],
[ 1.14, -1.22, -3.22,  5.43]]), Matrix([
[0.3],
[0.5],
[0.7],
[0.9]])]])

<text style=font-weight:bold;font-size:16px;font-family:serif>1 итерация<text>

Matrix([
[0.0],
[0.0],
[0.0],
[0.0]])

<text style=font-weight:bold;font-size:16px;font-family:serif>2 итерация<text>

Matrix([
[0.1159775588],
[0.1932959314],
[0.2706143039],
[0.3479326764]])

<text style=font-weight:bold;font-size:16px;font-family:serif>3 итерация<text>

Matrix([
[0.0985107399],
[0.2228601566],
[0.2605456268],
[0.3451615732]])

<text style=font-weight:bold;font-size:16px;font-family:serif>4 итерация<text>

Matrix([
[ 0.099772049],
[0.2233106841],
[0.2589100115],
[ 0.347960791]])

<text style=font-weight:bold;font-size:16px;font-family:serif>5 итерация<text>

Matrix([
[0.1000197017],
[0.2250170915],
[0.2607752527],
[  0.34866444]])

<text style=font-weight:bold;font-size:16px;font-family:serif>6 итерация<text>

Matrix([
[0.1003772689],
[0.2250728728],
[ 0.260373851],
[0.3494673588]])

<text style=font-weight:bold;font-size:16px;font-family:serif>7 итерация<text>

Matrix([
[0.1004387563],
[0.2254805811],
[0.2609386966],
[0.3496940339]])

<text style=font-weight:bold;font-size:16px;font-family:serif>8 итерация<text>

Matrix([
[0.1005313895],
[0.2254993065],
[0.2608236673],
[0.3499218645]])

<text style=font-weight:bold;font-size:16px;font-family:serif>9 итерация<text>

Matrix([
[0.1005401597],
[0.2256156715],
[0.2609812639],
[0.3499883034]])

<text style=font-weight:bold;font-size:16px;font-family:serif>10 итерация<text>

Matrix([
[0.1005660379],
[0.2256202222],
[0.2609492325],
[0.3500528971]])

<text style=font-weight:bold;font-size:16px;font-family:serif>Ответ<text>

Matrix([
[0.1005680733],
[0.2256523012],
[0.2609940632],
[0.3500720528]])

In [120]:
steepest_descent_method(test_A1_Err, f, 10)

<text style=font-weight:bold;font-size:16px;font-family:serif>Исходные данные<text>

Matrix([[Matrix([
[  1.0, 0.17, -0.25,  0.54],
[ 0.47,  1.0,  0.67, -0.32],
[-0.11, 0.35,   1.0, -0.74],
[ 0.55, 0.43,  0.36,   1.0]]), Matrix([
[0.3],
[0.5],
[0.7],
[0.9]])]])



In [126]:
steepest_descent_method(test_A2_Err, test_f2_Err, 10)

<text style=font-weight:bold;font-size:16px;font-family:serif>Исходные данные<text>

Matrix([[Matrix([
[-11.0,   6.0],
[  6.0, -11.0]]), Matrix([
[0.3],
[0.5]])]])



## Оценка точности полученного решения

In [115]:
r = f - np.matmul(A, x)
display(Markdown(f'<text style=font-weight:bold;font-size:16px;font-family:serif>Вектор невязки<text>'),
        sp.Matrix(r.T))

<text style=font-weight:bold;font-size:16px;font-family:serif>Вектор невязки<text>

Matrix([
[ 6.22681101437594e-5],
[ 1.11072297926951e-5],
[-7.82185327168339e-5],
[0.000157840633184247]])