# Алгоритм решения

## Постановка задачи
Пусть дана система $$Ax = b,\quad A=A^T>0.\quad (1)$$
    
Предполагаем, что задача является корректно поставленной. Нам необходимо:
1. найти решение системы указанным методом;
2. вычислить вектор невязки;
3. найти матрицу, обратную к матрице системы;
4. найти число обусловленности матрицы системы.

Решение системы мы будем искать как предел бесконечного вычислительного процесса. Когда строится последовательность $x^0, x^1,\ldots, x^k,\ldots$ приближения к решению $x^*$, мы должны обеспечить выполнение условия $$\lim\limits_{k\to\infty} | | x^k - x^* | | = 0.$$
В наших обозначениях $0,1,\ldots,k,\ldots$ - номер итерации. И каждый элемент является $k$-ой итерацией, или $k$-ым приближением к искомому значению $x^*$.

## Метод градиентного спуска
Наряду с задачей (1) будем рассматривать функционал $$F(x)=(Ax, x) - 2(b,x)$$ который называется **квадратичным функционалом ошибки**, являющийся многочленом второй степени от $x$. Очевидно, что он сопряжен с системой (1) посредством наличия тех же коэффициентов, то есть $$F(x) = \sum_{i,j = 1}^{n}a_{ij}x_{ij} - 2\sum_{i=1}^{n}b_ix_i.\quad(2)$$
Ввиду того, что $A$ положительно определенная, многочлен (2) имеет единственный минимум. Покажем, что решение задачи $$x^* = A^{-1}b$$ доставляет минимум функционала (2). Если мы установим соответствие между (1) и (2), то минимум функционала (2), т.е. решение задачи минимизации функционала (2), доставит нам решение исходной задачи. Для этого докажем две теоремы.

**Теорема.** Если в некоторой точке $x = (x_1,\ldots, x_n)$ многочлен $(2)$ имеет минимум, то координаты этой точки удовлетворяют системе $(1)$.

**Теорема.** Если $x$ - решение уравнения $(1)$, то многочлен $(2)$ имеет в точке $x$ абсолютный минимум во всем пространстве.

$\bullet$ **Градиентом функции** $F(x_1,\ldots, x_n)$ называется вектор с координатами $$\operatorname{grad}F(x)=\Big(\dfrac{\partial F}{\partial x_1},\ldots, \dfrac{\partial F}{\partial x_n}\Big)^T.$$
	Пусть известно начальное приближение $x^0 = (x_1^0,\ldots, x_n^0).$ Из этой точки будем двигаться в направлении $-\operatorname{grad}F(x^0)$. Тогда путь, по которому мы будем перемещаться, имеет вид уравнения $$x = x^0 - t\operatorname{grad} F(x^0),\quad t\geq 0.$$
	Будем двигаться до тех пор, пока функция $F$ не достигнет своего минимума. Отсюда запишем **общий метод итерационного процесса градиентного спуска**. Для этого введем обозначение невязки $r = Ax - b$. Тогда $$x^{k+1} = x^k - \dfrac{(r^k, r^k)}{(Ar^k, r^k)}r^k,\quad r^k = Ax^k - b.\quad(4)$$
Покажем сходимость метода.

**Теорема**. Если $A=A^T > 0$, то метод градиентного спуска $(4)$ сходится.

Обратную матрицу вычислим, изменив параметры в алгоритме градиентного спуска. Обратная матрица к $A$ является решением уравнения $$AX = E.$$
Тогда алгоритм (4) преобразуется в 
$$X^{k+1} = X^k - \dfrac{R^k(R^k)^T}{AR^k(R^k)^T}R^k,\quad R^k = AX^k - E,\quad(5)$$
где $X^k$ и $R^k$ теперь матрицы.

# Листинг программы

In [1]:
import numpy as np
import math

## Функция алгоритма

In [2]:
def gradient_descent(A, b, epsilon):
    x_k = np.copy(b) # Начальное приближение x_0 = g
    r_k = np.dot(A, x_k) - b # Вектор невязки
    x_k1 = np.zeros(x_k.shape[0]) # Переменная для хранения (k+1)-ой итерации
                
    # Метод градиентного спуска
    k = 0 # Переменная для хранения числа итераций
    while True:
        k += 1 # Повышаем число итераций
        x_k1 = x_k - np.dot(r_k, r_k.T) / np.dot(np.dot(A, r_k), r_k.T) * r_k # Формула (4)
        if np.linalg.norm(x_k1 - x_k) <= epsilon: # Проверка условия остановки итерационного процесса
            break # Прерываем цикл
        x_k = np.copy(x_k1) # Переносим значение из (k+1)-ой итерации в k-ую
        r_k = np.dot(A, x_k) - b # Считаем значение невязки для k-ой итерации
    x = x_k1 # Сохраняем результат для возвращения из функции
        
    return x, k # Возвращаем значение текущего приближения и числа итераций

## Проверка результатов

1. При заданном $n$ сгенерировать случайным образом квадратную матрицу размера $n\times n$, имеющую диагональное доминирование. Элементы матрицы - действительные числа с двумя знаками после запятой.

In [3]:
from random import randint
 
n = int(input())
 
A = np.array([[randint(10, 1000) / 100 for _ in range(n)] for _ in range(n)]).astype(float)

summary = 0
for i in range(n):
    for j in range(n):
        if i != j:
            summary += math.fabs(A[i][j])
for i in range (n):
    if A[i][i] <= summary:
        A[i][i] = randint(int(summary)*100, 10000) / 100

print(*A, sep='\n')

 4


[80.29  7.28  7.81  3.52]
[ 9.41 84.59  1.44  7.59]
[ 7.25  6.24 81.69  6.17]
[ 1.75  3.89  5.09 81.94]


Для сходимости метода проведем трансформацию Гаусса, чтобы получить симметрическую положительно определенную матрицу, то есть возьмем матрицу $$\overline A = A^TA.$$

In [4]:
A = np.dot(A.T, A)

for i in range(n):
    for j in range(n):
        A[i, j] = round(A[i, j], 2)

print(*A, sep='\n')

[6590.66 1432.55 1241.78  542.17]
[1432.55 7262.54  708.21 1024.91]
[1241.78  708.21 6762.23  959.52]
[ 542.17 1024.91  959.52 6822.23]


2. Сгенерировать случайным образом вектор решений $x$ (два знака после запятой).

In [5]:
x = np.array([randint(10, 1000) / 100 for _ in range(n)]).astype(float)

print(*x, sep='\n')

2.55
3.91
3.83
3.31


3. По сгенерированным данным вычислить вектор $b$ свободных членов системы по формуле $b = Ax$.

In [6]:
b = A.dot(x)

print(*b, sep='\n')

28958.0536
38154.4303
35010.9922
31646.474499999997


4. В качестве условия для остановки итераций будем проверять $$| |x^{k+1} - x^k | |\leq \varepsilon,$$
где зададим $\varepsilon = 10^{-5}$.

In [22]:
epsilon = 1e-6

4. Для полученных данных:

    a) найти решение системы указанным методом.

In [23]:
x_, iters = gradient_descent(A, b, epsilon)

print(*x_, sep='\n')

2.5499999087477248
3.909999993822787
3.830000006613991
3.3099999447958


Число итераций равно:

In [24]:
print(iters)

19


Выполнить проверку путем вычисления вектора невязки.

In [25]:
r = np.zeros(n)
for i in range(n):
    for j in range(n):
        r[i] += A[i][j]*x_[j];
    r[i] -= b[i]

print(*r, sep='\n')

-0.000631978822639212
-0.00022748094488633797
-0.00012593421706696972
-0.0004260748210072052


б) найти матрицу, обратную к матрице системы.

In [11]:
A_, iters = gradient_descent(A, np.eye(n), epsilon)

print(*A_, sep='\n')

[ 1.63348934e-04 -2.88426549e-05 -2.62677761e-05 -4.93846532e-06]
[-2.89568846e-05  1.46725675e-04 -7.39498247e-06 -1.87078334e-05]
[-2.83824950e-05  8.98849238e-07  1.56288811e-04 -1.89127483e-05]
[-4.95808080e-06 -1.86282086e-05 -1.87614470e-05  1.52420461e-04]


In [12]:
E = np.dot(A_, A)

for i in range(n):
    for j in range(n):
        E[i,j] = round(np.absolute(E[i,j]), 0) # Преобразуем "единичниую" матрицу, округлив до двух знаков после запятой
        
print(*E, sep='\n')

[1. 0. 0. 0.]
[0. 1. 0. 0.]
[0. 0. 1. 0.]
[0. 0. 0. 1.]


в) найти число обусловленности.

Вычислим число обусловленности $$\nu(A) = | | A| | \cdot | | A^{-1} | |,$$
используя сферическую норму матрицы.

In [13]:
nu = np.linalg.norm(A, 2) * np.linalg.norm(A_, 2)
print(nu)

1.97687356430038
