# Подготовка

Сначала напишем функции для более-менее приемлемого отображения матриц. Также создадим матрицу по-меньше как пример, на котором можно будет тестировать дальнейшие функции.

In [1]:
from copy import copy, deepcopy
import random as random

def print_matrix(matrix):
    n = len(matrix)
    m = len(matrix[0])
    for i in range(n):
        print("( ", end ="")
        for j in range(m):
            print("" if matrix[i][j] < 0 else " ", "%.5f" % matrix[i][j], sep = "", end = " ")
        print(")")
        
def print_system(matrix, vector):
    n = len(matrix)
    m = len(matrix[0])
    for i in range(n):
        print("( ", end ="")
        for j in range(m):
            print("" if matrix[i][j] < 0 else " ", "%.5f" % matrix[i][j], sep = "", end = " ")
        print(")   ", end = "")
        print("" if vector[i] < 0 else " ", "%.5f" % vector[i], sep = "")
        
def print_list(list):
    for i in range(len(list)):
        print(list[i])
        
def print_dict(dict):
    for item in dict.items():
        print(item[0] + ":")
        print(item[1])

example_matrix = [[100, 9, 5, 10], [1, 100, 10, 4], [5, 1, 100, 7], [7, 3, 2, 100]]
example_b = [8, 1, 9, 4]

print_matrix(example_matrix)
print(example_b)

(  100.00000  9.00000  5.00000  10.00000 )
(  1.00000  100.00000  10.00000  4.00000 )
(  5.00000  1.00000  100.00000  7.00000 )
(  7.00000  3.00000  2.00000  100.00000 )
[8, 1, 9, 4]


Также заранее подготовим некоторые математические операции с матрицами и векторами

In [2]:
import math

def matrix_vector_mul(a, b):
    n = len(a)
    m = len(b)
    result = [0 for i in range(n)]
    for i in range(n):
        for j in range(m):
            result[i] += a[i][j] * b[j]
    return result

def vector_norm(x):
    max = 0
    for i in range(len(x)):
        if (abs(x[i]) > max):
            max = abs(x[i])
    return max

def matrix_norm(a):
    max_row_sum = 0
    n = len(a)
    for i in range(n):
        row_sum = 0
        for j in range(n):
            row_sum += abs(a[i][j])
        if row_sum > max_row_sum:
            max_row_sum = row_sum
    return max_row_sum

def matrix_norm_2(a):
    sum = 0
    n = len(a)
    for i in range(n):
        for j in range(n):
            sum += a[i][j] * a[i][j]
    return math.sqrt(sum)

# Генерация матриц

Для начала зафиксируем размерность наших матриц `dim=10`, требуемую точность `eps=1e-12` и число `seed=30` для фиксированного рандома.

In [3]:
dim = 10
eps = 1e-12
seed = 30

Следующим нашим пунктом будет генерация нашей системы `Ax=b`. Сгенерируем три возможные варианта матрицы `A` и один вариант вектора `b` (будем использовать его для всех трёх систем).

## Рандомная матрица

In [4]:
random.seed(seed)
random_matrix = [[random.random() for j in range(dim)] for i in range(dim)]
print_matrix(random_matrix)

(  0.53908  0.28920  0.03004  0.65364  0.21001  0.25728  0.39720  0.64158  0.98881  0.46153 )
(  0.99349  0.99257  0.24268  0.07265  0.15990  0.84190  0.59955  0.91746  0.97217  0.65442 )
(  0.53520  0.06763  0.02351  0.80529  0.67197  0.76301  0.56565  0.67389  0.63872  0.89518 )
(  0.11175  0.49445  0.30919  0.82934  0.87708  0.25203  0.08034  0.24322  0.31462  0.76964 )
(  0.40973  0.74990  0.30095  0.52374  0.18637  0.64538  0.51310  0.86266  0.94846  0.52002 )
(  0.06826  0.93727  0.94484  0.47425  0.48565  0.93254  0.25367  0.25560  0.69523  0.67498 )
(  0.68606  0.82801  0.51242  0.42014  0.22551  0.21334  0.36985  0.43174  0.73964  0.62003 )
(  0.51073  0.38016  0.62545  0.38228  0.79730  0.64381  0.69472  0.37322  0.51790  0.72124 )
(  0.95667  0.52877  0.32079  0.68928  0.11954  0.33461  0.03270  0.55280  0.25383  0.39176 )
(  0.78753  0.63540  0.03697  0.44275  0.00671  0.82319  0.49649  0.85041  0.26465  0.82307 )


## Матрица с диагональным преобладанием

In [5]:
random.seed(seed)
def random_sign():
    return 1 if random.random() < 0.5 else -1
def random_with_major(dim):
    l = [random.random() for i in range(dim)]
    s = sum(l)
    l = [l[i]/(2 * s) for i in range(dim)]
    return l

diagonal_matrix = [[0 for j in range(dim)] for i in range(dim)]
for i in range(dim):
    l = random_with_major(dim - 1)
    for j in range(dim):
        if j < i:
            diagonal_matrix[i][j] = l[j]
        elif j > i:
            diagonal_matrix[i][j] = l[j - 1]
        else:
            diagonal_matrix[i][j] = random.uniform(0.5, 1)
        diagonal_matrix[i][j] *= random_sign()
print_matrix(diagonal_matrix)

( -0.73077 -0.06727  0.03609  0.00375  0.08157 -0.02621 -0.03210 -0.04957 -0.08006 -0.12339 )
( -0.05640  0.55588  0.00713 -0.00248 -0.08486  0.07081  0.08040  0.05961  0.07101 -0.06731 )
( -0.03985  0.07294 -0.96864  0.02927  0.05094 -0.01813  0.06278  0.04991 -0.08391 -0.09226 )
( -0.07749 -0.09352  0.05788  0.81272 -0.04746 -0.02547 -0.02410  0.04178 -0.04877 -0.08354 )
(  0.12624 -0.06978 -0.04233  0.09096  0.72137 -0.01577  0.04416 -0.00432  0.07295 -0.03350 )
(  0.01551  0.09707 -0.04361  0.00820 -0.10241 -0.88014 -0.09363 -0.02167  0.06462  0.05329 )
(  0.06613 -0.01491  0.07227  0.11265  0.08483 -0.02621 -0.51066 -0.03586 -0.07153 -0.01562 )
(  0.09145 -0.06540  0.03843 -0.07555  0.01891  0.02887  0.08846 -0.64393  0.07554  0.01739 )
( -0.09706  0.09893  0.09160 -0.01426  0.03225 -0.01163 -0.08827  0.05499 -0.74054  0.01102 )
(  0.08680 -0.03915  0.05735  0.03586 -0.08805  0.05401 -0.05044 -0.00703  0.08131  0.76679 )


## Матрица Гильберта

In [6]:
hilbert_matrix = [[1/(1 + i + j) for j in range(dim)] for i in range(dim)]
print_matrix(hilbert_matrix)

(  1.00000  0.50000  0.33333  0.25000  0.20000  0.16667  0.14286  0.12500  0.11111  0.10000 )
(  0.50000  0.33333  0.25000  0.20000  0.16667  0.14286  0.12500  0.11111  0.10000  0.09091 )
(  0.33333  0.25000  0.20000  0.16667  0.14286  0.12500  0.11111  0.10000  0.09091  0.08333 )
(  0.25000  0.20000  0.16667  0.14286  0.12500  0.11111  0.10000  0.09091  0.08333  0.07692 )
(  0.20000  0.16667  0.14286  0.12500  0.11111  0.10000  0.09091  0.08333  0.07692  0.07143 )
(  0.16667  0.14286  0.12500  0.11111  0.10000  0.09091  0.08333  0.07692  0.07143  0.06667 )
(  0.14286  0.12500  0.11111  0.10000  0.09091  0.08333  0.07692  0.07143  0.06667  0.06250 )
(  0.12500  0.11111  0.10000  0.09091  0.08333  0.07692  0.07143  0.06667  0.06250  0.05882 )
(  0.11111  0.10000  0.09091  0.08333  0.07692  0.07143  0.06667  0.06250  0.05882  0.05556 )
(  0.10000  0.09091  0.08333  0.07692  0.07143  0.06667  0.06250  0.05882  0.05556  0.05263 )


## Вектор b (будем использовать его для каждой матрицы)

In [7]:
random.seed(seed)
b = [random.random() for i in range(dim)]
print(b)

[0.5390815646058106, 0.2891964436397205, 0.03003690855112706, 0.6536357538927619, 0.21000869554973112, 0.2572769749796092, 0.39719826263322744, 0.6415781537746728, 0.9888112104037214, 0.46153301006262504]


## Коллекционирование результатов

In [8]:
random_matrix_answers = dict()
diagonal_matrix_answers = dict()
hilbert_matrix_answers = dict()

# Часть 1. Метод Гаусса

## Реализация метода

Для сравнения точности результатов рассмотрим классический метод Гаусса, с выбором ведущего элемента в столбце и с выбором ведущего элемента по всей матрице. Поскольку метод не опирается на сходимость, а использует лишь линейные операции, то все три метода приведут нас к какому-нибудь приближению решения.

In [9]:
def gauss_iteration(a, b, k):
    n = len(a)
    f = [a[k][j] for j in range(n)]
    s = b[k]
    mu = [0 for i in range(n)]
    for i in range(k + 1, n):
        mu[i] = a[i][k] / a[k][k]
    for i in range(k + 1, n):
        for j in range(k, n):
            a[i][j] -= mu[i] * f[j]
        b[i] -= mu[i] * s
        
def gauss_solving(a, b):
    n = len(a)
    x = [0 for i in range(n)]
    for i in range(n):
        sum = 0
        for j in range(n - i, n):
            sum += a[n - i - 1][j] * x[j]
        x[n - i - 1] = (b[n - i - 1] - sum) / a[n - i - 1][n - i - 1]
    return x
    

def gauss(a, b):
    n = len(a)
    for k in range(n - 1):
        gauss_iteration(a, b, k)
    x = gauss_solving(a, b)
    return x
    
def gauss_with_column_optimization(a, b):
    n = len(a)
    for k in range(n - 1):
        max_value = -1
        max_row_index = k
        for i in range(k, n):
            if abs(a[i][k]) > max_value:
                max_value = abs(a[i][k])
                max_row_index = i
        a[k], a[max_row_index] = a[max_row_index], a[k]
        b[k], b[max_row_index] = b[max_row_index], b[k]
            
        gauss_iteration(a, b, k)
    x = gauss_solving(a, b)
    return x
    
def gauss_with_full_optimization(a, b):
    n = len(a)
    s = [i for i in range(n)]
    for k in range(n - 1):
        max_value = -1
        max_row_index = k
        max_column_index = k
        for i in range(k, n):
            for j in range(k, n):
                if abs(a[i][j]) > max_value:
                    max_value = abs(a[i][j])
                    max_row_index = i
                    max_column_index = j
        a[k], a[max_row_index] = a[max_row_index], a[k]
        b[k], b[max_row_index] = b[max_row_index], b[k]
        s[k], s[max_column_index] = s[max_column_index], s[k]
        for i in range(n):
            a[i][k], a[i][max_column_index] = a[i][max_column_index], a[i][k]
            
        gauss_iteration(a, b, k)
    x = gauss_solving(a, b)
    tmp  = [x[i] for i in range(n)]
    for i in range(n):
        x[s[i]] = tmp[i]
    return x
    
def run_gauss(a, b, answers = dict()):
    g1 = gauss(deepcopy(a), deepcopy(b))
    answers["gauss"] = g1
    print(g1)
    
    g2 = gauss_with_column_optimization(deepcopy(a), deepcopy(b))
    answers["gauss_with_column_optimization"] = g2
    print(g2)
    
    g3 = gauss_with_full_optimization(deepcopy(a), deepcopy(b))
    answers["gauss_with_full_optimization"] = g3
    print(g3)

run_gauss(example_matrix, example_b)

[0.07251321000661325, -0.0004605033005403869, 0.08405096355375125, 0.03325687112747826]
[0.07251321000661325, -0.0004605033005403869, 0.08405096355375125, 0.03325687112747826]
[0.07251321000661325, -0.0004605033005403869, 0.08405096355375125, 0.03325687112747826]


## Вычисления для сгенерированных матриц

In [10]:
run_gauss(random_matrix, b, random_matrix_answers)

[3.3654277594220465, 10.980756075169433, -11.053567260723272, 10.504049960145258, 1.416614769458203, 5.419133933272693, 12.87967925303474, -15.823807746697645, -1.873611035431915, -12.539104841018592]
[3.3654277594220305, 10.98075607516942, -11.053567260723286, 10.504049960145236, 1.4166147694581923, 5.419133933272677, 12.87967925303471, -15.82380774669762, -1.8736110354319073, -12.539104841018545]
[3.3654277594220448, 10.980756075169463, -11.053567260723332, 10.504049960145275, 1.4166147694582014, 5.419133933272702, 12.879679253034759, -15.823807746697685, -1.8736110354319122, -12.5391048410186]


In [11]:
run_gauss(diagonal_matrix, b, diagonal_matrix_answers)

[-0.6579984341032276, 1.021393913949036, 0.05791318134497171, 0.9629400706963428, 0.5498183468691803, -0.21147674749937945, -0.33229671860103854, -1.4544369234949168, -1.1525178943920598, 0.8442168444015744]
[-0.6579984341032276, 1.021393913949036, 0.05791318134497171, 0.9629400706963428, 0.5498183468691803, -0.21147674749937945, -0.33229671860103854, -1.4544369234949168, -1.1525178943920598, 0.8442168444015744]
[-0.6579984341032273, 1.0213939139490358, 0.05791318134497173, 0.9629400706963429, 0.5498183468691805, -0.21147674749937956, -0.3322967186010383, -1.4544369234949166, -1.15251789439206, 0.8442168444015744]


In [12]:
run_gauss(hilbert_matrix, b, hilbert_matrix_answers)

[618162.4297733218, -58693906.93944507, 1335686894.848783, -12760607941.582708, 63278323924.11634, -179500822587.6829, 302252284953.04663, -298547715701.79395, 159690872954.2671, -35690729241.4723]
[618192.5818247707, -58696544.17338389, 1335743573.0921884, -12761126739.157534, 63280811790.64066, -179507691197.0002, 302263593948.5897, -298558676531.06396, 159696641492.73138, -35692000499.73094]
[618193.2590446384, -58696599.85349329, 1335744732.8637166, -12761137203.239378, 63280861728.495094, -179507829156.4871, 302263821957.1318, -298558898750.2293, 159696759205.35406, -35692026621.36878]


# Часть 2. Метод простых итераций Якоби

## Реализация метода

Сначала необходимо разобраться со сходимостью и условием остановки. Учтём, что не все матрицы могут удовлетворять необходимым условиям сходимости, поэтому введём ограничение на количество итераций `r=1000`.

In [13]:
jacobi_r = 1000

Теперь можно реализовать наш метод. В качестве способа выбора матрицы `B` и вектора `c` (здесь и далее они будут именоваться как `C` и `d` ввиду коллизии с вектором `b`) мы возьмём способ Якоби (как на лекции). Также напишем функцию, определяющую, удовлетворяет ли матрица `C` достаточному условию сходимости: `||C||<1`.

In [14]:
def jacobi_sufficient_condition(c):
    return True if matrix_norm(c) < 1 else False

def jacobi_iteration(x, c, d):
    n = len(c)
    x_new = matrix_vector_mul(c, x)
    x_new = [x_new[i] + d[i] for i in range(n)]
    return x_new

def jacobi(a, b):
    n = len(a)
    c = [[(0 if i == j else - a[i][j] / a[i][i]) for j in range(n)] for i in range(n)]
    d = [b[i] / a[i][i] for i in range(n)]
    x = [0 for i in range(n)]
    
    if not jacobi_sufficient_condition(c):
        print("Warning: Достаточное условие сходимости не выполняется")
    
    for k in range(jacobi_r):
        x_new = jacobi_iteration(x, c, d)
        x_delta = [x_new[i] - x[i] for i in range(n)]
        if (vector_norm(x_delta) < eps):
            break
        x = x_new
    return x
    
def run_jacobi(a, b, answers = dict()):
    x = jacobi(deepcopy(a), deepcopy(b))
    answers["jacobi"] = x
    print(x)
    
run_jacobi(example_matrix, example_b)

[0.07251321000626626, -0.0004605033007654743, 0.08405096355352445, 0.03325687112725102]


## Вычисления для сгенерированных матриц

In [15]:
run_jacobi(random_matrix, b, random_matrix_answers)

[inf, inf, nan, inf, inf, inf, inf, inf, inf, inf]


In [16]:
run_jacobi(diagonal_matrix, b, diagonal_matrix_answers)

[-0.6579984341031145, 1.0213939139497208, 0.05791318134506876, 0.9629400706963722, 0.5498183468694606, -0.21147674749931192, -0.33229671860111215, -1.4544369234950005, -1.1525178943919123, 0.8442168444017967]


In [17]:
run_jacobi(hilbert_matrix, b, hilbert_matrix_answers)

[-inf, nan, nan, nan, nan, nan, nan, nan, nan, nan]


## Анализ

Условие сходимости матрицы `C` выполняется лишь для матрицы с диагональным преобладанием. При подсчёте ответа методом простых итераций Якоби для рандомной матрицы и матрицы Гильберта видно, что значения расходятся и устремляются в бесконечность.

# Часть 3. Метод Зейделя

## Реализация метода

Аналогично методу простых итераций Якоби введём ограничение на количество итераций `r=10000` (на порядок выше).

In [18]:
seidel_r = 10000

В качестве способа выбора матрицы `C` и вектора `d` снова возьмём способ Якоби. Аналогично напишем функцию, определяющую, удовлетворяют ли `C1` и `C2` достаточному условию сходимости: `||C1||+||C2||<1`, однако помним, что здесь используется уже другая норма.

In [19]:
def seidel_sufficient_condition(c1, c2):
    return True if matrix_norm_2(c1) + matrix_norm_2(c2) < 1 else False

def seidel_iteration(x, c1, c2, d):
    n = len(x)
    x_new = matrix_vector_mul(c2, x)
    x_new = [x_new[i] + d[i] for i in range(n)]
    for i in range(n):
        for j in range(n):
            x_new[i] += c1[i][j] * x_new[j]
    return x_new

def seidel(a, b):
    n = len(a)
    c = [[(0 if i == j else - a[i][j] / a[i][i]) for j in range(n)] for i in range(n)]
    c1 = [[c[i][j] if i > j else 0 for j in range(n)] for i in range(n)]
    c2 = [[c[i][j] if i < j else 0 for j in range(n)] for i in range(n)]
    d = [b[i] / a[i][i] for i in range(n)]
    x = [0 for i in range(n)]
    
    if not seidel_sufficient_condition(c1, c2):
        print("Warning: Достаточное условие сходимости не выполняется")
    
    for i in range(seidel_r):
        x_new = seidel_iteration(x, c1, c2, d)
        x_delta = [x_new[i] - x[i] for i in range(n)]
        if (vector_norm(x_delta) < eps):
            break
        x = x_new
    return x
    
def run_seidel(a, b, answers = dict()):
    x = seidel(deepcopy(a), deepcopy(b))
    answers["seidel"] = x
    print(x)

run_seidel(example_matrix, example_b)

[0.0725132100064929, -0.0004605033005458259, 0.0840509635537701, 0.033256871127486466]


## Вычисления для сгенерированных матриц

In [20]:
run_seidel(random_matrix, b, random_matrix_answers)

[6.480954427807224e+306, -3.8292607884400445e+306, -1.7254098720141844e+307, 9.869089062895129e+306, 1.567319087007848e+307, 1.0209868641245113e+307, -6.5764855579138025e+305, -3.0569902872167213e+307, 2.408187294371015e+307, 6.121111292672282e+306]


In [21]:
run_seidel(diagonal_matrix, b, diagonal_matrix_answers)

[-0.6579984341036822, 1.0213939139486181, 0.057913181345041614, 0.9629400706962113, 0.5498183468692421, -0.21147674749953416, -0.3322967186010771, -1.4544369234949563, -1.152517894392044, 0.8442168444016188]


In [22]:
run_seidel(hilbert_matrix, b, hilbert_matrix_answers)

[166.87803573595082, -2228.7254311401966, -1214.75099858866, 38272.504998680466, -53206.51484997787, -16168.544559361493, 2800.53629633494, 33230.34300306463, 70530.89435197509, -72697.77613467716]


## Анализ

Можно заметить, что хоть достаточное условие сходимости не было выполнено ни для единого вариант матрицы `A`, для двух из трёх вариантов сходимость всё же наблюдается. Хоть и на первый взгляд может показаться, что сходимость наблюдается лишь для диагональной матрицы, где значения очень схожи с полученными другими методами, это не так.

Матрица Гильберта обладает симметричностью, а также является положительно определённой. На лекции мы рассматривали теорему, утверждающую, что для таких матриц метод Зейделя сходится. Однако матрица Гильберта обладает слишком плохой обусловленностью, поэтому для неё скорость сходимости очень низкая.

# Часть 4. Метод Зейделя с релаксацией

## Реализация метода

Поскольку выбор `w` ложится на наши плечи, будем брать их равномерно на промежутке `(0;2)`. Здесь мы рассматриваем всего `step_count=5` значений, однако при более тщательном дроблении (скажем, `step_count=200`) общая картина схожа.

In [23]:
def seidel_relaxed_iteration(x, c1, c2, d, w):
    x_new = seidel_iteration(x, c1, c2, d)
    x_new = [x[i] + w * (x_new[i] - x[i]) for i in range(len(x))]
    return x_new

def seidel_relaxed(a, b, possible_w):
    n = len(a)
    c = [[(0 if i == j else - a[i][j] / a[i][i]) for j in range(n)] for i in range(n)]
    c1 = [[c[i][j] if i > j else 0 for j in range(n)] for i in range(n)]
    c2 = [[c[i][j] if i < j else 0 for j in range(n)] for i in range(n)]
    d = [b[i] / a[i][i] for i in range(n)]
    
    if not seidel_sufficient_condition(c1, c2):
        print("Warning: Достаточное условие сходимости не выполняется")
    
    xx = []
    for k in range(len(possible_w)):
        x = [0 for i in range(n)]
        for i in range(seidel_r):
            x_new = seidel_relaxed_iteration(x, c1, c2, d, possible_w[k])
            x_delta = [x_new[i] - x[i] for i in range(n)]
            if (vector_norm(x_delta) < eps):
                break
            x = x_new
        xx.append(x)
    return xx
    
def run_seidel_relaxed(a, b, answers = dict(), step_count = 5):
    step = 2 / (step_count + 1)
    xx = seidel_relaxed(a, b, [step * i for i in range(1, step_count + 1)])
    for i in range(len(xx)):
        answers["seidel_relaxed w=" + str(step * (i + 1))] = xx[i]
        print(xx[i])
    
run_seidel_relaxed(example_matrix, example_b)

[0.07251321000410191, -0.0004605032982792741, 0.08405096355375812, 0.03325687112710258]
[0.07251321000601578, -0.0004605033003404446, 0.08405096355380745, 0.033256871127465754]
[0.0725132100064929, -0.0004605033005458259, 0.0840509635537701, 0.033256871127486466]
[0.07251321000620056, -0.0004605033003530564, 0.08405096355384363, 0.033256871127483933]
[0.07251321000716603, -0.00046050330073963455, 0.08405096355354665, 0.033256871127430775]


## Вычисления для сгенерированных матриц

In [24]:
run_seidel_relaxed(random_matrix, b, random_matrix_answers)

[7.704290188173007e+305, -5.4094722518105385e+305, 4.825930025179095e+306, -1.1424575421306491e+306, -2.909720012574445e+306, -1.9901457877571653e+306, -2.090309904580943e+306, 6.998980565416772e+306, -1.5647049612164425e+307, 1.1528846082448834e+306]
[1.825150311959754e+306, -1.2280535572337541e+306, 7.145311685799436e+306, -1.2628405906203855e+306, -3.917584555374006e+306, -2.7172890502285096e+306, -3.6975326903274286e+306, 9.951691660946324e+306, -2.552838222828766e+307, 2.466087204214156e+306]
[6.480954427807245e+306, -3.82926078844006e+306, -1.725409872014152e+307, 9.869089062895031e+306, 1.5673190870078274e+307, 1.0209868641244965e+307, -6.576485557915e+305, -3.056990287216672e+307, 2.408187294370919e+307, 6.121111292672333e+306]
[-8.464530683010746e+304, 1.692632360988418e+303, 4.10096194816801e+306, -1.4339050607084942e+306, -2.894505385806993e+306, -1.9389086017524144e+306, -1.1253662800142726e+306, 6.391591530378317e+306, -1.0745898019388353e+307, 1.5969810824199326e+305]
[-9

In [25]:
run_seidel_relaxed(diagonal_matrix, b, diagonal_matrix_answers)

[-0.6579984341008748, 1.0213939139485824, 0.05791318134461527, 0.9629400706952825, 0.5498183468696606, -0.21147674749902032, -0.3322967186011014, -1.4544369234947256, -1.152517894392373, 0.8442168444013658]
[-0.6579984341024061, 1.0213939139491222, 0.057913181345240594, 0.9629400706961994, 0.5498183468691922, -0.21147674749966772, -0.33229671860070403, -1.4544369234949852, -1.1525178943921657, 0.844216844401518]
[-0.6579984341036822, 1.0213939139486181, 0.057913181345041614, 0.9629400706962113, 0.5498183468692421, -0.21147674749953416, -0.3322967186010771, -1.4544369234949563, -1.152517894392044, 0.8442168444016188]
[-0.6579984341037144, 1.0213939139485786, 0.05791318134504065, 0.9629400706961899, 0.5498183468692474, -0.21147674749954337, -0.3322967186010855, -1.4544369234949581, -1.152517894392044, 0.844216844401622]
[-0.6579984341037134, 1.0213939139485795, 0.057913181345040685, 0.9629400706961898, 0.5498183468692478, -0.2114767474995431, -0.3322967186010853, -1.4544369234949583, -1.

In [26]:
run_seidel_relaxed(hilbert_matrix, b, hilbert_matrix_answers)

[4.61625426523411, -378.3810738435995, -75.40022536178881, 10635.166687535098, -18029.631936048987, -4071.3356186416586, 2590.842470603785, 12032.039033243198, 23165.25087106293, -26121.352323010593]
[98.33854414441377, -1543.7627032369924, 321.1269309183851, 23505.27291179016, -36100.393086118784, -9872.882230125808, 3248.1322652197277, 23053.90316200047, 46856.176488495585, -49957.42636667702]
[166.87803573595082, -2228.7254311401966, -1214.75099858866, 38272.504998680466, -53206.51484997787, -16168.544559361493, 2800.53629633494, 33230.34300306463, 70530.89435197509, -72697.77613467716]
[213.12211613616157, -2503.8229117143587, -4355.68099047526, 54561.956021263744, -69490.05913380843, -22837.20943514708, 1452.6095860175262, 42699.25973987955, 94176.19517504072, -94540.0928410474]
[241.15847059426417, -2445.1639532311087, -8797.348818424125, 72065.91318449574, -85082.27024304174, -29793.719463807367, -635.6529600297646, 51573.55767828319, 117787.90570761301, -115634.30397109549]


## Анализ

К сожалению, последовательная релаксация не выручила нас с рандомной матрицей: сходимость не образовалась. Для матрицы Гильберта скорость сходимости выросла, но не сильно:

In [27]:
print_list(seidel_relaxed(hilbert_matrix, b, [1, 1.999999999]))

[166.87803573595082, -2228.7254311401966, -1214.75099858866, 38272.504998680466, -53206.51484997787, -16168.544559361493, 2800.53629633494, 33230.34300306463, 70530.89435197509, -72697.77613467716]
[249.74400300567046, -2115.315931672376, -14290.198983627928, 90532.70988245861, -100090.91845980946, -36968.70361553005, -3333.391667826416, 59945.74614785305, 141362.77334167523, -136103.02051231166]


Для матрицы с диагональным преобладанием всё осталось без особого изменения, однако в какой-то момент можно заметить, как начиная с некоторого значения сходимость теряется.

In [28]:
print_list(seidel_relaxed(diagonal_matrix, b, [1.8, 1.81, 1.82, 1.83]))

[-0.6579984341027272, 1.0213939139495067, 0.05791318134490043, 0.9629400706964991, 0.5498183468691128, -0.2114767474992105, -0.3322967186009887, -1.4544369234948733, -1.1525178943920757, 0.8442168444015253]
[2.1693595082755744e+33, 2.0386267434479815e+33, -3.0761301585596877e+32, 6.825179991624099e+32, -2.9947220796325257e+32, 7.30241634843055e+32, 2.0952379504537376e+32, 1.8325109156824568e+32, -6.997598046762572e+31, -2.1333523220873355e+32]
[7.600705975690709e+80, 7.142662344354789e+80, -1.077772530969402e+80, 2.3913134798361926e+80, -1.0492498785638985e+80, 2.558521045717194e+80, 7.341008970507938e+79, 6.420501818261456e+79, -2.4517229664615656e+79, -7.474548907586167e+79]
[8.137904891049402e+127, 7.647487879829087e+127, -1.153946801687398e+127, 2.5603255442101072e+127, -1.1234082394460994e+127, 2.7393509232414014e+127, 7.859853150141784e+126, 6.87428685137019e+126, -2.6250046224755617e+126, -8.002831356452494e+126]


# Часть 5. Метод сопряжённых направлений и градиентов

Снова обезопасим себя от зацикливания и ограничим количество итераций.

In [29]:
conjgrad_r = 10000

## Реализация метода

In [30]:
def conjgrad_iteration(x, a, b, r, z):
    n = len(a)
    rr = [r[i] * r[i] for i in range(n)]
    az = matrix_vector_mul(a, z)
    alpha = sum(rr) / sum([az[i] * z[i] for i in range(n)])
    x_new = [x[i] + alpha * z[i] for i in range(n)]
    r_new = [r[i] - alpha * az[i] for i in range(n)]
    beta = sum([r_new[i] * r_new[i] for i in range(n)]) / sum(rr)
    z_new = [r_new[i] + beta * z[i] for i in range(n)]
    return x_new, r_new, z_new

def conjgrad(a, b, initial_value = 0):
    n = len(a)
    x = [initial_value for i in range(n)]
    r = [b[i] for i in range(n)]
    z = [b[i] for i in range(n)]
    for i in range(conjgrad_r):
        x_new, r_new, z_new = conjgrad_iteration(x, a, b, r, z)
        x_delta = [x_new[i] - x[i] for i in range(n)]
        if (vector_norm(r) / vector_norm(b) < eps):
            break
        x, r, z = x_new, r_new, z_new
    return x
    
def run_conjgrad(a, b, answers = dict()):
    x = conjgrad(a, b)
    answers["conjgrad"] = x
    print(x)

run_conjgrad(example_matrix, example_b)

[0.07251320996444181, -0.0004605033226355451, 0.08405096360796392, 0.0332568711303454]


## Вычисление для сгенерированных матриц

В отличие от предыдущих методов, метод сопряжённых направлений и градиентов применим к симметричным положительно определённым матрицам (к другим, возможно, тоже применим, но на лекциях шла речь только о такого рода матрицах). Из сгенерированных нами трёх матриц лишь матрица Гильберта обладаем этими свойствами, поэтому вычисления будем проводить лишь для неё.

In [31]:
run_conjgrad(hilbert_matrix, b, hilbert_matrix_answers)

[618156.2186409582, -58693440.22249881, 1335678105.2325225, -12760536389.81034, 63278015226.00991, -179500048659.5374, 302251118918.10736, -298546674865.32056, 159690365685.50845, -35690625227.12414]


## Анализ

В отличие от предыдущих методов (за вычетом метода Гаусса), метод сопряжённых направлений и градиентов хорошо показал себя для матрицы Гильберта. Также можно заметить интересное наблюдение, что для заранее заготовленной нами матрицы-примера `example_matrix` ответ тоже был найден верно, хотя матрица не обладает симметричностью. Конечно, ответ совпал только потому, что за изначальное приближение нами был взят нулевой вектор. При единичном векторе все его координаты сдвигаюся на `1`.

In [32]:
print(conjgrad(example_matrix, example_b, initial_value = 1))

[1.072513209964442, 0.9995394966773659, 1.0840509636079643, 1.0332568711303485]


# Результаты

## Рандомная матрица

In [33]:
print_dict(random_matrix_answers)

gauss:
[3.3654277594220465, 10.980756075169433, -11.053567260723272, 10.504049960145258, 1.416614769458203, 5.419133933272693, 12.87967925303474, -15.823807746697645, -1.873611035431915, -12.539104841018592]
gauss_with_column_optimization:
[3.3654277594220305, 10.98075607516942, -11.053567260723286, 10.504049960145236, 1.4166147694581923, 5.419133933272677, 12.87967925303471, -15.82380774669762, -1.8736110354319073, -12.539104841018545]
gauss_with_full_optimization:
[3.3654277594220448, 10.980756075169463, -11.053567260723332, 10.504049960145275, 1.4166147694582014, 5.419133933272702, 12.879679253034759, -15.823807746697685, -1.8736110354319122, -12.5391048410186]
jacobi:
[inf, inf, nan, inf, inf, inf, inf, inf, inf, inf]
seidel:
[6.480954427807224e+306, -3.8292607884400445e+306, -1.7254098720141844e+307, 9.869089062895129e+306, 1.567319087007848e+307, 1.0209868641245113e+307, -6.5764855579138025e+305, -3.0569902872167213e+307, 2.408187294371015e+307, 6.121111292672282e+306]
seidel_rel

## Диагональная матрица

In [34]:
print_dict(diagonal_matrix_answers)

gauss:
[-0.6579984341032276, 1.021393913949036, 0.05791318134497171, 0.9629400706963428, 0.5498183468691803, -0.21147674749937945, -0.33229671860103854, -1.4544369234949168, -1.1525178943920598, 0.8442168444015744]
gauss_with_column_optimization:
[-0.6579984341032276, 1.021393913949036, 0.05791318134497171, 0.9629400706963428, 0.5498183468691803, -0.21147674749937945, -0.33229671860103854, -1.4544369234949168, -1.1525178943920598, 0.8442168444015744]
gauss_with_full_optimization:
[-0.6579984341032273, 1.0213939139490358, 0.05791318134497173, 0.9629400706963429, 0.5498183468691805, -0.21147674749937956, -0.3322967186010383, -1.4544369234949166, -1.15251789439206, 0.8442168444015744]
jacobi:
[-0.6579984341031145, 1.0213939139497208, 0.05791318134506876, 0.9629400706963722, 0.5498183468694606, -0.21147674749931192, -0.33229671860111215, -1.4544369234950005, -1.1525178943919123, 0.8442168444017967]
seidel:
[-0.6579984341036822, 1.0213939139486181, 0.057913181345041614, 0.9629400706962113, 

## Матрица Гильберта

In [35]:
print_dict(hilbert_matrix_answers)

gauss:
[618162.4297733218, -58693906.93944507, 1335686894.848783, -12760607941.582708, 63278323924.11634, -179500822587.6829, 302252284953.04663, -298547715701.79395, 159690872954.2671, -35690729241.4723]
gauss_with_column_optimization:
[618192.5818247707, -58696544.17338389, 1335743573.0921884, -12761126739.157534, 63280811790.64066, -179507691197.0002, 302263593948.5897, -298558676531.06396, 159696641492.73138, -35692000499.73094]
gauss_with_full_optimization:
[618193.2590446384, -58696599.85349329, 1335744732.8637166, -12761137203.239378, 63280861728.495094, -179507829156.4871, 302263821957.1318, -298558898750.2293, 159696759205.35406, -35692026621.36878]
jacobi:
[-inf, nan, nan, nan, nan, nan, nan, nan, nan, nan]
seidel:
[166.87803573595082, -2228.7254311401966, -1214.75099858866, 38272.504998680466, -53206.51484997787, -16168.544559361493, 2800.53629633494, 33230.34300306463, 70530.89435197509, -72697.77613467716]
seidel_relaxed w=0.3333333333333333:
[4.61625426523411, -378.381073

## Какие можно сделать выводы?

1. Если матрица не обладает никакими примечательными свойствами, то скорей всего её возьмёт только Гаусс.
2. Матрицы с диагональным преобладанием берут многие методы (за исключением рассмотренного нами метода спуска, так как она не удовлетворяла условиям симметричности и положительной определённости).
3. Иногда бывают ужасно плохо обусловленные матрицы, которые, скорее всего, возьмёт только Гаусс.
4. Конкретно матрицу Гильберта можно ещё посчитать и с помощью метода спусков (но здесь спасают её свойства, для других плохо обусловленных далеко не факт, что повезёт).
5. Все зависит от ситуации, и в реальной жизни неплохо бы анализировать матрицы перед выбором метода ~~(хотя Гаусс всё равно всё посчитает, хотя бы с большим отклонением, но тем не менее)~~.