<style>
@import url(https://www.numfys.net/static/css/nbstyle.css);
</style>
<a href="https://www.numfys.net"><img class="logo" /></a>

# Метод Гаусса-Зейделя

### Modules - Partial Differential Equations
<section class="post-meta">
By Henning G. Hugdal, Håkon W. Ånes and Jon Andreas Støvneng
</section>
Last edited: February 7th 2018 
___

В этом модуле мы рассмотрим метод решения линейной системы уравнений с использованием итерационного метода, называемого методом Гаусса-Зейделя [1]. Тот факт, что это итерационный метод, означает, что нужно много раз повторять алгоритм решения, чтобы получить ответ с точностью ниже заданного допуска. Это противоположно прямым методам, где одна итерация алгоритма дает решение напрямую. Однако алгоритм прямого метода может иметь определенные ограничения в отношении того, где они могут быть применены, что делает итерационные методы полезными во многих ситуациях.

У нас есть линейная система уравнений
$$ A {\bf{x}} = {\bf{b}}$$
метод Гаусса-Зейделя основан на разложении $A$ на нижнюю диагональную матрицу $L$ и верхнюю диагональную матрицу $U$:
$$\begin{align}
 A = \left(\matrix{
 a_{11} & a_{12} & a_{13} & ...\\
 a_{21} & a_{22} & a_{23} & ...\\
 a_{31} & a_{32} & a_{33} & \ddots \\
 \vdots & \vdots & \vdots & \ddots
 }\right) = \left(\matrix{
 a_{11} & 0 & 0 & ...\\
 a_{21} & a_{22} & 0 & ...\\
 a_{31} & a_{32} & a_{33} & \ddots \\
 \vdots & \vdots & \vdots & \ddots
 }\right) + \left(\matrix{
 0 & a_{12} & a_{13} & ...\\
 0 & 0 & a_{23} & ...\\
 0 & 0 & 0 & \ddots \\
 \vdots & \vdots & \vdots & \ddots
 }\right) \equiv L + U\\
 \phantom{+}
\end{align}$$
Это можно использовать для получения $\bf{x}$ на итерации $k+1$, используя решение из предыдущей итерации:
$$ L{\bf{x}}^{k+1} = {\bf{b}} - U{\bf{x}}^{k}.$$
Если мы теперь посмотрим на уравнение для каждого элемента в ${\bf{x}}$, мы получим
$$\begin{align}
a_{11}x^{k+1}_1 &= b_1 - \sum_{i=2} a_{1i}x^{k}_i \quad \Rightarrow \quad x^{k+1}_1 = \frac{b_1}{a_{11}} - \frac{1}{a_{11}}\sum_{i=2} a_{1i}x^{k}_i,\\
a_{21}x^{k+1}_1 + a_{22}x^{k+1}_2 &= b_2 - \sum_{i=3} a_{2i}x^{k}_i \quad \Rightarrow \quad x^{k+1}_2 = \frac{b_2}{a_{22}} - \frac{1}{a_{22}}\sum_{i=3} a_{2i}x^{k}_i - \frac{a_{21}}{a_{22}}x_1^{k+1},
\end{align}$$
и т.д. Здесь мы видим, что во второй строке используется значение $x_1^{k+1}$, найденное в строке выше. Из вышеизложенного мы можем вывести общий алгоритм, а именно, что значение $x_i^{k+1}$ находится с помощью
$$x_i^{k+1} = \frac{b_i}{a_{ii}} - \frac{1}{a_{ii}}\sum_{j>i} a_{ij} x_j^{k} - \frac{1}{a_{ii}}\sum_{j<i} a_{ij}x_j^{k+1}.$$
Примечание: Если бы в последнем слагаемом у нас было $k$ вместо $k+1$, это соответствовало бы методу Якоби. Однако, поскольку мы здесь используем уже вычисленные новые значения везде, где это возможно, метод Гаусса-Зейделя сходится быстрее, чем метод Якоби.

#### Первоначальное предположение
Чтобы получить решение на итерации $k+1$, мы используем решение на итерации $k$. Но каково решение на итерации $k=0$? Это должно быть задано явно в качестве первоначального предположения! Хорошая догадка означает, что для получения точного решения требуется меньше итераций.


#### Критерий остановки
Но как мы узнаем, когда остановить итерацию? Один из вариантов - повторить заданное количество раз, несмотря ни на что, и сохранить полученное решение. Этот вариант имеет очевидные недостатки: во-первых, нет возможности узнать, насколько хорошо полученное решение. Во-вторых, может выйти огромная трата времени на 1000 итераций, в то время как решение было достаточно хорошим, например, после 300 итераций.
 
Второй вариант - посмотреть, насколько сильно меняется решение от итерации к итерации, и прекратить итерацию, когда разница меньше заданного значения. Один из способов сделать это - установить критерий остановки в виде допустимой погрешности, умноженной на 2-норму разницы между первоначальным предположением и первой итерацией. 2-норма вектора ${\bf{x}}$ задается
$$||{\bf x}||_2 = \left(\sum_{i=1}^n \left|x_i\right|^2\right)^{1/2}.$$
Хотя это может быть лучшим вариантом, чем выбор фиксированного числа итераций, это все равно будет не идеальным решением. Если, например, первоначальное предположение очень плохое, 2-норма разницы после первой итерации может быть очень большой, поэтому допустимая погрешность должна быть установлена очень низкой, чтобы получить хорошую точность. Это также означает, что метод должен сходиться, иначе мы получим бесконечное число итераций.


#### Сходимость
Метод Гаусса-Зейделя будет сходиться, когда матрица $A$ является диагонально доминирующей, т.е. если выполняются следующие условия:
$$\begin{align} a_{ii} &\ge \sum_{j\ne i} |a_{ij}| \qquad \forall~i,\\
\exists~i:\qquad a_{ii} &> \sum_{j\ne i} |a_{ij}|.\end{align}$$
Если это не выполняется, метод не гарантирует сходимости.

### Пример: Уравнение Лапласа

В качестве примера использования метода Гаусса-Зейделя мы решим уравнение Лапласа в одном измерении с граничными условиями Дирихле с обеих сторон, т.е.
$$ \frac{d^2}{dx^2} f = 0$$
с $f(0) = f_0 = 10$ и $f(1) = f_1 = 2$. Мы дискретизируем ось $x$, используя N+1 точек сетки: $x_i = i\Delta_x$, где $\Delta x = 1/(N+1)$ и $i\in [0, N+1]$. Следовательно, мы хотим найти решение $f(x_i) = f_i$ для $i\in[1, N]$. Мы используем центральные разности второго порядка для дискретизации второй производной,
$$ \frac{d^2}{dx^2} f(x_i)\quad\rightarrow\quad \frac{f_{i+1} - 2f_i + f_{i-1}}{\Delta x^2}.$$

Используя эту дискретизацию, мы можем записать уравнение Лапласа в виде линейной системы уравнений $A{\bf{f}} = {\bf b}$, где
$$\begin{align}
A = \left(\matrix{
2 & -1 & 0 & 0 & ...\\
-1 & 2 & -1 & 0 & ...\\
0 & -1& 2& -1 & ...\\
\vdots & \vdots & \vdots & \vdots & \ddots
}\right),\\
\phantom{+}
\end{align}$$
а источник ${ \bf b}$ будет обсуждаться ниже.
Здесь мы умножили обе стороны уравнения Лапласа на $-\Delta x^2$. Сначала мы проверяем, является ли $A$ матрицей с доминирующими диагоналями. 

Прежде всего,мы видим, что для всех строк, кроме первой и последней, у нас $|a_{ii}| = |a_{i, i+1}| + |a_{i, i-1}| = 2$. Следовательно, выполняется первое условие. Мы также видим, что для первой строки $|a_{11}| = 2 > |a_{12}| = 1$. Следовательно, справедливо и второе условие. Следовательно, $A$ является диагонально доминирующей.

Далее, особое внимание должно быть уделено случаям $i=1$ и $i=N$, так как тогда мы должны использовать граничные условия. Для $i=1$ в этом случае мы получаем константу $f_0$ с правой стороны. Аналогично, для $i=N$, мы получаем константу $f_1$ с правой стороны. Следовательно, вектор ${\bf b}$ состоит только из $f_0$ в качестве первого элемента и $f_1$ в качестве последнего, $N$-элемента. Все остальные элементы равны нулю.

#### Точное решение
Точное решение уравнения Лапласа с заданными граничными условиями легко получить. Интегрируя дважды относительно $x$, мы получаем
$$f(x) = Ax + B.$$
Используя первое граничное условие, мы получаем $B = f_0 = 10$. На второй границе мы получаем $A+10 = 2$, т.е. $A = -8$. Следовательно, точное решение $f(x) = -8x+10$.

Ниже мы импортируем необходимые библиотеки и определяем ${\bf f}$ с помощью метода Гаусса-Зейделя. Чтобы увидеть, как решение сходится к точному решению, мы построим 2-норму разницы между точным решением и решением на итерации $k$.

In [None]:
import numpy as np
import matplotlib.pyplot as plt
from datetime import datetime as datetime
newparams = {
    'figure.figsize': (16, 6), 'axes.grid': True,
    'lines.linewidth': 1.5,
    'font.size': 20
    }
plt.rcParams.update(newparams)

In [None]:
# Количество точек сетки
N = 100
dx = 1/(N+1)
x = np.linspace(dx, 1-dx, N)

# Точное решение
f_e = -8*x+10

# допустимая погрешность
tol = 1e-6
diff = 1
it_error = []

# Разница на первом проходе
diff0 = 0

# Граничные условия
f0 = 10
f1 = 2

# Диагональные элементы
d = 2

# Off-diagonal elements
e = -1

# Инициализация матрицы
A = np.zeros([N, N])
for i in range(N):
    A[i, i] = d
    if i < N-1:
        A[i, i+1] = e
    if i > 0:
        A[i, i-1] = e
        

# Инициализация вектор b
b = np.zeros(N)
b[0] = f0
b[N-1] = f1
        
# Инициализация массива решений, используя нули в качестве начального предположения
f = np.zeros(N)

n_iter = 0

start = datetime.now()

while diff > tol*diff0:
    f_new = np.zeros(N)
    for i in range(N):
        if i == 0:
            f_new[i] = (b[i] - A[i, i+1]*f[i+1])/A[i, i]
        elif i == N-1:
            f_new[i] = (b[i] - A[i, i-1]*f_new[i-1])/A[i, i]
        else:
            f_new[i] = (b[i] - A[i, i+1]*f[i+1] - A[i, i-1]*f_new[i-1])/A[i, i]


    # Определит 2-норму различий между итерациями
    diff = np.sqrt(sum((f_new-f)**2))
    
    # 2-норма разности на первой итерации
    if diff0 == 0:
        diff0 = diff
        
    it_error.append(np.sqrt(sum((f_new-f_e)**2)))
        
    # Обновление f
    f = f_new

    n_iter += 1
    
print("Общее время, затраченное на итерации: ", datetime.now() - start)
    
print("Общее количество итераций: ", n_iter)

print("2-норма разности между решением и точным решением: ", it_error[-1])

x = np.linspace(0, 1, N+2)
ftot = np.concatenate(([f0], f, [f1]))

plt.figure()
plt.plot(x, ftot)
plt.xlabel('$x$')
plt.ylabel('$f$')

plt.figure()
plt.plot(it_error)
plt.xlabel('Iteration no.')
plt.ylabel('Iteration error')
plt.show()

Из последнего графика мы видим, как отклонение от точного решения уменьшается с каждой итерацией.

Мы можем сравнить результат с использованием функций в `numpy.linalg`, посмотрев на время, используемое для определения ${\bf f}$, и на две нормы разницы между полученными решениями.

In [None]:
import numpy.linalg as linalg
start = datetime.now()

f_linalg = linalg.solve(A, b)

print("Time elapsed: ", datetime.now() - start)

# Определит 2-норму разности между решениями
dev = np.sqrt(sum((f-f_linalg)**2))

# Определит 2-норму между решением с использованием linalg и точным решением
error = np.sqrt(sum((f_linalg-f_e)**2))

print("2-норма разности между решениями: ", dev)
print("2-норма разности между решением linalg и точным решением: ", error)

Мы видим, что при выбранной погрешности разница между решениями невелика, и что решение, полученное с помощью `solve`, очень близко к точному решению. Обратите также внимание, что время, прошедшее при использовании `linalg`, на 3-4 порядка меньше, чем при использовании итерационного метода!

### References
[1] R.H. Pletcher, J. C. Tannehill, D. Anderson. *Computational Fluid Mechanics and Heat Transfer*, CRC Press (2011)