# MOwNiT lab5 - iteracyjne metody rozwiązywania równań liniowych

<h3> Przydatne linki: </h3>

- CPP: https://en.cppreference.com/w/

- Metoda Jacobiego: https://en.wikipedia.org/wiki/Jacobi_method
- Metoda SOR: https://en.wikipedia.org/wiki/Successive_over-relaxation
- Metoda Gaussa-Seidela: https://en.wikipedia.org/wiki/Gauss%E2%80%93Seidel_method
- Rozserzona wersja wstępu teoretycznego : http://mst.mimuw.edu.pl/lecture.php?lecture=mo2&part=Ch5#E12



**Dodatkowe źródła**
- Bardzo przydatne praktyczne przykłady z opracowaniem wszystkich bardziej znanych metod (od str. 107) : http://bc.pollub.pl/Content/1370/metody.pdf
- Kincaid, Cheney, rozdz. 8.2, str. 319

<h3> Wstęp teoretyczny</h3>

Rozważać będziemy metody iteracyjne, które mogą posłużyć do rozwiązania prostego układu równań: $Ax = b$, $A$ - macierz nieosobliwa (zapewne wielkiego) rozmiaru . Są to metody najprostsze w analizie i implementacji, ale najmniej efektywne. Stanowią jednak ważny składnik jednej z najszybszych metod rozwiązywania niektórych trudnych układów równań.

Metody iteracyjne przedstawione na zajęciach bazują na idei rozkładu macierzy $A$ na część ,,łatwo odwracalną” $M$ oraz ,,resztę” $Z$ ($Z = M - A$) .

Wszystkie będą bazować na podziale macierzy $A$ na trzy części: diagonalną $D$, ściśle dolną trójkątną $L$ i ściśle górną trójkątną $U$:

$L=\begin{pmatrix}0&&&&\\
a_{{21}}&0&&&\\
a_{{31}}&a_{{32}}&0&&\\
\vdots&\vdots&\ddots&0&\\
a_{{N1}}&a_{{N2}}&\cdots&\cdots&0\end{pmatrix},\quad D=\begin{pmatrix}a_{{11}}&&&&\\
&a_{{22}}&&&\\
&&\ddots&&\\
&&&\ddots&\\
&&&&a_{{NN}}\end{pmatrix},\quad U=\begin{pmatrix}0&a_{{12}}&a_{{13}}&\cdots&a_{{1N}}\\
&0&a_{{23}}&\cdots&a_{{2N}}\\
&&0&\ddots&\vdots\\
&&&0&\vdots\\
&&&&0\end{pmatrix}$

<h3> Metoda Jacobiego </h3>

Możemy jej użyć pod warunkiem, że macierz jest dominująca:  $ |a_{ii}|\geq \sum _{j\neq i}|a_{ij}| \hspace{2mm} \forall \hspace{2mm} i. $

Zapis macierzowy kroku iteracji wygląda następująco: 

$$x_{{k+1}}\,=D^{{-1}}(b-(L+U)x_{{k}})$$

Po rozpisaniu na kolejne współrzędne otrzymujemy układ rozszczepionych równań (numer iteracji wyjątkowo zaznaczamy w postaci górnego indeksu):

$$x^{{(k+1)}}_{i}=\frac{1}{a_{{ii}}}\left(b_{i}-\sum _{{j\neq i}}a_{{ij}}x^{{(k)}}_{j}\right)$$

(!) Ważny do zapamiętania jest fakt, że jesteśmy w stanie bardzo łatwo odwrócić macierz.


**Zadanie 1**
Proszę zaimplementować metodę Jacobiego oraz przetestować jej działanie na kilku znalezionych przez siebie układach równań (nie mniej niż 5 układów, nie więcej niż 10, w miarę możliwości różnorodne). Układy podać w sprawozdaniu.

<h3> Metoda Gaussa-Seidela </h3>

Heurystyka tej metody opiera się na zmodyfikowaniu metody Jacobiego tak, by w każdym momencie iteracji korzystać z najbardziej ,,aktualnych” współrzędnych przybliżenia rozwiązania $x$ (inny rozkład macierzy $A$).

Zapis macierzowy kroku iteracji wygląda następująco: 

$$x_{{k+1}}=(L+D)^{{-1}}(b-Ux_{{k}})$$

Po rozpisaniu na kolejne współrzędne otrzymujemy:

$$x^{{(k+1)}}_{i}=\frac{1}{a_{{ii}}}\left(b_{i}-\sum _{{j<i}}a_{{ij}}x^{{(k+1)}}_{j}-\sum _{{j>i}}a_{{ij}}x^{{(k)}}_{j}\right)$$

**Zadanie 2**
Proszę zaimplementować metodę Gaussa-Seidela oraz przetestować jej działanie na układach równań z poprzedniego zadania.

<h3> Metoda SOR (Successive Over Relaxation) </h3>

Zbieżność metody Gaussa–Seidela można przyspieszyć, wprowadzając parametr relaksacji $\omega$ i kolejne współrzędne nowego przybliżenia wyznaczać poprzez kombinacje poprzedniego przybliżenia $x^{{(k)}}_{i}$ oraz współrzędną nowego przybliżenia $\tilde{x}^{{k+1}}_{i}$. Nowe przybliżenie uzyskujemy za pomocą metody Gaussa–Seidela:

$x^{{(k+1)}}_{i}=(1-\omega)x^{{(k)}}_{i}+\omega\tilde{x}^{{k+1}}_{i}$

Gdy $\omega=1$ => metoda Gaussa–Seidela.

Ostatecznie po podstawieniu otrzymujemy: 

$$ x_{i}^{(k+1)}=(1-\omega )x_{i}^{(k)}+{\frac {\omega }{a_{ii}}}\left(b_{i}-\sum _{j\lt i}a_{ij}x_{j}^{(k+1)}-\sum _{j\gt i}a_{ij}x_{j}^{(k)}\right),\quad i=1,2,\ldots ,n. $$

Rozkład macierzy dla metody SOR z parametrem $\omega$ jest zadany przez: 

$$M=\frac{1}{\omega}D+L,\qquad Z=\left(\frac{1}{\omega}-1\right)D-U$$

**Zadanie 3**
Proszę zaimplementować metodę SOR oraz przetestować jej działanie na układach równań z poprzedniego zadania.

**Zadanie 4**
Proszę o **TEORETYCZNE** porównanie powyższych metod (zasadniczo wystarczy przeczytać ze zrozumienie wstęp teoretyczny i własnymi słowami je porównać). Proszę wziąć pod uwagę aspekt zbieżności oraz rozkładu na składowe macierze.  

**Zadanie 5**
Proszę dla powyższych metod porównać tempo zbiegania do rozwiązania (na wykresie). Co można zaobserwować i o czym to może świadczyć?



**zad 1**

In [None]:
typedef std::vector<std::vector<double>> arr2d;
typedef std::vector<double> arr1d;
arr1d Jacobi_solve(arr2d &A, arr1d &B, int k){

    int n = A.size();

    arr1d X1(n, 0);
    arr1d X2(n, 0);

    for(int i = 0; i < k; i++){
        for(int j = 0; j < n; j++){
            double sum = 0;
            for(int s = 0; s < n; s++){
                if( s != j){
                    sum += A[j][s]*X1[s];
                }
            }

            X2[j] = (1.0/A[j][j])*(B[j] - sum); 
        }
        for(int j = 0; j < n; j++){
            X1[j] = X2[j];
        }
    }

    std::cout << " A: " << std::endl;
    print_matrix(A);
    std::cout << " X2: " << std::endl;
    print_matrix1d(X2);


    return X2;
}

In [None]:
void run_tests(arr1d (*test_func)(arr2d &A, arr1d &B, int k), int iter){
    arr2d A1({{5 ,2 ,1 ,1}, {2 ,6 ,2 ,1}, {1, 2, 7, 1}, {1, 1, 2, 8}});
    arr2d A2({{2,1}, {5,7}});
    arr2d A3({{3.23,2.22,1.11}, {3.34, 4.78, -1.2}, {-1, -1, 1.96}});
    arr2d A4({{333, 90, -20}, {70,120,40}, {20,40,85}});
    arr2d A5({{45, 12, 1, 6, 10},
              {7, 34, 0, 2, 6},
               {6, 3, 62, 2 ,1},
               {5, 4, 1, 34, 3},
               {15, 13, 8, 9, 53}});

    arr2d A6({{29, 2, 12, 7},
              {17, 54, 18, 21},
              {7, 9, 39, 9},
              {2, 4, 1, 19}});

    arr1d B1({29, 31, 26, 19});
    arr1d B2({11,13});
    arr1d B3({7,14,2});
    arr1d B4({90,70,80});
    arr1d B5({33, 17, 5 ,1, 22});
    arr1d B6({1, 22, 1, 0});

    arr1d X;
    arr1d Xn;

    std::cout << "1. blad: ";
    X = test_func(A1, B1, iter);
    Xn = solve_normally(A1, B1);
    std::cout << calc_error_sum(X, Xn) << std::endl;

    std::cout << "2. blad: ";
    X = test_func(A2, B2, iter);
    Xn = solve_normally(A2, B2);
    std::cout << calc_error_sum(X, Xn) << std::endl;
    
    std::cout << "3. blad: ";
    X = test_func(A3, B3, iter);
    Xn = solve_normally(A3, B3);
    std::cout << calc_error_sum(X, Xn) << std::endl;
     
    std::cout << "4. blad: ";
    X = test_func(A4, B4, iter);
    Xn = solve_normally(A4, B4);
    std::cout << calc_error_sum(X, Xn) << std::endl;
    
    std::cout << "5. blad: ";
    X = test_func(A5, B5, iter);
    Xn = solve_normally(A5, B5);
    std::cout << calc_error_sum(X, Xn) << std::endl;
    
    std::cout << "6. blad: ";
    X = test_func(A6, B6, iter);
    Xn = solve_normally(A6, B6);
    std::cout << calc_error_sum(X, Xn) << std::endl;
}

In [None]:
run_tests(Jacobi_solve, 10);

```
1. blad: 0.237305
2. blad: 0.0600413
3. blad: 0.299063
4. blad: 0.00315262
5. blad: 0.0035626
6. blad: 0.00403105

```

**zad 2**

In [None]:
arr1d Gauss_Seidel_solve(arr2d &A, arr1d &B, int k){

    int n = A.size();


    arr1d X1(n, 0);
    arr1d X2(n, 0);

    for(int i = 0; i < k; i++){
        for(int j = 0; j < n; j++){
            double sum1 = 0;
            for(int s = 0; s < j; s++){
                sum1 += A[j][s]*X2[s];
            }
            double sum2 = 0;
            for(int s = j+1; s < n; s++){
                sum2 += A[j][s]*X1[s];
            }
            X2[j] = (1.0/A[j][j])*(B[j] - sum1 - sum2); 
        }
        for(int j = 0; j < n; j++){
            X1[j] = X2[j];
        }
    }

    return X2;
}

In [None]:
run_tests(Gauss_Seidel_solve, 10);

```
1. blad: 5.16447e-08
2. blad: 0.000261088
3. blad: 0.000181203
4. blad: 1.55005e-06
5. blad: 6.09929e-10
6. blad: 2.6676e-09
    
```

**zad 3**

In [None]:
arr1d SOR_solve(arr2d &A, arr1d &B, int k){

    int n = A.size();
    double w = 0.5;

    arr1d X1(n, 0);
    arr1d X2(n, 0);

    for(int i = 0; i < k; i++){
        for(int j = 0; j < n; j++){
            double sum1 = 0;
            for(int s = 0; s < j; s++){
                sum1 += A[j][s]*X2[s];
            }
            double sum2 = 0;
            for(int s = j+1; s < n; s++){
                sum2 += A[j][s]*X1[s];
            }
            X2[j] = (1.0 - w)*X1[j] + (w/A[j][j])*(B[j] - sum1 - sum2); 
        }
        for(int j = 0; j < n; j++){
            X1[j] = X2[j];
        }
    }


    return X2;
}

In [None]:
run_tests(SOR_solve, 10);

```
1. blad: 0.00818885
2. blad: 0.620093
3. blad: 1.37506
4. blad: 0.037829
5. blad: 0.00188592
6. blad: 0.00693356

```

**zad 4**

Wszystkie metody iteracyjne korzystają z rozkładu macierzy na $A = D + L + U$

W metodzie Jacobiego macierz (L + U) traktujemy jako jedną macierz. Jest to najprostsza z tych trzech metod. W teorii jest również metodą najwolniej zbiegającą.

W metodzie Gaussa-Seidela macierz (L + D) traktujemy jako jedną macierz. Jest to ulepszona metoda Jacobiego, ponieważ w każdym kroku iteracji korzysta z wyliczonych wartosći już w tym kroku, a więc nowszych. Dzięki temu metoda ta szybciej zbiega od metody Jacobiego

Metoda SOR jest usprawnieniem metody Gaussa-Seidela. Macierz w niej jest również dzielona na części U + (L + D).
Ulepszenie polega na dodaniu współczynnika relaksacji, który dobrze dobrany poprawia zbieżność zwiększając, bądź zmniejszając znaczenie dodawanej "poprawki" w kolejnych krokach iteracji.

**zad 5**

Macierze A1

![](./plot.png)

Macierze A2

![](./plot2.png)

Macierze A3

![](./plot3.png)

Macierze A4

![](./plot4.png)

Macierze A5

![](./plot5.png)

Macierze A6

![](./plot6.png)

Widać że najszybciej zbiega metoda Gaussa-Seidela. Na drugim miejscu jest metoda SOR, a na ostatnim metoda Jacobiego (dwie ostatnie czasem zamieniają się miejscami, ale Gauss-Seidel zawsze wygrywa). Zaskakujący jest fakt, że metoda SOR, będąca usprawnieniem metody Gaussa-Seidela daje gorsze rezultaty niż metoda Gaussa-Seidela. Możliwe że parametr $\omega$ został źle dobrany, ale metodami prób i błędów w przedziale (0,2) nie udało mi się znaleźć takiej wartości, która pozwalałaby uczynić metodę SOR lepszą od metody Gaussa-Seidela