# Obliczenia Naukowe
### Labolatoria, Lista 5<br/>Kamil Matejuk, 250135

# Programy pomocnicze

#### Generowanie macierzy A, wektora b i x

In [5]:
# Kamil Matejuk, 250135
using SparseArrays
using LinearAlgebra

function generate_data(n::Int64, l::Int64, cond::Float64)
    if n < 2
     error("Size n should be > 1")
    end
    if n % l != 0
        error("n is not divisible by l")
    end
    if cond < 1.0
         error("Condition number of a matrix should be >= 1.0")
    end
    
    # matrix A
    nb = div(n,l)
    cord_i = Int64[]
    cord_j = Int64[]
    values = Float64[]
    for k in 1 : nb
        (U,S,V) = svd(rand(n,n))
        Ak = U * diagm(0 => [LinRange(1.0,cond,n);]) * V'
        for i in 1:l, j in 1:l
            push!(cord_i, (k - 1) * l + i)
            push!(cord_j, (k - 1) * l + j)
            push!(values, Ak[i, j])
        end
        if k < nb
            for i in 1:l
                push!(cord_i, (k - 1) * l + i)
                push!(cord_j, k * l + i)
                push!(values, 0.3 * rand())
            end
        end
        if k > 1
            for i in 1:l
                push!(cord_i, (k - 1) * l + i)
                push!(cord_j, (k - 1) * l)
                push!(values, 0.3 * rand())
            end
        end 
    end
    A = sparse(cord_i, cord_j, values)
    
    # vector b
    b = A*[1 for i in 1:n]
    
    # solutions
    x = ones(n)
    
    return (A, b, x)
end

# generate_data(16, 4, 10.0)

generate_data (generic function with 1 method)

## Zad 1
*Niech macierz $A_{n \times n}$ składa się z bloków $A_i, B_i, C_i \in \mathbb{R}^{l \times l}$, gdzie $l\cdot v = n$. Macierz $A_i$ jest macierzą gęstą, macierz $B_i$ zawiera wartości niezerowe tylko w ostatniej kolumnie, natomaist $C_i$ jest diagonalna. Wtedy macierz $A$ ma postać:*
$$\begin{pmatrix}
A_1 & C_1 & 0 & 0 & 0 & \dots & 0 \\
B_2 & A_2 & C_2 & 0 & 0 & \dots & 0 \\
0 & B_3 & A_3 & C_3 & 0 & \dots & 0 \\
\vdots & \ddots & \ddots & \ddots & \ddots & \ddots & \vdots \\
0 & \cdots & 0 & B_{v-2} & A_{v-2} & C_{v-2} & 0 \\
0 & \cdots & 0 & 0 & B_{v-1} & A_{v-1} & C_{v-1} \\
0 & \cdots & 0 & 0 & 0 & B_v & A_v \\
\end{pmatrix}$$

*Napisać funkcję rozwiązującą układ $Ax = b$ metodą eliminacji Gaussa uwzględniającą specyficzną postać (1) macierzy A dla dwóch wariantów:*
### 1.1 Wariant bez wyboru elementu głównego

In [8]:
# Kamil Matejuk, 250135
using SparseArrays

function simple_gauss_elimination_without_main_element(A::SparseMatrixCSC{Float64, Int64}, n::Int64, l::Int64, b::Array{Float64})
    """
    A::SparseMatrixCSC - macierz postaci tak jak w treści zadania
    n::Int64 - rozmiar macierzy A
    l::Int64 - rozmiar bloku A_i, B_i, C_i w macierzy A
    b::Array - wektor prawych stron równania
    """
    # Gaussian elimination
    for k in 1 : n - 1
        last_row = convert(Int64, min(l + l * floor((k+1) / l), n))
        last_col = convert(Int64, min(k + l, n))
        for i in k + 1 : last_row
            if abs(A[k,k]) < eps(Float64)
                error("Na przekatnej znajduje się współczynnik 0")
            end
            I_ki = A[i, k] / A[k, k]
            for j in k + 1 : last_col
                A[i, j] = A[i, j] - I_ki * A[k, j]
            end
            b[i] = b[i] - I_ki * b[k]
        end
    end

    # solving equation with traingular matrix
    x = Array{Float64}(undef, n)
    for i in n : -1 : 1
        prev_total = 0.0
        last_col = min(n, i + l)
        for j in i + 1 : last_col
            prev_total += A[i, j] * x[j]
        end
        x[i] = (b[i] - prev_total) / A[i, i]
    end
    return x
end

n = 16
l = 4
A, b, _ = generate_data(n, l, 10.0)
simple_gauss_elimination_without_main_element(A, n, l, b)

16-element Array{Float64,1}:
 0.9999999999999989
 1.0
 0.999999999999999
 1.0
 1.0000000000000078
 0.9999999999999974
 1.0000000000000022
 1.0000000000000002
 1.0000000000000064
 0.9999999999999989
 0.9999999999999898
 1.0000000000000107
 0.9999999999999996
 0.9999999999999692
 0.9999999999999802
 1.000000000000017

### Omówienie
Algorytm wykorzystuje eliminację Gaussa, pozwalającą doprowadzić macierz $A$ do postaci macierzy górnotrójkątnej.
Zaczynając od takiej postaci równania:
$$a_{11}^{(1)}x_1 + a_{12}^{(1)}x_2 + \cdots + a_{1n}^{(1)}x_n = b_{1}^{(1)}$$
$$a_{21}^{(1)}x_1 + a_{22}^{(1)}x_2 + \cdots + a_{2n}^{(1)}x_n = b_{2}^{(1)}$$
$$ \vdots $$
$$a_{n1}^{(1)}x_1 + a_{n2}^{(1)}x_2 + \cdots + a_{nn}^{(1)}x_n = b_{n}^{(1)}$$

program wykonuje $n-1$ iteracji, w każdej eliminując kolejną zmienną $x_i$ z równań od $(i+1)-ego$ do $n-tego$. Przykładowo po pierwszej iteracji zostanie usunięte $x_1$:
$$\begin{align*}
a_{11}^{(1)}x_1 + a_{12}^{(1)}x_2 + \cdots + a_{1n}^{(1)}x_n &= b_{1}^{(1)} \\
a_{22}^{(2)}x_2 + \cdots + a_{2n}^{(2)}x_n &= b_{2}^{(2)} \\
\vdots \\
a_{n2}^{(2)}x_2 + \cdots + a_{nn}^{(2)}x_n &= b_{n}^{(2)} \\
\end{align*}$$

a po skończonym programie zostanie macierz górnotrójkatna:
$$\begin{align*}
a_{11}^{(1)}x_1 + a_{12}^{(1)}x_2 + \cdots + a_{1n}^{(1)}x_n &= b_{1}^{(1)} \\
a_{22}^{(2)}x_2 + \cdots + a_{2n}^{(2)}x_n &= b_{2}^{(2)} \\
\vdots \\
a_{nn}^{(n)}x_n &= b_{n}^{(n)} \\
\end{align*}$$

Mechanizm usuwania kolejnych zmiennych polega na wyliczeniu w $k-tej$ iteracji współczynników:
$$ I_{ik} = \frac{a_{ik}^{(k)}}{a_{kk}^{(k)}} \hspace{1cm} \forall i \in \{ k+1, \cdots, n\}$$
Nastepnie trzeba pzremnożyć $k-te$ równanie przez ten współczynnik i odjąć od pozostałych równań.

Finalnie należy rozwiązać układ równań $A^{(n)}x = b^{(n)}$ z macierzą trójkątną, zaczynając od ostatniej niewiadomej:
$$ x_n = \frac{b_{n}^{(n)}}{a_{nn}^{(n)}} $$
nastepnie po kolei od końca wystarczy rozwiązać równanie z jedną niewiadomą aż zostaną wyznaczone wszystkie wartości x. Ogólnie postać algorytmu podstawienia wygląda następująco:
$$ x_i = \frac{b_i - \sum_{j=i-1}^{n} a_{ij}x_j}{a_{ii}} $$

Prosty algorytm eliminacji Gaussa działa w złożoności $O(n^3)$. Natomiast ponieważ struktura macierzy $A$ jest specyficzna, można go znacznie przyspieszyć, poprzez sprawdzanie tylko tych wartości, gdzie jest większe prawdopodobieństwo niewystapienia zera. Wiedząc, że większość wartości pod przekątną będzie zerami, i nie ma sensu ich dwa razy zerować, można ograniczyć pole przeszukiwać, znacząco skracając czas działania wewnętrznych pętli algorytmu, ostatecznie sprowadzając go do $O(n)$.<br/>
Dla $l−1$ kolumn elementy niezerowe znajduja sie jedynie w $A_1$, czyli tylko w $l$ pierwszych wierszach.  Dla nastepnych $l$ kolumn niezerowe elementy znajduja sie w $B_2$ lub $A_2$ czyli w $2l$ pierwszych wierszach itd. Posiadając tą wiedzę, można wyznaczyć indeks ostatniego wartego sprawdzenia elementu w $k-tej$ kolumnie:
```
last_row = convert(Int64, min(l + l * floor((k+1) / l), n))
```
Analogicznie,  w  każdym  wierszu  ostatnim  niezerowym  elementem  jest  element leżący na pzrekątnej$C_i$ (poza ostatnimi $l$ rzędami).  Sa one w odległości $l$ od elementów macierzy $A$. Zatem wzór na indeks kolumny, w której leży ostatni niezerowy element w $k-tym$ wierszu wynosi:
```
last_col = convert(Int64, min(k + l, n))
```

### 1.2 Wariant z częściowym wyborem elementu głównego

In [9]:
# Kamil Matejuk, 250135
using SparseArrays

function simple_gauss_elimination_with_main_element(A::SparseMatrixCSC{Float64, Int64}, n::Int64, l::Int64, b::Array{Float64})
    """
    A::SparseMatrixCSC - macierz postaci tak jak w treści zadania
    n::Int64 - rozmiar macierzy A
    l::Int64 - rozmiar bloku A_i, B_i, C_i w macierzy A
    b::Array - wektor prawych stron równania
    """
    # Gaussian elimination
    p = [i for i in 1:n]
    for k in 1 : n - 1
        last_row = convert(Int64, min(l + l * floor((k+1) / l), n))
        last_col = convert(Int64, min(2*l + l * floor((k+1) / l), n))
        for i in k + 1 : last_row
            # max value in column
            max_row = k
            max = abs(A[p[k], k])
            for x in i : last_row
                if (abs(A[p[x], k]) > max)
                    max_row = x;
                    max = abs(A[p[x], k])
                end
            end
            # switch p and k
            p[k], p[max_row] = p[max_row], p[k]
            # regular Gaussian elimination
            I_ki = A[p[i], k] / A[p[k], k]
            for j in k + 1 : last_col
                A[p[i], j] = A[p[i], j] - I_ki * A[p[k], j]
            end
            b[p[i]] = b[p[i]] - I_ki * b[p[k]]
        end
    end

    # solving equation with traingular matrix   
    x = Array{Float64}(undef, n)
    for i in n : -1 : 1
        prev_total = 0.0
        last_col = convert(Int64, min(2*l + l*floor((p[i]+1)/l), n))
        for j in i + 1 : last_col
            prev_total += A[p[i], j] * x[j]
        end
        x[i] = (b[p[i]] - prev_total) / A[p[i], i]
    end
    return x
end

n = 16
l = 4
A, b, _ = generate_data(n, l, 10.0)
simple_gauss_elimination_with_main_element(A, n, l, b)

16-element Array{Float64,1}:
 0.9999999999999998
 0.9999999999999994
 1.0000000000000002
 1.0000000000000002
 1.0000000000000002
 1.0000000000000004
 1.0000000000000004
 1.0000000000000002
 1.0000000000000002
 1.0
 1.0000000000000002
 0.9999999999999998
 1.0
 1.0
 1.0000000000000002
 1.0

### Omówienie
W podstawowej wersji eliminacji Gaussa, bez wyboru elementu głównego, ważne jest aby żadem diagonalny element nie był zerem, ani bardzo małą liczbą, wprowadzającą znaczny błąd w obliczeniach. Np dla małego $\epsilon$
$$
\begin{pmatrix}
\epsilon & 1 \\
1 & 1 \\
\end{pmatrix}
\cdot
\begin{pmatrix}
x_1 \\
x_2 \\
\end{pmatrix}
=
\begin{pmatrix}
1 \\
3 \\
\end{pmatrix}
$$
po eliminacji Gaussa:
$$
\begin{pmatrix}
\epsilon & 1 \\
0 & 1-\epsilon^{-1} \\
\end{pmatrix}
\cdot
\begin{pmatrix}
x_1 \\
x_2 \\
\end{pmatrix}
=
\begin{pmatrix}
1 \\
3-\epsilon^{-1} \\
\end{pmatrix}
$$
otrzyma się:
$$ x_2 = \frac{3-\epsilon^{-1}}{1-\epsilon^{-1}} \simeq 1 $$
$$ x_1 = (1-x_2)\epsilon^{-1} \simeq 0 $$

Rozwiązaniem tego problemu jest zmiana kolejności równań:
$$
\begin{pmatrix}
1 & 1 \\
\epsilon & 1 \\
\end{pmatrix}
\cdot
\begin{pmatrix}
x_1 \\
x_2 \\
\end{pmatrix}
=
\begin{pmatrix}
3 \\
1 \\
\end{pmatrix}
$$
po eliminacji Gaussa:
$$
\begin{pmatrix}
1 & 1 \\
0 & 1-\epsilon \\
\end{pmatrix}
\cdot
\begin{pmatrix}
x_1 \\
x_2 \\
\end{pmatrix}
=
\begin{pmatrix}
3 \\
1-3\epsilon \\
\end{pmatrix}
$$
otrzyma się już prawidłowe wartości:
$$ x_2 = \frac{1-3\epsilon}{1-\epsilon} \simeq 1 $$
$$ x_1 = 3-x_2 \simeq 2 $$

Eliminacja Gaussa z częściowym wyborem elementu głównego rozwiązuje ten problem, poprzez przestawienia wierszy i kolumn. W $k-tej$ iteracji zwykłej eliminacji Gaussa, eliminacja Gaussa z częściowym wyborem znajduje element największy w danej kolumnie, znjadujący się pod lub na przekatnej:
$$ |a_{pk}^{(k)}| = max_{k \ge i \ge n} \big(|a_{ik}^{(k)}| \big) $$
a nastepnie zamienia kolejnością $k-te$ i $p-te$ równanie ($k-ty$ i $p-ty$ wiersz w macierzy $A^{(k)}$ i $k-tą$ i $p-tą$ wartość wektora $b^{(k)}$).

Algorytm działa w złożoności $O(n)$, ponieważ wykorzystuje skrócenie wewnętrznychh pętli (opisane w 1.1). Pełna wersja algorytmu działała by w złozoności $O(n^3)$.

## Zad 2
*Napisać funkcję wyznaczającą rozkład LU macierzy A metodą eliminacji Gaussa uwzględniającą
specyficzną postać macierzy A (jak w zad 1) dla dwóch wariantów:*
### 2.1 Wariant bez wyboru elementu głównego

In [10]:
# Kamil Matejuk, 250135
using SparseArrays

function disintegrate_A_into_LU_without_main_element(A::SparseMatrixCSC{Float64, Int64}, n::Int64, l::Int64)
    # copy matrix A
    LU = dropzeros(A)
    for k in 1 : n - 1
        last_row = convert(Int64, min(l + l * floor((k+1) / l), n))
        last_col = convert(Int64, min(k + l, n))
        for i in k + 1 : last_row
            if abs(LU[k, k]) < eps(Float64)
                error("Na przekatnej znajduje się współczynnik 0")
            end
            I_ki = LU[i, k] / LU[k, k]
            LU[i, k] = I_ki # store I_ik in empty spaces
            for j in k + 1 : last_col
                LU[i, j] = LU[i, j] - I_ki * LU[k, j]
            end
        end
    end
    return LU
end

n = 16
l = 4
A, _, _ = generate_data(n, l, 10.0)
disintegrate_A_into_LU_without_main_element(A, n, l)

16×16 SparseMatrixCSC{Float64,Int64} with 106 stored entries:
  [1 ,  1]  =  0.790012
  [2 ,  1]  =  3.31325
  [3 ,  1]  =  -2.51267
  [4 ,  1]  =  1.92999
  [1 ,  2]  =  2.71066
  [2 ,  2]  =  -9.30198
  [3 ,  2]  =  -0.493701
  [4 ,  2]  =  0.39487
  [1 ,  3]  =  -1.92627
  [2 ,  3]  =  8.39982
  [3 ,  3]  =  -1.50478
  [4 ,  3]  =  0.299911
  ⋮
  [15, 14]  =  0.456161
  [16, 14]  =  -0.510739
  [11, 15]  =  0.0564715
  [12, 15]  =  0.262223
  [13, 15]  =  2.42072
  [14, 15]  =  -3.38316
  [15, 15]  =  1.46231
  [16, 15]  =  -1.06974
  [12, 16]  =  0.121912
  [13, 16]  =  0.593775
  [14, 16]  =  -3.23871
  [15, 16]  =  -0.558237
  [16, 16]  =  -1.07031

### Omówienie
W algorytmie eliminacji Gaussa, proces przejścia z $A^{(k)}$ do $A^{(k+1)}$ i z $b^{(k)}$ do $b^{(k+1)}$ (czyli $k-tą$ iterację) można zapisać z wykorzystaniem macierzy L.
$$ A^{(k+1)} = L^{(k)} \cdot A^{(k)} $$
$$ b^{(k+1)} = L^{(k)} \cdot b^{(k)} $$
gdzie L wyglada następująco:
$$ L^{(k)} =
\begin{pmatrix}
1 & & & & & & \\
 & \ddots & & & & & \\
 & & 1 & & & & \\
 & & & 1 & & & \\
 & & & -I_{k+1, k} & 1 & & \\
 & & & \vdots & & \ddots & \\
 & & & -I_{n, k} & & & 1\\
\end{pmatrix}
$$

Uogólniając na cały algorytm eliminacji Gaussa:
$$ A^{(n)} = L^{(n-1)} \cdot \dots \cdot L^{(2)} \cdot L^{(1)} \cdot A $$

Oznaczając $A^{(n)}$ jako U, otrzymano rozkład **A = U $\cdot$ L**, gdzie L jest macierzą dolnotrójkatną, składającą się z współczynników $I_{ik}$, zawierającą 1 na przekatnej.
$$ L = \big(L^{(n-1)}\big)^{-1} \cdot \dots \cdot \big(L^{(2)}\big)^{-1} \cdot \big(L^{(1)}\big)^{-1} =
\begin{pmatrix}
1 & & & & \\
I_{21} & 1 & & & \\
I_{31} & I_{32}& 1 & & \\
\vdots & \vdots & & \ddots &\\
I_{n1} & I_{n2} & \dots & I_{n, n-1} & 1 \\
\end{pmatrix}
$$

Ponieważ U jest macierzą górnotrójkatną, a L macierzą dolnotrójkątną, algorytm wyznacza iloczyn LU jako całość, i zapisuje w jednej macierzy:

$$ L =
\begin{pmatrix}
1 & & & & \\
I_{21} & 1 & & & \\
I_{31} & I_{32}& 1 & & \\
\vdots & \vdots & & \ddots &\\
I_{n1} & I_{n2} & \dots & I_{n, n-1} & 1 \\
\end{pmatrix}
\hspace{1cm}
U =
\begin{pmatrix}
u_{11} & u_{12} & u_{13} & \cdots & u_{1n} \\
 & u_{22} & u_{23}& \cdots & u_{2n} \\
 & & u_{33} & \dots & u_{3n} \\
 & & & \ddots & \vdots \\
 & & & & u_{11} \\
\end{pmatrix}
\hspace{1cm} \rightarrow \hspace{1cm}
LU = 
\begin{pmatrix}
u_{11} & u_{12} & u_{13} & \cdots & u_{1n} \\
I_{21} & u_{22} & u_{23}& \cdots & u_{2n} \\
I_{31} & I_{32} & u_{33} & \dots & u_{3n} \\
\vdots & \vdots & \vdots & \ddots & \vdots \\
I_{n1} & I_{n2} & I_{n3} & \cdots & u_{nn} \\
\end{pmatrix}
$$

Zatem algorytm wylicza macierz U analogicznie jak pierwsza część algorytmu `simple_gauss_elimination_without_main_element(A,n,l,b)`, dodatkowo zapisując wartości współczynników $I_{ik}$ w wolnych miejscach powstałych po każdym kroku eliminacji Gaussa.

Algorytm działa w złożoności $O(n)$, ponieważ wykorzystuje skrócenie wewnętrznychh pętli (opisane w 1.1). Pełna wersja algorytmu działała by w złozoności $O(n^3)$.

### 2.2 Wariant z częściowym wyborem elementu głównego

In [11]:
# Kamil Matejuk, 250135
using SparseArrays

function disintegrate_A_into_LU_with_main_element(A::SparseMatrixCSC{Float64, Int64}, n::Int64, l::Int64)
    # copy matrix A
    LU = dropzeros(A)
    p = [i for i in 1:n]
    for k in 1 : n - 1        
        last_row = convert(Int64, min(l + l * floor((k+1) / l), n))
        last_col = convert(Int64, min(2*l + l * floor((k+1) / l), n))
        # max value in column
        max_row = k
        max = abs(LU[p[k], k])
        for x in k + 1 : last_row
            if (abs(LU[p[x], k]) > max)
                max_row = x;
                max = abs(LU[p[x], k])
            end
        end
        # switch p and k
        p[k], p[max_row] = p[max_row], p[k]
        # regular Gaussian elimination
        for i in k + 1 : last_row
            I_ki = LU[p[i], k] / LU[p[k], k]
            LU[p[i], k] = I_ki # store I_ik in empty spaces
            for j in k + 1 : last_col
                LU[p[i], j] = LU[p[i], j] - I_ki * LU[p[k], j]
            end
        end
    end
    return (LU, p)
end

n = 16
l = 4
A, _, _ = generate_data(n, l, 10.0)
disintegrate_A_into_LU_with_main_element(A, n, l)

(
  [1 ,  1]  =  -0.210382
  [2 ,  1]  =  -0.392465
  [3 ,  1]  =  -0.102757
  [4 ,  1]  =  -2.86254
  [1 ,  2]  =  2.50614
  [2 ,  2]  =  0.252143
  [3 ,  2]  =  -0.443881
  [4 ,  2]  =  -1.19647
  [1 ,  3]  =  0.293783
  [2 ,  3]  =  1.60141
  [3 ,  3]  =  -0.0131599
  [4 ,  3]  =  0.885974
  ⋮
  [11, 15]  =  0.143307
  [13, 15]  =  1.01315
  [14, 15]  =  0.106165
  [15, 15]  =  -0.395904
  [16, 15]  =  -0.73516
  [9 , 16]  =  -0.037588
  [10, 16]  =  -0.0979026
  [11, 16]  =  0.0822323
  [12, 16]  =  0.0998216
  [13, 16]  =  -2.63759
  [14, 16]  =  -2.86669
  [15, 16]  =  3.371
  [16, 16]  =  -0.00762813, [4, 1, 2, 3, 7, 8, 6, 5, 12, 11, 10, 9, 16, 15, 13, 14])

### Omówienie
Wersja algorytmu z częściowym wyborem zachowuje się analogicznie do wersji z zadania 1, podmieniając wiersze , tak aby na przekatnej leżał największy element w kolumnie (w każdej iteracji ewentualna podmiana $k-tego$ i $p-tego$ wiersza. Analogicznie do wersji rozkładu LU bez wyboru, algorytm zwraca macierz LU, która w górnym trójkącie i na przekatnej zawiera współczynniki $u_{ik}$, natomiast w dolnym trójkącie współczynniki $I_{ik}$.

$$ L =
\begin{pmatrix}
1 & & & & \\
I_{21} & 1 & & & \\
I_{31} & I_{32}& 1 & & \\
\vdots & \vdots & & \ddots &\\
I_{n1} & I_{n2} & \dots & I_{n, n-1} & 1 \\
\end{pmatrix}
\hspace{1cm}
U =
\begin{pmatrix}
u_{11} & u_{12} & u_{13} & \cdots & u_{1n} \\
 & u_{22} & u_{23}& \cdots & u_{2n} \\
 & & u_{33} & \dots & u_{3n} \\
 & & & \ddots & \vdots \\
 & & & & u_{11} \\
\end{pmatrix}
\hspace{1cm} \rightarrow \hspace{1cm}
LU = 
\begin{pmatrix}
u_{11} & u_{12} & u_{13} & \cdots & u_{1n} \\
I_{21} & u_{22} & u_{23}& \cdots & u_{2n} \\
I_{31} & I_{32} & u_{33} & \dots & u_{3n} \\
\vdots & \vdots & \vdots & \ddots & \vdots \\
I_{n1} & I_{n2} & I_{n3} & \cdots & u_{nn} \\
\end{pmatrix}
$$

Algorytm działa w złożoności $O(n)$, ponieważ wykorzystuje skrócenie wewnętrznychh pętli (opisane w 1.1). Pełna wersja algorytmu działała by w złozoności $O(n^3)$.

## Zad 3
*Napisać funkcję rozwiązującą układ równań Ax = b jeśli wcześniej został już wyznaczony rozkład LU przez funkcję z zad 2.*

In [12]:
# Kamil Matejuk, 250135
function solve_from_LU(LU::SparseMatrixCSC{Float64, Int64}, n::Int64, l::Int64, b::Array{Float64}, p::Array{Int64}=[i for i in 1:n])
    y = Array{Float64}(undef, n)
    for i in 1 : n
        prev_total = 0.0
        for j in 1 : i - 1
            prev_total += LU[p[i], j] * y[j]
        end
        y[i] = b[p[i]] - prev_total
    end

    x = Array{Float64}(undef, n)
    for i in n : -1 : 1
        prev_total = 0.0
        for j in i + 1 : n
            prev_total += LU[p[i], j] * x[j]
        end
        x[i] = (y[i] - prev_total) / LU[p[i], i]
    end
    return x
end


n = 16
l = 4
# without
A, b, _ = generate_data(n, l, 10.0)
LU = disintegrate_A_into_LU_without_main_element(A, n, l)
for i in solve_from_LU(LU, n, l, b)
    println(i)
end
println()

# with
A, b, _ = generate_data(n, l, 10.0)
LU, p = disintegrate_A_into_LU_with_main_element(A, n, l)
for i in solve_from_LU(LU, n, l, b, p)
    println(i)
end

1.000000000000001
1.000000000000001
0.9999999999999962
1.000000000000007
0.9999999999999453
1.0000000000000335
0.9999999999999488
1.0000000000000493
0.9999999999998607
1.0000000000008757
0.9999999999997362
1.0
1.0000000000000036
1.000000000000001
1.0000000000000022
1.0

1.0000000000000002
1.0000000000000002
0.9999999999999998
0.9999999999999998
1.0000000000000002
1.0000000000000002
1.0000000000000002
0.9999999999999998
1.0
0.9999999999999998
1.0000000000000002
0.9999999999999994
1.0000000000000002
1.0
0.9999999999999999
0.9999999999999998


### Omówienie
Znając rozkład LU macierzy $A$, można rozwiążać równanie $Ax=b$ za pomocą dwóch układów równań z macierzami trójkatnymi.

Niech $A^{-1} = X$.
Wtedy $A \cdot X = I$.
$$ A \cdot [x^{(1)}, x^{(2)}, \dots, x^{(n)}] = [i^{(1)}, i^{(2)}, \dots, i^{(n)}] \hspace{1cm} \forall j \in \{1 \dots n\} \hspace{1cm} x^{(j)} \in \mathbb{R}^n, i^{(j)} \in \mathbb{R}^n $$

Nastepnie w dwóch etapach mozna wyznaczyć X:
1. Rowziązując $Ly^{(j)} = i^{(j)}$
1. Rowziązując $Ux^{(j)} = y^{(j)}$

Oby dwa zadania zawierają w sobie macierz trójkatną, więc da się je stosunkowo łatwo rozwiązać. Zaczynając od wiersza $k$ z jedną wartością niezerową (to będzie pierwszy lub ostatni, zależnie czy jest górno- czy dolnotrójkątna macierz) i wyznaczając:
$$ x^{(k)} = \frac{y_{k}^{(k)}}{a_{kn}^{(k)}} $$
Następnie po kolei wyznaczając kolejne wartości zgodnie ze schematem:
$$ x_i = \frac{y_i - \sum_{j=i-1}^{n} a_{ij}x_j}{a_{ii}} $$

Macierz wykorzystywana w algorytmie jest macierzą pełną, zatem nie można wykorzystać pustych miejsc do skrócenia obliczeń. Algorytm działa zatem w złożoności $O(n^2)$.

## Testy

In [None]:
function err(x::Array{Float64}, correct)
    return norm(correct - x) / norm(x)
end

for n in [16, 10000, 50000]
    println("\n     n = $n")
    l = 4

    A, b, x = generate_data(n, l, 10.0)
    e1 = err(simple_gauss_elimination_without_main_element(A, n, l, b), x)
    println(e1)
    
    A, b, x = generate_data(n, l, 10.0)
    e2 = err(simple_gauss_elimination_with_main_element(A, n, l, b), x)
    println(e2)
    
    A, b, x = generate_data(n, l, 10.0)
    LU = disintegrate_A_into_LU_without_main_element(A, n, l)
    e3 = err(solve_from_LU(LU, n, l, b), x)
    println(e3)
    
    A, b, x = generate_data(n, l, 10.0)
    LU, p = disintegrate_A_into_LU_with_main_element(A, n, l)
    e4 = err(solve_from_LU(LU, n, l, b, p), x)
    println(e4)
end


     n = 16


Błąd względny metody w zalezności od rozmiaru macierzy A:


| metoda | 16 | 10000 | 50000 |
|:------:|:--:|:-----:|:-----:|
| eliminacja Gaussa bez wyboru | 5.10280049072226e-16 | 8.252489306370072e-15 | 1.839891573325161e-13 |
| eliminacja Gaussa z częściowym wyborem | 2.88444402957534e-16 | 4.215880986485695e-16 | 3.928599120211437e-16 |
| rozkład LU bez wyboru | 9.87958144769023e-16 | 9.673417173856611e-15 | 2.004092926598465e-13 |
| rozkład LU z częściowym wyborem | 2.64771316376407e-16 | 4.144746714261900e-16 | 3.886151700163112e-16 |

Jak widać, metody z częściowym wyborem elementu głównego są bardziej dokładne.

In [None]:
for n in [16, 10000, 50000]
    println("\nn = $n")
    l = 4
    
    A, b, _ = generate_data(n, l, 10.0)
    t1 = (@timed simple_gauss_elimination_without_main_element(A, n, l, b)).time
    println(t1, 's')
    
    A, b, _ = generate_data(n, l, 10.0)
    t2 = (@timed simple_gauss_elimination_with_main_element(A, n, l, b)).time
    println(t2, 's')
    
    A, b, _ = generate_data(n, l, 10.0)
    LU, t31, _, _, _ = (@timed disintegrate_A_into_LU_without_main_element(A, n, l))
    t32 = (@timed solve_from_LU(LU, n, l, b)).time
    println(t31 + t32, 's')
    
    A, b, _ = generate_data(n, l, 10.0)
    (LU, p), t41, _, _, _ = (@timed disintegrate_A_into_LU_with_main_element(A, n, l))
    t42 = (@timed solve_from_LU(LU, n, l, b, p)).time
    println(t41 + t42, 's')
end

Czas działania metody w zalezności od rozmiaru macierzy A:


| metoda | 16 | 10000 | 50000 |
|:------:|:--:|:-----:|:-----:|
| eliminacja Gaussa bez wyboru | 3.4818e-5s | 0.10258054s | 2.86724976s |
| eliminacja Gaussa z częściowym wyborem | 6.9494e-5s | 0.12126328s | 2.9597040s |
| rozkład LU bez wyboru | 3.5775e-5s | 0.74804783s | 17.862547904s |
| rozkład LU z częściowym wyborem | 4.1536e-5s | 0.94549956s | 22.3224051s |

Da się zauważyć, że algorytm wymagające rozkładu LU trwają dłużej, ponieważ rozkład można wykonać w czasie $O(n)$, ale rozwiązanie powstałych układów macierzy trójkątnych trwa już $O(n^2)$.
Dodatkowo są minimalne różnice w czasie pomiędzy metodami bez wyboru i z częściowym wyborem elementu głównego, wynikające z czasu potrzebnego na wybór permutacji.