In [None]:
import math
import time
import numpy as np
from numpy.linalg import norm
import matplotlib.pyplot as plt
import sys

# Programmieraufgabe: CG-Verfahren und PCG-Verfahren

Betrachtet wird das lineare Gleichungssystem $Ax = b$, wobei
$$
 A =  \begin{bmatrix}
        \phantom{-}2 & -1 &  &  &  \\
        -1& \phantom{-}2 & -1&  & \\
        & \ddots & \ddots & \ddots & \\
        & & -1 & \phantom{-}2 & -1 \\
        & & & -1 & \phantom{-}2 
    \end{bmatrix} \in \mathbb{R}^{n\times n}.
$$
verwendet wird. Ziel ist es, dieses System mithilfe des **CG-Verfahrens** (konjugierte Gradienten) und des **PCG-Verfahrens** (vorkonditionierte Gradienten) zu lösen.

## Teil 1: Implementierung der Hilfsfunktionen

Zunächst sind die folgenden Funktionen zu implementieren, die eine explizite Speicherung der vollständigen Matrizen vermeiden:

* `Av = Av_mul(v)`: Diese Funktion soll die Multiplikation der Matrix $A$ mit einem beliebigen Vektor $v$ effizient realisieren, **ohne** dass $A$ als $n \times n$-Matrix gespeichert werden muss. (Wird auch als "Matrix-Free" bezeichnet.)
* `w = pre_mul(r)`: Analog soll diese Funktion die Multiplikation eines Vektors $r$ mit dem Vorkonditionierer $M^{-1} = S^{-1} S^{-T}$ realisieren.

Für die Vorkonditionierung soll, wie in der Vorlesung besprochen, $S = \frac{1}{2} D + L^T$ verwendet werden, wobei die Zerlegung $A = L + D + L^T$ zugrunde liegt ($L$ ist der strikte untere Dreiecksteil und $D$ die Diagonale von $A$). Dadurch hat $S^{-T}S^{-1}$ die Form
$$
\begin{bmatrix}
n & \dots & 3 & 2 & 1 \\
\vdots & & \vdots & \vdots & \vdots \\
3 & \dots & 3 & 2 & 1 \\
2 & \dots & 2 & 2 & 1 \\
1 & \dots & 1 & 1 & 1
\end{bmatrix}
$$

In [None]:
def Av_mul(v):
    """
    A*v = Av_mul ( v )
    (Hier darf nicht die Matrix A angelegt werden.)
    """

    # ...
    
    return Av

def pre_mul(r):
    """
    Anwendung des Vorkonditionierers S^(-T)S^(-1)
    (Auch hier dürfen weder A noch S^(-1) als Matrix angelegt werden)
    """
    n = r.shape[0]

    # ...
    
    return w


### Teil 2: Implementierung der CG-Verfahren

Als Nächstes werden die Hauptfunktionen für die iterativen Lösungsverfahren benötigt:

* `x, res = cg(b, avm, tol, kmax)`
* `x, res = pcg(b, avm, prm, tol, kmax)`

Diesen Funktionen werden `Av_mul` und `pre_mul` als Parameter (`avm` und `prm`) übergeben, um die Matrixoperationen durchzuführen.

Parameter:
* `tol` ist die Fehlertoleranz. Die Verfahren sollen abgebrochen werden, wenn **sowohl** die Norm des Residuums **als auch** die Norm der Differenz aufeinanderfolgender Iterierter $\leq$ `tol` ist.
* `kmax` ist die maximale Anzahl an Iterationen. Die Verfahren müssen spätestens terminieren, wenn diese Grenze erreicht ist.
* Als Startvektor wählen Sie die rechte Seite $b$.


Die Rückgabewerte der Funktionen `cg` und `pcg` sollen sein:
* `x`: Die vom jeweiligen Verfahren berechnete Lösung.
* `res` (Vektor): Der Vektor mit den Normen des Residuums:
    $$\text{res}(i) = \| b - A x^{(i)} \|_{2}$$


In [None]:
def cg(b, avm, tol, max_iter):
    """
    Konjugierte-Gradienten-Verfahren (CG)
        solution, residuals, steps = cg(b, avm, tol, max_iter)

    Parameter:
      b        : Rechte Seite und Initialschätzung (Startvektor x0);
      avm      : Funktion, die A*v berechnet;
      tol      : Geforderte absolute Genauigkeit;
      max_iter : Maximale Zahl von Iterationen.

    Resultate:
      solution  : Näherungslösungsvektor xk von A*xk=b;
      residuals : Folge der Residuennormen ||b - A*x^(i)||_2;

    Das Verfahren bricht ab, wenn entweder die maximale Zahl von
    Iterationsschritten 'kmax' erreicht ist oder die 2-Normen von
    Residuum (A*x - b) und Schrittweite (x^(i+1) - x^(i)) beide kleiner-gleich
    der Toleranz 'tol' sind.
    """
    n = b.shape[0]

    # ...

    return (solution, residuals)

In [None]:
def pcg(b, avm, prm, tol, max_iter):
    """
    Präkonditioniertes Konjugierte-Gradienten-Verfahren (PCG)
        solution, residuals, steps = pcg(b, avm, prm, tol, max_iter)

    Parameter:
      b : Rechte Seite und Initialschätzung (Startvektor x0);
      avm : Funktion, die A*v berechnet;
      prm : Funktion, die M^(-1)*v berechnet (M^(-1) = S^(-T)*S^(-1));
      tol : Geforderte absolute Genauigkeit;
      max_iter: Maximale Zahl von Iterationen.

    Resultate:
      solution   : Näherungslösungsvektor xk von A*xk=b;
      residuals : Folge der Residuennormen ||b - A*x^(i)||_2;
    """
    n = b.shape[0]

    # ...
    
    return (solution, residuals)

### Teil 3: Vergleich der Verfahren

Nun wollen wir die implementierten Verfahren vergleichen. Dafür betrachten wir verschieden große Matrizen $A \in \mathbb{R}^{n \times n}$, wobei wir $n = 2^m + 1$ setzen. Für $m = 3$ ist $A$ also eine $9 \times 9$-Matrix, für $n=10$ hingegen schon $1025 \times 1025$. 

Testen Sie ihre Verfahren, in dem Sie die folgende Zelle ausführen:

In [None]:
from util.plotting_06 import compute_and_plot_06

tol = 1.0e-9
m_smallest = 3
m_largest  = 12

n_iterations = np.zeros((m_largest - m_smallest, 2), dtype=int)
residuals = np.zeros((m_largest - m_smallest, 2))
norms = np.zeros((m_largest - m_smallest, 2))
times = np.zeros((m_largest - m_smallest, 3))

for i, m in enumerate(range(m_smallest, m_largest)):
    (
        cg_solution,
        cg_residuals,
        cg_norm,
        cg_time,
        pcg_solution,
        pcg_residuals,
        pcg_norm,
        pcg_time,
        init_time,
    ) = compute_and_plot_06(Av_mul, pre_mul, cg, pcg, m, tol, 2**m)
    if (type(cg_solution) == np.ndarray):
        n_iterations[i, 0] = cg_residuals.shape[0]
        residuals[i, 0] = cg_residuals[-1]
        norms[i, 0] = cg_norm
        times[i, 0]  = cg_time
    else:
        n_iterations[i, 0] = 0
        residuals[i, 0] = np.inf
        norms[i, 0] = np.inf
        times[i, 0]  = np.inf
    n_iterations[i, 1] = pcg_residuals.shape[0]
    residuals[i, 1] = pcg_residuals[-1]
    norms[i, 1] = pcg_norm
    times[i, 1]  = pcg_time
    times[i, 2]  = init_time

# Ausgabe der Tabellen
names = ["CG", "PCG"]
for i in range(2):
    if i == 1 and (type(cg_residuals) != np.ndarray):
        continue
    print(f"{names[i]}-Verfahren")
    print('m\titer\t||x-u||\t\t||b-Ax||\tct["]\t\tict["]')
    for j, m in enumerate(range(m_smallest, m_largest)):
        print(f"{m}\t{n_iterations[j,i]}\t{format(norms[j, i], '.2e')}\t{format(residuals[j, i], '.2e')}\t{format(times[j, i], '.1e')}\t\t{format(times[j, 2], '.1e')}")
    print("")