# Programmieraufgabe 4

In dieser Aufgabe wollen wir veschiedene Schrittweitenverfahren miteinander vergleichen. Dabei verwenden wir wie in Programmieraufgabe 3 das Gradientenverfahren für eine quadratische Funktion
$$f(x) =  \frac{1}{2}x^TAx + b^Tx.$$

Tragen Sie zunächst in der folgenden Zelle **beide** Ihre Namen ein: 

In [ ]:
# Numerische Optimierungsverfahren der Wirtschaftsmathematik
# Wintersemester 2025/2026
# Übungsblatt 4 - Programmieraufgabe 4
#
# [Nachname], [Vorname]
# [Nachname.Vorname@uni-a.de]
# 
# [Nachname], [Vorname]
# [Nachname.Vorname@uni-a.de]

In [ ]:
import numpy as np
import numpy.linalg as la
import matplotlib.pyplot as plt
import matplotlib.backend_bases

Implementieren Sie in den folgenden Funktionen die **optimale Schrittweite** aus Programmieraufgabe 3, die **Armijo-Schrittweitenregel** und die **Wolfe-Powell-Regel**.

In [ ]:
def optimal_step_size(A, b, x, d):
    '''
        Optimale Schrittweitenregel für quadratische Funktion f(x) = 1/2 x^T A x + b x

        Sie können dabei Ihre Lösung aus der Programmieraufgabe 3 wiederverwenden,
        beachten Sie dabei aber das zusätzliche Argument d.

        Parameter:
            A, b: Parameter der Funktion f
            x   : Aktueller Wert der Iteration
            d   : Aktuelle Richtung des Abstiegsverfahrens

        Rückgabewert:
            alpha: Optimale Schrittweite
    '''
    
    ???

    return alpha

In [ ]:
def armijo_step_size(A, b, x, d, beta = 0.9, gamma = 0.8):
    '''
        Armijo-Schrittweitenregel

        Parameter:
            A, b        : Parameter der Funktion f
            x           : Aktueller Wert der Iteration
            d           : Aktuelle Richtung des Abstiegsverfahrens
            beta, gamma : Parameter der Armijo-Schritweitenregel

        Rückgabewert:
            alpha: Armijo-Schrittweite
    '''
    
    if beta <= 0 or beta >= 1:
        raise ValueError(f'Der Parameter beta muss im Intervall (0,1) liegen, aber beta={beta}!')
    if gamma <= 0 or gamma >= 1:
        raise ValueError(f'Der Parameter gamma muss im Intervall (0,1) liegen, aber gamma={gamma}!')

    alpha = 1
    f  = lambda y : ???

    ???
    
    return alpha

In [ ]:
def wolfe_powell_step_size(A, b, x, d, gamma = 0.4, rho = 0.6):
    '''
        Wolfe-Powell-Schrittweitenregel

        Parameter:
            A, b        : Parameter der Funktion f
            x           : Aktueller Wert der Iteration
            d           : Aktuelle Richtung des Abstiegsverfahrens
            gamma, rho  : Parameter der Wolfe-Powell-Schritweitenregel

        Rückgabewert:
            alpha: Wolfe-Powell-Schrittweite
    '''
    
    if gamma <= 0 or gamma >= 0.5:
        raise ValueError(f'Der Parameter gamma muss im Intervall (0,0.5) liegen, aber gamma={gamma}!')
    if rho <= gamma or rho >= 1:
        raise ValueError(f'Der Parameter rho muss im Intervall (gamma,1) liegen, aber rho={rho} und gamma={gamma}!')  

    tol = 1e-12
    alpha = 1
    f  = lambda y : ???
    g = lambda y : ???

    ???
    
    return alpha

Implementieren Sie nun das Abstiegsverfahren. Sie können dabei weitestgehend ihre Lösung aus der Programmieraufgabe 3 wiederverwenden. Achten Sie allerdings darauf, dass `steepest_descent` nun als **zusätzliches Argument** eine Funktion `step_size` besitzt. Diese erhält als Argumente die Matrix `A`, den Vektor `b`, die aktuelle Iterierte `x` und die Abstiegsrichtung (also den Gradienten) `d` und gibt eine Schrittweite `alpha` zurück.

In [ ]:
def steepest_descent(A, b, x_0, tol, kmax, step_size):
    '''
    Steepest-Descend- (= Gradienten-) Verfahren
    zur iterativen Lösung des Optimierungsproblems mit quadratischer Funktion
        f(x) = 1/2 x^T A x + b^T x.

    Parameter:
      A, b      : obige quadratische Funktion;
      x_0       : Startvektor;
      tol       : geforderte relative Genauigkeit;
      kmax      : maximale Zahl von Iterationen.
      step_size : Schrittweitenregel
    Resultate:
      iterates : Iterierten-Vektor von f(x); die letzte Zeile ist die Lösung.

    Das Verfahren bricht ab, wenn entweder die maximale Zahl von
    Iterationsschritten 'kmax' erreicht ist oder die 2-Norm der 
    relativen Aenderung in Funktionswert und Iterierter (vergl. Vorlesung) 
    beide kleiner-gleich der Toleranz tol bzw. sqrt(tol) sind.

    Es resultiert der Vektor der Iterierten x^{(*)} in Form eines 2D-numpy-array.
    Jede Zeile ist eine Iterierte. Anfangs erzeugt man das Array so gross, dass
    alle möglichen Iterierten (incl. Startpunkt) hineinpassen. Am Ende wird 
    das Array so zurecht gestutzt, dass nur noch die tatsächlich berechneten 
    Iterierten den Weg aus der Funktion heraus finden. 
    Am letzten Eintrag des Arrays sind die Anzahl der Iterationen k(+1) und
    die berechnete Minimalstelle ablesbar.

    Sie können ihre Lösung aus der Programmieraufgabe 3 weitestgehend wieder-
    verwenden. 
    '''
    #  Parameter-Check:
    kmax = max(kmax, 1)
    tol = max(2.0e-16, abs(tol))
    sqrt_tol = np.sqrt(tol)
    
    #  Initialisierung
    n = x_0.shape[0]
    iterates = np.ones((kmax + 1, n))
    x = np.copy(x_0)
    iterates[0,:] = x

    #  Zielfunktion f und deren Ableitung g
    f = lambda x : ???
    g = lambda x : ???
    
    ???

    return ???

Wie in Programmieraufgabe 3 minimieren wir wieder die selbe quadratische Funktion
$$f(x_1,x_2) = x_1^2 + 4x_2^2.$$
Verwenden Sie wieder als Startwert
$$x_0 = \begin{pmatrix}1.9\\ 0.7\end{pmatrix}.$$

In [ ]:
A = ???
b = ???
x_0 = ???
tol = 1e-9
kmax = 250

Nutzen Sie nun die folgende interaktive grafische Darstellung, um den Einfluss der Parameter auf die Schrittweitenregeln zu untersuchen. Durch einen Mausklick in die Grafiken starten Sie dabei neue Durchgänge mit den entsprechenden Parametern.

In [ ]:
from util.plotting_04 import plot_step_sizes
# Die nächsten beiden Zeilen werden für die interaktiven Plots benötigt
%pip install -q ipympl
%matplotlib widget
    
plot_step_sizes(steepest_descent, optimal_step_size, armijo_step_size, wolfe_powell_step_size, A, b, x_0, tol, kmax)