# 4. Feladatsor
Gradiens-módszer, nemlineáris egyenletek: intervallumfelezés, fixpont iteráció

## Gradiens-alapú módszerek

Bizonyos esetekben egy lineáris algebrai egyenletrendszer megoldása előáll mint egy megfelelő függvény minimumhelye.

#### Gradiens-ereszkedés (vagy -módszer)
Legyen $\phi: V \to \mathbb{R}$. Ekkor az

$$
x_{k+1} = x_k - \alpha_k \nabla \phi(x_k)
$$

iterációt gradiens-ereszkedésnek nevezzük. Itt $\phi$ például konvex, folytonosan differenciálható funkcionál, melynek gradiense Lipschitz-folytonos; $\alpha_k > 0$ pedig a lépéshosszok.

Legyen $\phi: V \mapsto \mathbb{R}$ egy $A$ SZPD mátrix esetén 
$$\phi_{A,b}(x) = \frac{1}{2}  \langle x ,Ax \rangle - \langle b, x \rangle.$$

Gondoljuk meg, hogy
 
$$
\phi'_{A,b}(x) = \nabla \phi_{A,b} (x) =  Ax-b
$$

$$
\phi_{A,b}''(x) = A
$$

Azt mondjuk, hogy a $\phi: V \to \mathbb{R}$ funkcionál konvex, ha minden $x, y \in V$ és $0 \leq t \leq 1$ esetén 
$$
\phi(tx + (1-t)y) \leq t \phi(x) + (1-t)\phi(y),
$$
azaz az $x$ és $y$ pontokat összekötő szakasz $\phi$ függvény általi képe nem helyezkedik el feljebb, mint az $\phi(x)$ és $\phi(y)$ pontokat összekötő szakasz.



Láttuk, hogy ha $A$ SZPD, akkor a Richardson-iteráció alkalmazható. Ebben az esetben gondoljuk meg a következőket.

a) Az $x$ megoldása az $Ax = b$ egyenletnek pontosan akkor, ha $x$ az $\phi_{A, b}$ funkcionál kritikus pontja. 

b) A Richardson-iteráció egy lépése valójában a 
$$x_{k+1} = x_k - \omega \phi'_{A, b} (x_k) $$
formulával írható le.



A Richardson-iteráció tehát tekinthető egy állandó lépéshosszú gradiens-ereszkedésnek, melyet a $\phi_{A, b}$ függvényre alkalmazunk. Hogyan válaszhatnánk meg ennél ügyesebben a lépéshosszainkat? Mutassuk meg, hogy egy $x$ ponton átmenő, $p$ irányvektorú egyenes mentén a $\phi_{A, b}$ függvény minimumhelye 

$$x - \frac{p^T r}{p^T A p} p,$$

ahol $r = Ax - b$.

### 1. Feladat
Mutassuk meg, hogy ha $A$ pozitív szemidefinit, akkor $\phi_{A, b}$ konvex.

### 2. Feladat

Ha $\phi$ konvex és folyt. diff.ható, akkor mutassuk meg az alábbiakat.

a*)

$$
\phi(y) \geq \phi(x) + \langle \phi'(x), y- x\rangle,
$$

azaz az érintősíkok a függvény grafikonja alatt helyezkednek el.

b) 
Ha $\phi'(x) = 0$, akkor $x$ globális minimumhely.




### 2.+ Feladat

a) Mutassunk egy olyan $\phi_{\tilde A, \tilde b}$ függvényt, melynek minimumhelye egybeesik az
$$
\| Ax - b \|^2_2
$$
függvény minimumhelyével.

b) Mutassuk meg, hogy $\| Ax - b \|^2_2$ konvex.

c) Mutassuk meg, hogy a normálegyenlet megoldása egybeesik a $\phi_{\tilde A, \tilde b}$ függvény gradiensének zérushelyével.

## Nemlineáris egyenletek

Cél: Az $f(x)=0$ egyenlet megoldása, ahol  adott, szép tulajdonságú (pl. folytonosan deriválható) függvény, azaz keressük az  függvény gyökeit/zérushelyeit. Ekvivalensen $g(x)=b$  megoldása az $f = g-b$ függvényre alkamazott gyökkereséssel.



## Intervallumfelezés
Tegyük fel, hogy tudjuk, hogy egy adott $[a,b]$ intervallumon a függvényünknek van egy gyöke; például ezt onnan tudhatjuk, hogy a végpontokban különböző előjelű a függvény, pontosabban: $f(a) \cdot f(b) < 0$. Tegyük fel, hogy ez fennáll és hogy $f(a) > 0, f(b)<0$. Ez utóbbi nem megszorítás, mert $f$ és  $-f$ gyökei ugyanott vannak.

**Alapgondolat**: Vizsgáljuk meg a függvény előjelét az $\frac{a+b}{2}$ pontban! Ha itt pozitív, az azt jelenti, hogy a keresett zérushely az $\left[a,\; \frac{a+b}{2}\right)$ intervallumban van, azaz itt érdemes folytatni a keresést. Ugyanakkor ha itt negatív, akkor a zérushely az $\left( \frac{a+b}{2},\; b\right]$ intervallumban található, és itt kell tovább keresnünk. Ezt követően az előbbi gondolatot folytatjuk az új, kisebb intervallumokon, azaz vagy az $\frac{a+b}{4}$, vagy a $\frac{3 (a+b)}{4}$ pontban vizsgáljuk a előjelet, és így tovább. 
Az algoritmus addig fut, amíg  értéke a vizsgált pontban nulla nem lesz (ez programok esetén a gépi hibák miatt ritkán következik be), vagy amikor a vizsgált intervallum már nagyon kicsi/rövid, de természetesen megadhatunk maximális lépésszámot is, amely után álljon le mindenképpen a program. Határértékben ez a módszer mindenképpen megtalál egy zérushelyet (ha több is van, akkor a zérushelyek közül valamelyiket).

### 3. Feladat
Fibonacci egyik cikkében szerepel az alábbi állítás: az

$$f(x) = x^3 + 2 x^2 + 10 x - 20$$

egyenlet gyöke $x = 1.368808107...$ Ellenőrizzük le az intervallumfelezéses módszerrel, hogy jól számolt-e!
Megoldás: Legyen a toleranciánk , és indítsuk az iterációt az  intervallumon!

In [23]:
import numpy as np

tol = 10**(-10)

a = 1
b = 2

k = 0

while np.abs(b - a) > tol:
    x = (a + b) / 2
    f = x**3 + 2*x**2 + 10*x - 20
    if f == 0:
        break
    else:
        if f > 0:
            b = x
        else:
            a = x
    k += 1

print(x)
print(k)

1.368808107858058
34


### Fixpont-iteráció

Emlék: A Banach-féle fixponttétel következtében ha $X$ Banach-tér és $f:X\rightarrow X$ kontrakció $0\leq q<1$ együtthatóval, akkor van $x^*$ fixpontja, amire $f(x^*) = x^*$; továbbá az $x_{n+1} = f(x_n)$ sorozat tetszőleges $X$-beli pontból indítva $x^*$-hoz fog tartani; továbbá $e_n = x_n - x^*$ választással látható, hogy

$$\|e_{n+1}\| = \| x_{n+1} - x^* \| =  \| f(x_{n}) - f(x^*) \| \leq q \|x_n - x^*\| = q \| e_n\|$$
és
$$\|e_n\| = \|  (f\circ \ldots \circ f)(x_0) - (f\circ \ldots \circ f)(x^*) \| \leq q^n\|x_0 - x^*\| = q^n\|e_0\|$$

**Emlék:** Legyen $X$ végesdimenziós valós vektortér, $U \subseteq X$ nyílt halmaz, $f: U \to X$ folytonosan differenciálható és legyen $x, h \in U$ olyan, hogy az $x+h\cdot[0,1] \subseteq U$, azaz az $x$-ből induló $x+h$ végű szakasz része $U$-nak, akkor

$$f(x+h) - f(x) = \int_{0}^1 f'(x+th) \cdot h\, dt.$$

Ebből kapjuk a középérték-tétel magasabbdimenziós változatát:

$$\|f(x+h) - f(x)\| \leq \left(\sup_{0\leq t \leq 1}\|f'(x+th)\| \right) \|h\|.$$

Ha $K \subseteq U\subseteq X$ és $K$ kompakt, akkor

$$M = \sup_{K}\|f'\|$$

választással $x, y \in K$ esetén ha az $x$ és $y$ pontok által határolt szakasz $K$-ban van (pl. ha  konvex), akkor

$$\| f(x) - f(y) \| \leq M \|x -y\|.$$

Ha $f(K) \subseteq K$ (hívjuk ezt ráképezésnek) és $M<1$, akkor $f|_K:K \to K$ kontrakció. Mivel teljes tér zárt részhalmaza teljes, $K$ ezért teljes, tehát $f|_K$-ra is alkalmazható a Banach-féle fixponttétel. Érdemes lehet megjegyezni, hogy $K$ általában nem vektortér, azonban az eredeti tér normája által generált metrikával a halmaz teljes metrikus tér, tehát a Banach-féle fixponttétel valóban alkalmazható.

### 4. Feladat 
Oldjuk meg a $\cos(x) = x$ egyenletet a valós számok halmazán. Keressünk alkalmas halmazon alkalmas kontrakciót, majd írjunk kódot amivel addig iteráljunk, míg két szomszédos lépés távolsága nem lesz -nél kisebb.

In [21]:
def fixpont_it(x0, f, atol, max_it):
    x = x0
    for num_steps in range(1, max_it + 1):
        dx = -(x - f(x))
        x = x + dx
        if np.abs(dx) < atol:
            break
    return x, num_steps

x, num_steps = fixpont_it(0, np.cos, 1e-5, 100)

print("Fixpont:", x)
print("Iterációk száma:", num_steps)
print(np.cos(x)-x)

Fixpont: 0.7390822985224023
Iterációk száma: 30
4.744172929949109e-06



A lineáris esettel analóg módon az iterációt megadhatjuk az alábbi módon is általában.

$$
\begin{align}
f(x) &= b\\
0 &= b - f(x) \\
x &= x - f(x) + b \\
\end{align}
$$

Az iterációt ugyanolyan módon el tudjuk végezni mint a lineáris esetben, amíg $f(x)=x-(f(x)+b)$ kontrakció. Ha nem az, akkor valamely $c$ megválasztása mellett még lehet esélyünk arra, hogy az $f_c(x)=x-c(f(x)+b)$ függvény kontrakció legyen, a kérdés, hogy ezt hogy válasszuk meg. A választ erre kérdésre a gradiens módszer leírásánál kapjuk meg, láttuk a lineáris esetben, hogy a Richardson iteráció tulajdonképpen egy állandó lépésközű Gradiens-ereszkedésnek felelt meg. 

### Gradiens-módszer nemlineáris esetben

A gradiens-módszert is tudjuk alkalmazni nemlineáris feladatokra. A következő tételt alkalmazhatjuk speciális $A$ leképezések esetén. A tételt általános esetben mondjuk ki, egy $A: H\rightarrow H$ Hilbert-tér operátor esetén, az $A(u)=b$ egyenletre.

**Tétel:** Legyen $H$ valós Hilbert-tér (gondolhatunk $H=\mathbb{R}^n$-re is az Euklideszi skalárszorzattal ellátva) és $A:H\rightarrow H$ legyen deriválható minden $u\in H$ pontban, azaz létezik az $A'(u)\in B(H)$ lineáris operátor. Legyen $A'(u)$ önadjungált minden $u\in H$ esetén. Tegyük fel, hogy léteznek $0<m\leq M$ állandók, hogy

$$m\|h\|^2\leq \langle A'(u)h,h\rangle \leq M\|h\|^2 \qquad \forall u,h\in H.$$

Ekkor létezik a $\phi: H\rightarrow \mathbb{R}$ funkcionál, amelyre teljesül, hogy $\phi'=A$, továbbá a $\phi$ funkcionál szigorúan konvex. $A(u^*)=b$ pontosan akkor áll fenn, ha ($\phi(u^*)-\langle b, u^*\rangle$)'=0, vagyis ha $u^*$ minimumhelye a $\phi(u)-\langle b,u\rangle$ leképezésnek. Ekkor tetszőleges $u_0$ esetén az

$$u_{n+1}=u_n-\tau(A(u_n)-b)$$

sorozat konvergál az $u^*$-hoz, $\tau=\dfrac{2}{m+M}$ mellett.

**Megjegyzés:** Feladattól függően nem állandó lépésköz is választható, ezt azonban most nem tárgyaljuk.

Ez az tétel valamilyen értelemben analóg a lineáris esetben tanultakkal: a feltételek miatt létezik az egyenletben adott monoton $A$ függvény "primitív függvénye", ami konvex is, így az erre felírt minimalizási feladat az eredeti feladatunk egyértelmű megoldása lesz. 
 




### 5. Feladat
Gondoljuk meg mit jelentenek a tétel feltételei $H=\mathbb{R}^n$ esetén, illetve azt is hogy a képletben milyen dimenziójú objektumok szerepelnek.

### 6. Feladat

Legyen  $H=\mathbb{R}^n$, ekkor ellenőrizzük, hogy ha teljesülnek az előbbi tétel $A$-ra vonatkozó feltételei, akkor $F(u)=u-\tau (A(u)-b)$ kontrakció. Mutassuk meg, hogy bármely $0<\tau<\dfrac{2}{M}$ választás jó.

### 7. Feladat
Keressük meg az $f(x) = x^3 + 2 x^2 + 10 x - 20$ egyenlet gyökét, ha valahonnan sejtjük, hogy a $K=[1,2]$  intervallumban van. Alkalmazzunk fixpont-iterációt és addig iteráljunk, míg a szomszédos iteráltak távolsága $10^{-10}$ alá nem csökken.

### *8. Feladat 
Tekintsük az alábbi függvényt, ahol $c \in \mathbb{R}^+$:

$$f(x) = \frac{1}{x} - \frac{x}{c}$$

(a) Keressük a függvény $x^*>0$ zérushelyét fixpont iteráció segítségével! Írjuk fel alkalmas $F(x) $ függvényt, és bizonyítsuk be, hogy valóban konvergál minden $c>0$ esetén! Hová fog tartani?

### P1. Feladat

Implementáljuk a gradiens-módszert az optimális lépéshosszválasztással az SZPD-baloldalú lineáris egyenletrendszer iteratív megoldására.

In [19]:
import numpy as np

def gradient_descent(A, b, x0, tol=1e-6, max_iter=1000):
    """
    Gradient Descent method for solving symmetric positive definite (SPD) linear systems.

    Parameters:
        A (numpy.ndarray): The symmetric positive definite matrix.
        b (numpy.ndarray): The right-hand side vector.
        x0 (numpy.ndarray): Initial guess for the solution.
        tol (float): Tolerance for convergence.
        max_iter (int): Maximum number of iterations.

    Returns:
        x (numpy.ndarray): Solution vector.
        iter (int): Number of iterations performed.
        is_success (bool): True if the method was successful, False otherwise.
    """
    is_success = False
    x = x0.copy()
    for iter in range(max_iter):
        r = A @ x - b  # Compute residual
        if np.linalg.norm(r) < tol:
            is_success = True
            break  # Convergence achieved

        # Compute step size
        omega = r @ r / (r @ (A @ r))
        d = -omega * r

        x = x + d  # Update solution

    return x, iter + 1, is_success

# Example usage:
A = np.array([[2, 1, 0],
              [1, 2, -1],
              [0, -1, 2]])
b = np.array([5, -6, 6])
x0 = np.zeros_like(b)

solution, iterations, is_success = gradient_descent(A, b, x0)
print("Solution:", solution)
print("Number of iterations:", iterations)
print("Success:", is_success)
print(A@solution)

Solution: [ 5.24999937 -5.49999939  0.25000063]
Number of iterations: 46
Success: True
[ 4.99999936 -6.00000003  6.00000064]
