# 5. Feladatsor

*(Nemlineáris egyenletek: intervallumfelezés, fixpont iteráció)*

**Cél:** Az $f(x)=0$ egyenlet megoldása, ahol  adott, szép tulajdonságú (pl. folytonosan deriválható) függvény, azaz keressük az $f$ függvény gyökeit/zérushelyeit. Ekvivalensen $g(x)=b$  megoldása az $f = g-b$ függvényre alkamazott gyökkereséssel.



## Intervallumfelezés
Tegyük fel, hogy tudjuk, hogy egy adott $[a,b]$ intervallumon a függvényünknek van egy gyöke; például ezt onnan tudhatjuk, hogy a végpontokban különböző előjelű a függvény, pontosabban: $f(a) \cdot f(b) < 0$. Tegyük fel, hogy ez fennáll és hogy $f(a) < 0, f(b)>0$. Ez utóbbi nem megszorítás, mert $f$ és  $-f$ gyökei ugyanott vannak.

**Alapgondolat**: Vizsgáljuk meg a függvény előjelét az $\frac{a+b}{2}$ pontban! Ha itt pozitív, az azt jelenti, hogy a keresett zérushely az $\left[a,\; \frac{a+b}{2}\right)$ intervallumban van, azaz itt érdemes folytatni a keresést. Ugyanakkor ha itt negatív, akkor a zérushely az $\left( \frac{a+b}{2},\; b\right]$ intervallumban található, és itt kell tovább keresnünk. Ezt követően az előbbi gondolatot folytatjuk az új, kisebb intervallumokon, azaz vagy az $\frac{a+b}{4}$, vagy a $\frac{3 (a+b)}{4}$ pontban vizsgáljuk a előjelet, és így tovább. 
Az algoritmus addig fut, amíg  értéke a vizsgált pontban nulla nem lesz (ez programok esetén a gépi hibák miatt ritkán következik be), vagy amikor a vizsgált intervallum már nagyon kicsi/rövid, de természetesen megadhatunk maximális lépésszámot is, amely után álljon le mindenképpen a program. Határértékben ez a módszer mindenképpen megtalál egy zérushelyet (ha több is van, akkor a zérushelyek közül valamelyiket).

### P1. Feladat
Fibonacci egyik cikkében szerepel az alábbi állítás: az

$$f(x) = x^3 + 2 x^2 + 10 x - 20$$

egyenlet gyöke $x = 1.368808107...$ Ellenőrizzük le az intervallumfelezéses módszerrel, hogy jól számolt-e!
Megoldás: Legyen a toleranciánk $10^{-10}$ és indítsuk az iterációt az $[1,2]$ intervallumon!

In [3]:
import numpy as np

tol=10**(-10)

a=1
b=2
k=0

while np.abs(b-a) > tol:
    x=(a+b)/2
    f=x**3+2*x**2+10*x-20
    if f==0:
        break
    else:
        if f>0:
            b=x
        else:
            a=x
    k=k+1

print(x)
print(k)



1.368808107858058
34


### Fixpont-iteráció (még egyszer)

**Emlék:** A Banach-féle fixponttétel következtében ha $X$ Banach-tér és $f:X\rightarrow X$ kontrakció $0\leq q<1$ együtthatóval, akkor van $x^*$ fixpontja, amire $f(x^*) = x^*$; továbbá az $x_{n+1} = f(x_n)$ sorozat tetszőleges $X$-beli pontból indítva $x^*$-hoz fog tartani; továbbá $e_n = x_n - x^*$ választással látható, hogy

$$\|e_{n+1}\| = \| x_{n+1} - x^* \| =  \| f(x_{n}) - f(x^*) \| \leq q \|x_n - x^*\| = q \| e_n\|$$
és
$$\|e_n\| = \|  (f\circ \ldots \circ f)(x_0) - (f\circ \ldots \circ f)(x^*) \| \leq q^n\|x_0 - x^*\| = q^n\|e_0\|$$

**Emlék:** Legyen $X$ végesdimenziós valós vektortér, $U \subseteq X$ nyílt halmaz, $f: U \to X$ folytonosan differenciálható és legyen $x, h \in U$ olyan, hogy az $x+h\cdot[0,1] \subseteq U$, azaz az $x$-ből induló $x+h$ végű szakasz része $U$-nak; ekkor

$$f(x+h) - f(x) = \int_{0}^1 f'(x+th) \cdot h\, dt.$$

Ebből kapjuk a középérték-tétel magasabbdimenziós változatát:

$$\|f(x+h) - f(x)\| \leq \left(\sup_{0\leq t \leq 1}\|f'(x+th)\| \right) \|h\|.$$

Ha $K \subseteq U\subseteq X$ és $K$ kompakt, akkor

$$M = \sup_{K}\|f'\|$$

választással $x, y \in K$ esetén ha az $x$ és $y$ pontok által határolt szakasz $K$-ban van (pl. ha  konvex), akkor

$$\| f(x) - f(y) \| \leq M \|x -y\|.$$

Ha $f(K) \subseteq K$ (hívjuk ezt ráképezésnek) és $M<1$, akkor $f|_K:K \to K$ kontrakció. Mivel teljes tér zárt részhalmaza teljes, $K$ ezért teljes, tehát $f|_K$-ra is alkalmazható a Banach-féle fixponttétel. Érdemes lehet megjegyezni, hogy $K$ általában nem vektortér, azonban az eredeti tér normája által generált metrikával a halmaz teljes metrikus tér, tehát a Banach-féle fixponttétel valóban alkalmazható.


A lineáris esettel analóg módon bizonyos feltételek mellett fixpontiterációt készíthetünk az alábbi átalakítással:

$$
\begin{align}
f(x) &= b\\
0 &= b - f(x) \\
x &= x - f(x) + b \\
\end{align}
$$

Az iterációt ugyanolyan módon el tudjuk végezni mint a lineáris esetben, amíg $f(x)=x-(f(x)-b)$ kontrakció. Ha nem az, akkor valamely $c$ megválasztása mellett még lehet esélyünk arra, hogy az $f_c(x)=x-c(f(x)-b)$ függvény kontrakció legyen, a kérdés, hogy ezt hogy válasszuk meg. 

Egy lehetséges választ kaphatunk erre a kérdésre az alábbi gradiens-módszerre vonatkozó tételben, mely analóg lesz a lineáris esetnél látottakkal, melyek szerint a Richardson iteráció tulajdonképpen egy állandó lépésközű Gradiens-ereszkedésnek felelt meg.

### Gradiens-módszer

A gradiens-módszert is tudjuk alkalmazni nemlineáris feladatokra. A következő tételt alkalmazhatjuk speciális $A$ leképezések esetén. A tételt általános esetben mondjuk ki, egy $A: H\rightarrow H$ Hilbert-tér operátor esetén, az $A(u)=b$ egyenletre.

**Tétel:** Legyen $H$ valós Hilbert-tér (gondolhatunk $H=\mathbb{R}^n$-re is az Euklideszi skalárszorzattal ellátva) és $A:H\rightarrow H$ legyen deriválható minden $u\in H$ pontban, azaz létezik az $A'(u)\in B(H)$ lineáris operátor. Legyen $A'(u)$ önadjungált minden $u\in H$ esetén. Tegyük fel, hogy léteznek $0<m\leq M$ állandók, hogy

$$m\|h\|^2\leq \langle A'(u)h,h\rangle \leq M\|h\|^2 \qquad \forall u,h\in H.$$

Ekkor létezik olyan $\phi: H\rightarrow \mathbb{R}$ funkcionál, amelyre teljesül, hogy $\phi'=A$, és a $\phi$ funkcionál szigorúan konvex, továbbá, mint a lineáris esetben láthattuk:
$A(u^*)=b$ pontosan akkor áll fenn, ha $(\phi(u^*)-\langle b, u^*\rangle)'=0$, azaz ha $u^*$ minimumhelye az $u \mapsto \phi(u)-\langle b,u\rangle$ leképezésnek. Ekkor tetszőleges $u_0$ esetén az

$$u_{n+1}=u_n-\tau(A(u_n)-b)$$

sorozat konvergál az $u^*$-hoz, $\tau=\dfrac{2}{m+M}$ mellett.

Ez a tétel valamilyen értelemben analóg a lineáris esetben tanultakkal: a feltételek miatt létezik az egyenletben adott monoton $A$ függvény "primitív függvénye", ami konvex is, így az erre felírt minimalizási feladat az eredeti feladatunk egyértelmű megoldása lesz. 
 

**Megjegyzés:** Feladattól függően nem állandó lépésköz is választható, ezt azonban most nem tárgyaljuk.
Ennél valójában megengedőbbet is elég ellenőriznünk gyakran.

Legyen $f: V \to V$ folytonosan differenciálható függvény, melynek gyöke van az $x^*$ pontban, továbbá tegyük fel, hogy léteznek $m, M$ pozitív konstansok, melyekkel tetszőleges $x$ pontra az $x^*$ egy gömbi környezetéből
$$ m \|h\| \leq \| f'(x) h \| \leq M\| h \| \quad \forall h \in V.$$







### 1. Feladat
Gondoljuk meg mit jelentenek a tétel feltételei $H=\mathbb{R}^n$ esetén, illetve azt is hogy a képletben milyen dimenziójú objektumok szerepelnek. Gondoljuk meg, hogy a tétel visszaadja a lineáris esetnél látottakat.

### 2. Feladat

Legyen a norma a $\| \cdot \|_2$. Teljesülhet-e a fenti feltétel a $0$ körüli zárt egységgömbön, ha

a)  $f(x,y) = [2x - y, -x + 2y]$;

b) $f(x,y) = [2x^3 + x, y^3 +y]$;

és ha igen, akkor milyen $M,m$ értékekkel?

### 3. Feladat

Vizsgáljuk meg, hogy az alábbi $x^*$-hoz tartó $(x_n)_n$ valós számsorozatok esetén melyekre teljesül,

* egy lineáris becslés $ \| x_{n+1} - x^* \| \leq L \| x_n - x^* \|, $ ahol $ 0 < L < 1$;

* egy kvadratikus becslés, azaz $\| x_{n+1} - x^* \| \leq q \| x_n - x^* \|^2$, ahol $ 0 < q$

a) $2^{-n}$

b) $2^{-n^2}$

c) $2^{-2^{n}}$


### 4. Feladat

Legyen $A:\mathbb{R}^2\rightarrow \mathbb{R}^2$
$$A(x,y)=\left[\begin{matrix} 
x(3x^2+5+2y^2) \\
y(2x^2+5+y^2) 
\end{matrix}\right]$$

Gradiens-ereszkedés segítségével szeretnénk megoldani az

$$A(x,y)=\begin{pmatrix}2 \\ 2 \end{pmatrix}$$

feladatot. Írjuk fel a gradiens iteráció első lépését $(x_0,y_0)$ pontból kiindulva egy konstans $\tau>0$ lépéshossz mellett. Ellenőrizzük, hogy teljesül-e a

$$m\|h\|^2\leq \langle A'(x,y)h,h\rangle \leq M\|h\|^2 \qquad \forall h\in \mathbb{R}^2,\forall \;\|(x,y)\|_2\leq 1$$

feltétel valamely $0<m\leq M$ mellett, és adjuk meg $m$ és $M$ értékeit. 

Gersgorin-tétel: Ha $A$ négyzetes mátrix, akkor minden $\lambda$ sajátértékhez létezik $i$ index, hogy $\lambda_i\in[a_{ii}-\sum_{i\neq j}|a_{ij}|,a_{ii}+\sum_{i\neq j}|a_{ij}|]$.


In [13]:
import numpy as np

def f(x,y):
    return np.array([
        5*x**2-y**2,
        y-0.25*(np.sin(x)+np.cos(y))
    ])

b=np.array([0,0])

def fixpont_it(x0, y0, f, b, omega, atol, max_it):
    x=x0
    y=y0
    a=np.array([x,y])

    for num_steps in range (1, max_it+1):

        dxy=f(x,y)-b
        a=a-omega*dxy
        x=a[0]
        y=a[1]
        if np.linalg.norm(dxy) < atol:
            break
    return x,y,num_steps

x,y,num=fixpont_it(0.5,0.5,f,b,0.5,10**(-10),1000)
print(x,y)
print(f(x,y))
print(num)
    
    

0.12124191154040738 0.2711051558417675
[4.5870821e-11 3.7790493e-11]
43
