# Appendiks 1: Kontinuitet og skjæringssetningen

## Funksjoner, definisjonsmengde og verdimengde
Vi starter med å se på en skalar funksjon $f = f(x)$ av en skalar variabel $x$.
Det vil si, for et reelt tall $x$ som argument til funksjonen $f$ vil den gi oss et reelt tall $f(x)$.

Vi skriver $\mathbb{R}$ for mengden av alle reelle tall, slik at $x$ ovenfor vil være et element i denne mengden, $x \in \mathbb{R}$.

Ikke alle slike funksjoner $f$ er definert for alle mulige argumenter $x$. For eksempel er kvadratrot-funksjonen $f(x) = \sqrt{x}$ kun definert for $x \ge 0$, og samtidig vil de tilhørende funksjonsverdiene også være større enn eller lik null.
Dette leder oss til konseptene definisjonsmengde og verdimengde. Vi skriver definisjonsmengden til $f$ som $D_f$: dette er mengden av alle $x$ som $f$ er definert for.
Videre skriver vi $V_f$ for verdimengden til $f$, det vil si de verdiene som $f(x)$ kan ha gitt $x \in D_f$.

Vanligvis velger vi $D_f$ til å være den største mengden $f$ er definert for.
Likevel kan det noen ganger være nyttig å begrense seg til en mindre delmengde av denne største mengden, som vi skal se nedenfor.
Vi kan da skrive $f\colon D_f \to V_f$ hvor vi setter inn for $D_f$ og $V_f$ for å presisere, for eksempel $f\colon \mathbb{R} \to \mathbb{R}$.

>#### Eksempel:
Her er noen eksempler på funksjoner og deres største definisjons- og verdimengder.
>
>Vi har kvadrat-funksjonen
$$ f(x) = x^2, \qquad D_f = \mathbb{R}, \qquad V_f = [0,\infty), $$
kvadratrot-funksjonen
$$ f(x) = \sqrt{x}, \qquad D_f = V_f = [0,\infty), $$
og sinus-funksjonen
$$ f(x) = \sin(x), \qquad D_f = \mathbb{R}, \qquad V_f = [-1, 1]. $$

### Inverse funksjoner
For funksjonene ovenfor kan vi tenke at for en gitt $x \in D_f$ vil $f$ gi oss en verdi $y \in V_f$, nemlig $y = f(x)$.

Noen ganger er vi intressert i å finne hvilken $x$ som gav en gitt verdi $y$, og det er her *inverse funksjoner* kommer inn.
Men for at inversfunksjonen skal være nettopp en funksjon, så kan vi ikke tillate at det er flere enn én $x$ som gir verdien $y$.

For eksempel har vi for $f(x) = x^2$ at $f(\pm 2) = (\pm2)^2 = 4$.
Så ligningen $x^2 = 4$ har to løsninger dersom vi tillater at $x$ kan være i hele $\mathbb{R}$, og disse løsningene er $x = \pm\sqrt{4} = \pm 2$.
Da er det ikke klart hvilken av disse som skal være verdien av inversfunksjonen til $f$ for argumentet $y=4$.
Dersom vi i stedet begrenser oss til å lete etter løsninger slik at $x \ge 0$, er det klart at vi må velge $x=2$.

Dersom $f$ har en inversfunksjon skriver vi $f^{-1}$ for denne, og vi har at dersom $y = f(x)$ så er $x = f^{-1}(y)$. Fra dette følger det at

$$ f^{-1}(f(x)) = x, \qquad f(f^{-1}(y)) = y. $$

Vi merker oss at for inversfunksjonen bytter definisjons- og verdimengdene rolle, det vil si $D_{f^{-1}} = V_f$ og $V_{f^{-1}} = D_f$.

På samme vis kan en funksjon $f$ som ikke har en invers dersom vi lar $D_f$ være så stor som mulig likevel ha en invers dersom vi begrenser $D_f$.

For å gå tilbake til eksempelet ovenfor, dersom vi for $f(x) = x^2$ velger $D_f = [0,\infty)$ som ovenfor, så har $f$ inversfunksjonen $f^{-1}(y) = \sqrt{y}$.

For sinusfunksjonen, $f(x) = \sin(x)$, er det vanlig å velge $D_f$ til å være det sammenhengende intervallet hvor $\sin(x)$ tar alle verdier i $[-1,1]$ og som inneholder null, nemlig $[-\pi/2, \pi/2]$.

Inversfunksjonen til $\sin\colon [-\pi/2, \pi/2] \to [-1,1]$ kalles $\arcsin$,
$$ f(x) = \arcsin(x), \qquad D_f = [-1, 1], \qquad V_f = \left[-\frac{\pi}{2}, \frac{\pi}{2} \right], $$
Tilsvarende finnes inversfunksjoner for cosinus
$$ f(x) = \arccos(x), \qquad D_f = [-1, 1], \qquad V_f = \left[0, \pi \right], $$
og tangens
$$ f(x) = \arctan(x), \qquad D_f = \mathbb{R}, \qquad V_f = \left[-\frac{\pi}{2}, \frac{\pi}{2} \right]. $$

## Kontinuitet

> #### Definisjon (kontinuitet):
En skalar funksjon $f$ er kontinuerlig i punktet $x$ dersom vi gitt en vilkårlig $\epsilon > 0$ kan finne $\delta = \delta(\epsilon)$ slik at dersom $|y-x| < \delta$ så er
$$ |f(y) -f(x)| < \epsilon. $$

Her skriver vi $\delta = \delta(\epsilon)$ for å understreke at denne typisk vil være avhengig av $\epsilon$: dersom vi reduserer $\epsilon$ er vi typisk også nødt til å redusere $\delta$.

Dette kan fremstå nokså abstrakt, men idéen er at for en kontinuerlig funksjon skal det være mulig vi kan gjøre avviket mellom funksjonsverdiene $f(y)$ og $f(x)$ så lite vi vil ved å velge avstanden mellom $y$ og $x$ liten nok.

> #### Eksempel:
La oss se på funksjonen $f(x) = x^2$ og vise at denne er kontinuerlig i $x=0$ ved hjelp av definisjonen
$$ |f(y)-f(0)| = |y^2-0^2| = |y|^2 < \epsilon \implies \delta(\epsilon) = \sqrt{\epsilon} $$
Altså vil $|f(y)-f(0)| < \epsilon$ for $|y|=|y-0| < \sqrt{\epsilon}$.

## Skjæringssetningen

---
> #### Teorem (Skjæringssetningen):
La $f$ være en funksjon definert på intervallet $[a,b]$, som i endepunktene tar verdiene $f(a)$ og $f(b)$. Dersom $f(a) \neq f(b)$ så må funksjonen ta alle verdier mellom $f(a)$ og $f(b)$. Altså, for enhver verdi $d$ mellom $f(a)$ og $f(b)$ må det finnes en $c \in (a, b)$ sånn at $f(c) = d$.
---

For eksempel tar funksjonen $f(x) = x$ verdiene $f(\pm 1)$ i punktene $\pm 1$.
Siden $f$ er kontinuerlig må den i intervallet $(-1,1)$ også ta alle verdiene mellom $-1$ og $1$, som vi vet at den gjør fordi funksjonsverdien $f(x)$ er lik argumentet $x$.

## Funksjoner av flere variable

For denne delen kan det være til hjelp å kjenne til [lineære systemer](A-3_linalg.ipynb) på formen $\boldsymbol{y} = A\boldsymbol{x}$.

### Vektornormer
Dersom vi har mer enn én skalar variabel $x$, si vi har $n$ av dem som vi kaller $x_1, x_2, \dots, x_n$, så kan disse samles i en vektor $\boldsymbol{x} \in \mathbb{R}^n$ med $n$ komponenter.

$$ \boldsymbol{x} = \begin{bmatrix} x_1 \\ x_2 \\ \vdots \\ x_n \end{bmatrix}, \qquad \|\boldsymbol{x}\|_p \doteq \left(|x_1|^p + |x_2|^p + \dots + |x_n|^p\right)^{1/p} = \left(\sum_{i=1}^n |x_i|^p \right)^{1/p} $$

På samme måte som $x=y$ hvis og bare hvis $|x-y|=0$ for $x, y \in \mathbb{R}$ så er $\boldsymbol{x}=\boldsymbol{y}$ hvis og bare hvis $\|\boldsymbol{x}-\boldsymbol{y}\| = 0$ for $\boldsymbol{x}, \boldsymbol{y} \in \mathbb{R}^n$



For $1 \le p < q < \infty$
$$ \|\boldsymbol{x}\|_\infty = \max_{1 \le i \le n}|x_i| \le \|\boldsymbol{x}\|_q \le \|\boldsymbol{x}\|_p $$

For vektorer bruker vi vanligvis $p=2$, den *euklidske normen* 

>#### Eksempel:
Si vi har en vektor $\boldsymbol{x}$ med de tre komponentene $2$, $3$ og $6$. Da kan vi finne $\|\boldsymbol{x}\|_p$ for $p=1,2,\infty$.
$$ \boldsymbol{x} = \begin{bmatrix} 2 \\ 3 \\ 6 \end{bmatrix}, \quad \|\boldsymbol{x}\|_\infty = 6, \quad \|\boldsymbol{x}\|_2 = 7 \quad \|\boldsymbol{x}\|_1 = 11 $$

### Kontinuitet
$f$ tar inn $n$ skalare verdier $x_1, x_2, \dots, x_n$ og gir ut $m$ skalare verdier $y_1, y_2, \dots, y_m$ $\boldsymbol{y} = f(\boldsymbol{x})$
$$ f\colon \mathbb{R}^n \to \mathbb{R}^m $$

> #### Definisjon (kontinuitet):
En funksjon $f \colon \mathbb{R}^n \to \mathbb{R}^m$ er kontinuerlig i punktet $\boldsymbol{x}$ dersom vi gitt en vilkårlig $\epsilon > 0$ kan finne $\delta = \delta(\epsilon)$ slik at dersom $\|\boldsymbol{y}-\boldsymbol{x}\| < \delta$ så er
$$ \|f(\boldsymbol{y}) -f(\boldsymbol{x})\| < \epsilon. $$

Vi unngår $f(\boldsymbol{x}) = \boldsymbol{0}$ $A \boldsymbol{x} = \boldsymbol{b}$ $\boldsymbol{x} = A^{-1}\boldsymbol{b}$

>#### Eksempel:
$f(\boldsymbol{x}) = A\boldsymbol{x}$

### Matrisenormer




 $m\times n$-matrise $A$ med komponenter $a_{ij}$ gi $\boldsymbol{y} = A\boldsymbol{x}$ hvor $\boldsymbol{y} \in \mathbb{R}^m$

$$ A = \begin{bmatrix} a_{11} & a_{12} & \dots & a_{1n} \\ a_{21} & a_{22} &  & a_{2n} \\ \vdots & & \ddots & \vdots \\ a_{n1} & a_{n2} & \dots & a_{nn} \end{bmatrix} \qquad \|A\|_{\infty} = \max_{1\le i\le m}\sum_{j=1}^{n}|a_{ij}| \qquad \|A\|_{1} = \max_{1\le j\le n}\sum_{i=1}^{m}|a_{ij}| $$

[diagonaldominans](Jacobi.ipynb)

**Merk**: Den euklidske matrisenormen $\|A\|_2$ er mer komplisert å beregne, og involverer noe som kalles *egenverdier* for matriser som vi ikke dekker her.