# Kritiske punkt og optimering

Vi husker at et kritisk punkt er der hvor den deriverte $\frac{df}{dx}=0$. Det kan brukes til å finne lokale maksimum og minimum til en funksjon (optimering). Vi får vite om vi har en maks eller min ut fra fortegnet til den andrederiverte (hvis den eksisterer).

Formålet med dette kapitlet er å vise hva som skjer for funksjoner av to variable. Det blir nok ganske likt situasjonen med en variabel, bare at det finnes flere typer kritiske punkt, og fortegnet til den andre deriverte må erstattes med fortegnet til *egenverdiene* til den andrederiverte (som er den symmetriske Hessematrisen).

1. Kritiske punkt I. Her definerer vi et kritisk punkt, og viser hvordan man kan bruke den andrederiverte til å finne ut hva slags kritisk punkt vi har, men bare når den andrederiverte er en diagonal matrise.
2. Kritiske punkt II. Hva gjør vi om den andrederiverte ikke er en diagonal matrise?
    - Med diagonalisering (mest intuitiv)
    - Med andrederivertstesten (mest lettvint)
3. Optimering og kritiske punkt. Vi viser hvordan man kan finne maks/min av en funksjon innenfor et område ved å finne kritiske punkter og deretter undersøke langs randene.
4. Med tre variabler. Hva gjør vi med funksjoner av tre variable?

**Læringsmål**

- Forstå intuitivt betydningen av kritiske punkt.
- Identifisere kritiske punkt for funksjoner av to eller tre variable.
- Klassifisere kritiske punkt for funksjoner av to eller tre variable med den andrederiverte (gjennom diagonalisering og andrederivertstesten).
- Forstå at den andrederiverte kan være null eller at den ikke eksisterer.
- Benytte kritiske punkt og partiellderivasjon til optimering av funksjoner av to variable.

## Kritiske punkter

Et punkt er et *kritisk punkt* når den deriverte $\frac{\partial f}{\partial \vec{n}} = 0$ for alle retninger $\vec{n}$. I praksis holder det å sjekke at $\frac{\partial f}{\partial x} = 0$ og $\frac{\partial f}{\partial y} = 0$. (*Hvorfor? Tenk på lineær algebra!*).

Fra kalkulus av en variabel vet vi at i (lokale) maksimum- og minimumspunkt så er den deriverte lik null. Det samme gjelder for funksjoner av flere variable. I tillegg har vi i flere dimensjoner *sadelpunkter*. Sadelpunkter er punkter som ikke er lokale maksimum eller minimum. 

### Eksempel 1

Funksjonen $f(x,y) = \sin(x) + \cos(y)$ er avbildet under. Da har vi at de partiellderiverte er 
$$
\frac{\partial f }{\partial x}(x,y)=\cos(x),\qquad \frac{\partial f }{\partial y}(x,y)=-\sin(y).
$$
For å finne de kritiske punktene må vi finne ut hvor
$$
\cos(x)=0,\quad \text{og}\quad-\sin(y)=0.
$$
Dette gir oss at $x=\frac{\pi}{2}+\pi n$ og $y=\pi m$ er kritiske punkt for alle heltall $n$ og $m$. Med andre ord er $(\frac{\pi}{2}+\pi n, \pi m)$ de kritiske punktene til funksjonen. Om vi plotter funksjonen kan vi se hvilken type kritisk punkt vi har. Klarer du å bestemme når vi har et maksimum- og når vi har et minimumspunkt ved å se på grafen? Hva med sadelpunkter?

In [None]:
# Importerer pakker for plotting og nummeriske beregninger
import matplotlib.pyplot as plt
import numpy as np

# Bestemmer at vi skal plotte i 3d, samt størelsen på plottet
fig, ax = plt.subplots(figsize=(15, 15), subplot_kw={"projection": "3d"})

# Lager et rutenett med 100x100 punkter på kvadratet [-5, 5]x[-5, 5]
x, y = np.meshgrid(np.linspace(-5, 5, 100), np.linspace(-5, 5, 100))

# Lager funksjonsverdiene
z = np.sin(x) + np.cos(y)

# Lager selve overflateplottet
ax.plot_surface(x, y, z)

## Kritiske punkt I: Når den andrederiverte er en diagonal matrise

Eksempel 1 viser alle de tre typene kritiske punkt vi er interesert i; (lokale) maksimum, (lokale) minimum og sadelpunkter. Det er enda ikke helt klart hvordan vi kan vite hva slags kritisk punkt vi har uten å plotte funksjonen. Det er dette vi skal se på nå.

Husk at den andrederiverte av en funksjon $f(x,y)$ er hessematrisen
$$
H = 
\left(\begin{array}{cc}
     \frac{\partial^2 f}{\partial x^2} & \frac{\partial^2 f}{\partial x
     \partial y}\\
     \frac{\partial^2 f}{\partial y \partial x} & \frac{\partial^2 f}{\partial
     y^2}
   \end{array}\right)
$$
Når $H$ er en diagonalmatrise i det kritiske punktet $(x_0,y_0)$, dvs. $\frac{\partial^2 f }{\partial x\partial y}(x_0,y_0) = 0$, finnes det en lett regel for å klassifisere det kritiske punktet. I dette tilfellet er det nok å skjekke fortegnet til $A=\frac{\partial^2 f}{\partial x^2}(x_0,y_0)$ og
$B=\frac{\partial^2 f}{\partial y^2}(x_0,y_0)$. Det er hovedsakelig tre
muligheter:

1. Når $A$ og $B$ er negative er det kritiske punktet et lokalt maksimum.
2. Når $A$ og $B$ er positive er det kritiske punktet et lokalt minimum.
3. Vi får et sadelpunkt når $AB$ er negativ, det vil si at $A$ og $B$ har forskjellig fortegn.

Den siste muligheten er at $A$ eller $B$ er lik null (eller ikke finnes), og da kan vi ikke bruke andrederivertstesten for å klasifisere det kritiske punktet. Å klasifisere det kritiske punktet i dette tilfellet er **ikke pensum**.



### 1. Maks

Lokalt ser et maksimum sånn ut. Funksjonen $f(x,y) = -x^2 - y^2$ er avbildet under. Alternativt kunne vi ha skrevet den

$$
f(\vec{x}) = 
\begin{pmatrix}
x &y 
\end{pmatrix}
\begin{pmatrix}
-1 & 0 \\
0 & -1
\end{pmatrix}
\begin{pmatrix}
x \\
y
\end{pmatrix}
$$
I dette tilfellet har vi at $$\frac{\partial f }{\partial x}(x,y)=-2x,\qquad \frac{\partial f }{\partial y}(x,y)=-2y.$$
Dermed er punktet $(0,0)$ det eneste kritiske punktet.

I dette tilfellet er $$\frac{\partial^2 f }{\partial x\partial y}=0$$ og $$\frac{\partial^2 f}{\partial x^2}=\frac{\partial^2 f}{\partial y^2}=-2<0.$$
Dermed er vi i tilfelle 1. over, og funksjonen har et lokalt makspunkt i punktet $(0,0)$. En grundigere forklaring kommer i neste kapittel, når vi ser på Taylors teorem.

In [None]:
# Bestemmer at vi skal plotte i 3d, samt størelsen på plottet
fig, ax = plt.subplots(figsize=(15, 15), subplot_kw={"projection": "3d"})

# Lager et rutenett med 50x50 punkter på kvadratet [-3, 3]x[-3, 3]
x, y = np.meshgrid(np.linspace(-3, 3, 50), np.linspace(-3, 3, 50))

# Lager funksjonsverdiene
z2 = -x**2 - y**2

# Lager selve overflateplottet
ax.plot_surface(x, y, z2)

## 2. Min

Funksjonen $f(x,y) =  x^2 + y^2$ er avbildet under og vi kan se at den har et minimum i punktet $(0,0)$. Alternativt kunne vi ha skrevet funksjonen som

$$
f(\vec{x}) = 
\begin{pmatrix}
x &y 
\end{pmatrix}
\begin{pmatrix}
1 & 0 \\
0 & 1
\end{pmatrix}
\begin{pmatrix}
x \\
y
\end{pmatrix}.
$$
I dette tilfellet har vi at $$\frac{\partial f }{\partial x}=2x,\qquad \frac{\partial f }{\partial y}=2y.$$
Dermed er punktet $(0,0)$ det eneste kritiske punktet.

I dette tilfellet er $$\frac{\partial^2 f }{\partial x\partial y}=0$$ og $$\frac{\partial^2 f}{\partial x^2}=\frac{\partial^2 f}{\partial y^2}=2>0.$$
Dermed er vi i tilfelle 2. hvor $A$ og $B$ er positiv, og funksjonen har et lokalt minimum i punktet $(0,0)$.

In [None]:
# Bestemmer at vi skal plotte i 3d, samt størelsen på plottet
fig, ax = plt.subplots(figsize=(15, 15), subplot_kw={"projection": "3d"})

# Lager et rutenett med 50x50 punkter på kvadratet [-3, 3]x[-3, 3]
x, y = np.meshgrid(np.linspace(-3, 3, 50), np.linspace(-3, 3, 50))

# Lager funksjonsverdiene
z1 = x**2 + y**2

# Lager selve overflateplottet
ax.plot_surface(x, y, z1)

## 3. Sadelpunkt

Funksjonen $f(x,y) = x^2 - y^2$ er avbildet under, og har et sadelpunkt i punktet $(0,0)$. Legg merke til at om vi går i en rett linje langs $x$-aksen ser det ut som et minimum, mens langs $y$-aksen ser det ut som et maksimum. Dette gjør at funksjonen ser ut som en "sadel" rundt punktet og derav navnet "sadelpunkt". Alternativt kunne vi ha skrevet funksjonen som

$$
f(\vec{x}) = 
\begin{pmatrix}
x &y 
\end{pmatrix}
\begin{pmatrix}
1 & 0 \\
0 & -1
\end{pmatrix}
\begin{pmatrix}
x \\
y
\end{pmatrix}.
$$
I dette tilfellet har vi at $$\frac{\partial f }{\partial x}=2x,\qquad \frac{\partial f }{\partial y}=-2y.$$
Dermed er igjen punktet $(0,0)$ det eneste kritiske punktet.

I dette tilfellet er $$\frac{\partial^2 f }{\partial x\partial y}=0$$ og $$\frac{\partial^2 f}{\partial x^2}=2>0, \qquad \frac{\partial^2 f}{\partial y^2}=-2<0.$$
Dermed er vi i tilfelle 3. hvor $A$ og $B$ har forskjellig fortegn, og funksjonen har et sadelpunkt i $(0,0)$.

In [None]:
# Bestemmer at vi skal plotte i 3d, samt størelsen på plottet
fig, ax = plt.subplots(figsize=(15, 15), subplot_kw={"projection": "3d"})

# Lager et rutenett med 50x50 punkter på kvadratet [-3, 3]x[-3, 3]
x, y = np.meshgrid(np.linspace(-3, 3, 50), np.linspace(-3, 3, 50))

# Lager funksjonsverdiene
z3 = x**2 - y**2

# Lager selve overflateplottet
ax.plot_surface(x, y, z3)

### Andre deriverte lik null/eksisterer ikke

Som nevnt, gir ikke andrederivertstesten noe informasjon når $A$ eller $B$ er null (eller ikke eksisterer).

Vi kan ikke utelukke at vi fortsatt har et kritisk punkt av en av de tre typene over. Et eksempel er funksjonen $f(x,y) = x^4 + y^4$, som har et minimum i origo. Her er også hessematrisen lik null.

Derimot vil funksjonen $g(x,y) = x^3 + y^3$, ha et kritisk punkt i origo som er verken et lokalt maksimum eller minimum. Vi har plottet funksjonen under.


In [None]:
# Bestemmer at vi skal plotte i 3d, samt størelsen på plottet
fig, ax = plt.subplots(figsize=(15, 15), subplot_kw={"projection": "3d"})

# Lager et rutenett med 50x50 punkter på kvadratet [-3, 3]x[-3, 3]
x, y = np.meshgrid(np.linspace(-3, 3, 50), np.linspace(-3, 3, 50))

# Lager funksjonsverdiene
z4 = x**3 + y**3

# Lager selve overflateplottet
ax.plot_surface(x, y, z4)

### Eksempel 1 (fortsettelse)

La oss gå tilbake til eksempelet $f(x,y) = \sin(x) + \cos(y)$.

Som vi har vist er
$$
\frac{\partial f}{\partial x}(x,y) = \cos(x), \quad \frac{\partial f}{\partial y}(x,y) = -\sin(y)
$$

Da har vi kritiske punkter der $\cos(x) = 0$ og $-\sin(y)=0$. Med andre ord har vi uendelig mange løsninger $(x,y)$, hvor $$x=
\ldots,-\frac{\pi}{2},\frac{\pi}{2}, \frac{3\pi}{2}, \ldots = \frac{m\pi + 1}{2}$$ og $$y=\ldots,-\pi, 0, \pi, 2\pi, \ldots = n\pi.$$ 

De andre deriverte er
$$
\frac{\partial^2 f}{\partial x^2}(x,y) = -\sin(x), \quad
\frac{\partial^2 f}{\partial y^2}(x,y) = -\cos(y), \quad
\frac{\partial^2 f}{\partial x\partial y}(x,y) = 0,
$$

slik at Hessematrisa er diagonal. Vi beregner

$$
\frac{\partial^2 f}{\partial x^2}\left(\frac{m\pi + 1}{2},n\pi \right) = -\sin\left(\frac{m\pi + 1}{2}\right) = (-1)^m, \quad
\frac{\partial^2 f}{\partial y^2}\left(\frac{m\pi + 1}{2},n\pi\right) = -\cos(n\pi)=(-1)^{n+1}
$$ 

Dermed får kritiske punkter av alle de tre typene:

1. Maks når $m$ er odde og $n$ er jevn
2. Min når $m$ er jevn og $n$ er odde
3. Sadel om $m$ og $n$ er begge odde eller begge jevn.

For eksempel, har vi et makspunkt ved $(x,y) = (\frac{\pi + 1}{2},0)$, siden det tilsvarer $m=1$ og $n=0$.