Before you turn this problem in, make sure everything runs as expected. First, **restart the kernel** (in the menubar, select Kernel$\rightarrow$Restart) and then **run all cells** (in the menubar, select Cell$\rightarrow$Run All).

Make sure you fill in any place that says `YOUR CODE HERE` or "YOUR ANSWER HERE", as well as your name and collaborators below:

In [None]:
NAME = ""
COLLABORATORS = ""

---

# Kodlabb - Algoritmen *gradient descent*

## Förkunskaper
- Matematik 3
- Grundkunskap - Python
- Grundkunskap - Jupyter Notebooks

## Introduktion
En dator lyder instruktioner till punkt och pricka. Men vad händer om en dator ombeds att träna upp en förmåga att ta egna beslut? Det är just det som maskininlärning (ML) och artificiell intelligens (AI) handlar om. AI tränas ofta genom att minimera någon form av fel den gör och *gradient descent* (GD) som vi kommer undersöka och implementera är en vanlig algoritm för detta.

[![](https://img.youtube.com/vi/jAu1ZsTCA64/maxresdefault.jpg)](https://www.youtube.com/watch?v=jAu1ZsTCA64)
*YouTube: En artificiell intelligens har besegrat Dota2 proffs i dueller (Augusti 2017).*

### Studiestund 1

Innan vi kommer igång behöver vi utvidga våra kunskaper från Matte 3 och lära oss om *funktioner av flera variabler*, *partiell derivata* och *gradienter*.

####  Funktioner av flera variabler, partiell derivata och gradienter

En *definitionsmängd* eller en *domän* är inom matematiken mängden av alla möjliga argument eller invärden för en funktion. Funktioner av flera variabler såsom $g$ och $h$ nedan har flerdimensionella definitionsmängder.

\begin{array}{rl rl}
f(x)     &=x^2         & f(2)     &=4  \\
g(x,y)   &=x^2+y^2     & f(2,3)   &=13 \\
h(x,y,z) &=x^2+y^2+z^2 & f(2,3,4) &=29 \\
\end{array}

Ibland är det bra att veta hur funktionsvärdet förändras om vi förflyttar oss i definitionsmängden. För varje riktning vi kan röra oss inom definitionsmängden kan vi beräkna en *partiell derivata*. En *gradient* är en vektor vars komponenter består av de partiella derivatorna. Titta nu på följande film och besvara därefter några kontrollfrågor.

[![](https://img.youtube.com/vi/GkB4vW16QHI/maxresdefault.jpg)](https://www.youtube.com/watch?v=GkB4vW16QHI)
*YouTube: Du får lära dig om [partiell derivata](https://sv.wikipedia.org/wiki/Partiell_derivata) som beteckas $\frac{\partial f}{\partial x}$ och $\frac{\partial f}{\partial y}$ och om [gradienter](https://sv.wikipedia.org/wiki/Gradient) som betecknas $\nabla f$.*

### Fråga 1
I bilden ovan ser vi en funktion $z=f(x, y)$ representerad som en yta. Föreställ dig att du är en myra på den ytan.
- a) Beskriv vart du skulle gå om du följde gradienten och stod i en backe.
- b) Beskriv vart du skulle gå om du följde gradienten och stod på en kulles topp.
- c) Beskriv vad det engelska ordet *descent* betyder och gissa hur algoritmen *gradient descent* fungerar.

YOUR ANSWER HERE

## Implementering
Nu ska vi implementera *gradient descent* (GD). Algoritmen kommer hjälpa oss att hitta funktionens minimipunkter.

### Kodkomplettering 1
Du behöver en funktion att testa algoritmen på med ett antal minimipunkter.

Definiera pythonfunktion `f` så att den beter sig precis som den matematiska funktionen $f(x, y)$ nedan. Använd dig av `numpy` bibliotekets funktioner `np.sin`, `np.cos` och `np.exp` tillsammans med Pythons inbyggda operator `**`.

$$f(x, y) = \sin(\,({\frac{x}{2}-2})^2 + (\frac{y}{2}-2)^2\,) \cdot \cos(\,x-y+e^{-y}\,)$$

In [None]:
import numpy as np
from simulation import Sim
sim = Sim()

In [None]:
def f(x, y):
    """En funktion att undersöka som returnerar ett värde för varje input x och y."""
    # YOUR CODE HERE
    raise NotImplementedError()

In [None]:
# TODO: testa
sim.setup_f(f)

In [None]:
sim.run(show_2d=False)

### Kodkomplettering 2
*Gradient descent* bygger på att vi kan promenera antiparallellt (åt andra hållet) till gradienten, och gradienten byggs upp av de partiella derivatorna. Vi kan beräkna den partiella derivatan ungefärligt med ett litet värde på $h$ på följande sätt.

$$\frac{\partial f}{\partial x} \approx \frac{f(x+h, y) - f(x-h, y)}{2h}$$

$$\frac{\partial f}{\partial y} \approx \frac{f(x, y+h) - f(x, y-h)}{2h}$$

Det är ditt uppdrag att komplettera funktionerna nedan som numeriskt beräknar de partiella derivatorna för funktionen `f`.

In [None]:
h = 0.001
def df_dx(x, y):
    """Returns the value of the partial derivative of x for a given """
    # YOUR CODE HERE
    raise NotImplementedError()
def df_dy(x, y):
    # YOUR CODE HERE
    raise NotImplementedError()

In [None]:
# TODO: testa...
sim.setup_grad_f(df_dx, df_dy)

In [None]:
sim.run(show_3d=False)

### Fråga 2

- TODO: Fråga om hur minimipunkterna...
- TODO: Fråga om höjdnivåskurvorna

YOUR ANSWER HERE

### Kodkomplettering 3
TODO: Använd snygg latex och förklara vad funktionen ska göra.
TODO: Förklara hur man gör ett steg i gd och vad gamma innebär, samt tipsa om `np.linalg.norm`

In [None]:
gamma = 0.2
def gradient_descent_step(x, y):
    # YOUR CODE HERE
    raise NotImplementedError()
    return new_x, new_y, step_size

In [None]:
# TODO: testa
sim.setup_gds(gradient_descent_step)

## Resultat
Med en funktion och dess partiella derivata tillgängliga, samt med förmåga att gå ett steg antiparallellt med gradienten, så är vi redo att testköra algoritmen!

In [None]:
starting_points = [(2, 2)]

sim.gd_trails = []
for starting_point in starting_points:
    x, y = starting_point
    gd_trail = np.array([[x, y, f(x,y)]])
    latest_step_length = np.inf

    precision = 0.001
    while latest_step_length > precision and len(gd_trail) <= 100:
        x, y, latest_step_length = gradient_descent_step(x, y)
        gd_trail = np.append(gd_trail, [[x, y, f(x,y)]], axis=0)

    sim.gd_trails.append(gd_trail)
    print('Ran GD from f({:.2f}, {:.2f})={:5.2f} to f({:.2f}, {:.2f})={:5.2f} after {} steps.'.format(*gd_trail[0,:], *gd_trail[-1,:], len(gd_trail)))

sim.run()

## Fråga 3
- TODO: Fråga: 
- TODO: Fråga: Undersök vad som händer med låg och hög step size multiplier.

YOUR ANSWER HERE

## Fortsättning

Har du blivit intresserad av maskinlärning och artificiell intelligens? Här finns lite uppföljningstips.

A.I. Experiments|Machine Learning Recipes|The Math of Intelligence
-|-|-
[![](https://img.youtube.com/vi/oOwfiYnRi5c/0.jpg)](https://www.youtube.com/watch?v=oOwfiYnRi5c&index=1&list=PLOU2XLYxmsIKubpTZNmgNKL6ToSQ1pWmy)|[![](https://img.youtube.com/vi/cKxRvEZd3Mw/0.jpg)](https://www.youtube.com/watch?v=cKxRvEZd3Mw&index=1&list=PLRAcvynLm0SCOJ7Ik3Q58-DTOKgY5h0Ky)|[![](https://img.youtube.com/vi/xRJCOz3AfYY/0.jpg)](https://www.youtube.com/watch?v=xRJCOz3AfYY&index=1&list=PL2-dafEMk2A7mu0bSksCGMJEmeddU_H4D)
*YouTube playlist: Introduktion till möjligheter inom ML.*|*YouTube playlist: Praktiskt hur ML går till.*|*YouTube playlist: Teoretiskt om matematiken i ML.*

Python - Basics|Python - Intermediate|Python - Machine Learning
-|-|-
[![](https://img.youtube.com/vi/IX6mc9l6tY4/0.jpg)](https://pythonprogramming.net/introduction-to-python-programming/)|[![](https://img.youtube.com/vi/YSe9Tu_iNQQ/0.jpg)](https://pythonprogramming.net/introduction-intermediate-python-tutorial/)|[![](https://img.youtube.com/vi/OGxgnH8y2NM/0.jpg)](https://pythonprogramming.net/machine-learning-tutorial-python-introduction/)
*Kurs och YouTube playlist: En grundkurs i Python.*|*Kurs och YouTube playlist: En fortsättningskurs i Python.*|*Kurs och YouTube playlist: En grundkurs i ML.*