# Lecture 26 - Oppsummering av IN1910
Programmering for naturvitenskapelige anvendelser

## Mål med IN1910

* Lære programmeringsverktøy som brukes til innenfor naturvitenskap
    - Git + GitHub
    - Python
    - C++

* Lære god praksis for hvordan man jobber med programmeringsprosjekter
    - Dokumentasjon av kode
    - Testing
    - Kodestil
    - Optimaliseringsteknikker

## Git

* Versjonskontrollsystem
* Gjør det enkelt å lagre historien til et programmeringsprosjekt
* Vi kan gå tilbake til tidligere versjoner
* Vi kan lage grener (branches) hvor man kan jobbe med utvidelser
* Man kan "enkelt" jobbe flere sammen på samme kode via GitHub

## Git - workflow

* Gå på github og lag et nytt repo

* Klon repoet på din lokale maskin
    - `git clone url`

* Start å jobbe med filer i repoet og legg til filer i repoet
    - `git add file.py`

* Commit filene til repoet - skriv en beskrivende melding av hva som er gjort
    - `git commit -m "Added file.py"`

* Fortsett å jobbe med koden. Sjekk hvilke filer som er endret og hvilke nye filer vi har
    - `git status`

* Sjekk forskjellen på en fil fra forrige commit
    - `git diff file.py`

* Push dine endringer til github
    - `git push`

* Hent endringer fra (partneren din) github
    - `git pull`

### Alle seriøse utviklere bruker et versjonskontrollsystem

Og Git er uten tvil det som er mest brukt

### Spørsmål om git

- Hva er Git og hvorfor er Git nyttig?
- Kan du forklare de vanligste Git-kommandoene du har brukt?
    - Du bør kunne add, commit, push og pull.
- Hva er en pull request?
- Hva er en Git gren (engelsk: branch)?
- Hva er formålet med en .gitignore-fil?
- Hvordan oppstår Git-konflikter?
- Hva er en Git commit-melding og hvorfor er de viktige?

## Hvordan skrive pålitelig kode?

Skrive assert statements som sjekker at koden oppfører seg som forventen

In [4]:
class Sphere:
    def __init__(self, radius):
        assert isinstance(radius, (int, float)), "Radius has to be a scalar"
        assert radius >= 0, "Radius cannot be negative."
        self.radius = radius
        
# s = Sphere("1")
# s = Sphere(-2)

### Heve exceptions

In [5]:
class Sphere:
    def __init__(self, radius):
        if not isinstance(radius, (float, int)):
            msg = f"Expected radius to be of type 'float' or 'int', got {type(radius)}"
            raise TypeError(msg)
        if radius < 0:
            msg = f"Radius cannot be negative, got radius = {radius}"
            raise ValueError(msg)
        self.radius = radius
        
# s = Sphere("1")
# s = Sphere(-2)

### Håndtere excepetions

In [6]:
for radius in ['Hello', -1, 1]:
    msg = f"Radius = {radius} raised "
    try:
        s = Sphere(radius)
    except ValueError as ex:
        msg += "ValueError"
        print(ex)
    except TypeError as ex:
        msg += "TypeError"
        print(ex)
    else:
        msg += "no exception"
    finally:
        print(msg + "\n")

Expected radius to be of type 'float' or 'int', got <class 'str'>
Radius = Hello raised TypeError

Radius cannot be negative, got radius = -1
Radius = -1 raised ValueError

Radius = 1 raised no exception



### Lage egne exceptions

In [2]:
class NegativeRadiusError(ValueError):
    pass


class Sphere:
    def __init__(self, radius):
        if not isinstance(radius, (float, int)):
            msg = f"Expected radius to be of type 'float' or 'int', got {type(radius)}"
            raise TypeError(msg)
        if radius < 0:
            msg = f"Radius cannot be negative, got radius = {radius}"
            raise NegativeRadiusError(msg)
        self.radius = radius
        
try:
    Sphere(-1)
except NegativeRadiusError:  # or ValueError
    print("Radius is negative")

Radius is negative


## Testing

Hvorfor bør man skrive tester?


* Du blir mer produktiv fordi du ikke trenger å bruke tid på å teste manuelt


* Du blir mer kreativ fordi du ikke trenger å tenke på at endrigene du gjør vil ødelegge kritisk funsjonalitet


* Tester er god dokumentasjon på hvordan man skal bruke koden du skriver.

* Jeg sover bedre om natten dersom jeg vet at koden jeg har skrevet (og andre er avhengig av) fungerer.

### Test-dreven utvikling (TDD)

* Du ønsker å implemetere en ny funksjonalitet
* Skriv en test som tester funksjonaliteten du ønsker å implementere
* Implementer det ønskede funksjonaliteten
* Sørg for at testen passerer

## `pytest` er et testing-rammeverk som finner og kjører alle tester automatisk

* Du kan bare skrive `pytest` i terminalen og den vil da kjøre alle filer som starter med `test`.
* I alle disse filene vil pytest kjøre alle funskjoner som starter med `test`

In [2]:

def my_fast_sin_function(x):
    """Computes sin(x) really fast!
    
    Parameters
    ----------
    x : float
        Value that you want to compute sin of
    
    Returns
    -------
    float
        sin(x)
        
    Note
    ----
    This only uses the first two terms of the taylor
    expansion around 0
    """
    if isinstance(x, str):
        raise TypeError("Cannot compute sinus of string")

    return x - x**3 / 6


In [3]:
import math

tol = 1e-12

def test_my_fast_sin_function():
    assert abs(math.sin(0) - my_fast_sin_function(0)) < tol  # eller math.isclose
    
test_my_fast_sin_function()

Hvordan kan jeg ikke skrive 
```python
assert math.sin(0) == my_fast_sin_function(0)
```

In [4]:
0.1 + 0.2 == 0.3

False

### Vi må teste ulike input til funksjonen vår

- parameteriserte tester



In [7]:
!python -m pip install ipython_pytest
%load_ext ipython_pytest



In [10]:
%%pytest -v

import pytest
import math
import numpy as np

def my_fast_sin_function(x):
    return x - x**3 / 6

tol = 1e-3

@pytest.mark.parametrize("x", np.linspace(-np.pi / 6, np.pi / 6, 5))
def test_my_fast_sin_function(x):
    assert abs(math.sin(x) - my_fast_sin_function(x)) < tol
    


platform darwin -- Python 3.10.4, pytest-7.1.2, pluggy-1.0.0 -- /Users/finsberg/local/src/IN1910/IN1910_dev/venv/bin/python
cachedir: .pytest_cache
rootdir: /private/var/folders/l4/fpn419yn0wd534g_95tm330r0000gn/T/tmppjkmh9uz
plugins: anyio-3.6.1
collecting ... collected 5 items

_ipytesttmp.py::test_my_fast_sin_function[-0.5235987755982988] PASSED    [ 20%]
_ipytesttmp.py::test_my_fast_sin_function[-0.2617993877991494] PASSED    [ 40%]
_ipytesttmp.py::test_my_fast_sin_function[0.0] PASSED                    [ 60%]
_ipytesttmp.py::test_my_fast_sin_function[0.26179938779914946] PASSED    [ 80%]
_ipytesttmp.py::test_my_fast_sin_function[0.5235987755982988] PASSED     [100%]



### Teste at funksjonen kaster exception

In [11]:
%%pytest -v
import pytest

def my_fast_sin_function(x):
    return x - x**3 / 6

def test_raises_TypeError_for_string_Arguments():
    with pytest.raises(TypeError):
        my_fast_sin_function("Hello")

platform darwin -- Python 3.10.4, pytest-7.1.2, pluggy-1.0.0 -- /Users/finsberg/local/src/IN1910/IN1910_dev/venv/bin/python
cachedir: .pytest_cache
rootdir: /private/var/folders/l4/fpn419yn0wd534g_95tm330r0000gn/T/tmp5q_cayrv
plugins: anyio-3.6.1
collecting ... collected 1 item

_ipytesttmp.py::test_raises_TypeError_for_string_Arguments PASSED        [100%]



### Automatisk testing hver gang man pusher til github

Sett opp GitHub actions til å kjøre testene dine!

https://github.com/finsberg/caesar_cipher_in1910

### Docstrings

In [7]:
def my_fast_sin_function(x):
    """Computes sin(x) really fast!
    
    Parameters
    ----------
    x : float
        Value that you want to compute
        sin of
    
    Returns
    -------
    float
        sin(x)
        
    Raises
    ------
    TypeError:
        For string inputs
        
    Note
    ----
    This only uses the first two terms of the taylor
    expansion around 0
    """
    if isinstance(x, str):
        raise TypeError("Cannot compute sinus of string")

    return x - x**3 / 6

### Verktøy for å skrive docstrings

[VSCode Python Docstring Generator](https://marketplace.visualstudio.com/items?itemName=njpwerner.autodocstring)
![_](https://github.com/NilsJPWerner/autoDocstring/raw/master/images/demo.gif)

### Hvorfor er det lurt å skrive docstrings på denne måten?

Man kan bruke det til å automatisk generere dokumentasjon <https://github.com/finsberg/vector3D>

Dette er også slik alle store bibliotek gjør det (f.eks `numpy`)


### Verktøy for kodestil

- `flake8` : Gir deg beskjed om hvilke linjer som ikke følger PEP8
- `black`: Autoformatterer koden din


Hvorfor er det lurt å bruke verktøy som `black` når man jobber med andre på et repo?

### Spørsmål

- Hvorfor bør man teste koden?
- Hva er en enhetstest?
- Hva er test-dreven utvikling?
- Si du har en funksjon sinus(x: float) -> float:
    - Hvordan ville du testet funksjonen?
    - Hvordan ville du håndtert brukerfeil?
- Hva er parametriserte tester?
- Hva må man passe på når man tester at to tall er like?
- Er det forskjell på om vi sammenligner heltall og flyttall?
- Hva legger man i begrepet kodestil?
- Hva menes med dokumentasjon i programmering?

## Objektorientert programmering i python

Hva er et annet navn på `__init__` funksjonen?

In [1]:
class Sphere:
    def __init__(self, radius):
        self.radius = radius
        
s = Sphere(10)

Hva kaller vi `s`?

### `@property`

Hva kaller et objekt som starter med en `@`?

In [3]:
class Sphere:
    def __init__(self, radius):
        self._radius = radius

    @property
    def radius(self):
        return self._radius

    @radius.setter
    def radius(self, r):
        if r < 0:
            raise ValueError("Radius cannot be negative")
        self._radius = r

Hva gjør `@property`?  Hvorfor er dette nyttig?

### Spesielle / magiske metoder

* Metoder som starter med `__`
* `__init__`, `__call__`, `__str__`, `__add__`, `__sub__`, `__mul__`, `__eq__`, ...

In [11]:
class Quadratic:
    def __init__(self, a, b, c):
        self.a = a
        self.b = b
        self.c = c

    def __str__(self):
        return f"{self.a}x^2 + {self.b}x + {self.c}"
        
    def __call__(self, x):
        return self.a * x ** 2 + self.b * x + self.c
f = Quadratic(1, 2, 1)
print(f)
print(f(4))

1x^2 + 2x + 1
25


In [12]:
# Hvordan fikser vi printingen av denne?
print([f])
q = Quadratic(1, 2, 1)
print(q)

[<__main__.Quadratic object at 0x10564b190>]
1x^2 + 2x + 1


### `@classmethod`

* Alternative konstruktører

In [7]:
class Sphere:
    def __init__(self, radius):
        self.radius = radius
    
    @classmethod
    def from_volume(cls, volume):
        radius = (3 * volume / (4 * np.pi)) ** (1 / 3)
        return cls(radius)

### `@staticmethod`

* Funksjoner som ikke avhenger instansen men som hører til klassen
    - Tar ikke self som argument

In [3]:
class ODESolver:
    @staticmethod
    def default_parameters():
        return dict(
            scheme="BackwardEuler", max_dt=0.1, init_dt=0.01, adaptive_stepping=False
        )
    
#ode = ODESolver()
ODESolver.default_parameters()

{'scheme': 'BackwardEuler',
 'max_dt': 0.1,
 'init_dt': 0.01,
 'adaptive_stepping': False}

### Hva er egentlig `self`

In [14]:
class Sphere:
    def __init__(self, radius):
        self.radius = radius
        print("self = ", self)
        
s = Sphere(3)

print("s = ", s)

self =  <__main__.Sphere object at 0x10564aac0>
s =  <__main__.Sphere object at 0x10564aac0>


### Fire pilarer innen OOP

#### Abstraksjon
* "Program to an interface not an implementation"
* Skriv tester først - det får deg til å tenkte over interfacet.
* Lag en abstrakt klasse og bruk type annoteringer

In [16]:
import numpy as np
import typing

class ODEResult(typing.NamedTuple): ...

class ODEModel:
    @property
    def num_states(self) -> int:
        raise NotImplementedError

    def __call__(self, t: float, u: np.ndarray) -> np.ndarray:
        raise NotImplementedError
        
def solve_ode(
    model: ODEModel, u0: np.ndarray, T: float, dt: float, **kwargs
) -> ODEResult: ...


#### Innkapsling (encapsulation)
* Skjul detaljer som ikke er viktige for brukeren. For eksempel gjem bort detaljer om hvordan en ODE løses

In [17]:
def solve_ode(
    model: ODEModel, u0: np.ndarray, T: float, dt: float, **kwargs
) -> ODEResult:
    """Solve an ODE model

    Parameters
    ----------
    model : ODEModel
        The model
    u0 : np.ndarray
        Initial condition
    T : float
        End time
    dt : float
       Time step

    Returns
    -------
    ODEResult
        The results
    """
    if len(u0) != model.num_states:
        raise InvalidInitialConditionError(
            "Invalid initial condition. Expected number of states to "
            f"be {model.num_states}, got {len(u0)}",
        )
    time = np.arange(0, T + dt, dt)
    solution = solve_ivp(model, (0, T), u0, t_eval=time, **kwargs)
    return ODEResult(time=time, solution=solution.y)

Lag private metoder som kun brukes internt i klassen

In [3]:
class Sphere:
    def __init__(self, radius):
        self.radius = radius
    
    @property
    def radius(self):
        return self._radius
    
    @radius.setter
    def radius(self, radius):
        if radius < 0:
            raise ValueError("Radius cannot be negative")
        self._radius = radius
        self._update_area()
        
    @property
    def area(self):
        return self._area

    def _update_area(self):
        # Brukes kun internt i klassen
        self._area = 4 * pi * self.radius**2

#### Polymorfisme
* Ulike implementasjoner for samme metode med ulik input
 

In [None]:
class Dog:
    def speak(self):
        return "Voff"

class Duck:
    def speak(self):
        return "Quack"
    
class Person:
    def speak(self):
        return "Hello"
    
    
x1 = Person(); x2 = Duck(); x3 = Dog()
for xi in [x1, x2, x3]:
    print(xi.speak())

In [19]:
class PendulumResults: ...

def plot_energy(results: PendulumResults, filename: str | None = None) -> None:

    fig, ax = plt.subplots()
    ax.plot(results.time, results.potential_energy, label="potential energy")
    ax.plot(results.time, results.kinetic_energy, label="kinetic energy")
    ax.plot(results.time, results.total_energy, label="total energy")
    ax.legend()
    ax.grid()
    ax.set_xlabel("Time")
    ax.set_ylabel("Energy")
    if filename is not None:
        fig.savefig(filename)
    else:
        plt.show()

#### Arv

In [1]:
class Parent:
    pass

class Child(Parent):
    pass

#### Kalle på metoder i foreldre-klassen
```python
class Child(Parent):
    def method(self):
        Parent.method(self)
```

eller ved å bruke `super`

```python
class Child(Parent):
    def method(self):
        super().method()
```

Hva er forskjellen?

`super` vil bruke "method resolution order" til å finne ut hvilken foreldre man skal kalle på

In [2]:
class GrandParent:
    def method():
        pass
    
class Parent(GrandParent):
    pass

class Child(Parent):
    def method():
        super().method()
        
for m in Child.mro():
    print(m)

<class '__main__.Child'>
<class '__main__.Parent'>
<class '__main__.GrandParent'>
<class 'object'>


In [20]:
class Pendulum: ...

class DampenedPendulum(Pendulum):
    def __init__(self, B, L=1, g=9.81):
        super().__init__(L, g)
        self.B = B

    def __call__(self, t: float, u: np.ndarray) -> np.ndarray:
        theta, omega = u
        return np.array([omega, -self.g / self.L * np.sin(theta) - self.B * omega])


#### Når skal man bruke arv?


Når vi har ett "er-en-forhold" ("is-a-relationship") 

* En hund er ett dyr

```python
class Animal:
    pass

class Dog(Animal):
    pass
```

* En bil har en motor - vi bruker sammensetning, ikke arv

```python
class Engine:
    pass

class Car:
    def __init__(self, engine):
        self.engine = engine
        
engine = Engine()
car = Car(engine=engine)
```

### Design patterns

- Erfarne utvikler at samlet oppskrifter på hvordan løser ulike problemer
- Oppskrifter som viser seg å være gode løsninger blir ofte kalt design patterns

Eksempel på desing pattern:
* Favor object composition over class inheritance
    - Sjekk ut `ModelVector` fra Lecture 7.
  
https://pages.github.uio.no/IN1910/IN1910_H22/docs/lectures/python/oop_concepts.html#composition-over-inheritance

### Namespace

- Hva er et namespace (navnerom)

Bruk

```python
import math
math.sin(x)
```
istedenfor

```python
from math import *
def sin(a):
    print("Hello")
sin(x)
```

Hvorfor?

### Funksjonell programmering

Funksjoner kan sendes inn som argumenter til andre funksjoner. Funksjoner som tar funksjoner som argumenter kalles høyere ordens funksjoner (higher order functions)

In [23]:
def square(x):
    return x * x


def map_func_over_list(func, lst):
    return [func(x) for x in lst]

y = [1, 2, 3]
z = map_func_over_list(square, y)

print(f"{y = }")
print(f"{z = }")

y = [1, 2, 3]
z = [1, 4, 9]


Rene funksjoner er funksjoner som alltid gir samme svar for samme input

In [25]:
x = 2
y = square(x)
z = square(x)

Rene funksjoner er enkle å teste og vi kan bruke memoisering

In [32]:
cache = {}
def square(x):
    try:
        y = cache[x]
        print("Using cache")
    except KeyError:
        print("Computing ...")
        y = x * x
        cache[x] = y
    finally:
        return y
    
y = square(x)
z = square(x)

Computing ...
Using cache


Vi kan også definere funksjoner inne i andre funksjoner

In [31]:
def throw_fun(v0):
    g = 9.81

    def height(t):
        return v0 * t - 0.5 * g * t**2

    return height


throw2 = throw_fun(5.0)
throw2(1)

0.09499999999999975

## C++

```C++
int a = 1;
float b = 1.0;
double c = 1.0;
```


<table style="border: 1px solid black; font-size:14pt; width: 90%;">
    <thead>
        <tr>
            <th colspan="4" style="text-align: center; border: 1px solid black;">a (int)</th>
            <th colspan="4" style="text-align: center; border: 1px solid black;">b (float)</th>
            <th colspan="8" style="text-align: center; border: 1px solid black;">c (double)</th>
        </tr>
    </thead>
    <tbody>
        <tr>
            <td style="border: 1px solid black;" >0001</td>
            <td style="border: 1px solid black;">0002</td>
            <td style="border: 1px solid black;">0003</td>
            <td style="border: 1px solid black;">0004</td>
            <td style="border: 1px solid black;" >0005</td>
            <td style="border: 1px solid black;">0006</td>
            <td style="border: 1px solid black;">0007</td>
            <td style="border: 1px solid black;">0008</td>
            <td style="border: 1px solid black;" >0009</td>
            <td style="border: 1px solid black;">0010</td>
            <td style="border: 1px solid black;">0011</td>
            <td style="border: 1px solid black;">0012</td>
            <td style="border: 1px solid black;" >0013</td>
            <td style="border: 1px solid black;">0014</td>
            <td style="border: 1px solid black;">0015</td>
            <td style="border: 1px solid black;">0016</td>
        </tr>
    </tbody>
</table>


In [22]:
%%HTML
<style>
td, tr {
  font-size: 30px
}
</style>


| Syntax    | Meaning               |
|--------	|---------------------	|
| `int i`  	| heltallsvariabel    	|
| `int &r` 	| referanse variabel  	|
| `int *p` 	| peker variable    	|
| `&i`     	| adressen til `i`  |
| `*p`     	| innholdet på adressen (dereferering) |

### Kalling av funksjoner i C++

Call by value
```C++
void add_one(double x) {
    x += 1;
}
```

Call by referece
```C++
void add_one(double &x) {
    x += 1;
}
```

Call by pointer
```C++
void add_one(double *x) {
    *x += 1;
}
```

Merk at vi må bruke dereferering for å endre verdien.

Er det noen fordel med å bruke "Call by reference" istedenfor "Call by value"?

### Hvordan er dette python? 

In [11]:
def add_one(x):
    x += 1
    
y = 1
add_one(y)
print(y)

1


### Hva med denne?

In [12]:
def add_one(x):
    x += [1]
    
y = [1]
add_one(y)
print(y)

[1, 1]


I python er et viktigere spørmål om du bruker en "mutable" (foranderlig) eller "immutable" (fast) datastruktur. Lister er mutable

In [10]:
# Det gir samme resultat
y = [1]
x = y
x += [1]
print(y)

[1, 1]


In [13]:
# Heltall er immutable
y = 1
x = y
x += 1
print(y)

1


### Objektorientert programmering i C++

```C++
struct Point {
    double x;
    double y;
};


class Circle {
private:
    double radius = 1.0;
    Point center{0.0, 0.0};

public:
    Circle() {}
};
```

For `struct` er alle variabler `public` by default mens for `class` er de `private`

### Vi kan også ha flere konstruktører

```C++

class Circle {
private:
    double radius = 1.0;
    Point center{0.0, 0.0};

public:
    Circle() {}
    Circle(double r): radius(r) {}
};
```
Hva kalles det når vi har flere funksjoner som heter det samme men kan ta ulik input?

### Dynamisk minne allokering

Brukes dersom vi ønsker at variabler skal leve utenfor sitt scope eller dersom du ikke vet størrelsen som må allokeres før programmet kjører

```C++
class Array {
public:
	int *data;
	int size;

	Array(int n) {
		data = new int[n];
		size = n;
		for (int i=0; i<size; i++) {
			data[i] = 0;
		}
	}
};
```

### Da må vi også huske å deallokere minnet

```C++
~ArrayList() {
    delete[] data;
}
```

Hva kan skje om vi glemmer å deallokere minnet?

### Smarte pekere er å foretrekke over råe pekere

```C++
#include <iostream>

int main()
{
    int *p = new int{42};
    std::cout << *p << "\n";
    delete p;
}
```
vs
```C++
#include <iostream>
#include <memory>

int main()
{
    std::unique_ptr<int> p = std::make_unique<int>(42);
    std::cout << *p << "\n";
}
```

## Datastrukturer for lister

* Dynamiske array
    + En liste med en gitt kapasitet blir allokert
    + Når størrelsen overgår kapasiteten så kopieres listen til et nytt sted og kapasiteten økes
    
* Lenkede lister
    + Elementer i lista er noder som inneholder en verdi og en peker til neste element i lista

## Analogier - legge til elementer

**Dynamisk array** - Stabel av bøker

![_](figures/stack_of_books.jpg)

**Lenkede lister** - sykkelkjede

![_](figures/bike_chain.jpg)

### Stor O notasjon

I hvor stor grad blir koden tregere når størrelsen på dataene øker.

Hvis jeg dobler størrelsen på input, vil det gå
- like tregt : konstant kjøretid  $\mathcal{O}(1)$
- dobbelt så tregt: lineær kjøretid $\mathcal{O}(N)$
- 4 ganger så tregt: kvadratisk kjøretid $\mathcal{O}(N^2)$

"How your code slows when your data grows" - Ned Batchelder

Vi teller antall opersjoner og kaster bort lavere ordens ledd

### Kjøretidsanalyse

| Operation           | Array            | Dynamic Array      | Linked List      |
|---------------------|------------------|--------------------|------------------|
| Indexing            | $\mathcal{O}(1)$ | $\mathcal{O}(1)$   | $\mathcal{O}(n)$ | 
| Insert at beginning | -                | $\mathcal{O}(n)$   | $\mathcal{O}(1)$ | 
| Insert at end       | -                | $\mathcal{O}(1)^*$ | $\mathcal{O}(1)$ | 
| Insert in middle    | -                | $\mathcal{O}(n)$   | $\mathcal{O}(n)^{**}$ | 
| Search (contains)   | $\mathcal{O}(n)$ | $\mathcal{O}(n)$   | $\mathcal{O}(n)$  | 




\*) Amortized/averaged cost \*\*) Insertion itself is $\mathcal{O}(1)$, but indexing into the list is $\mathcal{O}(n)$.

## Eksempler på vitenskapelige anvendelser

* Generering av pseudotilfeldige tall i python og C++
    - Hva er hensikten med et "seed"? 

* Bruk av tilfeldige tall i stokastiske simuleringer
    - Random walk
    - Markov chains

### Hvordan kan vi bruke stokastiske simuleringer?

Husker dere Monty Hall problemet?


Vi kan bruke stokastiske simuleringer til å formulere problemer som vi ikke kan finne analytiske løsninger på. Vi kan deretter simulere velding mange realiseringer og se hva som blir sansynligheten for at noe skjer.

## Anvendelser innenfor data science

* Hvordan kan vi bruke `pandas` til å jobbe med større datamengder
    - Lese data fra fil (f.eks covid-19 data eller bysykler)
    - Lese data fra python dictionary (f.eks flymodeller)


* Plotting med `matplotlib`

* Interaktiv visualisering med `streamlit`

## Optimalisering av kode

1. Sørg for at programmet fungerer og gir rikitg svar
    - Skriv tester
2. Refakturer koden
    - Skriv tester for corner cases
    - Skriv dokumentasjon
    - Gjør koden mer lesbar
    - Omstrukturer koden
    
3. Vurder nøye om du trenger å optimalisere!

4. Bruk en profiler for å finne flaskehalsene
5. Konsentrer deg om å utbedre flaskehalsene
6. Ha et benchmark som du kan bruke til å teste ytelsen på den nye implementering

### Teknikker for optimalisering

#### Mixed programming

* Numpy vektorisering
* mypyc
* Numba
* cppyy
* C / C++ utvidelse og bindinger med `ctypes`

#### Paralell programmering

* Multiprocessing for CPU bounded problemer
* Multithreading for IO bounded problemer
* Dask
* Numba
* C++ OpenMP

## Prosjekter

Projsektene er meget relevante for eksamen. Du må kunne svare på alle oppgaver fra prosjektet. Det hjelper ikke å si at partnerer din og du delte oppgavene mellom dere. Da vil du få en ny sjanse i januar

- Prosjekt 0 - Testing og git
- Prosjekt 1 - Dobbelpendel
- Prosjekt 2 - Lister (C++)
- Prosjekt 3 - Kaosspill

Sjekk https://www.uio.no/studier/emner/matnat/ifi/IN1910/h22/eksamen/sporsmal-til-eksamen.html for eksempler på spørsmål vi kan stille

## Gode råd

1. Skriv kode for mennesker, ikke for maskiner
    - Fokuser heller på å gjøre koden din lett å forstå enn å gjøre den mest mulig effektiv
    - Husk at tiden vi bruker å lese/skrive kode ofte er mer kritisk enn den tiden vi bruker på kjøre den (YouTube vs Google)
    - En person klarer i snitt å holde 4 $\pm$ 2 forksjellige tanker på en gang
    - Hver funksjon bør kun gjøre en ting
    - Gi meningsfulle navn på variabler
    - Bruk et kodeformatterringsprogramm (f.eks `black`)
    - Dokumenter koden
    - Bruk tid på å bli kjent med editoren din (det kan spare deg for mye tid)
   

2. La datamakskinen gjøre jobben
    - "Automate the boring stuff"
    - Hvis du gjør samme prosedyren mange ganger, se om den kan automatiseres
    - Lagre komandoer som du bruker ofte på ett sted (cheat sheets)
    - `gist` på github

3. Gjør små endringer når du utvikler
    - Bruk versjons kontrol system
    - Commit ofte - da er det lett å gå tilbake til en versjon som funker
    - Skriv tester og test før du commiter (test-driven-development)

4. Do not repeat yourself (DRY)
    - Ikke kopier kode fra ett sted til ett annet - da må du endre koden to steder dersom du må endre den
    - Gjenbruk kode
    - Lag egne moduler / bibliotek som du importerer

5. Planlegg for feil
    - Skriv `assert` statements
    - Bruk et ordentlig testing rammeverk som `pytest`
    - Finner du en bug - skriv en test som sørger for at den bugen aldri skjer igjen

6. Optimaliser koden kun hvis du virklelig trenger det
    - Bruk en profiler for å finne flaskehalser

7. Lær av hverandre og lær å finne svaret på google / stackoverflow!
    - Kopierer du kode fra nettet i en oppgave, husk å oppgi kilde

## Veien videre

* IN2010 — Algorithms and Data Structures
    - Videreføring av det vi drev med i C++
    
* IN3110/IN4110 — Higher Level Programming
    - Mye av det samme som dette kurset + bash + pakking av prosjekter + Cython + webutvikling i python + machine learning
* IN3200 — High-Performance Computing and Numerical Projects
    - Mer om å skrive effektiv og parallell kode 
* IN2070 – Digital image analysis
    - Lære verktøy for analysering av bilder
* IN2040 – Funksjonell programmering
    - Programmering i et funksjonelt programmeringsspråk
* FYS3150 – Computational Physics
    - C++ med fokus på fysikk
* IN4200 – High-Performance Computing and Numerical Projects
    - Lære grunnleggende konseptene innen parallell programmering og høy-ytelses databehandling
* FYS-STK3155 – Anvendt dataanalyse og maskinlæring
    - Innføring i sentrale algoritmer og metoder, som er viktige for studier av statistisk dataanalyse og maskinlæring
* IN3050 / IN4050 – Introduksjon til kunstig intelligens og maskinlæring
    - Grunnleggende introduksjon til maskinlæring (ML) og kunstig intelligens (AI) - anbefaler IN2010.

## Spørretime 

* Tirsdag 07.12 klokken 12.15 i OJD Simula
* Det blir ikke gjort opptak av denne

## Lykke til på eksamen!