# Tilfeldige Tall

**Bruk av *stokastiske* simuleringer.** Noen eksempler:
- Reaksjonskinetikk
- Diffusjon av væsker og gasser
- Bevegelser til væske- og gasspartikler 
- Addisjonspolymerisasjon
- Klimamodellering
- Risikovurderinger

Tilfeldige tall er også en sentral del av finans, kryptografi, IT-sikkerhet, samt spillutvikling.

**Til dette må vi kunne genrere *tilfeldige tall*.**

## Tilfeldighetsgeneratorer

> Engelsk: *Random Number Generators* (RNG).

Disse skal generere *tilfeldige* tall.

**Hva er egentlig tilfeldige tall?**

Forslag:
* Utfallet skal være *uforutsigbart*
* En rekke tilfeldige tall må oppfylle krav til *statistisk tilfeldighet*

### Mekaniske tilfeldighetsgeneratorer 

Noen eksempler:
- Bok fra 1955: A Million Random Digits with 100,000 Normal Deviates
- [random.org](https://www.random.org/) 

**Hvordan kan man generere tilfeldige tall?**

Noen forslag:
- Kaste terninger
- Stokke om på kort
- Ruletthjul
- Bruke støy fra målinger ([random.org](https://www.random.org/) bruker tall fra atmosfærisk støy)

I informatikken kalles slike RNGs gjerne for *ekte* tilfeldighet.

**Ekte tilfeldighet i programmering:** Kan importeres inn i programmet.

Ulemper:
- Gjerne teknisk komplisert
- Ofte tregt å generere tallene
- Ofte tregt å lese inn tallene

Alternativet er å la datamaskinen generere tilfeldige tall selv. Dette er i praksis mye raskere.

### Pseudo-tilfeldig tallgeneratorer

> Engelsk: Pseudo-Random Number Generators (pRNG)

Datamaskinen kan generere *pseudotilfeldiget*.

En datamaskin er *deterministisk*, og kan derfor ikke generere *ekte* tilfeldighet.

##  Pseudotilfeldighet 

Gitt et tall $x_n$, vil en pRNG produsere det *neste* tallet i rekken, $x_{n+1}$.

> **pRNG($x_{n}$) $\to$ $x_{n + 1}$**,

hvor $x_0$ kalles *seed*.

**En pseudotilfeldig tallrekke er:**

- Deterministisk

- Diskret

Kontinuerlige rekker kan ikke representeres via flyttall, som alltid vil ha en gitt *presisjon*.

### Statstisk tilfeldighet

Si at $\rho(x)$ gir oss *sannsynlighetsfordeling*. Den totale sannsynligheten må da bli:

$$
    \int_{-\infty}^{\infty} \rho(x) \mathrm{dx} = 1 .
$$


Hvis vi kun ser på et begrenset intervall $x \in [x_{min}, x_{max}]$, så har vi at 

$$
    \int_{x_{min}}^{x_{max}} \rho(x) \mathrm{dx} = 1 .
$$


Ved uniform fordeling er sannsynlighetsfordelingen konstant på intervallet $x \in [x_{min}, x_{max}]$.

**Forventningsverdien** er gitt ved:

$$
    \mu = \int_{x_{min}}^{x_{max}} x \rho (x) \mathrm{d}x
$$


For en uniform fordeling har vi at

$$
    \mu = \frac{x_{min} + x_{max}}{2} .
$$


In [None]:
def mu(x_min, x_max):
    return (x_min + x_max)/2

En rekke bestående av $N$ tall vil ha forventningsverdi

$$
    \mu = \frac{1}{N}\sum_{n = 1}^{N} x_n .
$$

Forventningsverdien er altså gjennomsnittet, $\mu = \bar{x}$.

In [None]:
from numpy import mean

**Standardavviket** er gitt ved

$$
    \sigma = \sqrt{\int_{x_{min}}^{x_{max}} (x - \mu)^2 \rho(x) \mathrm{d} x} .
$$


For en *kontinuerlig* uniform fordeling har vi at

$$
    \sigma =  \frac{x_{max} - x_{min}}{2\sqrt{3}},
$$

mens for en *diskret* uniform fordelig av heltall har vi

$$
    \sigma =  \frac{\sqrt{(x_{max} - x_{min} + 1)^2 - 1}}{2\sqrt{3}} .
$$


In [None]:
import numpy as np

def sigma(x_min, x_max, discrete):
    if discrete:
        n = (x_max - x_min + 1)
        return 0.5*np.sqrt(n*n - 1)/np.sqrt(3)
    else:
        return 0.5*(x_max - x_min)/np.sqrt(3)

En rekke bestående av $N$ tall vil ha standardavvik

$$
    \sigma = \sqrt{\frac{1}{N}\sum_{n = 1}^{N} (x_n - \mu)^2} .
$$


In [None]:
from numpy import std

### Farer med pseudotilfeldighet

> pRNG($x_{n}$) $\to$ $x_{n + 1}$

- **Perioder:** Når pRNG($x_{n}$) $\to$ $x_{n - M}$ får vi en syklus på $M + 1$ tall.

- **Konvergens:** Når pRNG($x_{n}$) $\to$ $x_{n}$.

Dette er bare et spesialtilfelle av en syklus med $M = 0$.

- **Trekke samme tall flere ganger:** En viktig statistisk egenskap, men vil for en (naiv) pRNG bety en syklus.

- **Dirichlets skuffeprinsipp:** Når ikke alle tall er like sannsynlige.

Vi skal komme tilbake til Dirichlets skuffeprinsipp senere.

## Midtkvadratmetoden

> Engelsk: Middle-square method

Laget av fysikeren John von Neumann i 1949, og er et av de første eksemplene på pRNG.

John von Neumann skal også ha en del av æren for datamaskinens opphav.

**Algoritmen er som følger:**
1. Input: `seed` som er et tall med $N$ siffer
2. Kvadrer tallet `seed`
3. Output: $N$ midtereste sifrene fra kvadrattallet 

På 50-tallet var alternativet å lese inn mekanisk genererte tall fra hullkort. 

Neumanns metode var mye raskere.

**Enkel implementasjon av midtkvadratmetoden:** Med bruk av fire siffer.

In [None]:
def middle_square(seed): 
    '''Middle-square number generator with four digits.'''
    ...

Forslag til implementasjon:

In [None]:
def middle_square(seed): 
    '''Middle-square number generator with four digits.'''
    square = str(seed*seed)
    middle = len(square)//2
    number = square[middle - 2:middle + 2]
    return int(number)

Dette er opplagt deterministisk, men det *ser* tilfeldig ut:

In [None]:
seed = 1910

print(seed, end="")
for n in range(75):
    seed = middle_square(seed)
    print(f", {seed}", end="")

**Metoden er veldig avhengig av `seed`.**

Med bruk av heldige starttall kan metoden gi tallrekker med gode statistiske egenskaper. 

Uheldige starttall gir *sykliske* tallrekker.

**Eksempel på *syklisk* oppførsel:**

In [None]:
seed = 6100
print(seed, end="")
for n in range(25):
    seed = middle_square(seed)
    print(f", {seed}", end="")

**Eksempel på *konvergering*:**

In [None]:
seed = 2000
print(seed, end="")
for n in range(25):
    seed = middle_square(seed)
    print(f", {seed}", end="")

Metoden har mange svakheter i praksis, men ble starten på utviklingen av langt bedre pRNG’er.

## Seed

Alle pRNG trenger et starttall (*seed*) for å kunne starte en sekvens.

Dette gir reproduserbarhet!

### Tilfeldig seed

In [None]:
import time

seed = int(time.time()) 
print(seed)

Bestemt intervall:

In [None]:
max_number = 100
seed = int(time.time()) % max_number
print(seed)

## Lineær kongruent generator

> Engelsk: Linear congruential generator (LGC)

LGC ble utviklet i 1958, og er mye brukt. De har generell formel:

$$
    X_{n+1} = (a X_n + c) \mod m.
$$

Ved å velge verdiene av $a$, $c$ og $m$ lager vi en bestemt LCG.

**Variablene til LCG:**

$$
    X_{n+1} = (a X_n + c) \mod m.
$$


- $a$: Settes ofte som et svært stort tall.

- $c$: Motvirker konvergens ved $X_n = 0$.

- $m$: Begrenser intervallet, slik at $X_{n+1} \in [0, m)$.

$m$ blir ofte satt til $2^{31}$, $2^{32}$ , $2^{63}$ eller  $2^{64}$.

**De statistiske egenskapene til en pRNG avhenger sterkt av $a$, $c$ og $m$.**

**Implementasjon:** Innkapsling ved bruk av klasser.

- `seed`: starttallet for den pseudotilfeldige sekvensen
- `state`: intern variabel for pRNG

In [None]:
%%writefile lcg.py
import time
import math


class LCG:
    '''Linear congruential generator.'''
    def __init__(self, a, c, m, seed=None):
        self._a = a
        self._c = c
        self._m = m
        if seed is None:
            self._state = int(time.time()) % self.m
        else:
            self._state = seed

    @property
    def a(self):
        return self._a

    @property
    def c(self):
        return self._c

    @property
    def m(self):
        return self._m

**Implementasjon:** $X_{n+1} = (a X_n + c) \mod m$.

```Python
    def advance(self):
        '''Advance internal state X.'''
        ...

    def __call__(self):
        '''Advance and return internal state X.'''
        self.advance()
        return self._state
```

Forslag til implementasjon:

In [None]:
%%writefile --append lcg.py

    def advance(self):
        '''Advance internal state X.'''
        self._state = (self.a*self._state + self.c) % self.m

    def __call__(self):
        '''Advance and return internal state X.'''
        self.advance()
        return self._state

Test ut koden med verdiene $a = 1664525$, $c = 1013904223$ og $m = 2^{32}$ fra boken *Numerical Recipes* av Saul Teukolsky:

In [None]:
import lcg

ST = {"a": 1664525, "c": 1013904223, "m": 1 << 32}
rnd = lcg.LCG(**ST)
for _ in range(7):
    print(rnd())

Merk at $2^n$ er raskest implementert med bit-operator `1 << n`:

In [None]:
n = 16
assert 2**n == 1 << n

**Histogram:** 

Funksjon til plotting og til å sammenligne teoretisk forventningsverdi og standardavvik med verdier til pseudotilfeldig rekke.

In [None]:
%matplotlib inline
import matplotlib.pyplot as plt

def histogram(results, bins, align="mid", title="Histogram"):
    plt.figure(figsize=(12, 5))
    plt.hist(results, bins, align=align, density=True, 
             facecolor='Gainsboro', edgecolor="black")
    plt.xlabel(r'$x$', fontsize=14)
    plt.ylabel(r'$\frac{\rho(x)}{\Delta x}$', fontsize=14)
    plt.title(title)
    
def stk_uniform(x_min, x_max, x_values, discrete=False):
    print(f"{'mean':>16}  {'STD':>7}\n{'--'*15}")
    print(f"Expected|{mu(x_min, x_max):>9.6f}{sigma(x_min, x_max, discrete):>10.6f}")
    print(f"Computed|{mean(x_values):>9.6f}{std(x_values):>10.6f}")

**Desimaltall:** Få ut desimaltall $x_n^d \in [0, 1)$.

Ved å bruke den interne tilstanden $X_n \in [0, m)$

$$
    x_n^d = \frac{X_n}{m} .
$$

```Python
    def decimal(self):
        '''Random decimal number in range [0, 1).'''
        ...
```

Forslag til implementasjon:

In [None]:
%%writefile --append lcg.py
    
    def decimal(self):
        '''Random decimal number in range [0, 1).'''
        self.advance()
        return self._state/self.m

Test ut koden:

In [None]:
import importlib
importlib.reload(lcg)

rnd = lcg.LCG(**ST)
x = [rnd.decimal() for _ in range(100_000)]
stk_uniform(0, 1, x)
histogram(x, 100, title="Uniform decimal numbers")
plt.show()

### Uniform fordeling

Vi skal nå generere tilfeldige tall $x \in [x_\text{min}, x_\text{max}]$.

**Eksempel:** Kaste terning ved å begrense $m$.

Vi velger $a = 1394785$, $c = 2$, $m = 6$.

Når vi bruker $m = 6$ vil LCG kunne gi tall på intervallet $X_n = [0, 5]$.

Vi kan da tenke oss at vi får terningens verdier ved å bruke $X_n + 1$.

In [None]:
lcg6 = lcg.LCG(a=1394785, c=2, m=6, seed=2)
numbers = [lcg6() + 1 for n in range(100_000)]
stk_uniform(1, 6, numbers, discrete=True)

In [None]:
plt.figure(figsize=(12, 4))
plt.plot(numbers[:16], "o--", color="black")
plt.xticks(range(0, 14, 3))
plt.xlim(-0.1, 14.5)
plt.xlabel("iteration")
plt.ylabel("random number")
plt.show()

**Perioden må være lengre enn antall tall vi genererer:**
- Periodisk oppførsel er ikke statistik tilfeldig
- Alle pRNGer har en syklus

Alle pRNGs ender til slutt opp i samme state, men vi ønsker at det tar lengst mulig tid før dette skjer. En god pRNG burde "aldri" ende opp i en syklus.

**$m$ må være betydelig større enn intervallet vi trenger:**
- En pRNG kan ikke gi samme tall innen én periode

Om utfallene skal være statistisk tilfeldige, så skal det derimot være en *viss sannsynlighet* for å få to like utfall på rad.

**Implementering av uniform distribusjon:** Tilfeldige tall 
$x^\text{u} \in [x_\text{min}^\text{u} , x_\text{max}^\text{u})$.

Vi kan *trunkere* tilstanden $X_n \in [0, m)$ til LCG:

$$
    x^\text{u}_n = x_\text{min}^\text{u} + (X_n\mod \Delta x^\text{u}) ,
$$

hvor $\Delta x^\text{u} = x_\text{max}^\text{u} - x_\text{min}^\text{u}$.

Intervallet er uavhengig av $a$, $c$ og $m$, men vi **bør ha at** $m >> \Delta x^\text{u}$.

```Python
    def uniform(self, x_min, x_max):
        '''Random number in [x_min, x_max) using uniform distribution.'''
        ...
```

In [None]:
%%writefile --append lcg.py

    def uniform(self, x_min, x_max):
        '''Random number in [x_min, x_max) using uniform distribution.'''
        self.advance()
        dx = x_max - x_min
        return (self._state % dx) + x_min

**Eksempel på bruk:** Kaste terning med forbedret implementasjon.

Vi bruker Teukolskys verdier $a = 1664525$, $c = 1013904223$ og $m = 2^{32}$.

Den interne tilstanden har nå $2^{32}$, og har en lang periode.

In [None]:
importlib.reload(lcg)

rnd = lcg.LCG(**ST)
dice = [rnd.uniform(1, 7) for _ in range(100_000)]
stk_uniform(1, 6, dice, discrete=True)
print(dice[:15])
histogram(dice, bins=range(1, 8), align="left")
plt.show()

Eksempelkoden viser at de seks utfallene er veldig jevnt fordelt. Men, vi kan bevise matematisk at det er en ren umulighet.

###  Dirichlets skuffeprinsipp

> Hvis $N$ objekter skal fordeles over $M$ skuffer, da må minst én skuff inneholde $\lceil N/M \rceil$ objekter.

Den underliggende pRNGen har et utfallsrom på alle heltall i $[0, m)$, og har derfor $m$ mulige verdier.

**Terningkast:** Her har vi $m = 2^{32}$ ulike tilstander.

Dette er ikke deleling på 6!

In [None]:
m = rnd.m
print(f"{m % 6 = }.")
print(f"floor(m/6): {int(np.floor(m/6))}.")
print(f"ceil(m/6):  {int(np.ceil(m/6))}.")

### Normalfordelte tall

En *Box-Muller transform* tar to tilfeldige desimaltall $x^d_1, x^d_2 \in (0, 1)$ og genererer to uavhengige normalfordelte tall $x^g_1$ og $x^g_2$.


Vi forenkler litt, og bruker formelen

$$
    x_{n + 1}^g = \sqrt{-2\ln x_{n}^d}\cos(2\pi x_{n+1}^d) .
$$

```Python
    def normal(self, eps=1e-20):
        '''Random decimal number using normal distribution.'''
        ...
```

Desimaltallene generert av vår LCG er på intervallet $x_n^d \in [0, 1)$, og inkluderer altså null. Siden $\log(0) = \inf$, må vi legge til et lite tall $\epsilon$ for å unngå dette!

In [None]:
%%writefile --append lcg.py

    def normal(self, eps=1e-20):
        '''Random decimal number using normal distribution.'''
        x_1 = self._state/self.m
        x_2 = self.decimal()
        R = math.sqrt(-2*math.log(x_1 + eps))
        theta = 2*math.pi*x_2
        return R*math.cos(theta)

Det viktige her er å huske at det finnes forskjellige "triks" for å oversette tilfeldige tall.

In [None]:
from scipy.stats import norm
importlib.reload(lcg)

random = lcg.LCG(**ST)
normal_samples = [random.normal() for _ in range(100_000)]
x = np.linspace(-4, 4, 150)
histogram(normal_samples, bins=101, title="Gaussian Distribution")
plt.plot(x, norm.pdf(x), '--', color="tomato")
plt.show()

### RANDU

En tradisjonell LCG fra 1960-tallet med $a = 65539$, $c = 0$ og $m = 2^{31}$. 

I tillegg kreves det at startseeden er et oddetall.

Parametrene for generatoren ble valgt for å gjøre generatoren lynrask.

In [None]:
randu = lcg.LCG(a=65539, c=0, m=1<<31, seed=124141)
samples = [randu.decimal() for _ in range(100_000)]

stk_uniform(0, 1, samples)
histogram(samples, bins=101, title="RANDU")
plt.show()

**Korrelasjon i tilfeldige sekvenser:** Enhetskube med RANDU.

Ved første øyekast ser RANDU ut som en fin LCG, men det viser seg dessverre at den produserer veldig korrelerte tall.

In [None]:
N = 10_000
r = np.zeros((3, N))
for n in range(N):
    r[0, n] = randu.decimal()
    r[1, n] = randu.decimal()
    r[2, n] = randu.decimal()

Plotting viser sterk korrelasjon:

In [None]:
ax = plt.figure( figsize=(6, 6)).add_subplot(projection='3d')
ax.scatter(r[0], r[1], r[2], marker=".", color="black", alpha=0.2)
ax.set_xlabel('x')
ax.set_ylabel('y')
ax.set_zlabel('z')
ax.view_init(azim=-125, elev=0)
ax.set_box_aspect((1, 1, 1), zoom=1.25)
plt.tight_layout()
plt.show()

RANDU ble mye brukt på 1960- og 1970-tallet. Forskningsartikler fra denne tiden er derfor satt i tvil.

### LCG i C++

C++ har innebygd funksjon `rand()` som bruker LCG:
```C++
int main() {
    srand(time(nullptr)); // change from default seed
    int X = rand();       // returns integers [0, RAND_MAX]
    double x = X/((double) RAND_MAX - 1);
    return 0;
}
```

- Har default `seed`, bruker derfor `srand(<seed>)`
- $m$ er `RAND_MAX` - 1
- Gir kun heltall

C++-standaren setter dårlig krav til hvordan `rand` skal være implementert. Med noen kompilatorer er perioen så lav som $32 000$.

**Ikke bruk LCG i C++!** Det finnes en mye bedre algoritme, som heter *Mersenne twister*.

## Mersenne Twister 

Algoritmen spesifiseres utifra et gitt *Mersenne primtall*, som er primtall på formen

$$
    M_p = 2^p - 1,
$$ 
    
hvor $p$ også er et primtall.

**MT19937:**

Den vanligste formen av algoritmen bruker primtallet $2^{19937} - 1$ og kalles derfor gjerne for MT19937.  

Regnes som en svært god pRNG.

### Algoritmen til Mersenne Twister

I liket med en LCG vil en Mersenne Twister:
* Bruke *seed* for å starte
* Ha en stor intern tilstand
* Tilstanden trunkeres for å gi oss gode tilfeldige tall

Perioden til sekvensen er svært lang sammenlignet med LCG.

Mersenne Twister er en langt mer komplisert algoritme enn LCG, og vi skal derfor ikke gå gjennom denne i IN1910.

### MT19937 i C++

Fra modulen [random](http://www.cplusplus.com/reference/random/):
   
```C++
#include <random>

int main() {
    int seed = 1234
    mt19937 engine(seed);
    uniform_real_distribution<double> uniform(0.0, 1.0);
    normal_distribution<double> normal(0.0, 1.0);
    
    double x_d = uniform(engine);
    double x_g = normal(engine);
    return 0;
}
```

Valg av pRNG er gitt av `engine`.

Det finnes mange distribusjoner. Her bruker vi:
* `uniform_real_distribution(x_min, x_max)`
* `normal_distribution(mean, standard_deviation)`

Et gitt program kan bruke flere ulike distribusjoner, men man bør bruke én *engine*.

### MT19937 i Python

Standardbiblioteket [`random`](https://docs.python.org/3/library/random.html):
- `random.random()`: uniform fordeling av desimaltall $x \in [0, 1)$
- `random.randint(x_min, x_max)`: uniform fordeling heltall $x \in [x_{min}, x_{max}]$
- `gauss(mu, sigma)`: normalfordelte desimaltall med forventningsverdi $\mu$ og standardavvik $\sigma$

In [None]:
import random

random.random()

NumPy sin [`numpy.random`](https://numpy.org/doc/stable/reference/random/index.html?highlight=random#module-numpy.random)
- `numpy.random.random()`: uniform fordeling av desimaltall $x \in [0, 1)$
- `numpy.random.randint(x_min, x_max)`: uniform fordeling av heltall $x \in [x_{min}, x_{max}]$
- `numpy.random.unifrom(x_min, x_max)`: uniform fordeling av desimaltall $x \in [x_{min}, x_{max}]$
- `numpy.normal(mu, sigma)`: normalfordelte desimaltall med forventningsverdi $\mu$ og standardavvik $\sigma$

Alle funksjonene til NumPy har også et default parameter `size=None`.

In [None]:
np.random.random()

NumPy har nylig fått en bedre pRNG. Dette er en 64-bit *Permuted Congruential Generator* (PCG64).

**Forskjell i tid**:

`numpy.random` er vektorisert, det er ikke `random`.

In [None]:
%%time
x = [random.random() for _ in range(500_000)]

In [None]:
%%time
x = np.random.random(size=500_000)

Vi kommer til å bruke mest NumPy, siden den er raskest.

### Statistiske egenskaper

Uniform fordeling:

In [None]:
x_min = -1
x_max = 1
print(f"{'N':>8}{'mean':>9}{'std':>9}\n{'='*30}")
N = 1
for _ in range(7):
    N *= 10
    x = np.random.uniform(x_min, x_max, size=N)
    print(f"{N:8d}{np.mean(x):10.5f}{np.std(x):10.5f}")
print(f"Analytic{mu(x_min, x_max):10.5f}{sigma(x_min, x_max, False):10.5f}\n{'='*30}")

Normal fordeling:

In [None]:
x_ = 0
x_std = 1
print(f"{'N':>8}{'mean':>9}{'std':>9}\n{'='*30}")
N = 1
for _ in range(7):
    N *= 10
    x = np.random.normal(x_, x_std, size=N)
    print(f"{N:8d}{np.mean(x):10.5f}{np.std(x):10.5f}")
print(f"Analytic{x_:10.5f}{x_std:10.5f}\n{'='*30}")

Når vi driver med stokastiske simuleringer, må vi altså bruke store mengder tilfeldige tall!

## Oppsummering 

Dette er hovedpoengene med dagens forelesning:

- **Det finnes mange pRNGer**
	- Bør oppfylle visse statistiske egenskaper
	- Vær obs på: sykluser, korrelasjon i tallrekken, Dirichlets skuffeprinsipp 

- **Bruk av pRNG i programmering**
	- C++: ikke bruk `rand()`, importer `random`
	- Python: `random` og `numpy.random`

- **En tilfeldig tallrekke vil ha bedre statistiske egenskaper jo lengre rekken er**

- **En uniformt fordelt rekke kan avbildes til nye fordelinger**
	- F.eks normalfordeling
