# Monte Carlo Integrasjon (Matematikk S2)


## Bakgrunnsteori

Vi skal nå se på en metode for å tilnærme integralet ved å bruke teorien for kontinuerlige stokastiske variabler.
Vi ønsker å løse integralet

$$
I = \int\limits_a^b f(x) \, dx. 
$$

Vi tenker oss at $p(x)$ er en uniform sannsynlighetsfordeling på intervallet $[a, b]$, slik at

$$
p(x) = 
\begin{cases}
\frac{1}{b-a} & \text{for } x \in [a, b] \\
0 & \text{ellers}.
\end{cases}
$$

Vi kan trikse litt med integralet (ganger med sannsynlighetsfordelingen oppe og nede - samme som å gange med 1!) slik at vi får

$$
I = \int\limits_a^b f(x) \, dx = \int\limits_a^b \frac{f(x)}{p(x)}p(x) \, dx = (b-a)\int\limits_a^b f(x)p(x) \, dx = (b-a)E[f(X)].
$$

Integralet kan altså skrives som forventningsverdien av $f(X)$. Vi kan tilnærme denne forventningsverdien ved å trekke $N$ tilfeldige tall av $X$ fra sannsynlighetsfordelingen $p(x)$, og regne ut gjennomsnittet av $f(X)$! Med andre ord

$$
I = \int\limits_a^b f(x) \, dx \approx \frac{b-a}{N}\sum\limits_{i=1}^{N} f(x_i),
$$

der $x_1, x_2, ..., x_N$ er $N$ tilfeldige tall trukket fra $p(x)$.

## Eksempler

### Eksempel 1: Tilnærming av $\pi$

Vi kan bruke Monte Carlo integrasjon til å tilnærme integralet

$$
I = \int\limits_0^1 \frac{4}{1 + x^2} \, dx.
$$

Dersom vi bruker en uniform fordeling 

$$
p(x) = 
\begin{cases}
1 & \text{for } x \in [0, 1], \\
0 & \text{ellers},
\end{cases}
$$

så sier teorien at vi kan tilnærme integralet ved

$$
I = \int\limits_0^1 \frac{4}{1 + x^2} \, dx \approx \frac{1}{N}\sum\limits_{i=1}^{N} \frac{4}{1 + x_i^2},
$$

der $x_i$ for $i = 1, 2, \ldots, N$ er tilfeldige tall trukket fra den uniforme fordelingen $p(x)$.

Dette kan vi programmere med følgende kode:

In [15]:
import numpy as np # trekke tilfeldige tall. 
def f(x):
    return 4/(1 + x**2)

I = 0
N = 1_000_000
for _ in range(N):
    x = np.random.uniform(0, 1)
    I += f(x)
I /= N # Deler på N for å få gjennomsnittet.
print(f"{I = :.6f}")




I = 3.141858


### Eksempel 2: Tilnærming av integralet av en normalfordeling

Tenk deg at vi skal tilnærme integralet

$$
\int_{-1}^1 \frac{1}{\sqrt{2\pi}}e^{-x^2/2} \, dx.
$$

Fra teorien om normalfordelinger, vet vi at dette skal være omtrent 68% (0.68 på desimalform) fordi integranden er en standardnormalfordeling ($\mu = 0$ og $\sigma = 1$), og vi integrerer derfor over et intervall som tilsvarer $\mu \pm \sigma$. 

Her kan vi velge den uniforme fordelingen

$$
p(x) = 
\begin{cases}
\frac{1}{2} & \text{for } x \in [-1, 1], \\
0 & \text{ellers}.
\end{cases}
$$

Anvender vi teorien for Monte Carlo integrasjon, får vi da at integralet kan tilnærmes med 

$$
\int_{-1}^1 \frac{1}{\sqrt{2\pi}}e^{-x^2/2} \, dx \approx \frac{2}{N}\sum_{i=1}^N \frac{1}{\sqrt{2\pi}}e^{-x_i^2/2},
$$

En Pythonkode som implementerer dette er som følger: 

In [16]:
import numpy as np # importeres for exp(x), pi, og for å trekke tilfeldige tall.

def f(x):
    return 1 / np.sqrt(2 * np.pi) * np.exp(-x**2 / 2)

I = 0
N = 1_000_000
for _ in range(N):
    x = np.random.uniform(-1, 1)
    I += f(x)

I *= 2 # Ganger med 2 fordi b - a = 2 (størrelsen på intervallet)
I /= N # Deler på N for å få gjennomsnittet.
print(f"{I = :.6f}")

I = 0.682772


## Øvingsoppgaver

### Øvingsoppgave 1

Bruk Monte Carlo integrasjon til å tilnærme verdien av integralet 

$$
I = \int\limits_0^1 x^2 \, dx.
$$

*Du kan ta utgangspunkt i kodeskallet under til å løse oppgaven. Du må fylle inn der det står `NotImplemented`.*

In [None]:
import numpy as np # trengs for å trekke tilfeldige tall med np.random.uniform
def f(x):
    """Funksjonen som skal integreres (integranden)."""
    return NotImplemented

I = NotImplemented
N = NotImplemented
for _ in NotImplemented: # Hvis loop-variabelene er `_`, betyr det bare at vi ikke bruker den til noe.
    x = NotImplemented
    I = NotImplemented

I *= NotImplemented # Hva er størrelsen på intervallet?
I /= NotImplemented # Hvor mange punkter har vi brukt?

print(f"{I = :.6f}")

````{dropdown} Løsningsforslag

Her kan vi velge den uniforme fordelingen 

$$
p(x) = 
\begin{cases}
1 & \text{for } x \in [0, 1], \\
0 & \text{ellers}\\.
\end{cases}
$$

Da kan vi tilnærme integralet med

$$
I = \int\limits_0^1 x^2 \, dx \approx \frac{1}{N}\sum\limits_{i=1}^{N} x_i^2,
$$

der $x_i$ er tilfeldige tall trukket fra den uniforme fordelingen $p(x)$.

En Pythonkode som implementerer denne løsninger er:

```python
import numpy as np
def f(x):
    return x**2

I = 0
N = 1_000_000
for _ in range(N):
    x = np.random.uniform(0, 1)
    I = I + f(x)

I *= 1 
I /= N 

print(f"{I = :.6f}")
```


````

### Øvingsoppgave 2

Bruk Monte Carlo integrasjon til å tilnærme verdien av integralet

$$
I = \int\limits_0^1 x\ln x\, dx.
$$

*Du kan ta utgangspunkt i kodeskallet under. Du må fylle inn der det står `NotImplemented`.*

In [None]:
import numpy as np # trengs for å trekke tilfeldige tall med np.random.uniform
def f(x):
    return NotImplemented

I = NotImplemented
N = NotImplemented
for _ in NotImplemented:
    x = NotImplemented
    I = NotImplemented

I *= NotImplemented
I /= NotImplemented

print(f"{I = :.6f}")

````{dropdown} Løsningsforslag

Vi velger den uniforme fordelingen på intervallet $[0, 1]$ som gir

$$
p(x) =
\begin{cases}
1 & \text{for } x \in [0, 1], \\
0 & \text{ellers}.
\end{cases}
$$

Med teorien om Monte Carlo integrasjon, blir tilnærmingen til integralet da

$$
I = \int\limits_0^1 x\ln x\, dx \approx \frac{1}{N}\sum\limits_{i=1}^{N} x_i\ln x_i,
$$

der $x_i$ er tilfeldig tall trukket på uniform på intervallet $[0, 1]$.

En Pythonkode som implementerer denne løsningen er:


```python
import numpy as np # trengs for å trekke tilfeldige tall med np.random.uniform
def f(x):
    return x*np.log(x)

I = 0
N = 1_000_000 
for _ in range(N):
    x = np.random.uniform(0, 1) # trekker tilfeldig tall på integrasjonsintervallet
    I += f(x) 

I *= (1 - 0) # ganger med b - a = 1 - 0. 
I /= N # Tar gjennomsnittet av verdiene.

print(f"{I = :.6f}")
```

som gir oss at integralet er omtrent $I \approx -0.25$



````

### Øvingsoppgave 3



Bruk Monte Carlo integrasjon til å tilnærme integralet 

$$
I = \int\limits_0^2 \sqrt{4 - x^2} \, dx.
$$

*Du kan ta utgangspunkt i kodeskallet under. Du må fylle inn der det står `NotImplemented`.*


In [None]:
import numpy as np # trengs for å trekke tilfeldige tall med np.random.uniform 

def f(x):
    return NotImplemented

I = NotImplemented
N = NotImplemented

for _ in NotImplemented:
    x = NotImplemented
    I = NotImplemented

I *= NotImplemented
I /= NotImplemented
print(f"{I = }")

````{dropdown} Løsningsforslag

Integrasjonsintervallet er $[0, 2]$, så vi velger den uniforme fordelingen

$$
p(x) =
\begin{cases}
\frac{1}{2} & \text{for } x \in [0, 2], \\
0 & \text{ellers}.
\end{cases}
$$

Tilnærmingen til integralet med teorien for Monte Carlo integrasjon blir da

$$
I = \int\limits_0^2 \sqrt{4 - x^2} \, dx \approx \frac{2}{N}\sum\limits_{i=1}^{N} \sqrt{4 - x_i^2},
$$

der $x_i$ er tilfeldige tall trukket fra den uniforme fordelingen $p(x)$.

En Pythonkode som implementerer denne løsningen er:

```python
def f(x):
    return (4 - x**2)**0.5

I = 0
N = 1_000_000

for _ in range(N):
    x = np.random.uniform(0, 2)
    I = I + f(x)

I *= (2 - 0)
I /= N
print(f"{I = }")
```

som gir oss en tilnærming på $I \approx 3.14...$.

Den eksakte løsningen er $I = \pi$. Merk at verdien du får fra gang til gang vil variere fordi vi trekker tall tilfeldige. Ved store veldige store valg av $N$ vil du få en verdi som er nærmere den eksakte løsningen.

````

````

### Øvingsoppgave 4: Mer effektiv trekking av tilfeldige tall med *Importance samling*

I denne oppgaven skal vi se på en metode som kalles *importance sampling*. Denne metoden er en variant av Monte Carlo integrasjon som kan brukes til å tilnærme integraler der den uniforme fordelingen ikke er et godt valg. 
I stedet velger man seg en annen fordeling $p(x)$ som i større grad trekker ut tall der integranden $f(x)$ har store funksjonsverdier, og unngår å trekke tall fra der $f(x)$ har små funksjonsverdier. På denne måten kan vi trekke færre tilfeldige tall før vi får en god tilnærming til integralet. Tanken er som følger. Vi bruker samme notasjon som i teorien over.

$$
I = \int\limits_a^b f(x) \, dx = \int\limits_a^b \frac{f(x)}{p(x)} p(x) \, dx = \int\limits_a^b g(x) p(x) \, dx = E[g(X)],
$$

der $g(x) = f(x) / p(x)$. Vi må altså regne ut en tilnærmingen til forventningsverdien til $g(x)$ i stedet, men nå er det ikke satt noe krav på hvilken sannsynlighetsfordeling $p(x)$ vi velger. I stedet blir tilnærmingen slik:

$$
I = \int\limits_a^b f(x) \, dx \approx \frac{1}{N}\sum_{i=1}^N g(x_i),
$$

der $x_i$ er tilfeldige tall trukket fra sannsynlighetsfordelingen $p(x)$.


Bruk denne teorien til å tilnærme verdien av integralet

$$
I = \int_0^\infty x^2e^{-x} \, dx,
$$

ved å bruke eksponentialfordelingen

$$
p(x) = e^{-x}, \quad x \in [0, \infty),
$$

som sannsynlighetsfordelingen du trekker tall fra.

*Du kan ta utgangspunkt i kodeskallet under. Du må fylle inn der det står `NotImplemented`. Her må du også tenke deg litt om så du får definert $g(x)$ riktig. Merk at for å trekke tall fra eksponentialfordelingen over, kan du bruke `np.random.exponential(scale=1.0)`*

In [None]:
import numpy as np
def f(x):
    return NotImplemented

def p(x):
    return NotImplemented

def g(x):
    return NotImplemented

I = NotImplemented
N = NotImplemented
for _ in range(N):
    x = NotImplemented # Trekk tilfeldig tall fra en eksponentialfordelingen
    I += NotImplemented

I /= NotImplemented

print(f"{I = }")

````{dropdown} Løsningsforslag

Ved å bruke teorien for importance sampling, der $p(x) = e^{-x}$, får vi at

$$
I = \int_0^\infty x^2e^{-x} \, dx \approx \frac{1}{N} \sum_{i=1}^N g(x_i) = \frac{1}{N} \sum_{i=1}^N \frac{x_i^2e^{-x_i}}{e^{-x_i}} = \frac{1}{N} \sum_{i=1}^N x_i^2,
$$

der $x_i$ er tilfeldige tall trukket fra eksponentialfordelingen $p(x) = e^{-x}$. Vi kunne forenklet koden betraktelig, og bare tatt gjennomsnittet av verdiene $x_i^2$, men vi kan heller bare følge teorien slavisk og implementere en funksjon for $g(x) = f(x) / p(x)$, og regne ut gjennomsnittet av funksjonsverdiene $g(x_i)$. 
I koden under har vi valgt å gjøre det slik i stedet, som gir

```python
import numpy as np
def f(x):
    return x**2 * np.exp(-x)

def p(x):
    return np.exp(-x)

def g(x):
    return f(x) / p(x)

I = 0
N = 1_000_000
for _ in range(N):
    x = np.random.exponential(scale=1.0) # Trekk tilfeldig tall fra en eksponentialfordelingen
    I += g(x)

I /= N

print(f"{I = }")
```

som gir oss en tilnærming på $I \approx 2.00...$.

````