# Markovkjeder

![](figures/markov_chain.png)

- Beskriver et system som kan være i **forskjellige tilstander**.
- **Overgangen** mellom to tilstander er gitt ved en **viss sannsynlighet**.
- Har **ingen hukommelse**.

Vi skal fokusere på Markovkjeder som er diskret.

I Markovkjeden i figuren over er det tre tilstander, A, B og C. Hvis du er i tilstand A er det 60 % sannsynlig at du forblir i tilstand A, og 40 % sannsynlighet for at du går over til tilstand B. Hvilken tilstand systemet går til i neste tidssteg avhenger kun av nåværende tilstand.

## Stokastiske matriser

Elementene i en stokastisk matrise $\mathbf{M}$ er gitt ved

$$
    M_{i j} = P(i | j),
$$

hvor $P(i | j)$ gir sannsynligheten for overgangen *fra* tilstand $j$ *til* tilstand $i$.

**Summen til sannsynlighetene** til alle overganger *fra* tilstand $j$ må bli 1:

$$
    \sum_{i} M_{i j} = 1 .
$$


In [None]:
import numpy as np

def test_stochastic_matrix(M, tol=1e-9): 
    ...

Enkelt eksempel på implementasjon av testfunksjonen:

In [None]:
def test_stochastic_matrix(M, tol=1e-9):
    for j in range(len(M)):
        assert abs(np.sum(M[:,j]) - 1) < tol, f"column {j} does not sum up to 1."

### Sannsynlighetsfordeling 

Gitt at $\mathbf{p}^n$ er sannsynlighetsfordelingen  til alle tilstandene ved tidssteg $n$. Da må summen over alle tilstandene være

$$
    \sum_i p^n_i = 1 .
$$


Sannsynlighetsfordelingen i **neste tidssteg** finner man da ved

$$
    \mathbf{p}^{n+1}=  \mathbf{M}\mathbf{p}^n ,
$$

gitt en starttilstand $\mathbf{p}^0$.

In [None]:
def markov_chain(p0, M, N):
    p = np.zeros((N, len(p0)))
    ...
    return p

Forslag til implementasjon:

In [None]:
def markov_chain(p0, M, N):
    p = np.zeros((N, len(p0)))
    p[0] = p0
    for n in range(N-1):
        p[n+1] = M@p[n]
    return p

**Hvordan ser den stokastiske matrisen ut for Markovkjeden i figuren under?**

![](figures/markov_chain.png)

$$
    \mathbf{M} = 
    \begin{bmatrix}
        P(A|A) & P(A|B) & P(A|C)\\
        P(B|A) & P(B|B) & P(B|C)\\
        P(C|A) & P(C|B) & P(C|C)
    \end{bmatrix} .
$$

Husk at $P(i | j)$ gir sannsynligheten for overgangen *fra* tilstand $j$ *til* tilstand $i$.

**Løsning:** Sannsynlighetsfordelingen mellom A, B og C i neste tidssteg:

$$
    \begin{bmatrix}
        p^{n+1}_\text{A} \\
        p^{n+1}_\text{B} \\
        p^{n+1}_\text{C}
    \end{bmatrix}
    = 
    \begin{bmatrix}
        0.6 & 0.2 & 0\\
        0.4 &  0  & 0.1\\
         0  & 0.8 & 0.9
    \end{bmatrix}
    \begin{bmatrix}
        p^n_\text{A} \\
        p^n_\text{B} \\
        p^n_\text{C}
    \end{bmatrix} .
$$

![](figures/markov_chain.png)

### Steady states

En steady state er egenvektoren til den stokastiske matrisen

$$
    \mathbf{p}^\infty = \mathbf{M}\mathbf{p}^\infty ,
$$

med egenverdi 1. 

Hvis man ved tid $n_\infty$ er kommet til en steady state, så vil systemet forbli i likevekt for alle senere tidssteg

$$
    \mathbf{p}^{n_\infty + n} = \mathbf{p}^\infty .
$$

**Kan brukes for å studere systemer i likevekt.**

## Monte Carlo simulering av Markovkjeder


1. **Bestem starttilstand $X^0$ og antall punkter i tid, $N$**.

2. For hvert tidssteg $n \in [0, N)$, **bestem neste tilstand $X^{n+1}$ *tilfeldig***. Valg av tilstand må ta hensyn til sannsynlighetene.

3. **Regn ut** de interessante **egenskapene**.

4. **Gjenta forsøket** (2. og 3.) mange ganger. De store talls lov gjelder!

5. **Regn ut gjennomsnittet** til de interessante egenskapene.

### Steady states

Man kan også bruke Monte Carlo simuleringer til å studere systemer i likevekt.

Dette kan gjøres ved å studere tetthetsfordeligen $\rho(t_n)$ over tid. 

Når $\rho$ stabiliserer seg, er systemet i likevekt.

## Virrevandring

Simulering av gange langs en linje $x_n \in [x_\text{min}, x_\text{max}]$ etter

$$
    x_{n} = x_{n - 1} + \Delta x_{n},
$$

gitt et utgangspunkt $x_0$ og *stokastisk* steglengde $\Delta x_{n} = \pm 1$. 

![](figures/1D_walk.png)

In [None]:
x_min = -15
x_max = 15
x_states = np.arange(x_min, x_max+1)
print(x_states)

### Stokastisk matrise

Når vandreren er på en ende av linjen, vil vandreren ha 50 % sjanse for å forbli på enden, og 50 % sjanse for å flytte seg ett steg mot sentrum. 

In [None]:
Sx = len(x_states)
Mx = np.zeros((Sx, Sx))
...

Den stokastiske matrisen vil ha elementer

$$
    M_{i-1, i} = 0.5, \\
    M_{i+1, i} = 0.5,
$$

for $i = 2, 3, ... , S - 1$. På venstre ende $M_{1, 1} = M_{2, 1} = 0.5$ og høyre ende $M_{S-1, S} = M_{S, S} = 0.5$

In [None]:
# left edge
Mx[0][0] = 0.5
Mx[1][0] = 0.5

# right edge
Mx[-2][-1] = 0.5
Mx[-1][-1] = 0.5

# middle part
for i in range(1, Sx-1):
    Mx[i-1][i] = 0.5
    Mx[i+1][i] = 0.5

Bilde av den stokastiske matrisen:

In [None]:
%matplotlib inline
import plotting

plotting.transitions(Mx, 'Random Walk', step=2)
test_stochastic_matrix(Mx)

**Sannsynlighet over tid:** Når $x_0 = 0$.

In [None]:
x0 = 0
Nx = 75
p0 = np.zeros(Sx)
...
px = markov_chain(p0, Mx, Nx)
plotting.states(px, x_states, r"$x$", step=5)

En verdi for $x$ vil ha tilstand $i = x - x_\text{min} + 1$ i *matematisk* kontekst. I programmering begynner vi på indeks null. Vi kan finne indeksen `i` til tilstand `x` ved `i = x - x_min`. (Hvis $x = x_\text{min}$, så får vi `i = 0`).

In [None]:
p0 = np.zeros(Sx)
p0[x0 - x_min] = 1
px = markov_chain(p0, Mx, Nx)
plotting.states(px, x_states, r"$x$", step=5)

**Monte Carlo simulering:** med en god del vandrere.

In [None]:
walkers = 100_000
x = np.zeros((Nx, walkers), dtype=int)
x[0, :] = x0 
...

In [None]:
for n in range(Nx-1):
    x[n+1] = x[n] + np.random.choice([-1, 1], size=walkers)
    x[n+1][x[n+1] < x_min] = x_min
    x[n+1][x[n+1] > x_max] = x_max

Tettheten som funksjon av tid ved bruk av histogram:

In [None]:
rho_x = np.zeros((Nx, Sx))
for n in range(Nx):
    rho_x[n], _ = np.histogram(x[n], bins=Sx, range=(x_min, x_max+1), density=True)
    
plotting.states(rho_x, x_states, r"$x$", step=5)

## Ehrenfest-eksperimentet

Du har to urner med totalt $B$ baller fordelt mellom dem.

I hvert tidsteg flyttes én tilfeldig ball fra den ene urnen til den andre.

In [None]:
B = 20    # total number of balls
u0 = 0    # initial number of balls

![](figures/ehrenfest.png)

### Stokastisk matrise

Sett opp en stokastisk matrise for Ehrenfest-eksperimentet. 

In [None]:
M_E = np.zeros((B+1, B+1))
...

Det er $S = B + 1$ tilstander. Tilstand nummer $i$ har $i - 1$ baller.

Hvis du $0$ baller, er det $100 \, \%$ sannsynlig at du vil ha én ball i neste tidssteg. Hvis du har $B$ baller, er det $100 \, \%$ sannsynlighet for at du har $B-1$ baller i neste tidssteg. Kantene til den stokastiske matrisen blir da

$$
    M_{2, 1} = 1, \\
    M_{S-1, S} = 1.
$$


Hvis urnen har $u$ baller så er sannsynligheten $\frac{u}{B}$ for å flytte en ball vekk fra urnen, men det er $1 - \frac{u}{B}$ sannsynlighet for å flytte en ball til urnen. Den stokastiske matrisen får da elementer

$$
    M_{i, i+1} =  \frac{i}{B} ,\\
    M_{i+2, i+1} =  \frac{B - i}{B},
$$

for $i = 2, 3, ..., B$. 

Husk at indeksene har i programmering begynner på $0$!

In [None]:
M_E[1, 0] = 1
M_E[B-1, B] = 1
for i in range(1, B):
    M_E[i-1, i] = i/B
    M_E[i+1, i] = 1 - i/B

Bilde av den stokastiske matrisen:

In [None]:
plotting.transitions(M_E, 'Ehrenfest', step=2)
test_stochastic_matrix(M_E)

**Sannsynlighet over tid:** når vi begynner med $u_0 = 0$ antall baller i urnen.

Når vi en steady state?

In [None]:
N_E = 50
p0 = np.zeros(B+1)
p0[u0] = 1
p_E = markov_chain(p0, M_E, N_E)
plotting.states(p_E, np.arange(B+1), r"Number of balls")

Vi kan se på figuren at sannsynlighetsfordelingen oscillerer mellom to tilstander.

**Funksjon for ett stokastisk eksperiment:**

In [None]:
def ehrenfest(u0, B, N):
    U = np.zeros(N, dtype=int)
    U[0] = u0
    ...
    return U

Forslag til implementasjon ligger i kodecellen under.

In [None]:
def ehrenfest(u0, B, N):
    U = np.zeros(N, dtype=int)
    U[0] = u0
    for n in range(N-1):
        ball = np.random.randint(B)
        if ball < U[n]:  
            U[n+1] = U[n] - 1
        else:
            U[n+1] = U[n] + 1
    return U

Kjør cellen under for å utføre et stokastisk forsøk med $N = 15$ tidssteg.

In [None]:
u = ehrenfest(u0, B, 15)
print(u)

**Monte Carlo simulering:** 

In [None]:
mc_cycles = 10_000
U = np.zeros((N_E, mc_cycles))
for cycle in range(mc_cycles):
    U[:, cycle] = ehrenfest(u0, B, N_E)

Tettheten som funksjon av tid ved bruk av histogram:

In [None]:
rho_E = np.zeros((N_E, B+1))
for n in range(N_E):
    rho_E[n], _ = np.histogram(U[n], bins=B+1, range=(0, B+1), density=True)
plotting.states(rho_E, np.arange(B+1), r"Number of balls")

## Reaksjonskinetikk


Vi skal studere reaksjoner med stoffene $\text{A}$, $\text{B}$ og $\text{C}$. 

Reaksjonshastigheten er gitt av reaksjonshastighetskonstanter, $k$. (Enheter gitt i molekyl per tidssteg).

Alle forsøkene begynner med kun $\text{A}$-molekyler, og ingen molekyler av typen $\text{B}$ eller $\text{C}$.

In [None]:
import kinetics # Analytical solutions

# kinetic rates
k1 = 0.1
k_1 = 0.025
k2 = 0.05

# time steps
Nt_1 = 50
Nt_2 = 150

# Number of molecules
N = 10_000

Idé hentet fra [Rabinovitch](https://pubs-acs-org.ezproxy.uio.no/doi/10.1021/ed046p262)
og [Miguel og Formosinho](https://pubs-acs-org.ezproxy.uio.no/doi/abs/10.1021/ed056p582).

### Første-ordens reaksjon


$$
    \text{A} \xrightarrow{k_1} \text{B}
$$

**Stokastisk matrise:** 

In [None]:
M = np.zeros((2, 2))
...

p0 = np.array([1, 0]) 
p = markov_chain(p0, M, Nt_1)
kinetics.plot(p, kinetics.first_order(k1), r"Markov Chain: A $\to$ B")
test_stochastic_matrix(M)

Den stokastiske matrisen til reaksjonen $\text{A} \xrightarrow{k_1} \text{B}$ er gitt ved

$$
    \mathbf{M} = 
    \begin{bmatrix}
        1 - k_1 &  0  \\
         k_1    &  1
    \end{bmatrix} .
$$

**Monte Carlo simulering:** $\text{A} \xrightarrow{k_1} \text{B}$.

In [None]:
A = np.zeros(Nt_1, dtype=int)
B = np.zeros(Nt_1, dtype=int)
A[0] = N
...

c = np.array([A, B]).T
kinetics.plot(c/N, kinetics.first_order(k1), r"Monte Carlo: A $\to$ B")

I cellen under ligger en enkel implementasjon. I hvert tidssteg itererer vi gjennom alle $\text{A}$-molekylene. Hvert $\text{A}$-molekyl trekker et tilfeldig tall på intervallet $[0, 1)$. Hvis  tallet er innenfor intervallet $[0, k_1]$, så vil $\text{A}$-molekylet bli til et $\text{B}$-molekyl. 

In [None]:
A = np.zeros(Nt_1, dtype=int)
B = np.zeros(Nt_1, dtype=int)
A[0] = N
for n in range(Nt_1-1):
    A[n+1] = A[n]
    B[n+1] = B[n]
    for molecule in range(A[n]):
        if np.random.random() < k1:
            A[n+1] -= 1
            B[n+1] += 1

c = np.array([A, B]).T
kinetics.plot(c/N, kinetics.first_order(k1), r"Monte Carlo: A $\to$ B")

### Konkurrerende reaksjoner

$$
    \text{A} \xrightarrow{k_1} \text{B} \\
    \text{A} \xrightarrow{k_2} \text{C}
$$

**Stokastisk matrise:** 

In [None]:
M = np.zeros((3, 3))
...

p0 = np.array([1, 0, 0])
p = markov_chain(p0, M, Nt_1)
kinetics.plot(p, kinetics.competing(k1, k2), r"Markov Chain: A $\to$ B & A $\to$ C")
test_stochastic_matrix(M)

Den stokastiske matrisen til reaksjonene $\text{A} \xrightarrow{k_1} \text{B}$ og $\text{A} \xrightarrow{k_2} \text{C}$ er gitt ved

$$
    \mathbf{M} = 
    \begin{bmatrix}
        1 - k_1 + k_2 &  0 & 0  \\
         k_1    &  1 & 0 \\
         k_2 & 0 & 1
    \end{bmatrix} .
$$


**Monte Carlo simulering:** $\text{A} \xrightarrow{k_1} \text{B}$ og $\text{A} \xrightarrow{k_2} \text{C}$.

In [None]:
A = np.zeros(Nt_1, dtype=int)
B = np.zeros(Nt_1, dtype=int)
C = np.zeros(Nt_1, dtype=int)
A[0] = N
...
            
c = np.array([A, B, C]).T
kinetics.plot(c/N, kinetics.competing(k1, k2), r"Monte Carlo: A $\to$ B & A $\to$ C")

Implementasjonen i cellen under bruker `numpy.random.choice`, som er vektorisert i hvert tidssteg. $\text{A}$ har tre muligheter: forbli et $\text{A}$-molekyl, bli til et $\text{B}$-molekyl eller $\text{C}$-molekyl. I hvert tidssteg, trekkes derfor en ny tilstand for alle $\text{A}$-molekyl (derfor `size=A[n]`). Sannsynligheten for de tre tilstandene er ikke lik, men `numpy.random.choice` har et parameter `p` hvor man kan angi sannsynlighetene til elementene i listen som sendes inn. Til slutt er det bare å summere hvor mange $\text{A}$-molekyl som gikk over i de forskjellige tilstandene. 

In [None]:
A = np.zeros(Nt_1, dtype=int)
B = np.zeros(Nt_1, dtype=int)
C = np.zeros(Nt_1, dtype=int)
A[0] = N
ABC = ["A", "B", "C"]
prob = [1 - k1 - k2, k1, k2]
for n in range(Nt_1 - 1):
    X = np.random.choice(ABC, p=prob, size=A[n])
    A[n+1] = np.sum(X == "A")
    B[n+1] = B[n] + np.sum(X == "B")
    C[n+1] = C[n] + np.sum(X == "C")
            
c = np.array([A, B, C]).T
kinetics.plot(c/N, kinetics.competing(k1, k2), r"Monte Carlo: A $\to$ B & A $\to$ C")

### Rekker med reaksjoner

$$
    \text{A} \xrightarrow{k_1} \text{B} \xrightarrow{k_2} \text{C}
$$

**Stokastisk matrise:**

In [None]:
M = np.zeros((3, 3))
...

p0 = np.array([1, 0, 0])
p = markov_chain(p0, M, Nt_1)
kinetics.plot(p, kinetics.consecutive(k1, k2), r"Markov Chain: A $\to$ B $\to$ C")
test_stochastic_matrix(M)

Den stokastiske matrisen til reaksjonsveien $\text{A} \xrightarrow{k_1} \text{B} \xrightarrow{k_2} \text{C}$ er gitt ved

$$
    \mathbf{M} = 
    \begin{bmatrix}
        1 - k_1 &  0 & 0  \\
         k_1 &  1 - k_2 & 0\\
         0 & k_2  & 1
    \end{bmatrix} .
$$

**Monte Carlo simulering:** $\text{A} \xrightarrow{k_1} \text{B} \xrightarrow{k_2} \text{C}$.

In [None]:
A = np.zeros(Nt_2, dtype=int)
B = np.zeros(Nt_2, dtype=int)
C = np.zeros(Nt_2, dtype=int)
A[0] = N
...

c = np.array([A, B, C]).T
kinetics.plot(c/N, kinetics.consecutive(k1, k2), r"Monte Carlo: A $\to$ B $\to$ C")

Implementasjonen i cellen under ligner mye på den for enkel første-ordens reaksjon ($\text{A} \to \text{B}$), men nå er hvert tidssteg vektorisert. Sannsynligheten for $\text{A} \to \text{B}$ og $\text{B} \to \text{C}$ er uavhengig av hverandre, og bestemmes kun av konstantene $k_1$ og $k_2$, samt antall molekyler som potensielt kan endre tilstand.

In [None]:
A = np.zeros(Nt_2, dtype=int)
B = np.zeros(Nt_2, dtype=int)
C = np.zeros(Nt_2, dtype=int)
A[0] = N
for n in range(Nt_2-1):
    rA = np.random.random(A[n])
    rB = np.random.random(B[n])
    A_to_B = np.sum(rA < k1)
    B_to_C = np.sum(rB < k2)
    A[n+1] = A[n] - A_to_B
    B[n+1] = B[n] + A_to_B - B_to_C
    C[n+1] = C[n] + B_to_C

c = np.array([A, B, C]).T
kinetics.plot(c/N, kinetics.consecutive(k1, k2), r"Monte Carlo: A $\to$ B $\to$ C")

### Reaksjoner med likevekt

$$
    \text{A} \underset{k_{-1}}{\stackrel{k_1}\rightleftharpoons} \text{B} \xrightarrow{k_2} \text{C}
$$


**Stokastisk matrise:**

In [None]:
M = np.zeros((3, 3))
...

p0 = np.array([1, 0, 0])
p = markov_chain(p0, M, Nt_1)
kinetics.plot(p, kinetics.equilibrium(k1, k_1, k2), r"Markov Chain: A $\rightleftharpoons}$ B $\to$ C")
test_stochastic_matrix(M)

Den stokastiske matrisen til reaksjonsveien $\text{A} \underset{k_{-1}}{\stackrel{k_1}\rightleftharpoons} \text{B} \xrightarrow{k_2} \text{C}$ er gitt ved

$$
    \mathbf{M} = 
    \begin{bmatrix}
        1 - k_1 &  k_{-1} & 0  \\
         k_1 &  1 - k_2 - k_{-1} & 0\\
         0 & k_2  & 1
    \end{bmatrix} .
$$


**Monte Carlo simulering:** 
$\text{A} \underset{k_{-1}}{\stackrel{k_1}\rightleftharpoons} \text{B} \xrightarrow{k_2} \text{C}$.

In [None]:
A = np.zeros(Nt_2, dtype=int)
B = np.zeros(Nt_2, dtype=int)
C = np.zeros(Nt_2, dtype=int)
A[0] = N
...

c = np.array([A, B, C]).T
kinetics.plot(c/N, kinetics.equilibrium(k1, k_1, k2), 
              r"Monte Carlo: A $\rightleftharpoons}$ B $\to$ C")

Implementasjonen i cellen under ligner mye på den forrige ( for $\text{A} \to \text{B} \to \text{C}$). En viktig forskjell er at sannsynligheten for $\text{B} \to \text{A}$ og $\text{B} \to \text{C}$ avhenger av hverandre, og må derfor bruke samme tilfeldige tall.

In [None]:
A = np.zeros(Nt_2, dtype=int)
B = np.zeros(Nt_2, dtype=int)
C = np.zeros(Nt_2, dtype=int)
A[0] = N
for n in range(Nt_2-1):
    pA = np.random.random(A[n])
    pB = np.random.random(B[n])
    A_to_B = np.sum(pA < k1)
    B_to_C = np.sum(pB < k2)
    B_to_A = np.sum(pB < (k_1 + k2)) - B_to_C
    A[n+1] = A[n] - A_to_B + B_to_A
    B[n+1] = B[n] + A_to_B - B_to_A - B_to_C
    C[n+1] = C[n] + B_to_C
            
c = np.array([A, B, C]).T
kinetics.plot(c/N, kinetics.equilibrium(k1, k_1, k2), r"Monte Carlo: A $\rightleftharpoons}$ B $\to$ C")

Med dette avslutter vi delen om stokastiske simuleringer.