In [None]:
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
from scipy.optimize import curve_fit
from fb2 import mm_widget, add_textbox

# Michaelis-Menten Kinetik

Som beskrevet tidligere i kurset kan nogle enzyme katalyserede reaktioner beskrives med **Michaelis-Menten ligningen**:

$$
v = \frac{V_{\mathrm{max}}[S]}{K_m + [S]}
$$

Hvor 

- $v$ er reaktions hastigheden.
- $[S]$ er koncentrationen af substratet. 
- $V_{\mathrm{max}}$ er den maksimale reaktions rate. 
- $K_m$ er Michaelis konstanten

### Opgave 1: Analyse af Michaelis-Menten ligningen

Cellen nedenfor laver et interaktivt plot af Michaelis-Menten ligningen, brug 
dette til at svare p√• disse sp√∏rgsm√•l: 

- Hvad er betydningen af $V_\mathrm{max}$? Hvilken indflydelse har denne parametre? 
- Hvad kontrollere $K_m$ parameteren? Hvad sker der hvis $K_m$ er lille/stor? 
- Hvad er v√¶rdien af reaktions hastigheden n√•r substrat koncentrationen er lig $K_m$?
- Hvorfor er det en asymptoptisk kurve? Hvad betyder det for enzymerne i reaktionen?

Snak gerne om sp√∏rgsm√•lene i sm√• grupper.

In [None]:
mm_widget()

### Datas√¶t

Vi vil i resten af opgaven l√¶re at bruge Python til at fitte Michaelis-Menten ligningen mod data, s√• 
de to parametre kan findes. 

Til dette vil vi bruge data'en vist nedenfor

In [None]:
data = pd.read_csv('combined_data.txt', sep='\t') # L√¶ser data fra en tab-separeret fil
data # Udskriver data for at se hvad der er i filen - P√¶nt i Jupyter Notebook.

Hvor disse st√∏rrelser har f√∏lgende enheder

| Substrate_Concentration | Reaction_Velocity | Inverse_Substrate | Inverse_Velocity |
| ----------------------- | ----------------- | ----------------- | ---------------- |
| $mM$                    | $\frac{ŒºM}{min}$  | $\frac{1}{mM}$    | $\frac{\mathrm{min}}{ŒºM}$ |

For at danne os et indtryk af dataen er det altid en god ide at plotte det.

<div class="alert alert-block alert-info"> <b>Note:</b> L√¶g m√¶rke til at der bruges 
firkant parenteser til at tr√¶kke kolonner ud af datas√¶ttet. 
F.eks. <code>x_data = data['Inverse_Substrate']</code></div>

In [None]:
fig, axes = plt.subplots(1, 2, figsize=(7, 3))
x_data = data['Inverse_Substrate'] # Bruger [...] til at hente kolonne
y_data = data['Inverse_Velocity'] 
axes[0].plot(x_data, y_data, 'o')
axes[1].plot(data['Substrate_Concentration'], data['Reaction_Velocity'], 'o')

axes[0].set_xlabel('Invers substrat koncentration [1/mM]')
axes[0].set_ylabel('Invers reaktions hastighed [min/ŒºM]')
axes[1].set_xlabel('Substrat koncentration [mM]')
axes[1].set_ylabel('Reaktions hastighed [ŒºM/min]')

Vi vil gerne finde ud af om det givne data opf√∏rer sig som vi forventer - sagt 
p√• en anden m√•de vil vi se om det passer med formlerne. 

Vi vil g√∏re dette ved at fitte dataen til ligningerne, dette er et *curve fit*. 
Python har mange redskaber der kan hj√¶lpe os, i dette tilf√¶lde vil vi bruge `curve_fit`-funktionen. 

For at bruge `curve_fit` skal vi fort√¶lle programmet formlen for den funktion vi vil fitte mod. 
Det g√∏res ved at definere en funktion der beregner formlen. 


### Opgave 1: Fit af invers koncentration mod invers reaktionshastighed.

Til at starte med vil vi pr√∏ve at fitte en line√¶r funktion,

$$
y = a x + b
$$

Hvor

- $x$: Invers subtrat koncentratation.
- $y$: Invers reaktions hastighed.

S√• vi vil alts√• finde h√¶ldningskoefficienten *a* og sk√¶ringspunktet *b* s√•dan at formlen 
passer bedst muligt til vores data.

Vi starter med at skrive en Python-funktion der definere den lin√¶re funktion

<div class="alert alert-block alert-info"> <b>Note:</b> At definere en funktion i Python er 
som skrive en opskrift ned uden at starte med at lave maden, 
der regnes ikke noget f√∏r funktionen 'kaldes' med () f.eks. <code>line√¶r_funktion(1, 2, 0)</code>.</div>

In [None]:
def line√¶r_funktion(x, a, b):
    """Line√¶r funktion for curve fitting.

    Parametre:
    x : Inverse substrat koncentration
    a : H√¶ldningskoefficient
    b : Sk√¶ringspunkt med y-aksen

    Returnerer:
    V√¶rdien af den line√¶re funktion for givet x.
    """
    return a * x + b # Opgave: Implementer formlen for den line√¶re funktion

Det er altid en god ide at checke at vi har implemeneret en funktion korrekt, 
i dette tilf√¶lde kan vi f.eks. checke at disse g√¶lder

- Hvis `x = 0` skal `line√¶r_funktion` give `b`.
- Hvis `x = 1` og `b = 0` skal `line√¶r_funktion` give `a`.

In [None]:
# Dette kalder funktionen s√• beregningen udf√∏res
line√¶r_funktion(x=0, a=1, b=2) # For x = 0 skal funktionen returnere b

In [None]:
line√¶r_funktion(x=1, a=1, b=0) # For x = 1 og b = 0 skal funktionen returnere a

Nu har vi funktionen og kan nu bruge den til at fitte med. 

Vi starter med at tr√¶kke de relevant kolonner ud af vores datas√¶t.

Den inverse substrat koncentration kan f.eks. tr√¶kkes ud med `data["Inverse_Substrate"]`

In [None]:
x_data = data['Inverse_Substrate'] # Opgave: Hent invers substrat koncentration
y_data = data['Inverse_Velocity']  # Opgave: Hent invers reaktions hastighed

Du kan printe dataen for at se at det er det korrekte

In [None]:
print(x_data)

Nu kan vi bruge `curve_fit` funktionen til at lave fittet. Syntaksen er 

`popt, pcov = curve_fit(funktion, x_data, y_data, p0)`

Hvor `popt` er en liste af de fundne parametre i samme r√¶kkef√∏lge som i definition af funktionen, og 
`p0` er et start g√¶t p√• hvad parametrene kunne v√¶re. 

I dette tilf√¶lde v√¶lger vi at g√¶tte p√• at begge parametre er 1 s√•

In [None]:
p0 = (1, 1) # Opgave: G√¶t p√• startv√¶rdier for a og b

In [None]:
popt, _ = curve_fit(line√¶r_funktion, x_data, y_data, p0=p0) # Opgave: Fit data til den line√¶re funktion
a, b = popt
print(f'H√¶ldning: {a:.3f}') # Vi bruger 'print' til at udskrive v√¶rdier {a:.3f} betyder at vi udskriver a med 3 decimaler
print(f'Sk√¶ringspunkt: {b:.3f}') # Opgave: Udskriv h√¶ldning og sk√¶ringspunkt

<details>
    <summary><strong><span style="color: lightblue; font-size: 18px;">üí° Ekstra info</span></strong></summary>
    <p> curve_fit funktionen returnere en liste af de fundne parametre v√¶rdier, og variansen af dem. Ved at sige <code>popt, _</code> s√¶ttes variansen i en dummy variable <code>_</code> som vi ikke bruger.</p>
  </details>

Som vi har h√∏rt i forel√¶sningen er dette  fit af reciprokke st√∏rrelser kendt som 
Lineweaver‚ÄìBurk transformationen; 


\begin{align*}
y &= v  \\ 
&= a x + b \\ 
& = a [S] + b \\
& = \frac{K_m}{V_\mathrm{max}} [S] + \frac{1}{V_\mathrm{max}}
\end{align*}


S√• kan vi bruge de fundne v√¶rdier af h√¶ldningen og sk√¶ringspunktet til at beregne $V_\mathrm{max}$ og $K_m$.
Det kan vises at

$$
V_{max} = \frac{1}{b}
$$

$$
K_m = \frac{a}{b}
$$

In [None]:
V_max = 1 / b # Opgave: Beregn V_max
K_m = a / b   # Opgave: Beregn K_m
print(f'V_max: {V_max:.3f} [ŒºM/min]')
print(f'K_m: {K_m:.3f} [mM]')

<div class="alert alert-block alert-info"> <b>Note:</b> Det er altid v√¶gt at holde styr p√• enheder af beregnede st√∏rrelser. Fra ligningen \(v = \frac{V_{\mathrm{max}}[S]}{K_m + [S]}\) kan vi se at enheden 
af \(K_m\) skal v√¶re \(mM\) og at \(V_{\mathrm{max}}\) har samme enhed som $v$ alts√• [ŒºM/min].</div>

Vi kan nu bruge de fundne parametre til at udregne kurven fra vores fit.

In [None]:
x_fit = np.linspace(-1, 11, 100) # Dette laver 100 punkter mellem -1 og 11
y_fit = line√¶r_funktion(x_fit, a, b) # Vi bruger den line√¶re funktion til at beregne y-v√¶rdierne for de x-v√¶rdier vi har lavet

For at vurdere hvor godt vores fit passer kan vi beregne mean squared error (MSE)
fittet og vores data

$$
\mathrm{mse} = \frac{1}{N} \sum_i (f(x_i) - y_i)^2
$$
Hvor $f$ er den funktion vi har fittet, $N$ er antallet af data eksempler og $x_i$ og $y_i$ er vores data.
Figuren nedenfor illustrerer hvordan MSE kan fortolkes

<img src="https://images.prismic.io/encord/08ced892-f045-41f7-9007-d1ab3b426159_image7.png?auto=compress,format" width="600">

In [None]:
mse = np.sqrt(np.mean((line√¶r_funktion(x_data, a, b) - y_data) ** 2))
print(f'Mean Squared Error: {mse:.1e}')

Du burde f√• en MSE sammenlignlig med `3.4e-16` som bettyder $3.4 \times 10^{-16}$, alts√• et meget lille tal.

Nu kan vi plotte vores fit sammen med dataen.

In [None]:
fig, ax = plt.subplots(figsize=(3.5, 3.5))

# Plot af den fitted line√¶re funktion
ax.plot(x_fit, y_fit, color='red') # Opgave: Plot den fittede funktion

# Plot af data -  dette plotter data som cirkler
ax.plot(data['Inverse_Substrate'], data['Inverse_Velocity'], 'o')

# S√¶tter en tekstboks med de fittede parametre ind
add_textbox(ax, a=a, b=b, V_max=V_max, K_m=K_m, mse=mse)

ax.set_xlabel('Invers substrat koncentration [1/mM]')
ax.set_ylabel('Invers reaktions hastighed [min/ŒºM]');

<div class="alert alert-block alert-success"> <b>Takeaway:</b> Vi kan se at det  fit passer meget godt med vores data! Vi kan se det visuelt, linjen g√∏r igennem alle vores data punkter og kvantativt har vi regnet en 
MSE p√• st√∏rrelses orden \(1 \times 10^{-16}\) (0.0000000000000001) som er p√• st√∏rrelse ordne af den numeriske 
pr√¶cision af Python brugt p√• denne m√•de.</div>

<details>
    <summary><strong><span style="color: lightblue; font-size: 18px;">üí° Ekstra info - Textbox </span></strong></summary>
    <p> Hvis du er interesseret kan du se koden for at lave tekstboxen med <code>add_textbox??</code> i en kode celle. 
    Dette kan g√∏res for alle funktioner som du gerne vil forst√• i mere detalje. </p>
  </details>

### Opgave 2: Michaelis-Menten fit 

Nu vil vi fitte direkte til Michaelis-Menten ligningen, som igen er givet ved 

$$
v = \frac{V_{\mathrm{max}}[S]}{K_m + [S]}
$$

Vi skal alts√• finde parametrene $V_\mathrm{max}$ og $K_m$.

Vi starter med at definere en funktion der beregner formlen

In [None]:
def michaelis_menten(S, V_max, K_m):
    return (V_max * S) / (K_m + S) # Opgave: Implementer Michaelis-Menten ligningen

Et par ting der skal g√¶lde for funktionen er; 

- For store v√¶rdier af koncentrationen `S` skal reaktions hastigheden v√¶re t√¶t p√• `V_max`
- N√•r koncentrationen er lig med Michaelis konstanten skal reaktionshastigheden v√¶re 1/2 `V_max`.

Brug denne information og de to n√¶ste celler til at analysere om din funktion er korrekt.

In [None]:
v = michaelis_menten(S=100, V_max=10, K_m=1)
print('S = 100, V_max = 10, K_m = 1')
print(f'v = {v:.2f}') # Skal v√¶re t√¶t p√• V_max

In [None]:
v = michaelis_menten(S=0.5, V_max=10, K_m=0.5)
print('S = 0.5, V_max = 10, K_m = 0.5')
print(f'v = {v:.2f}') # Skal v√¶re t√¶t p√• 1/2 V_max

N√•r du er tilfreds kan du g√• videre til at lave fittet

F√∏rst skal vi hente den afh√¶ngige og uafh√¶ngige variable fra vores datas√¶t

In [None]:
x_data = data['Substrate_Concentration'] # Opgave: Hent substrat koncentration
y_data = data['Reaction_Velocity']  # Opgave: Hent reaktions hastighed

Nu har vi tre ting
- x: Den uafh√¶ngige variable
- y: Den afh√¶ngige variable
- En funktion 

S√• vi mangler bare et start g√¶t p√• v√¶rdierne af $V_\mathrm{max}$ og $K_m$, som f√∏r v√¶lger vi at s√¶tte dem til 1.

In [None]:
p0 = (1, 1) # Start v√¶rider for V_max og Km

Nu er vi klar til at lave fittet. 

Brug i cellen nedenfor `curve_fit` og tr√¶k de to parametere ud i hver deres variable `V_max` og `K_m`.

<details>
    <summary><strong><span style="color: lightblue; font-size: 18px;">üí° Hint 1 </p></strong></summary>
    Husk at <code>curve_fit</code> returnere to ting en liste <code>popt</code> og <code>pcov</code> som vi ikke skal bruge.
  </details>

<details>
    <summary><strong><span style="color: lightblue; font-size: 18px;">üí° Hint 2 </p></strong></summary>
    Husk at du skal give 4 argumenter til <code>curve_fit</code> og at r√¶kkef√∏lgen skal v√¶re rigtig.    
  </details>

<details>
    <summary><strong><span style="color: lightblue; font-size: 18px;">üí° Hint 3 </p></strong></summary>
    Parameterne returneres <code></code> som en liste af tal i samme r√¶kkef√∏lge som de er brugt i funktionen <code>michaelis_menten</code>. Hvis du gemmer den i en variable <code>popt</code> kan du indeksere for at tr√¶kke 
    hvert enkelt ud <code>V_max = popt[0]</code>
  </details>


In [None]:
print(f'V_max: {V_max}')
print(f'K_m: {K_m}')

Ligesom med det lin√¶re fit kan vi nu regne funktionen med de fittede parametre og bruge 
disse til at udregne MSE og lavet et plot

In [None]:
x_fit = np.linspace(0, data['Substrate_Concentration'].max(), 100) # Laver 100 punkter mellem 0 og den maksimale substrat koncentration
y_fit = michaelis_menten(x_fit, V_max, K_m)

Vi regner MSE p√• samme m√•de, ved at sammenligne beregne funktions-v√¶rdier med data.

In [None]:
mse = np.sqrt(np.mean((michaelis_menten(x_data, V_max, K_m) - y_data) ** 2))
print(f'Mean Squared Error: {mse:.1e}')

Og endeligt kan vi plotte vores fit

In [None]:
fig, ax = plt.subplots(figsize=(4, 4))
ax.plot(data['Substrate_Concentration'], data['Reaction_Velocity'], 'o')
ax.plot(x_fit, y_fit, label='Fitted Michaelis-Menten funktion', color='red')

add_textbox(ax, V_max=V_max, K_m=K_m, mse=mse)

ax.set_xlabel('Substrat koncentration [mM]')
ax.set_ylabel('Reaktions hastighed [ŒºM/min]')
ax.set_xlim(0-0.5, x_fit.max()+0.5)

<div class="alert alert-block alert-success"> <b>Takeaway:</b> Vi f√•r igen et rigtig godt fit med en meget lille MSE, 
og de fundne v√¶rdier af \(V_\mathrm{max}\) og \(K_m\) er de samme som vi fandt med det lin√¶re fit. </div>

# Opsamling

Vi har studeret Michaelis-Menten kinetik og l√¶rt at bruge Python til at fitte Michalis-Menten ligningen 
til at datas√¶t. 

Samme procedure kan bruges til at fitte andre former for ligninger til mange andre datas√¶t! 

Husk at skridtene til at fitte en ligning er

1. Definer en Python funktion for den ligninger der skal fittes med. 
2. Specifere det data der skal bruges, b√•de `x` og `y`-v√¶rdier. 
3. V√¶lg et start g√¶t for de parametre der fittes `p0`.
3. Brug `curve_fit` til at f√• de fittede parametre. 