# Clase 3
# Algebra lineal aplicada al metabolismo celular

## Contenidos

1. Métodos númericos con `numpy`
2. Breve introducción al metabolismo celular
3. Simulación de flujos metabólicos usando Programación lineal


# 1. Métodos numéricos con numpy


Resolución de sistemas de ecuaciones lineales
--------------------------------------------------------

El siguiente sistema de equaciones lineales

\begin{equation}
10a + 2b = 20 \\ 
3a + 7b = 19
\end{equation}

Se puede escribir como 

\begin{equation}
\left[ \begin{array}{ccc} 10 & 2 \\ 3 & 7 \\ \end{array} \right]\left[ \begin{array}{c} a \\ b \\ \end{array} \right] = \left[ \begin{array}{c} 20 \\ 19 \\ \end{array} \right]
\end{equation}

O de manera más compacta:

\begin{equation} 
Ax = b
\end{equation}

Usando algebra lineal podemos encontrar $x$:

\begin{align}
Ax &= b \\
A^{-1} Ax &= A^{-1}b \\
x &= A^{-1}b
\end{align}

Para resolver este sistema en Python utilizaremos la libreria [numpy](http://www.numpy.org/)

In [11]:
# Carga la libreria numpy y la renombra np (simplemente para ser más conciso)
import numpy as np 

# Definiendo matrices
A = np.matrix([[10,2], [3,7]])
b = np.matrix([[20], [19]])

# Calculando la inversa de A

A_inverse = np.linalg.inv(A)

# Resolviendo para X
x = A_inverse * b # esta es la libreria de al
print( x )
print( A*x )

[[1.59375]
 [2.03125]]
[[20.]
 [19.]]


Ejercicios
-----------

Resuelve los siguientes sistemas de ecuaciones, definiendo una función que tome como input $A$ y $b$, y entregue como resultado $x$.

1. Sistema de 3x3

    \begin{align}
    10a + 2b + 3c &= 20 \\ 
    3a + 7b + 5c &= 19 \\
    3a + 7b + 7c &= 15
    \end{align}

2. Sistema de 4x4

    \begin{align}
    10a + 2b + 3c + 3d &= 20 \\ 
    3a + 7b + 5c + 1d &= 19 \\
    3a + 7b + 7c + 10d &= 15 \\
    4a + 9b + 8c + 9d &= 18 
    \end{align}

# 2. Breve introducción al metabolismo celular

El problema es que incluso la red de un organismo simple, como el de la bacteria *Escherichia coli*, luce así:

<img src="https://raw.githubusercontent.com/mrivas/ModelamientoDeProcesosBiotecnologicos/master/clase4_eColiMetabolis.png" alt="Drawing" style="width: 800px;"/>

["Fuente KEGG"](https://www.genome.jp/kegg-bin/show_pathway?eco01100+M00125)

Resumen: ¡Es complicado!. **Busquemos un modelo a escala más pequeño para ganar intución.**

## Metabolismo y la paradoja del origen de la vida

La [NASA ha definido la vida como](https://www.ncbi.nlm.nih.gov/pmc/articles/PMC3005285/): 

1. Un sistema químico autosustentable,
2. capaz de evolución Darwiniana.

La primera condición involucra el metabolismo, toda vez que el metabolismo es el conjunto de reacciones químicas que extraén energía del medio y producen todos los precursores (nucleotidos, lipidos, azucares, y aminoacidos) para generar biomasa.

Sin embargo, la segunda condición implica que los objetos vivos tienen nucleotidos (o algún otro medio de almacenamiento de información) a su disposición, los cuales pueden reordenar. Pero los nucleotidos son moleculas complejas que dificilmente se crea de manera espontanea. Algún organimso debió ser el primero en crearlos.

## Teoría del metabolismo primero

Una explicación a la aparición de bases nucleotidas es que no fueron creados por un organimso, sino por un conjunto de reacciones simples que son las precursoras de la vida. Esta hipótesis se denomina [metabolismo primero](http://www.preposterousuniverse.com/blog/2010/03/10/free-energy-and-the-meaning-of-life/). Según esta hipotesis, un conjunto de reacciones quimicas espontaneas pueden autoreplicarse para aumentar progresivamente la complejidad de las moleculas involucradas, las cuales a su vez pueden crear sistemas más complejos. Sólo cuando hay un nivel de complejidad mínimo se puede apelar al mecanismo de evolución Darwiniana. 

Uno de los candidatos a metabolismo primogenio es la transformación de CO2 y H2 en CH4.

<img src="https://raw.githubusercontent.com/mrivas/ModelamientoDeProcesosBiotecnologicos/master/clase4_problemSolvedByLife.png" alt="Drawing" style="width: 500px;"/>

Imagen de una [presentación de Eric Smith](http://www.santafe.edu/~desmith//PDF_talks/SFI_publec_OOL.pdf)


<img src="https://raw.githubusercontent.com/modcommet/Clases/master/methaneFreeEnergy.jpg" width="500">

Perfil de energía libre a través de la vía geoquímica (en purpura) a metano contrastado con la vías acetogénica bacteriana (triangulos) y metanogénica de las arqueas (cuadrados), ambas usando la via de la acetil conenzima-A.(Imagen adpatada de [Yung et al 2010](http://journalofcosmology.com/SearchForLife128.html) )

In [7]:
# Ejemplo de una reacción termodinamicamente favorable pero sin un mecanismo de liberación de energía
from IPython.lib.display import YouTubeVideo
from datetime import timedelta

start=int(timedelta(hours=0, minutes=0, seconds=10).total_seconds())
stop=int(timedelta(hours=0, minutes=0, seconds=44).total_seconds())
YouTubeVideo("xYjF9WPyZfg", start=start, end=stop, theme="light", color="red")

Análisis en estado estacionario de una red simple
=========================================

Supongamos que este metabolismo primigenio está dado por la siguiente red (inventada) de reacciones:

<img src="https://raw.githubusercontent.com/modcommet/Clases/master/metanogenesis.png" width="500">


1. ¿Cuál es el balance de masa de sus metabolitos en estado estacionario?
2. ¿Cómo podemos representar el balance de masa en notación matricial?
3. ¿Cómo podemos calcular el valor de los flujos metabólicos?



# 3. Simulación de flujos metabólicos usando Programación lineal


La distribución de flujos metabolicos de una celula puede ser modelado como:

\begin{align}
\mbox{max}\ & f(x)=c^Tx \\
\mbox{s.a.} & \\
&Sx=0 \\
&LB<=x<=UB
\end{align}

En donde `S` es la matriz estequiométrica, `x` los flujos metabólicos, y `LB` y `UB` que son los limites inferiores (lower bound) y superiores (upper bound) de cada flujo. Por otra parte, `c` contiene los coeficientes que ponderan el aporte de cada `x` a la generación de una función apropiada, las cuales tipicamente corresponden a biomasa o producción de energía. 

Para resolver este tipo de problemas usando el método simplex existe la librería `scipy.optimize.linprog`. Típicamente un modelo metabólico consiste en restricciones de igualdad, por ejemplo: 


\begin{align}
\mbox{min}\ &f(x)=70x_1+80X_2+85X_3 \\
\mbox{s.a:}\ & \\
&x_1+x_2+x_3+x_4=999 \\
&x_1+4x_2+8x_3+x_5 = 4500 \\
&40x_1 + 30x_2 +20x_3 = 36000 \\
&3x_1 + 2x_2 +4x_3 +x_6= 2700 \\
&x>=0
\end{align}

puede ser resuelto con la siguiente sintaxis:

In [13]:
import numpy as np
from scipy.optimize import linprog
from numpy.linalg import solve

A = np.array([
[1, 1, 1, 1, 0, 0],
[1, 4, 8, 0, 1, 0],
[40, 30, 20, 0, 0, 0],
[3, 2, 4, 0, 0, 1]])

b = np.array([999, 4500, 36000, 2700])
c = np.array([70, 80, 85, 0, 0, 0])

LB=[0]*6      # [0,0,0,0,0,0]
UB=[100000]*6 # ya sabes la idea

res = linprog(c, A_eq=A, b_eq=b, bounds=list(zip(LB,UB)))
print('Optimal value:', res.fun, '\nX:', res.x)

Optimal value: 63000.00000805061 
X: [8.99999999e+02 5.90578300e-07 5.89605907e-08 9.89999998e+01
 3.60000000e+03 7.90838148e-10]


Sin embargo, `linprog` tambien nos permite resolver problemas en donde las restricciones son una mezcla de igualdades y desigualdades. Por ejemplo:

\begin{align}
\mbox{min}\ &f(x)=70x_1+80X_2+85X_3 \\
\mbox{s.a:}\ & \\
&x_1+x_2+x_3=999 \\
&x_1+4x_2+8x_3 \le 4500 \\
&40x_1 + 30x_2 +20x_3 \le 36000 \\
&3x_1 + 2x_2 +4x_3 \le 2700 \\
&x>=0
\end{align}

Puede ser resuelto con las siguiente sintaxis:

In [9]:
import numpy as np
from scipy.optimize import linprog
from numpy.linalg import solve

A_eq = np.array([[1,1,1]])
b_eq = np.array([999])

A_ub = np.array([
[1, 4, 8],
[40,30,20],
[3,2,4]])

b_ub = np.array([4500, 36000,2700])

c = np.array([70, 80, 85])

LB=[0]*3
UB=[100000]*3

res = linprog(c, A_eq=A_eq, b_eq=b_eq, A_ub=A_ub, b_ub=b_ub,bounds=list(zip(LB,UB)) )
print('Optimal value:', res.fun, '\nX:', res.x)

Optimal value: 73724.99999997338 
X: [635.99999999 330.          33.        ]


Ejercicio
-------------

Dadao que el flujo limitante es $E_1=10$ [mmol/gDW/h], calcular el valor de los flujos metabólicos asumiendo que:

1. El organismo maximiza la producción de CH4.
2. El organismo maximiza la producción de F420.

In [15]:
[10]+[0]*7

[10, 0, 0, 0, 0, 0, 0, 0]