In [None]:
import numpy as np
import matplotlib.pyplot as plt
from openmolecularsystems.systems import TwoLJParticles
from openmolecularsystems.tools.md import langevin_NVT
import simtk.unit as unit
import molsysmt as msm
from tqdm import tqdm

# La termodinámica del proceso asociación-disociación de dos partículas LJ

Recordemos que estamos definiendo el sistema de dos partículas de Lennard-Jones en una caja cúbica con condiciones de contorno periódicas con los siguientes parámetros:

In [None]:
# Particula A
mass_A = 40.0 * unit.amu
sigma_A = 2.0 * unit.angstroms
epsilon_A = 2.0 * unit.kilocalories_per_mole

# Particula B
mass_B = 120.0 * unit.amu
sigma_B = 4.0 * unit.angstroms
epsilon_B = 4.5 * unit.kilocalories_per_mole

# Box
Lbox = 5.0*unit.nanometers
box = np.zeros((3, 3))*unit.nanometers
box[0,0] = Lbox
box[1,1] = Lbox
box[2,2] = Lbox

El potencial Lennard-Jonnes entre las partículas se define mediante la expresión:

\begin{equation}
V(l) = 4 \epsilon_{red} \left[ \left( \frac{\sigma_{red}}{l} \right)^{12} - \left( \frac{\sigma_{red}}{l} \right)^{6} \right]
\end{equation}

Donde $l$ es la distancia entre las partículas A y B en el espacio periódico cúbico de lado $L_{box}$:

\begin{equation}
dist(\vec{r}_{A},\vec{r}_{B}) = \sqrt{\theta(x_{A},x_{B})^2+\theta(y_{A},y_{B})^2+\theta(z_{A},z_{B})^2}
\end{equation}

con

\begin{equation}
\theta(q_{A},q_{B}) =
\begin{cases}
q_{B}-q_{A}-L_{box} \;\;\;\; \rm{si} \;\;\; \frac{L_{box}}{2}<(q_{B}-q_{A}) \\
q_{B}-q_{A}+L_{box} \;\;\;\; \rm{si} \;\;\; (q_{B}-q_{A})\leq-\frac{L_{box}}{2} \\
q_{B}-q_{A} \;\;\;\; \rm{si} \;\;\; -\frac{L_{box}}{2}<(q_{B}-q_{A})\leq\frac{L_{box}}{2}
\end{cases}
\end{equation}

y los parámetros reducidos del potencial se construyen desde los parámetros de las partículas de la siguiente manera:



\begin{equation}
\sigma_{red} = \frac{\sigma_{A}+\sigma_{B}}{2}
\end{equation}

\begin{equation}
\epsilon_{red} = \sqrt{\epsilon_{A}\epsilon_{B}}
\end{equation}



Supongamos ahora que queremos conocer la probabilidad de que ambas partículas se encuentren "unidas" o "asociadas" a la temperatura de 300K.

In [None]:
# Estado termodinámico
temperature = 300*unit.kelvin
KbT = unit.BOLTZMANN_CONSTANT_kB * unit.AVOGADRO_CONSTANT_NA * temperature

Podemos calcular la probabilidad de encontrar a las dos partículas separadas una distancia $d$ de la siguiente manera:

\begin{equation}
P(l) = \frac{1}{Z_{V}} \iiint_{0.0}^{L_{box}} \iiint_{0.0}^{L_{box}} e^{-\frac{1}{K_{B}T}V(l)} \delta\left(l−dist(\vec{r}_{A}, \vec{r}_{B})\right) \; d\vec{r}_{A} d\vec{r}_{B}
\end{equation}

Siendo la parte del potencial de la función de partición total:

\begin{equation}
Z_{V} = \iiint_{0.0}^{L_{box}} \iiint_{0.0}^{L_{box}} e^{-\frac{1}{K_{B}T}V\left(dist(\vec{r}_{A}, \vec{r}_{B})\right)} \; d\vec{r}_{A} d\vec{r}_{B}
\end{equation}

Esta expresión corresponde a la definición tal cual es. Podemos resolver estas integrales reescribíendolas de manera inteligente, pero antes, intentemos calcular numéricamente $Z_{V}$ de esta manera para que tengas una idea de cuanto tiempo puede costar resolver una integral sexta (considerando todas las conformaciones posibles de dos partículas en tres dimensiones) en Python:

In [None]:
sigma_red = 0.5*(sigma_A+sigma_B)
epsilon_red = np.sqrt(epsilon_A*epsilon_B)

def potential(distance):
    
    global sigma_red, epsilon_red
    
    d_aux = sigma_red/distance
    
    return 4.0*epsilon_red*(d_aux**12-d_aux**6)

def distance_AB_with_PBC(rA, rB, box_length):

    box_half_length=0.5*box_length
    r_ab = rA-rB
    for jj in range(3):
        if r_ab[jj]>box_half_length:
            r_ab[jj]-=box_length
        elif r_ab[jj]<-box_half_length:
            r_ab[jj]+=box_length
        output=(r_ab[0]**2+r_ab[1]**2+r_ab[2]**2)**0.5
    
    return output

In [None]:
def calc_ZV(box_length, n_bins_dimension):
    
    global KbT
    
    dxA=box_length/n_bins_dimension
    dyA=dxA
    dzA=dxA
    dxB=dxA
    dyB=dxA
    dzB=dxA
    dv=dxA*dyA*dzA*dxB*dyB*dzB
    
    rA = np.zeros([3])*unit.nanometers
    rB = np.zeros([3])*unit.nanometers
    
    for ii_A in tqdm(range(n_bins_dimension)):
        rA[0] = ii_A*dxA
        for jj_A in range(n_bins_dimension):
            rA[1] = jj_A*dyA
            for kk_A in range(n_bins_dimension):
                rA[2] = kk_A*dzA
                for ii_B in range(n_bins_dimension):
                    rB[0] = ii_B*dxB
                    for jj_B in range(n_bins_dimension):
                        rB[1] = jj_B*dyB
                        for kk_B in range(n_bins_dimension):
                            rB[2] = kk_B*dzB
                            
                            dist = distance_AB_with_PBC(rA, rB, box_length)
                            if dist<0.00001*unit.nanometers:
                                try:
                                    output+= 0*dv
                                except:
                                    output= 0*dv
                            else:
                                V = potential(dist)
                                try:
                                    output+= np.exp(-V/KbT)*dv
                                except:
                                    output= np.exp(-V/KbT)*dv
    
    return output

In [None]:
ZV = calc_ZV(5.0*unit.nanometers, 10)

In [None]:
ZV

En mi laptop este cálculo cuesta un poco más de 4 minutos con una discretización muy pobre, $\Delta x =0.5 \; \rm{nm}$, una resolución espacial mayor incluso que $\sigma_{red}$. Para tener una estimación mínimamente decente tendríamos que al menos hacer divisiones cada angstrom. Estimemos cuanto tiempo costaría este cálculo. 50 divisiones por dimensión significa incrementar en $x5$ cada uno de los 6 bucles. Haríamos entonces $x5^{6}$ iteraciones con respecto al cálculo que hicimos. Veamos cuanto tiempo sería esto:

In [None]:
time=(4*unit.minutes)* 5**6
print(time.in_units_of(unit.days), 'days')

Ahora imagina lo que costaría un cálculo de este tipo si tenemos del orden de 5000 átomos en un caja periódica.

Sucede que para este sistema tenemos todavía recursos para que el cálculo sea sencillo y rápido, en primer lugar se puede demostrar que la probabilidad $P(d)$ se puede reescribir como:


\begin{equation}
P(l) = \frac{1}{Z_{V}} \iiint_{0.0}^{L_{box}} d\vec{r} \iiint_{-L_{box}/2}^{L_{box}/2} e^{-\frac{1}{K_{B}T}V(l)} \delta (l−\lVert \vec{u} \rVert) \; d\vec{u}
\end{equation}

Siendo la parte del potencial de la función de partición total:

\begin{equation}
Z_{V} = \iiint_{0.0}^{L_{box}} d\vec{r} \iiint_{-L_{box}/2}^{L_{box}/2} e^{-\frac{1}{K_{B}T}V(\lVert \vec{u} \rVert)} \; d\vec{u}
\end{equation}

Así que simplificando:

\begin{equation}
P(l) = \frac{1}{\hat{Z}_{V}} \iiint_{-L_{box}/2}^{L_{box}/2} e^{-\frac{1}{K_{B}T}V(l)} \delta (l−\lVert \vec{u} \rVert) \; d\vec{u}
\end{equation}

donde $\hat{Z}_{V}$ es:

\begin{equation}
\hat{Z}_{V} = \iiint_{-L_{box}/2}^{L_{box}/2} e^{-\frac{1}{K_{B}T}V( \lVert \vec{u} \rVert )} \; d\vec{u}
\end{equation}

Hemos reducido las integrales sextuples a integrales triples. Pero todavía podemos hacer más porque nuestras funciones a integrar dependen de un parámetro, la distancia. Pero además el potencial tiende a cero rápidamente, emplear un umbral sobre el cual hacemos cero el potencial, puede ahorrar tiempo de cálculo para obtener $P(d)$:

In [None]:
distance_serie = np.linspace(0.01, 2.5, 500) * unit.nanometers
potential_serie = potential(distance_serie)

plt.plot(distance_serie, potential_serie)
plt.ylim([-5,10])
plt.xlabel('x [{}]'.format(distance_serie.unit.get_symbol()))
plt.ylabel('V [{}]'.format(potential_serie.unit.get_symbol()))
plt.hlines(0, 0.0, 2.0, linestyles='dotted', color='gray')
plt.show()

Vamos a suponer que el potencial es cero desde la distancia umbral $l_{top}=2.0 \; \rm{nm}$, no parece una mala aproximación y simplifica mucho las cosas. Veamos cuanto vale el potencial en ese punto:

\begin{equation}
V(l) \approx
\begin{cases}
4 \epsilon_{red} \left[ \left( \frac{\sigma_{red}}{l} \right)^{12} - \left( \frac{\sigma_{red}}{l} \right)^{6} \right] \;\;\;\;\; si \;\;\; l \leq l_{top} \\
0 \;\;\;\;\; si \;\;\; l> l_{top}
\end{cases}
\end{equation}

In [None]:
potential(2.0*unit.nanometers) # aunque lo importante es ver el valor de la primera derivada (la fuerza).

Con esta aproximación podemos entonces reescribir:

\begin{equation}
\hat{Z}_{V} \approx \int_{0}^{l_{top}} 4 \pi l^{2} e^{-\frac{1}{K_{B}T}V(l)} \; dl + \left[L_{box}^{3}-\frac{4}{3}\pi l_{top}^{3}\right]
\end{equation}

Ya podemos entonces calcular el valor de la función de partición total $\hat{Z}_{V}$. Resolveremos el término integral numéricamente.

In [None]:
def zV(x):
    
    global sigma_red, epsilon_red, KbT
    
    x_aux = sigma_red/x
    Vx =  4 * epsilon_red * (x_aux**12 - x_aux**6)

    return (4*np.pi*x**2)*np.exp(-Vx/KbT)

def integral_numerica_1D (f, lim_inf, lim_sup, n_bins):
    
    delta_x = (lim_sup - lim_inf)/n_bins
    
    x = lim_inf

    for ii in range(1,n_bins):
        try:
            output += f(x)*delta_x
        except:
            output = f(x)*delta_x
        x += delta_x
    
    return output

In [None]:
ltop = 2.0 * unit.nanometers
ZV = integral_numerica_1D(zV, 0.000001*unit.nanometer, ltop, 1000)
ZV += (Lbox)**3 - (4/3)*np.pi*ltop**3

In [None]:
ZV

Ahora, la parte del numerador para el cálculo de la función de densidad de probabilidad de la distancia entre las dos partículas lo haremos también en coordenadas polares para que la función delta de dirac simplifique la integral:

\begin{equation}
P(l) = \frac{1}{\hat{Z}_{V}} \iiint_{-L_{box}/2}^{L_{box}/2} e^{-\frac{1}{K_{B}T}V(l)} \delta (l−\lVert \vec{u} \rVert) \; d\vec{u} = \frac{1}{\hat{Z}_{V}} e^{-\frac{1}{K_{B}T}V(l)} \phi(l) \; dl
\end{equation}

Donde aquí el valor $\phi(l)$ corresponde a la superficie de la esfera de radio $l$ circunscrita en un cubo de lado $L_{box}$ que queda dentro de dicho cubo. Resolveremos este valor también numéricamente, pero esta vez utilizando una aproximación de tipo monte carlo:

In [None]:
def portion_of_sphere_surface_inside_cube(radius, Lbox, n_mc_tries):
    
    half_Lbox = 0.5*Lbox
    
    try_in = 0

    for ii in range(n_mc_tries):
        aux=np.random.randn(3)
        norm_aux=sum(aux*aux)**.5
        point_unit_sphere=aux/norm_aux
        point_distance_sphere=radius*point_unit_sphere

        if np.all(np.abs(point_distance_sphere)*radius.unit<=half_Lbox):
            try_in+=1

    portion=try_in/n_mc_tries

    return portion

La función anterior nos ofrece una buena estimación de la fracción de superficie de la esfera de radio $l$ que queda dentro del cubo de lado $L_{box}$ en el que está circunscrita:

In [None]:
radii_serie = np.linspace(0.001, 5.0, 100)*unit.nanometers
portions_serie = []
for radius in tqdm(radii_serie):
    factor = portion_of_sphere_surface_inside_cube(radius, Lbox, 10000)
    portions_serie.append(factor)

In [None]:
plt.plot(radii_serie, portions_serie)
plt.show()

Así que ya tenemos el valor de $\phi(l)$ para todo $l$:

In [None]:
areas_serie = []*unit.nanometers**2
for radius, portion in zip(radii_serie, portions_serie):
    areas_serie.append((4*np.pi*radius**2)*portion)

In [None]:
areas_serie._value = np.array(areas_serie._value)

In [None]:
plt.plot(radii_serie, areas_serie)
plt.show()

Finalmente, ya podemos representar la densidad de probabilidad de que las dos partículas $A$ y $B$ se encuentren a distancia $l$ en una caja cúbica de lado $L_{box}$ de condiciones de contorno periódicas:

In [None]:
l_serie = np.linspace(0.000001, 5.0 , 500) * unit.nanometer
zVl_serie = []*unit.nanometer**2
for l in tqdm(l_serie):
    portion = portion_of_sphere_surface_inside_cube(l, Lbox, 20000)
    l_aux = sigma_red/l
    Vl =  4*epsilon_red*(l_aux**12-l_aux**6)
    zVl = (4*np.pi*l**2)*portion*np.exp(-Vl/KbT)
    zVl_serie.append(zVl)

Pl_serie = zVl_serie/ZV
Pl_serie._value = np.array(Pl_serie._value)

In [None]:
plt.figure(figsize=[12,3])
plt.plot(l_serie, Pl_serie, label='Theory')
plt.legend()
plt.show()

In [None]:
Fl_theo = -KbT*np.log(Pl_serie)

plt.figure(figsize=[12,3])
plt.plot(l_serie, Fl_theo.in_units_of(unit.kilocalories_per_mole), label='Theory')
plt.ylim([-2,6])
plt.legend()
plt.show()

¿Te recuerda al sistema de doble pozo que vimos anteriormente? Ya podemos calcular las magnitudes termodinámicas $P_\rm{on}$, $P_\rm{off}$, $K_\rm{D}$, $K_\rm{A}$, $\Delta F_\rm{binding}$, ... Pero antes, hagámosnos una pregunta. ¿Donde está la distancia limite por debajo de la cual consideramos el complejo AB formado?¿Cómo definimos el sistema asociado y el disociado? Con el potencial de tipo doble pozo era muy claro... ¿Y ahora? ¿Hacemos uso de la barrera que vemos en la energía libre?

In [None]:
plt.figure(figsize=[12,3])
plt.plot(l_serie, Fl_theo.in_units_of(unit.kilocalories_per_mole), label='F(l)')
plt.plot(distance_serie, potential_serie+2.7*unit.kilocalorie_per_mole, label='V(l)')
plt.xlim([0,2])
plt.ylim([-0.5,3])
plt.vlines(0.58, -0.5, 4.0, linestyle=':', color='gray')
plt.legend()
plt.show()


Hemos situado una linea punteada sobre la coordenada $l_{b}$ de la barrera de la energía libre para saber cómo es la energía potencial en ese punto. A temperatura '0' esta claro que podríamos discutir si $l_{b}$ es o no una buena distancia umbral para definir lo que consideramos como estado "unido". Si a temperatura cero ponemos 1000 pares de partículas A-B a una distancia $l_{b}$, esta claro que el 100% de los pares relajaran al complejo AB formado. No parece un buen límite, ¿cierto? Ahora, si vemos la barrera del doble pozo de las unidades anteriores y ponemos sobre ella 1000 pares de partículas A-B a una temperatura próxima a cero, aproximadamente la mitad de los pares relajarán a su estructura asociada y la otra mitad relajará a su estructura disociada. No parece una definición rigursa de barrera pero si es muy intuitiva. Entonces, si ponemos a 300K 1000 pares A-B a una distancia $l_{b}$... ¿Será equiparable la población que antes visitará el estado "asociado" antes que el "disociado" a la que visitará antes el "disociado" que el "asociado"? ¿Será cierto esto para cualquier paisaje de energía libre? ¿Nos sirve entonces la energía potencial para definir el estado "unido" o "asociado" de un complejo molecular a cierta temperatura?

In [None]:
osystem = TwoLJParticles(atom_1='Dummy_A', atom_2='Dummy_B',
                         box=[[5.0, 0.0, 0.0], [0.0, 5.0, 0.0], [0.0, 0.0, 5.0]]*unit.nanometers)

In [None]:
osystem.parameters

In [None]:
initial_coordinates = np.zeros([2,3])*unit.nanometers
initial_coordinates[0,:] = 1.0*unit.nanometers
initial_coordinates[1,:] = 2.0*unit.nanometers

traj_dict = langevin_NVT(osystem, time=5.0*unit.nanoseconds, saving_timestep=1.0*unit.picoseconds,
                          integration_timestep=5.0*unit.femtoseconds, friction=5.0/unit.picoseconds,
                          temperature=300.0*unit.kelvin, initial_coordinates=initial_coordinates)

Tomemos la distancia entre los dos átomos como coordenada de reacción y construyamos, con los datos de la trayectoria, el paisaje de energía libre sobre esa coordenada de reacción:

In [None]:
distance = msm.distance(traj_dict, selection=0, selection_2=1, pbc=True)

In [None]:
def occupation_probability_density_1d(traj_x, x_range, n_bins):
    delta_x = (x_range[1]-x_range[0])/n_bins
    frequency = np.zeros(n_bins, dtype=int)
    for x in traj_x:
        bin_visited = int((x-x_range[0])/delta_x)
        frequency[bin_visited]+=1
    x_bins_centers = (x_range[0]+0.5*delta_x) + delta_x*np.arange(n_bins)
    bins_probability_density = (1.0/delta_x)*(frequency/frequency.sum())
    return x_bins_centers, bins_probability_density

In [None]:
x_center_bin, px = occupation_probability_density_1d(distance[:,0,0],
                                                     [0.0,5.0]*unit.nanometers, 200)

In [None]:
plt.figure(figsize=[12,3])
plt.plot(x_center_bin, px)
plt.show()

In [None]:
KbT = KbT = unit.BOLTZMANN_CONSTANT_kB * unit.AVOGADRO_CONSTANT_NA * 300.0*unit.kelvin
Fx_traj = -KbT*np.log(px)

In [None]:
plt.figure(figsize=[12,3])
plt.plot(x_center_bin, Fx_traj.in_units_of(unit.kilocalories_per_mole))
plt.show()

Y ahora de manera teórica:

\begin{equation}
P(d) = \frac{1}{Z_{V}} \iiint_{0.0}^{5.0} \iiint_{0.0}^{5.0} e^{-\frac{1}{K_{B}T}V(d)} \delta(d−dist_{PBC}(x_{A}, y_{A}, z_{A}, x_{B}, y_{B}, z_{B})) \; dx_{A} dy_{A} dz_{A} dx_{B} dy_{B} dz_{B}
\end{equation}

Donde:

\begin{equation}
Z_{V} = \iiint_{0.0}^{5.0} \iiint_{0.0}^{5.0} e^{-\frac{1}{K_{B}T}V(dist_{PBC}(x_{A}, y_{A}, z_{A}, x_{B}, y_{B}, z_{B}))} \; dx_{A} dy_{A} dz_{A} dx_{B} dy_{B} dz_{B}
\end{equation}

\begin{equation}
V(x) = 4 \epsilon_{red} \left[ \left( \frac{x}{\sigma_{red}} \right)^{12} - \left( \frac{x}{\sigma_{red}} \right)^{6} \right]
\end{equation}

\begin{equation}
\sigma_{red} = \frac{1}{2}(\sigma_{A} + \sigma_{B})
\end{equation}

\begin{equation}
\epsilon_{red} = \sqrt{(\epsilon_{A}\epsilon_{B})}
\end{equation}


\begin{equation}
dist_{PBC}(x_{A}, y_{A}, z_{A}, x_{B}, y_{B}, z_{B}) = \sqrt{\theta(x_{A},x_{B})^2+\theta(y_{A},y_{B})^2+\theta(z_{A},z_{B})^2}
\end{equation}