# Preparación de archivos para dinámica molecular con NAMD: PSF y PDB

### Primeramente, es importante que te familiarices con los archivos *.psf , .pdb* y los archivos de topología y parámetros de CHARMM 
- [.pdb](https://www.ks.uiuc.edu/Training/Tutorials/namd/namd-tutorial-unix-html/node22.html)
- [.psf](https://www.ks.uiuc.edu/Training/Tutorials/namd/namd-tutorial-unix-html/node23.html)
- [Topology](https://www.ks.uiuc.edu/Training/Tutorials/namd/namd-tutorial-html/node24.html)
- [Parameters](https://www.ks.uiuc.edu/Training/Tutorials/namd/namd-tutorial-html/node25.html)
  
### Para ejecutar dinámica molecular con NAMD, es necesario tener cuatro archivos con distinta información:
- Coordenadas de cada átomo del sistema
- Cargas, tipos de átomo y la estructura del sistema (enlaces, ángulos, diedros, etc.)
- Parámetros para evaluar la energía potencial del sistema
- Las "reglas" que va a seguir nuestra simulación  


> Puedes identificar que tipo de archivo es cada uno de estos?

---

## Parte 1: Preparación de archivos y obtención de estados de protonación

En esta parte, vamos a generar el archivo *.psf* a partir de un archivo de topología de CHARMM y un *.pdb*  
Es importante mencionar que de paso, también solvataremos y vamos a agregar iones al sistema  
> Por qué haremos esto?


Primero, en nuestro directorio de trabajo vamos a crear las siguientes 5 carpetas:

In [None]:
mkdir 0_prep 1_min 2_term 3_eq 4_prod 

Además, en el directorio base vamos a agregar el siguiente archivo ya descomprimido:  
- [CHARMM Force Field Files](https://www.charmm.org/archive/charmm/resources/charmm-force-fields/download.php?filename=CHARMM_ff_params_files/toppar_c36_jul19.tgz)  

Debe quedar una carpeta llamada toppar

In [5]:
ls -l

total 36
drwxrwxr-x  2 wong wong 4096 mar 16 22:10 [0m[01;34m0_prep[0m/
drwxrwxr-x  2 wong wong 4096 mar 16 22:10 [01;34m1_min[0m/
drwxrwxr-x  2 wong wong 4096 mar 16 22:10 [01;34m2_term[0m/
drwxrwxr-x  2 wong wong 4096 mar 16 22:10 [01;34m3_eq[0m/
drwxrwxr-x  2 wong wong 4096 mar 16 22:10 [01;34m4_prod[0m/
-rw-rw-r--  1 wong wong 4504 mar 16 22:15 MolecularDynamicsTutorial.ipynb
drwxrwxr-x  2 wong wong 4096 mar 16 21:38 [01;34mnbimages[0m/
drwxr-xr-x 14 wong wong 4096 mar 16 22:17 [01;34mtoppar[0m/


> Ignorar la carpeta nbimages y el archivo .ipynb

Nos movemos a la carpeta 0_prep
```
cd 0_prep
```

Dentro de esta carpeta, vamos a poner los siguientes archivos:
- [PDB de BSA](https://files.rcsb.org/download/4F1S.pdb)
- Script de Bash para imprimir los residuos a modificar su estado protonación [(ph_cleaning.sh)](https://classroom.google.com/c/NjU0NDM0ODg1OTk3/p/NjY5NTYyNTUwNjUx/details)
- Script de Python para separar los residuos que se deben protonar y los que se deben desprotonar [(patching_info.py)](https://classroom.google.com/c/NjU0NDM0ODg1OTk3/p/NjY5NTYyNTUwNjUx/details)

Renombraremos el pdb a BSA_unprep.pdb

In [8]:
mv 4f5s.pdb BSA_unprep.pdb

Procederemos a revisar los residuos que será necesario ajustar su estado de protonación ejecutando nuestro script  
```
bash ph_cleaning.sh
```

> Verifica si tienes propka instalado utilizando: pip install propka

> Es posible que necesites activar el ambiente mds

La salida debería verse algo así:

**We need to unprotonate:  
    Resname  Resid Chain   pka  model_pka  
363     LYS    221     A  6.61       10.5  
432     LYS    294     B  6.33       10.5  
We need to protonate:  
    Resname  Resid Chain   pka  model_pka  
163     GLU    251     B  7.36        4.5  
203     HIS     67     A  7.79        6.5  
207     HIS    246     A  8.20        6.5  
208     HIS    287     A  7.62        6.5  
220     HIS     67     B  7.78        6.5  
224     HIS    246     B  8.72        6.5  
225     HIS    287     B  7.17        6.5  
227     HIS    366     B  7.19        6.5**

Es importante que guardes esta información, en especial: *Resname, Resid  y Chain*

## Parte 2: Creación de archivo .psf en VMD

Vamos a abrir el archivo *BSA_unprep.pdb* en VMD

```
vmd BSA_unprep.pdb
```

Aquí, me gustaría que se dieran el tiempo de observar la proteína de forma general y de cerca, las siguientes cosas
- La presencia de hidrógenos
- Los residuos que el script de protonación nos dijo que debemos modificar

Para modificar los estados de protonación de GLU y LYS, usaremos parches pero para protonar las HIS, no existe un parche.  
Sin embargo, existe una entrada como residuo, entonces cambiaremos el nombre de las HIS a HSP

En la terminal de VMD pondremos los siguientes comandos línea por línea

```
set hsps [atomselect top "(chain A and resid 67 246 287) or (chain B and resid 67 246 287 366)"]
$hsps set resname HSP
```

Seguido esto, en la ventana VMD Main, nos iremos a *Extensions > Modeling > Automatic PSF Builder*

![autopsf](nbimages/automaticpsfbuilder.png)

A continuación, vemos la pantalla del plugin AutoPSF. En el cuadro azul, hay que verificar que este nuestra molécula  
con la que abrimos el programa y a la cual le cambiamos el nombre de las Histidinas, muchas veces cuando tenemos un error  
y queremos volver a empezar el programa selecciona otro archivo temporal y los errores se van en cascada  
En el cuadro naranja, tenemos el nombre que tendrán los archivos de salida, a mi me gusta usar el sufijo: *_unsolvate*
  
El cuadro de Topology Files, tiene cargado archivos de parámetros de CHARMM que se encuentran comúnmente, son versiones más viejas  
de lo que tenemos en nuestra carpeta toppar. Si quisieramos agregar otros archivos, utilizamos la opción Add. Por el momento, solo  
necesitamos utilizar la opción *Load input files*

![psf_1](nbimages/psf_1.png)

En el paso 2 haremos la selección para lo cual nos interesa generar el archivo *.psf*. En este caso vamos a seleccionar *protein*  
Este paso sirve para "limpiar" nuestro sistema de moléculas no deseadas. Finalizamos con la opción:  
*Guess and split chains using current selections*

![psf_1](nbimages/psf_2.png)

En la siguiente sección hay que verificar si el programa identifico de forma correcta las cadenas y segmentos del sistema  
En este caso tenemos correctamente las dos cadenas de la proteína. Si seleccionamos las cadenas que se ven en el cuadro azul  
podemos ver cuales son en el visualizador de VMD. Para agregar, editar o eliminar cadenas tenemos las opciones del lado derecho.  
Para proceder, usamos: *Create Chains*

![psf_1](nbimages/psf_3.png)

En el paso 4, vamos a asignar Parches a los residuos. Estas son modificaciones que se hacen a algunos residuos para cumplir con ciertas  
propiedades, como enlaces de azufre o estados de protonación. En los archivos de Topología podemos encontrar los parches disponibles.  
AutoPSF automaticamente asigna el parche DISU de enlaces de Azufre  a todos los pares de azufre con una distancia menor a 3 Angstroms.  
Iremos a la opción Add Patch para agregar los parches de los estados de protonación que modificaremos

![psf_1](nbimages/psf_4.png)

Se abre este menú, en donde llenaremos los campos correspondientes para generar los parches.

![patch](nbimages/patch.png)

En nuestro caso, los parches que usaremos son:  
- LSN AP1:221
- LSN BP1:294
- GLUP BP1:251

Después de agregar los parches, verificamos que aparezcan en AutoPSF.  
Para finalizar, usamos *Apply patches and finish PSF/PDB*

![patch](nbimages/psf_5.png)

Si todo sale bien, nos aparecerá esta ventana, hay que ver bien cuales son los nombres de los archivos de salida.  
![psf_out](nbimages/psf_results.png)

## Parte 3: Solvatación e ionización del sistema

Para mantener un orden, a mi me gusta cerrar VMD y cambiar el nombre de estos archivos:
- BSA_unsolvate_formatted_autopsf.pdb ---> BSA_unsolvate.pdb
- BSA_unsolvate_formatted_autopsf.psf ---> BSA_unsolvate.psf

Ahora vamos a abrir los archivos en VMD
```
vmd BSA_unsolvate.psf BSA_unsolvate.pdb
```

> Te invito a que veas que pasa si solamente abres el archivo psf o si los abres en orden inverso. Si no abres el archivo .psf no se puede hacer lo siguiente

> Observa que ahora si tenemos protones en el sistema

Ahora, tenemos que terminar de modelar nuestro sistema en un ambiente fisiológico. Para esto, tenemos que solvatar y agregar iones.  
Contrario a la clase, ahora lo haremos en la terminal de VMD. Para solvatar:  
```
package require solvate
solvate 
solvate BSA_unsolvate.psf BSA_unsolvate.pdb -o BSA_solvate -rotate -t 15
```

Vamos a limpiar nuestro espacio de trabajo de VMD para observar nuestra proteína solvatada. Dejaremos solamente la que tiene el sufijo _solvate  
Para esto, vamos a dar clic derecho y luego Delete Molecule  
![del_molecule](nbimages/delete_molecule.png)

Para ionizar, seguiremos un método similar a la solvatación. 
```
package require autoionize
autoionize
autoionize -psf BSA_solvate.psf -pdb BSA_solvate.pdb -sc 0.15 -o ../BSA_wb
```

> En este caso puse en la salida ../ para guardar los archivos finales del sistema en nuestro directorio padre

Ahora eliminamos la molecula sin iones para visualizar nuestro sistema. Las selecciones que puedes usar en Graphical Representations:
- protein
- water
- ions

![system](nbimages/system.png)

## Parte 4: Obtención de las dimensiones del sistema

Antes de finalizar, para poder ejecutar el paso de minimización debemos tener información sobre las dimensiones del sistema.  
Necesitamos el centro y el tamaño de la caja, para esto usaremos los siguientes comandos en la terminal de VMD

### Centro 

```
set all [atomselect top all]
measure center $all
```

### Dimensiones

```
pbc get
```

### Resultado  
En mi caso, obtuve esto:  
Centro: -0.17828397452831268 0.15849146246910095 -4.632832050323486  
Dimensiones: {95.360001 179.488007 112.685997 90.000000 90.000000 90.000000}  

Guarda esta información. El centro lo puedes redondear a dos decimales y las dimensiones a números enteros.  
Si te fijas en dimensiones tenemos 6 números, los primeros 3 son los que nos interesan y los otros son los ángulos entre los vectores