## Visualización de moléculas y macromoléculas

Este cuaderno interactivo lo introducirá a los conceptos básicos de visualización y análisis de moléculas orgánicas y macromoléculas biológicas usando programas libres como Avogadro y PyMOL.

### 1. Introducción a Avogadro 

Avogadro es un **editor molecular** para construir y ver moléculas y materiales en 3D.

#### Instalción 

Para evitar conflictos con versiones de OpenBabel ya instaladas en nuestra computadora, es conveniente hacer la instalación en un nuevo entorno de conda

* Descargar e instalar anaconda: https://www.anaconda.com/products/individual

* Crear un nuevo entorno de conda:  
``` bash
> conda create -n myenv
```

* Activar el entorno: 
``` bash
> conda activate myenv 
```

* Instalar avogadro dentro del entorno: 
``` bash
> conda install -c rpmuller avogadro
```


#### Una vez instalado.....

Cuando abre inicialmente Avogadro, se le presentará una pantalla como la que se muestra a continuación:

![avogadro_fig1.png](attachment:avogadro_fig1.png)


#### Abrir un archivo 

Lo primero que probablemente querrá hacer es abrir un archivo y visualizar una molécula. Para ello haga clic en el menú **File** y seleccione **Open...**

![avogadro_fig2.png](attachment:avogadro_fig2.png)

Se admite una gran cantidad de tipos de archivos, incluidos CML, XYZ, SDF, Mol2, PDB, etc. Se suministran varias moléculas de ejemplo con Avogadro.


![avogadro_fig3.png](attachment:avogadro_fig3.png)

La captura de pantalla anterior muestra el archivo etanol.cml usando el tipo de visualización predeterminado "Ball and Stick". Tenga en cuenta que cuando se abre un archivo nuevo, Avogadro cambia de modo "Drawing" a modo "Navigation", lo que le permite ver la molécula sin editarla.

#### Navagación

Puede acercar/alejar la vista con la rueda de desplazamiento del mouse o manteniendo presionado el botón central del mouse y moviendo el cursor del mouse arriba/abajo. Puede rotar la vista manteniendo presionado el botón izquierdo  y moviendo el cursor del mouse. También puede transladar la vista manteniendo presionado el botón derecho y moviendo el cursor del mouse.

#### Creando moleculas

Las moléculas se pueden construir y editar con la herramienta de dibujo (Drawing mode).

![avogadro_fig4.png](attachment:avogadro_fig4.png)


Puede comenzar a crear una molécula haciendo clic izquierdo en la pantalla negra. Esto generará un átomo de carbono. Haciendo clic derecho sobre el átomo lo borrará.

![avogadro_fig5.png](attachment:avogadro_fig5.png)



Al hacer clic con el botón izquierdo y arrastrar el mouse, se generará un enlace con otro átomo de carbono:
![avogadro_fig6.png](attachment:avogadro_fig6.png)



Se pueden seleccionar diferentes elementos en el menú desplegable "Elements":

![avogadro_fig7.png](attachment:avogadro_fig7.png)



Por ejemplo, si desea crear una molécula de agua, puede escribir "O" o seleccionar "Oxígeno (8)" en el menú desplegable y hacer clic izquierdo en la pantalla negra.

![avogadro_fig8.png](attachment:avogadro_fig8.png)



Si la casilla "Ajust hidrogens" está marcada, los hidrógenos en la molécula se ajustan automáticamente para satisfacer la valencia (como se muestra arriba).

![avogadro_fig9.png](attachment:avogadro_fig9.png)



El orden de enlace se puede cambiar a través del menú desplegable "Bond order" o escribiendo los números "1", "2" o "3". Los enlaces también se pueden agregar a una molécula haciendo clic con el botón izquierdo en un enlace que ya se ha creado. Al hacer clic con el botón derecho en un enlace, se eliminará el enlace y el átomo al que está unido.

![avogadro_fig10.png](attachment:avogadro_fig10.png)

Por ejemplo, para crear dióxido de carbono, se debe dibujar la estructura general ("O-C-O") y luego, al hacer clic con el botón izquierdo en los enlaces de la molécula, se crearán enlaces dobles.

![avogadro_fig11.png](attachment:avogadro_fig11.png)



En el menú "Extensions", la geometría de una molécula se puede optimizar seleccionando "Optimize geometry".

![avogadro_fig12.png](attachment:avogadro_fig12.png)

Luego de finalizada la optimización, la molécula de dioxido de carbono adquiere una conformación lineal. 
Avogadro viene equipado con diferentes campos de fuerza o Force Fields (ya estudiaremos mas adelante los campos de fuerza). Por defecto Avogadro utiliza el campo de fuerza de mecánica molecular UFF (Universal Force Field) para realizar las optimizaciones de geometría. Este campo de fuerza puede optimizar la geometría de todos los elementos y funciona bien con materiales inorgánicos y materiales organometálicos.


Para mas información sobre las funcionalidades de Avogadro puede consultar la página del programa: https://avogadro.cc/

<div class="alert alert-block alert-warning">

<b> Actividad 1 </b>


Considere la siguiente reación de adicion del ácido bromhídrico a propeno:


</div>

![Screenshot%20from%202022-02-19%2016:28:16.png](attachment:Screenshot%20from%202022-02-19%2016:28:16.png)


<div class="alert alert-block alert-warning">

a) ¿Cuál de estos dos compuestos de bromopropano será el producto principal de una reacción de bromación de propeno? Justifique. 


b) Construya los reactivos propeno y ácido bromhídrico y optimice sus geometrías empleando el campo de fuerza UFF. Calcule la energía de los reactivos optimizados empleando los campos de fuerza disponibles en Avogadro.

<blockquote>  <b>Ayuda:</b> En el menu Extensions --> Molecular Mechanics --> Setup Force Field puede elegir el campo de fuerza. Luego puede estimar la energía con: Extensions --> Molecular Mechanics --> Calculate Energy </blockquote>


c) Construya los posibles interemediarios formados por la adicion del átomo de H del HBr sobre el carbono 1° y carbono 2° del propeno. Optimize los intermediarios empleando el campo de fuerza UFF. Luego calcule la energía de las estructuras optimizadas empleando los campos de fuerza disponibles.


d) Construya los productos de ambos caminos de reacción. Optimicelos con UFF y estime la energía con todos los campos de fuerza. 


e) Con las energias estimadas para reactivos, intermediarios y productos, grafique los perfiles de energía de la reacción de formación de 1-bromopropano y 2-bromopropano empleando matplotlib.pyplot. 
<blockquote> <b>Ayuda:</b> Puede guardar primero las energías en listas de python y utilizar estas listas como entradas para graficar con la función plt.plot().</blockquote>  


f) ¿Como interpreta los resultados? ¿Que campos de fuerza predicen correctamente el producto principal? 

</div>


In [9]:
# ESCRIBA SUS RESPUESTAS EN ESTA CELDAE

### 2. Introducción a PyMOL

#### Instalación
Puede descargar el instalador de Pymol apropiado para su sistema operativo de: https://pymol.org/2/#download

#### La interfaz PyMOL
Cuando se abre PyMOL, aparecen dos ventanas. La ventana más pequeña (llamada "GUI externa") contiene la barra de menú (Archivo, Editar, Ayuda, Mostrar, etc.), botones de acceso directo para comandos comunes y la línea de comando.<br>
La segunda ventana es el **Visualizador de PyMOL** donde se muestran los modelos 3D y el usuario interactúa (por ejemplo, gira) y manipula el modelo.Los objetos que renderiza PyMOL en 3D se cargan desde archivos de coordenadas que describen las posiciones de los átomos individuales en la molécula.<br> 

![Viewer_guide.png](attachment:Viewer_guide.png)

PyMOL puede mostrar más de un objeto a la vez, el **Panel de control de objetos** permite ajustar los modos de visualización, los colores, las etiquetas, etc para cada objeto. Después de cada nombre de objeto hay un conjunto de botones de comando que controlan el objeto. Estos son los botones y algunas de sus opciones:

**A** - Acciones: cambiar el nombre, duplicar, eliminar, aplicar ajustes preestablecidos, realizar cálculos <br>
**S** - Mostrar: cambia la representación de los átomos, por ejemplo,  **wireframe** o **stick** para visualizar todos los átomos y enlaces de la proteina o **cartoon** para visualizar los elementos de estructura secundaria <br>
**H** - Ocultar: las cosas que se muestran usando S se acumulan y no reemplazan automáticamente la última vista. H es lo opuesto a S y oculta representaciones no deseadas <br>
**L** - Etiqueta: Etiqueta átomos, residuos, etc <br>
**C** - Color: cambia el color de los átomos y grupos <br>

La esquina inferior derecha del Visor contiene una guía para usar el mouse, así como una poderosa herramienta de selección. También hay otra línea de comando en la parte inferior del Visor (PyMOL>).<br>

 
        
#### Operaciones básicas

* Descargue el archivo PDB 1YY8.pdb desde el Protein Data Bank (www.rcsb.org).<br>

* Abralo con PyMOL (en la barra de menu, en la parte superior de la GUI externa, seleccione File→Open→(seleccione el archivo).<br>

* Utilice el mouse y los botones del mouse para rotar (botón izquierdo), transladar (botón medio/rueda) y acercer/alejar (botón derecho) la molécula.<br>

* En el Panel de control de objetos, en la linea del objeto 1YY8 seleccione select **H**ide→Everything, luego **S**how→Cartoon, then **C**olor→By	Chain→By Chain (e.	c), luego **L**abel→Chains.<br>

    Debería ver dos copias del fragmento de anticuerpo, ya que había dos copias del anticuerpo en la celda unitaria del cristal que se midió para determinar la estructura. Debería ser capaz de ver dos cadenas separadas en cada fragmento de anticuerpo (cadenas A y B en el fragmento 1 y cadenas C y D en el fragmento 2).<br>
    
    Centrémonos en un fragmento. Utilizaremos la linea de comandos que está debajo del visualizador para crear una selección que contenga únicamente las cadenas A y B del fragmento 1. La linea de comandos permite realizar todo tipo de acciones, algunas de ellas simplemente no aparecen en la interfaz gráfica.<br> 
    
    
* En PyMOL> prompt, tipee los siguientes comandos: 
```PyMOL>
PyMOL> select AB, chain A+B
PyMOL> hide all
PyMOL> show cartoon, AB
PyMOL> orient AB
```    
    Note que en el Panel de control de objetos a la derecha, ahora aparece una selección llamada AB sobre la cual ahora puede operar utilizando los botones.<br> 


Puede consultar el Algebra utilizado por PyMOL para crear selecciones en  https://pymolwiki.org/index.php/Selection_Algebra



#### Análisis estructural 
La estructura que ha descargado es cetuximab, un anticuerpo terapéutico en desarrollo para el tratamiento del cáncer. Los anticuerpos en general están compuestos por dos cadenas pesadas y dos cadenas ligeras; la construcción particular de su parte superior se conoce como fragmento Fab y contiene una cadena ligera completa (cadena A) y la mitad N-terminal de una cadena pesada (cadena B). En un extremo del fragmento Fab hay seis loops conocidos como "regiones determinantes de complementariedad" (CDR), que se unen a un antígeno particular. 

![anticuerpo.png](attachment:anticuerpo.png)

* Construya una seleccion que contenga únicamente la cadena ligera del fragmento Fab, mas específicamente el dominio amino-terminal de la cadena ligera (residuos 1 al 107). 

```PyMOL>
PyMOL> select L, chain A and resi 1-107
```

* Luego, en el Panel de control de objetos, oculte todo excepto la selección creada L y coloréela clickeando en **C**olor→Spectrum→Rainbow.<br>
 
* Analicemos un par de cadenas beta en el dominio N-terminal. Visualizando la estructura, encuentre las cadenas 3 y 8 (que deben ser adyacentes y de color cian y caléndula, respectivamente). <br>

* Ahora realicemos algunas medidas entre los residuos de las cadenas 3 y 8. Cree selecciones para los residuos 73 y 21 de las cadena 8 y 3, respectivamente. <br>

* Visualice los átomos de estos residuos con **S**how→Stick, en la selección correspondiente de Panel de control de objetos. Luego coloréelos por elemento con **C**olor→ByElement. (Tenga en cuenta que los átomos de hidrógeno son demasiado pequeños para ser detectados por cristalografía, por eso no se observan en la estructura analizada)<br>
    
* En la barra de menú de la GUI externa, seleccione Wizard→Measurement. Debería desplegarse un menú a la derecha en donde puede seleccionar entre medir Distancia, Angulo, Dihedro, etc. Luego de seleccionar "Distance", PyMOL le pedirá que seleccione los átomos para la medida.<br>  



<div class="alert alert-block alert-warning">
      
<b> Pregunta 2</b>

<ul>
<li> ¿Cual es la distancia entre el átomo de N del L73 y el O de F21? ¿Considera que existe un enlace de hidrógeno entre ambos residuos?</li>   
</ul>    

</div>


In [1]:
# ESCRIBA AQUI SU RESPUESTA


#### Comparando proteínas

* En www.rcsb.org, busque un segundo archivo PDB de cetuximab (codigo 1YY9), esta vez unido a su antígeno, el factor de crecimiento epidérmico.<br> 

* Borre su sesión actual de PyMOL (All→Actions→Delete everything”, en el panel de control de objetos).<br> 

* Use la vista de cartoon y coloree y etiquete por cadena para tener una vision general de las estructuras. Debería ver el fragmento Fab del anticuerpo y el antígeno unido a él.<br> 

* Abra la estructura 1YY8 en la misma sesion. Como lo hizo anteriormente, cree un objeto para las cadenas A y B esconda las cadenas C y D.Tenga en cuenta que en este caso deberá especificar sobre que estructura realiza la selección <br> 

```PyMOL>
PyMOL> select unboundFab, 1YY8 and chain A+B
```

* Del mismo modo, cree un objeto (llámelo boundFab) para el fragmento Fab del anticuerpo unido al antigeno.(Tenga cuidado de especificar el identificadores de cadena correctos; son arbitrarios y pueden variar entre archivos PDB).<br>

* Ahora superponga ambas estructuras con el comando align en linea de comandos: <br> 

```PyMOL>
PyMOL> align unboundFab, boundFab
```

La similaridad estructural entre las dos moléculas se mide por la desviación cuadratica media (RMS) de los átomos alineados. 

![rms_formula.png](attachment:rms_formula.png)

donde $x_i$ y $y_i$ son las coordenadas vectoriales (vectores de desplazamiento) de los n átomos en las dos estructuras. El comando align genera automáticamente una alineación de secuencia para elegir los átomos correctos para comparar y luego resuelve y ejecuta la transformación de coordenadas que minimiza el RMS entre las estructuras.<br>


<div class="alert alert-block alert-warning">
      
<b>Pregunta 3</b>

<ul>
<li> En la terminal de comandos asociada a esta sesión de PyMOL, debe haber algunas líneas que describen el proceso de alineamiento. ¿Cuál es el error RMS calculado para este alineamiento estructural (incluya unidades)?</li> 


<li> Identifique los rangos de residuos involucrados en los 6 loops determinantes de complementariedad (CDRs). ¿Observa mucha diferencia en las region de los CDRs del Fab unido / no-unido a antígeno? </li> 
</ul>

</div>

In [11]:
# ESCRIBA SUS RESPUESTAS AQUI

## Referencias

* https://dasher.wustl.edu/chem430/software/avogadro/learning-avogadro.pdf
* https://pymolwiki.org/index.php/Practical_Pymol_for_Beginners
* https://pymolwiki.org/index.php/Selection_Algebra 