<a href="https://colab.research.google.com/github/molecular-mar/molecular-mar.github.io/blob/master/Taller_PyQComp_S1.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# Python en Química Computacional: análisis de datos y visualización molecular

![tdm_2014](https://simulacion-molecular.mx/wp-content/uploads/2023/09/asdf.jpeg)

Este Notebook muestra fundamentos de Python necesarios para el análisis de datos generados en flujos de trabajo de Química Computacional. Adicionalmente, veremos como visualizar algunos sistemas usando también Python.

## Fundamentos de Python

### Qué es Python

Python es un lenguaje de programación, permitiendonos desarrollar aplicaciones computacionales diversas. Algunas de sus características son:

* *Es un lenguaje interpretado*: no requiere compilarse para ejecutarse. Por ello resulta inmediato ejecutar sus programas. Una desventaja es que la interpretación implica un costo adicional frente a programas compilados.

La ejecución requiere de un *interprete*:
```console
$ python program.py
```


* Usando el interprete, es posible ejecutar código de forma interactiva:

```console
$ python
Python 3.9
[GCC 11.3.1 20220421 (Red Hat 11.3.1-2)] on linux
Type "help", "copyright", "credits" or "license" for more information.
>>> # Instrucciones de Python interactivas
```


* *Primordialmente Orientado a Objetos*.

* *Comunidad amplia*: Existe una gran cantidad de bibliotecas, lo que permite su uso en ambitos que incluyen desarrollo web, cómputo científico e inteligencia artificial.

### Jupyter Notebooks y Google Colab

#### Jupyter Notebooks

Las Jupyter Notebooks fueron desarrolladas como *bitácoras* para el análisis de datos. Son documentos formados por bloques, cuyo contenido puede ser texto en formato **Markdown** o código ejecutable en **Python**, aunque es posible usar otros lenguajes.

#### Google Colab

Google Colab es una implementación de los Jupyter Notebooks. Algunos puntos a considerar:

* Permite el acceso a máquinas virtuales, en donde se ejecuta el código desarrollado. Estas incluyen (ejemplo):
  * 12.7 GB de RAM
  * 107.7 GB de Disco duro
  * Acceso a GPU (NVIDIA T4 en la versión gratuita) y a TPU (Tensor Processing Units).
* Puede integrarse con Google Drive.
* Permite en cierto grado el trabajo colaborativo.
* Es necesario acceso a internet.

### Bloques de Texto

Los bloques de texto, como los que has visto hasta este punto en el documento, hacen uso de Markdown. Si haces doble click sobre el texto, puedes acceder al texto en Markdown que genera el texto visualizado.

Para visualizar el contenido generado puedes seleccionar otra celda, o usar la combinación de teclas: ` ⇧ + Enter`. Esta combinación equivale a **Ejecutar** la celda.

Puedes hacer uso de las herramientas de formato que se encuentran en la parte superior de la celda. Esto puede ayudarte a familiarizarte con el formato de Markdown.

Para una descripción más detalladas, abre este [enlace](https://www.markdownguide.org/cheat-sheet/).

*NOTA*: La implementación de Markdown de Google Colab no incluye algunas características (Ej. HTML).

#### Funciones básicas de Colab

* Para abrir o crear un nuevo Notebook, usa el menú *File*.
* Para ver el Índice o Tabla de contenidos, selecciona el primer ícono del lado izquierdo.
* Para crear un nuevo bloque, usa las opciones con el símbolo +, debajo de los Menús.
* Dichas opciones aparecen si colocas tu cursor en la orilla de la celda.
* Algunas opciones aparecen en la esquina superior derecha de la celda cuando la estás editando.


### ❓ Ejercicio sugerido:
Prueba las opciones de formato e intenta generar en una nueva celda un escrito sobre el [Modelo de esferas duras](https://en.wikipedia.org/wiki/Hard_spheres), incluyendo algunas ecuaciones e imágenes.

## Python como calculadora

Ahora, veamos debajo algunas celdas de código. Para ejecutar su contenido, puedes usar la combiación de teclas de *Ejecutar* (ver arriba) o dar click sobre el simbolo ▶ a la izquierda de la celda.

In [None]:
5 + 5

In [None]:
# Esto es un comentario. Empiezan por el simbolo # y son ignorados por el interprete.

In [None]:
1 - 10

In [None]:
100*6 # Nota que los espacios son ignorados

In [None]:
1/5

In [None]:
20 + 10 * (5-3)

In [None]:
10**2 # Potencia

In [None]:
-1//2 # Division entera

In [None]:
4%2 # Modulo

### Variables

Las operaciones observadas son evaluadas y se muestra su resultado. La información usada luego desaparece.
Para que podamos reutilizar esta información debemos de almacenarla, usando para ello variables.

Supongamos que deseamos almacenar la información necesaria para calcular $\Delta G$, usando $$\Delta G = \Delta H - T \Delta S$$

In [None]:
deltaH = -541.5   #kJ/mol
deltaS =  10.4     #kJ/(mol K)
temp = 298      #Kelvin
deltaG = deltaH - (temp * deltaS) # Puedes usar parentesis para agrupar
#deltaG

Algunos puntos a notar:
* Cuando hay varias lineas en un bloque, estas son evaluadas de forma ordenada.
* Cuando almacenamos una variable, su valor no se muestra/imprime de vuelta.
* Podemos imprimir el valor de la variable solo *llamando* a la variable.
* Si llamamos variables en lineas distintas a la última del bloque, esta no se imprimirá.

Para imprimir variables/cantidades/expresiones en cualquier linea, usamos la función `print(variable)`:

In [None]:
print(deltaH)
deltaS * 2 # No se imprime. Tambien nota que no alteramos deltaS
print(temp)
print(temp*deltaS)

In [None]:
#Podemos asignar variables en una misma linea
deltaH, deltaS, temp = -541.5, 10.4, 298
deltaG = deltaH - temp * deltaS
print(deltaG)


### Tipos de variables

Las variables pueden ser de distintos tipos, dado el tipo de información que almacenan. Algunos tipos son entero (`int`), real o de punto flotante (`float`), y texto o cuerdas (`string`).

Es posible cambiar el tipo de una variable `x` usando las funciones `int(x)`, `float(x)` o `str(x)`. La función `type(x)` indica el tipo de una variable.

In [None]:
type(deltaG)

In [None]:
deltaG_string = str(deltaG)
type(deltaG_string)

### Listas y cuerdas

Las listas son un tipo de variable diseñado para almacenar múltiples datos. Las listas se definen entre corchetes `[]`.

In [None]:
# Esto es una lista
energia_kcal = [-13.4, -2.7, 5.4, 42.1]
# Podemos observar su tamanio
energia_tamanio = len(energia_kcal)
energia_tamanio

Otro tipo de variable/dato son las cuerdas. Estas se definen entre comillas simples o dobles (`''` o `""`). Una forma de ver a las cuerdas es como una lista de caractéres.

In [None]:
# Imprime el tamanio de la lista
print('El tamaño de la lista es', energia_tamanio)

In [None]:
# Podemos acceder a los elementos de la lista indicando la posicion
# entre corchetes
energia_kcal[0]

In [None]:
# Convirtamos el segundo valor de la lista en kJ
energia_kiloj = energia_kcal[1] * 4.184
print(energia_kiloj)


In [None]:
# En Python podemos usar indices negativos, que van en sentido 'contrario'
# -1 es el ultimo valor, -2 el penultimo.
energia_kcal[-1]

### Slices

Podemos seleccionar secciones de una lista. Para ello usamos `lista[inicio:fin]`.

In [None]:
energia_kcal[0:2] # Nota que el elemento 'final' no se contempla

In [None]:
# Si no incluyes el elemento 'inicial', se parte desde el primer
# elemento.
energia_kcal[:2]

In [None]:
# Efecto analogo si no incluyes el 'final'
energia_kcal[:2]

## Ciclos For

Es frecuente que necesitemos realizar una tarea de forma reiterada. Para ello, podemos utilizar los ciclos For:

```python
for item in lista:
    # instrucciones
```

En esta instrucción, `item` es una variable que tomará los valores de cada elemento en `lista`. Durante el `for` se ejecutarán las instrucciones *identadas* (con un número fijo de espacios al inicio), y una vez que se ejecuten todas estas `item` cambiará su valor al siguiente elemento de `lista`, hasta terminar con dichos elementos

In [None]:
for energia in energia_kcal:
  print('Una energía en kcal es', energia)
  print('La misma energía en kJ es', energia * 4.184)

In [None]:
energia # La variable termina con el último valor de la lista

Es común usar estos ciclos para generar nuevas variables o listas. Pero debemos crear esa variable o lista antes de editarla en el ciclo.

*Extra:* Las variables definidas en *bloques*, secciones identadas de código, son globales y pueden ser usadas fuera del bloque. La necesidad de definirlas *a priori* es cuando en lugar de definirlas las editamos (`+=` o `x.append()`)

In [None]:
energia_total = 0 # Intenta comentar esta definicion de variable
for energia in energia_kcal:
    energia_total = energia_total + energia # O energia_total += energia
energia_total

En el caso de listas, usamos `lista.append(elemento)` para agregar `elemento` al final de `lista`.

In [None]:
factor_kcal_hartree = 9.597e+20 # Python entiende notacion cientifica
energias_hartree = [] # Lista vacia
for energia in energia_kcal:
    energias_hartree.append(energia * factor_kcal_hartree)
energias_hartree

## Declaraciones Lógicas If

Podemos establecer condiciones para controlar que una o más instrucciones se ejecuten. Para ello usamos:

```python
if condicion:
    # instrucciones
```
La condición es una operación lógica cuyo resultado debe ser cierto(`True`) o falso(`False`). Algunas de estas operaciones son:

* igual a `==`
* no igual a `!=`. `!` Funciona junto con el resto de operaciones lógicas, y equivale a invertir el resultado (si es falso, convertir en cierto, y viceversa),
* mayor que `>`
* menor que `<`
* mayor igual que `>=`
* menor igual que `<=`



In [None]:
#Generemos una lista solo con energias negativas
energias_negativas = []

for energia in energia_kcal:
    if energia < 0:
        energias_negativas.append(energia) # Debemos identar a un nuevo nivel

print(energias_negativas)

In [None]:
# Podemos evaluar mas de una condicion incluyendo
# alguno de los siguientes operadores: 'and', 'or' y 'not'
energia_negativa2 = []
for numero in energia_kcal:
    if numero < 0 or numero < -3: # Prueba cambiando por and
        energia_negativa2.append(numero)

print(energia_negativa2)


## ❓ Ejercicio sugerido:

La siguiente lista tiene valores reales y números almacenados como cuerdas. Copiala en un bloque de código:

```python
lista_datos = ['-12.5', 14.4, 8.1, '42']
```

Crea un ciclo `for` que te permita convertir los elementos que son tipo `string` en tipo `float`. Guarda **todos**
 los elementos en una nueva lista llamada lista_numeros.



## Observaciones sobre Jupyter Notebooks

Ten en cuenta que los Jupyter Notebooks te permiten ejecutar de forma 'desordenada' los bloques de código: puedes intentar ejecutar el último y luego ejecutar el primero. Esto puede afectar el valor de tus variables de formas no esperadas: puedes intentar ejecutar una celda con una variable que no ha sido definida, ya que no ejecutaste la celda correspondiente.