# Clase 5: I/O con Archivos

* Ya hemos visto como recibir entradas de usuario con `input` y salidas con `print`.

* En muchas circunstancias querremos un input/output (I/O) con archivos.

* Nuestro programa podrá leer de un archivo y escribir en otro

# Descargar los archivos

Usaremos algunos archivos previamente hechos, para acceder a ellos tienes que descargarlos, puedes hacerlo ejecutando la siguiente celda 

(este código no es de python, es de terminal bash, por eso anteponemos un ! en la celda)

**Ejecuta esta celda para empezar**

In [None]:
!git clone https://github.com/furcelay/python-QTC.git
%cd python-QTC/Tutoriales/archivos

## Abrir archivos

Podemos abrir un archivo con la función `open()` que recibe el nombre del archivo (o ruta completa a este) y el modo en que se abre el archivo.

```python
mi_archivo = open("ruta/archivo.formato", 'modo')
```

El modo puede ser uno de los siguientes:
* `'r'`: lectura (read), **solo permite leer el archivo**
* `'w'`: escritura (write): **crea un archivo en blanco** (borrando el anterior si es que existía) y **permite escribir** en él
* `'a'`: añadir (append): **abre un archivo ya existente** y **permite escribir** añadiendo líneas al final

## Cerrar archivos

Una vez terminamos de usar el archivo debemos cerrarlo (por ejemplo para que otras aplicaciones puedan acceder a él)

Esto se hace con el método `close`

```python
# cerramos el archivo
mi_archivo.close()
```

## Trabajando con archivos

El esquema general al trabajar con archivos es el siguiente:

```python

mi_archivo = open("ruta/archivo.formato", 'modo')

# leemos o escribimos en mi_archivo
...

mi_archivo.close()
```

Otra sintaxis conveniente para esto es usando un *context manager* de la siguiente manera con `with`:

```python
with open("ruta/archivo.formato", 'modo') as mi_archivo:
    # leemos o escribimos en mi_archivo
    ...

# el archivo se cierra automáticamente al salir del bloque identado
```

De esta manera no olvidamos cerrar el archivo y además nos aseguramos de que se cierre aunque ocurra algún error en el programa

## Leer archivos

Para leer un archivo debemos abrirlo en modo lectura (`'r'`):

```python
mi_archivo = open("ruta/archivo.formato", 'r')
```

Luego podemos acceder al contenido del archivo de muchas maneras, en este curso veremos dos:

* `mi_archivo.readlines()`: lee todo el archivo y lo retorna como una lista. Cada elemento de la lista es una línea como string.
* `for linea in mi_archivo`: también podemos iterar sobre las líneas del archivo con un loop for.
* Para más formas de leer un archivo ver la [documentación](https://docs.python.org/3/tutorial/inputoutput.html#methods-of-file-objects)

### readlines()

In [None]:
ejemplo_1 = open("ejemplos/ejemplo_1.txt", 'r')

lineas_archivo = ejemplo_1.readlines()

In [None]:
lineas_archivo

In [None]:
lineas_archivo[0]

Todas las líneas del archivo terminan con un salto de línea `\n`, si queremos quitarla usamos el método `strip()` de los string:

In [None]:
lineas_archivo[0].strip()

También remueve espacios al comienzo y al final

In [None]:
lineas_archivo[-1]

In [None]:
lineas_archivo[-1].strip()

**no debemos olvidarnos de cerrar el archivo**

In [None]:
ejemplo_1.close()

Luego podemos por ejemplo trabajar con esta lista en un loop for:

In [None]:
for linea in lineas_archivo:
    # quitamos \n y espacios
    linea = linea.strip()
    print(linea)

Podemos hacer lo mismo con la sentencia `with`

In [None]:
with open("ejemplos/ejemplo_1.txt", 'r') as ejemplo_1:
    lineas_archivo = ejemplo_1.readlines()

for linea in lineas_archivo:
    # quitamos \n y espacios
    linea = linea.strip()
    print(linea)

### for linea in archivo:

Podemos hacer lo mismo que antes con un loop for directamente sobre el archivo ya que este es un iterable:

In [None]:
ejemplo_1 = open("ejemplos/ejemplo_1.txt", 'r')

for linea in ejemplo_1:
    # quitamos \n y espacios
    linea = linea.strip()
    print(linea)

ejemplo_1.close()

Podemos hacer lo mismo con la sentencia `with`

In [None]:
with open("ejemplos/ejemplo_1.txt", 'r') as ejemplo_1:
    for linea in ejemplo_1:
        # quitamos \n y espacios
        linea = linea.strip()
        print(linea)

## Escribir archivos

Para crear un archivo nuevo abrimos un archivo en modo escritura (`'w'`):

```python
mi_archivo = open("ruta/archivo.formato", 'w')
```

Luego podemos escribir un string en el archivo con 

```python
mi_archivo.write(string)
```

El string debe terminar con '\n' para poder escribir una nueva línea después

In [None]:
ejemplo_2 = open("ejemplos/ejemplo_2.txt", 'w')

In [None]:
texto = "vamos a escribir un archivo"

ejemplo_2.write(texto + "\n")

In [None]:
texto = "cada vez que usamos write se genera una nueva línea"

ejemplo_2.write(texto + "\n")

In [None]:
ejemplo_2.close()

Si queremos escribir strings de una lista podemos hacerlo en un loop for:

In [None]:
lista_texto = ["primera linea", "segunda linea", "tercera linea"]

with open("ejemplos/ejemplo_3.txt", 'w') as ejemplo_3:
    for linea in lista_texto:
        ejemplo_3.write(linea + "\n")

Por ejemplo si queremos escribir datos de una tabla:

In [None]:
tabla = [[0.651, 0.071, 0.803],
         [0.751, 0.086, 0.498],
         [0.668, 0.943, 0.304],
         [0.080, 0.936, 0.797],
         [0.777, 0.035, 0.350]]

En este caso debemos trabajar más los datos para convertirlos a un string, tomemos como ejemplo una fila y luego lo haremos para toda la tabla

In [None]:
fila = tabla[0]

fila

primero convertimos los datos a string

In [None]:
# hacemos un loop en los índices de la fila para poder modificarla
for i in range(len(fila)):
    # convertimos los números a str
    fila[i] = str(fila[i])
    
fila

luego convertimos la fila en un string separando los elementos por coma

In [None]:
fila = ','.join(fila)

fila

Este es un string que podría escribirse en un archivo

Hagámoslo con todas las filas en on loop:

In [None]:
# abrimos el archivo en modo escritura
with open("ejemplos/ejemplo_4.txt", 'w') as ejemplo_4:
    # recorremos las filas en un loop y las convertimos a string
    for fila in tabla:
        # convertimos los números a string
        for i in range(len(fila)):
            fila[i] = str(fila[i])
        
        # convertimos la línea a un string de números separados por coma
        fila = ','.join(fila)
        
        # escribimos la línea en el archivo
        ejemplo_4.write(fila + "\n")

# Extra: break

`break` sirve para "romper" un loop for o while. Cuando aparece break el loop termina

Se usa generalmente dentro de una condición `if` (o `elif`, `else`)

Por ejemplo en un loop for podemos usarlo para salir del loop cuando se cumpla una condición:

In [None]:
palabra_clave = "miau"

archivo = "ejemplos/texto_break.txt"

lista_texto = []

with open(archivo, 'r') as archivo_break:
    for linea in archivo_break:
        
        lista_texto.append(linea)
        
        if palabra_clave in linea:
            break

In [None]:
lista_texto

# Ejercicios en conjunto

**Objetivos:**
1. Aprender a trabajar con archivos
2. Extraer información relevante contenida en tablas de Gaussian
3. Escribir los resultados en un archivo fácil de leer con otros programas

**Caso de estudio:**
Intentaremos obtener las energías de los orbirales de un sistema químico y en particuar de los orbitales frontera HOMO y LUMO desde un archivo de salida da Gaussian

## Ejercicio 1

### a)

En este ejercicio trabajaremos solo con la tabla de orbitales alpha, **ver ejercicio_1.txt**.

Objetivo:
1. Definir una función que lea un archivo y retorne una lista con las
   líneas del archivo
2. Definir una función que reciba una lista con las líneas del archivo
   y entregue una lista con los orbitales alpha ocupados 
   y otra con los orbitales alpha desocupados
3. El código debe ser genérico tal que funcione también con orbitales beta

### b)
En este ejercicio trabajaremos solo con la tabla de orbitales alpha, **ver ejercicio_1.txt**.

Objetivo:
1. Obtener las energías de los orbitales frontera HOMO y LUMO (alpha)

## Ejercicio 2
En este ejercicio trabajaremos con la tabla de orbitales alpha y beta, **ver ejercicio_2.txt**

Objetivos:
1. Definir una función que reciba las líneas de un archivo 
   con los orbitales alpha y beta y las separe en una de orbitales
   alpha y otra de orbitales beta

2. Obtener orbitales frontera para alpha y beta

## Ejercicio 3
En este ejercicio trabajaremos con la salida de un cálculo de energía de Gaussian, **ver ejercicio_3.txt**

Objetivos:
1. Encontrar un patrón de inicio y fin para extraer la tabla de orbitales alpha y beta
2. Obtener una lista que contenga las líneas del archivo que corresponden a la tabla de orbitales alpha y beta
3. Usar las funciones anteriores para obtener los orbitales frontera

## Ejercicio 4
Ahora usaremos un archivo con múltiples cálculos de energía, uno por cada punto de una reacción dada por un IRC, **ver ejercicio_4.txt**

Objetivos:
1. Encontrar un patrón que permita separar los archivos
2. Separar los archivos creando una lista con el texto de cada uno y guardarlos en una lista
3. Obtener los orbitales frontera de cada uno

## Ejercicio 5
Objetivos:
1. Escribir los resultados del ejercicio anteriore en un archivo .dat (separado por tab)
2. Debe incluir headers indicando los nombres de cada columna

# Ejercicios individuales

[Coding Rooms](https://app.codingrooms.com/app)!