## Lectura y escritura de archivos

Siempre necesitamos leer y escribir archivos. Es la forma básica de interactuar con el resto del sistema, introducir y exportar datos para la "computación". Como en Python todo es un objeto, lo que tenemos es un "objeto manejador de archivos" . La forma más básica de obtener uno es con la función `open()` que se le dice la ruta al archivo y modo/s, que se especifican con 


       'r': lectura (default)
       'w': (sobre)escritura
       'a': agregar contenido al final 
       'x': para escribir, pero no sobreescribe si existe el path
       'b': modo binario
       't': modo texto (default)
       '+':	actualizar contenido
       



Vamos a leer un archivo de coordenadas en formato `.xyz`. La forma de estos archivos es:

`natoms`

`El1   x1   y1   z1`

`El2   x2   y2   z2`

`El3   x3   y3   z3`

`El4   x4   y4   z4`

...

Abrimos el archivo en modo lectura:

In [None]:
coords = open('benceno.xyz', 'r')

Pero `coords` es un **objeto**

In [None]:
type(coords)

Para leer las líneas hay varias opciones. Si el archivo no es muy pesado se puede cargar completamente en la memoria RAM, con el método `readlines()`

In [None]:
lines = coords.readlines()

In [None]:
lines #es una lista, cada elemento es una línea completa del archivo

In [None]:
len(lines) #número de líneas

In [None]:
lines[0]

Obviamente la primera línea no es el número de átomos directamete, hay que hacerle unos cambios para poder leer de ahí el número. En primer lugar quitar el \n del final, esto se hace con el método `strip()`. También hay que convertirlo a entero, con la función `int`.

In [None]:
lines[0].strip()

In [None]:
natoms = int(lines[0].strip())

In [None]:
natoms

Luego sabemos que la línea 1 no contiene información útil. A partir de la línea 2, queremos guardar en listas el símbolo del elemento y las coordenadas. Aquí deberemos usar el método `split()`, que genera una lista separando todos los strings separados por espacios en la línea.   

In [None]:
linea2 = lines[2].strip().split()

In [None]:
linea2

In [None]:
linea2[0],float(linea2[1]),float(linea2[2]),float(linea2[3])

El método más fácil es generar listas vacías e ir guardando sucesivamente la información que se lea del archivo usando `append`. 

In [None]:
names = []
x = []
y = []
z = []

In [None]:
for idx in range(2,natoms+2):
    linea = lines[idx].strip().split()
    names.append(linea[0])
    x.append(float(linea[1]))
    y.append(float(linea[2]))
    z.append(float(linea[3]))

In [None]:
names

A todo esto lo podemos encapsular en una función a la que le demos el archivo y nos devuelva las listas:

In [None]:
def readCoords(filename):
    coords = open(filename, 'r')
    lines = coords.readlines()
    natoms = int(lines[0].strip())
    names = []
    x = []
    y = []
    z = []
    for idx in range(2,natoms+2):
        linea = lines[idx].strip().split()
        names.append(linea[0])
        x.append(float(linea[1]))
        y.append(float(linea[2]))
        z.append(float(linea[3]))
    return names, x, y, z

In [None]:
Bname, Bx, By, Bz = readCoords('benceno.xyz')

-------------------------------
Ahora supongamos que queremos **escribir** un archivo de coordenadas. Para eso abrimos un archivo en modo "write" y usamos el método `write` para escribir línea a línea, recordando introducir un salto de línea `\n` cuando corresponda.

Algo importante es saber escribir cadenas con números dándoles un formato. Esto se hace colocando llaves donde van los números, dentro de las cuales se indica el formato, y al final usando el método `format()` de las cadenas, rellenar esas llaves con los valores adecuados. Por ejemplo:

In [None]:
import math

In [None]:
ejemplo = 'El número pi con 10 cifras decimales es {:.10f}'.format(math.pi)
print(ejemplo)

Ahora vamos a la escritura del archivo en sí:

In [None]:
outcoords = open('out_benceno.xyz', 'w')

In [None]:
outcoords.write('{}\n'.format(natoms))

In [None]:
outcoords.write('\n') # linea en blanco

In [None]:
for idx in range(natoms):
    outcoords.write('{} \t {:.15f} \t {:.15f} \t {:.15f} \n'.format(names[idx],2*x[idx],y[idx],z[idx]))

(`\t` quiere decir `<TAB>` )

In [None]:
outcoords.close()

In [None]:
!cat out_benceno.xyz