# Trabajar con archivos de texto

En este JNB vamos a ver algunas funciones muy útiles de Python que nos van a permitir trabajar con archivos de texto plano.

## Crear un archivo con IPython

Una forma muy rápida de crear un archivo de texto es usando el _magic command_ de IPython `%%writefile`. Solo tenemos que indicar la ruta y, a continuación, el texto que queremos que contenga. _**¡Cuidado!**_ Si ya existe un archivo con ese nombre lo sobreescribe.

In [1]:
%%writefile data/test.txt
Treinta días trae septiembre
Con abril, junio y noviembre
De veintiocho sólo hay uno
Y los demás, treinta y uno

Overwriting data/test.txt


Para más información de los _magic commands_ de IPython puedes consultar la documentación oficial en [Built-in magic commands](https://ipython.readthedocs.io/en/stable/interactive/magics.html#built-in-magic-commands).

## Leer un archivo con Python

Es muy importante poner bien la ruta para que no nos dé un error.

Para Windows necesitamos usar doble barra invertida (`\\`) o _raw string literals_:

    myfile = open("C:\\Users\\YourUserName\\Folder\\myfile.txt")
    myfile = open(r"C:\Users\YourUserName\Folder\myfile.txt")

Para MacOS y Linux:

    myfile = open("/Users/YourUserName/Folder/myfile.txt")

In [2]:
# Abrimos el archivo que creamos antes
my_file = open('data/test.txt')

Si queremos asegurarnos de que la ruta funciona en cualquier sistema operativo, lo correcto es usar el módulo `os`.

In [3]:
import os

In [4]:
my_file = open(os.path.join('data', 'test.txt'))

### read() y seek()

In [5]:
my_file

<_io.TextIOWrapper name='data/test.txt' mode='r' encoding='UTF-8'>

Como vemos, `my_file` es un objeto de tipo archivo guardado en memoria.

In [6]:
# Para leer el contenido del archivo
my_file.read()

'Treinta días trae septiembre\nCon abril, junio y noviembre\nDe veintiocho sólo hay uno\nY los demás, treinta y uno\n'

In [7]:
# Si lo leemos de nuevo ocurre lo siguiente
my_file.read()

''

Esto se debe a que el cursor de lectura se encuentra ahora al final del archivo tras haberlo leído y no queda nada más que leer. Para resetear el cursor haremos lo siguiente:

In [8]:
# Para ir al inicio del archivo (index 0)
my_file.seek(0)

0

In [9]:
# Leemos de nuevo
my_file.read()

'Treinta días trae septiembre\nCon abril, junio y noviembre\nDe veintiocho sólo hay uno\nY los demás, treinta y uno\n'

Después de trabajar con el archivo lo cerraremos para liberar memoria.

In [10]:
my_file.close()

Si ahora que lo hemos cerrado intentamos volver a abrirlo nos dará error.

In [11]:
# ¡ERROR! El archivo está cerrado
my_file.read()

ValueError: I/O operation on closed file.

### readlines()

También podemos leer un archivo línea a línea usando la función `readlines()`, que devuelve una lista con las líneas del documento.

In [12]:
# Primero abrimos el archivo que habíamos cerrado
my_file = open('data/test.txt')

In [13]:
# (Opcional) Nos aseguramos que el cursor está al inicio del documento
my_file.seek(0)

# Leemos el archivo línea a línea
my_file.readlines()

['Treinta días trae septiembre\n',
 'Con abril, junio y noviembre\n',
 'De veintiocho sólo hay uno\n',
 'Y los demás, treinta y uno\n']

**¡Ojo con los archivos grandes!** Debemos usar este método con precaución ya que todo el contenido se guarda en memoria.

La función `readlines()` devuelve una lista y por tanto podemos acceder a las diferentes líneas de texto usando su índice.

In [14]:
# Seleccionamos la primera línea del archivo
my_file.seek(0)
my_file.readlines()[0]

'Treinta días trae septiembre\n'

In [15]:
# Cerramos el archivo
my_file.close()

## Escribir a un archivo

Por defecto, la función `open()` solo nos deja leer el archivo, si queremos escribir en él necesitamos pasarle el argumento `'w'`. Si pasamos `w+` además de leerlo podremos escribir en él, sin el `+` nos dará error al leer.

In [16]:
# Abrimos el archivo
my_file = open('data/test.txt','w+')

<div class="alert alert-danger" style="margin: 20px">
    <b>¡Cuidado!</b>
    <br>
    Abrir un archivo con 'w' o 'w+' <b>trunca el original</b>, lo que significa que cualquier cosa que que contenga <b>será borrada</b>
</div>

In [17]:
# Escribimos en el archivo
my_file.write('¡Me encanta la programación!')

28

Como vemos, la función nos devuelve el número de caracteres del texto que hemos escrito en el archivo.

In [18]:
# Leemos el archivo
my_file.seek(0)
my_file.read()

'¡Me encanta la programación!'

In [19]:
# Cerramos el archivo
my_file.close()

Si pasamos el argumento `'a'` abrimos el archivo y ponemos el puntero al final, de modo que todo lo que escribamos se añade al final (_append_). Igual que `'w+'`, `'a+'` nos permite leer y escribir en el archivo. Si el archivo no existe se crea uno con ese nombre.

In [20]:
# Escribimos al final del archivo
my_file = open('data/test.txt','a+')
my_file.write('\nVamos a añadir esta frase al final del texto anterior.')
my_file.write('\nY esta otra también.')

21

In [21]:
# Leemos el archivo
my_file.seek(0)
my_file.read()

'¡Me encanta la programación!\nVamos a añadir esta frase al final del texto anterior.\nY esta otra también.'

Si queremos que se muestre con los saltos de línea usaremos `print()`.

In [22]:
# Mostramos el archivo con los saltos de línea
my_file.seek(0)
print(my_file.read())

¡Me encanta la programación!
Vamos a añadir esta frase al final del texto anterior.
Y esta otra también.


In [23]:
# Cerramos el archivo
my_file.close()

Para escribir al final con IPython también podemos usar:

In [24]:
%%writefile -a data/test.txt

Seguimos añadiendo texto a nuestro archivo.
Y aún más texto.

Appending to data/test.txt


Debemos dejar esa línea en blanco debajo del _magic command_ si queremos que la primera línea comience en su propia línea, ya que Jupyter no reconoce las secuencias de escape como `'\n'`.

## Alias y Context Managers
Podemos asignar nombres temporales a variables usando alias, así como gestionar la apertura y cierre de los archivos de forma automática con un **_context manager_**. Para más información puedes consultar la documentación oficial en [Context Managers](https://book.pythontips.com/en/latest/context_managers.html).

In [25]:
# Usamos un context manager para
#   1. Abrir el archivo en modo lectura
#   2. Leer su contenido línea a línea y quedarnos con la primera línea
#   3. Cerrar el archivo
with open('data/test.txt','r') as txt:
    first_line = txt.readlines()[0]
    
print(first_line)

¡Me encanta la programación!



El context manager `with ... as ...:` automáticamente cierra `test.txt` después de realizar las operaciones que indiquemos en su interior.

In [26]:
# ¡ERROR! El archivo está cerrado
txt.read()

ValueError: I/O operation on closed file.

## Iterar un archivo

Para iterar sobre las líneas del contenido de un archivo haremos lo siguiente.

In [27]:
with open('data/test.txt', 'r') as txt:
    for line in txt:
        print(line, end='')  # end='' elimina saltos de línea extra

¡Me encanta la programación!
Vamos a añadir esta frase al final del texto anterior.
Y esta otra también.
Seguimos añadiendo texto a nuestro archivo.
Y aún más texto.


## Escribir una lista en un archivo

Si con nuestro programa hemos generado una lista que deseamos exportar a un archivo lo haremos de la siguiente manera:

In [28]:
items = ['lunes', 'martes', 'miércoles', 'jueves', 'viernes', 'sábado', 'domingo']  

In [29]:
with open('data/my_list.txt', 'w+') as f:
    # Guardamos la lista en el archivo
    f.write('\n'.join(items))
    
    # Comprobamos que se ha guardado
    f.seek(0)
    print(f.read())

lunes
martes
miércoles
jueves
viernes
sábado
domingo


Si queremos importar el contenido del archivo y guardarlo en una lista haremos lo siguiente.

In [30]:
with open('data/my_list.txt', 'r') as f:
    # Leemos el archivo y creamos la lista
    my_list = f.read().splitlines()
    print(my_list)

['lunes', 'martes', 'miércoles', 'jueves', 'viernes', 'sábado', 'domingo']
