# Archivos en Python

Al igual que en otros lenguajes de programación, en Python es posible **abrir archivos de texto** y **leer su contenido**. Los archivos o archivos pueden ser de lo más variado, desde un simple texto a contenido binario. Ahora veremos como **leer un archivo de texto**.

## Abrir archivos en Python

Imagínate  que tienes un archivo de texto con  datos, como podría ser un **.txt** o un **.csv**, y quieres leer su contenido para realizar algún tipo de operaciones sobre el mismo.

Podemos utilizar la función `open( )` para abrir el archivo que queremos abrir pasando como *argumento* el nombre o la ruta del archivo.

In [None]:
archivo = open('../Python/Archivos/archivo.txt')

La función `open()` retorna un ***objeto file***. Los objetos file contienen métodos y atributos que se usan para recolectar información sobre el archivo que acabamos de abrir, así como también para manipular dicho archivo.

## `encoding='utf-8'`

`encoding='utf-8'` es un parámetro utilizado en Python para especificar la codificación de caracteres que se utilizará al leer o escribir archivos de texto.

In [None]:
archivo = open('../Python/Archivos/archivo.txt', encoding='utf-8')

En el código anterior el parámetro ***encoding='utf-8'*** se utiliza al abrir un archivo en Python para asegurarse de que se esté utilizando la codificación de caracteres correcta para leer el archivo. Si el archivo está codificado en **UTF-8**, especificar `encoding='utf-8'` garantiza que Python lo lea correctamente.

## Modo de apertura de los archivos: Argumentos de `open()`

La función `open()` tiene un segundo parametro opcional que es importante especificar para indicar el modo en que se abrirá el archivo. Se trata del **modo de apertura del archivo**. Los principales modos de apertura son:

* **Modo sólo  lectura** `‘r’`: Este es el valor por defecto para el segundo parámetro, en este caso no es posible realizar modificaciones sobre el archivo, solamente leer su contenido del archivo.
  
* **Modo sólo escritura** `‘w’`: En este caso el archivo es "vaciado" si es que ya existiera, y se crea uno nuevo con el nombre indicado si no existe aún el archivo.
  
  
* **Modo sólo escritura posicionándose al final del archivo** `‘a’`: En este caso se crea el archivo, si no existe, pero en caso de que exista se posiciona al final, manteniendo el contenido original. El archivo se abre para añadir contenido a un archivo ya existente.
  


Por otro lado, en cualquiera de estos modos se puede agregar un `+` para pasar a un **modo lectura-escritura**. Sin embargo, observa que el comportamiento de `r+` y de `w+` no es el mismo, ya que en el primer caso se tiene el archivo completo, y en el segundo caso se vacia el archivo, perdiendo así los datos.

Otros modos de apertura de un documento son:

* `‘x’`: Para crear de un archivo nuevo, devuelve un error si ya existe un archivo con el mismo nombre especificado.

* `‘b’`: Para abrir el archivo en modo binario.

**Observación:** Aunque el modo `r` sea por defecto, es una buena práctica indicarlo para darle a entender a otras personas que lean nuestro código que no queremos modificarlo, tan solo leerlo. Por lo tanto lo estrictamete correcto si queremos sólo leer el archivo sería hacer lo siguiente.

In [None]:
archivo = open('../Python/Archivos/archivo.txt','r')

**Observaciones:**

* Si un archivo no existe y se lo intenta abrir en modo lectura, se generará un error; en cambio si se lo abre para escritura, Python se encargará de crear el archivo al momento de abrirlo, ya sea con `w`, `a`, `w+` o con `a+`).

* Si un archivo existente se abre en modo escritura (`w` o `w+`), todos los datos anteriores son borrados y reemplazados por lo que se escriba en él.

## Leer archivos en Python

La operación más sencilla a realizar sobre un archivo es leer su contenido. Podemos realizar esto mediante diferentes métodos.

### Método 1:  `read( )`

Con `open()` tendremos ya en archivo el contenido del documento listo para usar, y podemos imprimir su contenido con `read( )`. El siguiente código imprime todo el archivo.

In [None]:
archivo = open('../Python/Archivos/archivo.txt','r')
contenido = archivo.read()
print(contenido)

### Método 2:  `readline( )`

Es posible también **leer un número de líneas determinado** y no todo el archivo de golpe. Para ello hacemos uso de la función `readline( )`. Cada vez que se llama a la función, se lee una línea.

In [None]:
archivo = open('../Python/Archivos/archivo.txt')
linea_archivo = archivo.readline()
print(linea_archivo, end="")
linea_archivo = archivo.readline()
print(linea_archivo)


Esto funciona ya que cada archivo que se encuentre abierto tiene una posición asociada, que indica el último punto que fue leido. Cada vez que se lee una línea, avanza esa posición. Es por ello que `readline()` devuelve cada vez una línea distinta y no siempre la misma.

**Observación:** Es muy importante saber que **una vez hayas leído todas las línea del archivo, la función ya no devolverá nada, porque se habrá llegado al final**. Si quieres que `readline( )` funcione otra vez, podrías por ejemplo volver a abrir el archivo con `open()`.

El método `readline()` lee línea por línea el archivo. Podemos utilizar un bucle `while` para leer líneas mientras que no se haya llegado al final. Es por eso por lo que comparamos **linea != ''**, ya que se devuelve un string vació cuando se ha llegado al final.

In [None]:
archivo = open('../Python/Archivos/archivo.txt')
linea = archivo.readline()
while linea != '':
        print(linea, end='')
        linea = archivo.readline()

Enseguida se presenta una forma equivalente de realizar lo presentado en el ejemplo anterior.

In [None]:
archivo = open('../Python/Archivos/archivo.txt')
for linea in archivo:
    print(linea, end='')

De esta manera, la variable `línea` irá almacenando distintas cadenas correspondientes a cada una de las líneas del archivo.

####  `readline()` con argumentos: `readline(#)`

Otra forma de usar `readline( )` es pasando como argumento un número. Este número **leerá un determinado número de caracteres**. El siguiente código lee todo el archivo carácter por carácter.

In [None]:
archivo = open('../Python/Archivos/archivo.txt')
caracter = archivo.readline(1)
#print(caracter)
while caracter != "":
    print(caracter)
    caracter = archivo.readline(5)


### Método 3: `readlines( )`

Es posible, además, obtener todas las líneas del archivo utilizando una sola llamada a función: `readlines()`, que **devuelve una lista donde cada elemento es una línea del archivo de texto**.

In [None]:
archivo = open('../Python/Archivos/archivo.txt')
lineas = archivo.readlines()
print(lineas)

De manera muy sencilla podemos **iterar las líneas e imprimirlas en pantalla**.

In [None]:
archivo = open('../Python/Archivos/archivo.txt')
lineas = archivo.readlines()
for linea in lineas:
    print(linea)

En este caso, la variable `líneas` tendrá una lista de cadenas con todas las líneas del archivo.

**Observación:** Es importante tener en cuenta que cuando se utilizan el método `readlines()`, se está cargando en memoria el archivo completo. Siempre que una instrucción cargue un archivo completo en memoria debe tenerse cuidado de utilizarla sólo con archivos pequeños, ya que de otro modo podria agotarse la memoria de la computadora.

## Cerrar archivos

Otra cosa que debemos hacer cuando trabajamos con archivos en Python, es **cerrarlos una vez que ya hemos acabado con ellos**. Aunque es verdad que el archivo normalmente acabará siendo cerrado automáticamente, es importante especificarlo para evitar tener comportamientos inesperados.

Cuando queremos cerrar un archivo sólo tenemos que usar la función `close()`

En **resumen** cuando trabajamos con archivos en Python se siguen en general tres pasos:

* Abrir el archivo que queramos. En modo texto se tiene por defecto:  `‘r’`.
  
* Usamos el archivo para *recopilar* o *procesar* los datos que necesitábamos.

* Cuando hayamos acabado, cerramos el archivo implementando la función: `close()` .

### Método 1

In [None]:
archivo = open('../Python/Archivos/archivo.txt','r')

archivo.close()

### Método 2

Existen otras formas de hacerlo, como con el uso de **excepciones** que veremos más adelante.

No pasa nada si aún no entiendes pleamente el uso de `try` y `finally`, el bloque de código en la sección `finally` se ejecuta siempre sin importar si hay un error o no. De esta manera el `close( )` siempre será ejecutado.

In [None]:
archivo = open('../Python/Archivos/archivo.txt','r')
try:
    # Aquí agregas las instrucciones para indicar lo que quieres realizar con el archivo
    pass
finally:
    # Esta sección siempre se ejecuta
    archivo.close()

### Método 3

Y por si no fuera poco, existe otra forma de cerrar el archivo automáticamente. Si hacemos uso de `with()`, el archivo **se cerrará automáticamente una vez se salga de ese bloque de código**.

In [None]:
with open('../Python/Archivos/archivo.txt','r') as archivo:
    # Aquí agregas las instrucciones para indicar lo que quieres realizar con el archivo
    lineas = archivo.readlines()
    for linea in lineas:
        print(linea)
    pass

Como `readlines()` nos devuelve directamente una lista que podemos iterar con las líneas. Podemos utilizar el ciclo `for` de la siguiente manera:

In [None]:
with open('../Python/Archivos/archivo.txt','r') as archivo:
    for linea in archivo.readlines():
        print(linea, end='')

Nótese que usamos el `end=''` para decirle a Python que no imprima el salto de línea `\n` al final del `print`. Pero puede ser simplificado aún más de la siguiente manera.

In [None]:
with open('../Python/Archivos/archivo.txt','r') as archivo:
    for linea in archivo:
        print(linea, end='')

**Observación** Es muy importante el uso de `close()` ya que si dejamos el archivo abierto, podríamos llegar a tener un comportamiento inesperado que queremos evitar. Por lo tanto, siempre que se abre un archivo es necesario cerrarlo cuando hayamos acabado.

## Escribir en un archivo en Python

Imagínate que tienes unos datos que te gustaría guardar en un archivo para su posterior análisis. A continuación veremos como guardarlos en un archivo, por ejemplo, `.txt`.

Lo primero que debemos de hacer es **crear un objeto para el archivo**, con el nombre que queramos. Además del nombre se puede pasar un segundo parámetro que indica el **modo en el que se tratará el archivo**.

* `‘w’`: Borra el archivo si ya existiese y crea uno nuevo con el nombre indicado.
* `‘a’`: Añadirá el contenido al final del archivo si ya existiese (append end Inglés)
* `‘x’`: Si ya existe el archivo se devuelve un error.

Por lo tanto con la siguiente línea estamos creando un archivo con el *mi_primer_archivo.txt.*

In [None]:
archivo = open("../Python/Archivos/mi_primer_archivo.txt", 'w')

El uso de `‘x’` hace que si el archivo ya existe se devuelve un error. En el siguiente código intentamos crear un archivo con el mismo nombre: *mi_primer_archivo.txt* con la opción `‘x’`. Por lo tanto se devolverá un error.

In [None]:
archivo = open("../Python/Archivos/mi_primer_archivo.txt", 'x')

### Agregar información a un archivo

Si por lo contrario **queremos añadir contenido al ya existente en un archivo de texto previo**, podemos hacerlo en el modo `append` como se ha indicado antes.

In [None]:
archivo = open("../Python/Archivos/mi_primer_archivo.txt", 'w')

## Método 1: `write( )`

In [None]:
#archivo = open("datos_guardados.txt", 'w')
archivo = open("../Python/Archivos/mi_primer_archivo.txt", 'a')
archivo.write("Esta es una linea que voy a agregar\n")
archivo.close()

Por lo tanto si ahora abrimos el archivo *archivo.txt*, veremos como efectivamente contiene la línea: "Esta es la última linea que voy a agregar".

Ahora **vamos a guardar una lista de elementos en el archivo**, donde cada elemento de la lista se almacenará en una línea distinta.

In [None]:
archivo = open("../Python/Archivos/mi_primer_archivo.txt", 'w')
lista = ["Edith", "Miguel", "Dalia", "Franco", "Javier"]
for nombre in lista:
    archivo.write(nombre + "\n")
archivo.close()
archivo = open("../Python/Archivos/mi_primer_archivo.txt", 'r')
print(archivo.read())

**Observaciòn:** Estamos almacenando la línea mas `\n`. Es importante añadir el salto de línea porque por defecto no se añade, y si queremos que cada elemento de la lista se almacena en una línea distinta, será necesario su uso.

## Método 2: `writelines( )`

También podemos usar el método `writelines( )` y pasarle una lista. Dicho método se encargará de guardar todos los elementos de la lista en el archivo.

In [None]:
archivo = open("../Python/Archivos/mi_primer_archivo.txt", 'w')
lista = ["Edith", "Miguel", "Dalia", "Franco", "Javier"]
archivo.writelines(lista)
archivo.close()
archivo = open("../Python/Archivos/mi_primer_archivo.txt", 'r')
print(archivo.read())
archivo.close()

**Observación:** En realidad lo que se guarda es *EdithMiguelDaliaFrancoJavier*, todo junto. Si queremos que cada elemento se almacene en una línea distinta, deberíamos añadir el salto de línea en cada elemento de la lista como se muestra a continuación.

In [None]:
archivo = open("../Python/Archivos/mi_primer_archivo.txt", 'w')
lista = ["Edith\n", "Miguel\n", "Dalia\n", "Franco\n", "Javier\n"]

archivo.writelines(lista)
archivo.close()
archivo = open("../Python/Archivos/mi_primer_archivo.txt", 'r')
print(archivo.read())
archivo.close()


## Usando el `with`

Utilizando la instrucción `with` podemos ahorrararnos una línea de código. En este caso nos podemos ahorrar la llamada al `close()` ya que se realiza automáticamente. El código anterior se podría reescribir de la siguiente manera:

In [None]:
lista = ["Edith\n", "Miguel\n", "Dalia\n", "Franco\n", "Javier\n"]
with open("../Python/Archivos/mi_primer_archivo.txt", 'w') as archivo:
     archivo.writelines(lista)

archivo = open("../Python/Archivos/mi_primer_archivo.txt", 'r')
print(archivo.read())
archivo.close()
