<a href="https://colab.research.google.com/github/moisesquintana57/CursoMINTIC/blob/main/archivos.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

#Archivos en Python
##Leer archivos en Python
Al igual que en otros lenguajes de programación, en Python es posible **abrir ficheros y leer su contenido**. Los ficheros o archivos pueden ser de lo más variado, desde un simple texto a contenido binario. Para simplificar nos centraremos en **leer un fichero de texto**. Si quieres aprender como escribir en un fichero te lo explicamos en este otro post.

Imagínate entonces que tienes un fichero de texto con unos datos, como podría ser un ***.txt*** o un ***.csv***, y quieres leer su contenido para realizar algún tipo de procesado sobre el mismo. Nuestro fichero podría ser el siguiente.

In [None]:
# contenido del fichero ejemplo.txt
Contenido de la primera línea
Contenido de la segunda línea
Contenido de la tercera línea
Contenido de la cuarta línea

Podemos abrir el fichero con la función **open()** pasando como argumento el nombre del fichero que queremos abrir.

In [None]:
fichero = open('archivo.txt')

###Método read()
Con **open()** tendremos ya en fichero el contenido del documento listo para usar, y podemos imprimir su contenido con **read()**. El siguiente código imprime todo el fichero.

In [None]:
print(fichero.read())
#Contenido de la primera línea
#Contenido de la segunda línea
#Contenido de la tercera línea
#Contenido de la cuarta línea

###Método readline()
Es posible también leer un número de líneas determinado y no todo el fichero de golpe. Para ello hacemos uso de la función ***readline()***. Cada vez que se llama a la función, se lee una línea.

In [None]:
fichero = open('ejemplo.txt')
print(fichero.readline())
print(fichero.readline())
# Contenido de la primera línea
# Contenido de la segunda línea

Es muy importante saber que una vez hayas leído todas las línea del archivo, la función ya no devolverá nada, porque se habrá llegado al final. Si quieres que readline() funcione otra vez, podrías por ejemplo volver a leer el fichero con **open()**.

Otra forma de usar **readline()** es pasando como argumento un número. Este número leerá un determinado número de caracteres. El siguiente código lee todo el fichero carácter por carácter.

In [None]:
fichero = open('ejemplo.txt')
caracter = fichero.readline(1)
while caracter != "":
    print(caracter)
    caracter = fichero.readline(1)

### Método readlines()

Existe otro método llamado **readlines()**, que devuelve una lista donde cada elemento es una línea del fichero.

In [None]:
fichero = open('ejemplo.txt')
lineas = fichero.readlines()
print(lineas)
#['Contenido de la primera línea\n', 'Contenido de la segunda línea\n',
#'Contenido de la tercera línea\n', 'Contenido de la cuarta línea']

De manera muy sencilla podemos iterar las líneas e imprimirlas por pantalla.

In [None]:
fichero = open('ejemplo.txt')
lineas = fichero.readlines()
for linea in lineas:
    print(linea)

###Argumentos de open()
Hasta ahora hemos visto la función open() con tan sólo un argumento de entrada, el nombre del fichero. Lo cierto es que existe un segundo argumento que es importante especificar. Se trata del modo de apertura del fichero. En la documentación oficial se explica en detalle.

 - ‘r’: Por defecto, para leer el fichero.
 - ‘w’: Para escribir en el fichero.
 - ‘x’: Para la creación, fallando si ya existe.
 - ‘a’: Para añadir contenido a un fichero existente.
 - ‘b’: Para abrir en modo binario.

Por lo tanto lo estrictamete correcto si queremos leer el fichero sería hacer lo siguiente. Aunque el modo **r** sea por defecto, es una buena práctica indicarlo para darle a entender a otras personas que lean nuestro código que no queremos modificarlo, tan solo leerlo.

In [None]:
fichero = open('ejemplo.txt', 'r')

### Cerrando el fichero

Otra cosa que debemos hacer cuando trabajamos con ficheros en Python, es ***cerrarlos una vez que ya hemos acabado con ellos***. Aunque es verdad que el fichero normalmente acabará siendo cerrado automáticamente, es importante especificarlo para evitar tener comportamientos inesperados.

Por lo tanto si queremos cerrar un fichero sólo tenemos que usar la función **close()** sobre el mismo. Por lo tanto tenemos tres pasos:

Abrir el fichero que queramos. En modo texto usaremos **‘r’**.
Usar el fichero para recopilar o procesar los datos que necesitábamos.
Cuando hayamos acabado, cerramos el fichero.

In [None]:
fichero = open('ejemplo.txt', 'r')
# Usar la variable fichero
# Cerrar el fichero
fichero.close()

Y  existe otra forma de cerrar el fichero automáticamente. Si hacemos uso se **with()**, el fichero se cerrará automáticamente una vez se salga de ese bloque de código.

In [None]:
with open('ejemplo.txt') as fichero:
    # Usar el fichero. Se cerrará automáticamente
    pass

###Ejemplos
Como ya hemos visto **readline()** lee línea por línea el fichero. También hacemos uso de un bucle while para leer líneas mientras que no se haya llegado al final. Es por eso por lo que comparamos ***linea != ''***, ya que se devuelve un string vació cuando se ha llegado al final.

In [None]:
with open('ejemplo.txt', 'r') as fichero:
    linea = fichero.readline()
    while linea != '':
        print(linea, end='')
        linea = fichero.readline()

#Contenido de la primera línea
#Contenido de la segunda línea
#Contenido de la tercera línea
#Contenido de la cuarta línea

#Escribir archivos en Python
A continuación te explicamos como escribir datos en un fichero usando Python. Imagínate que tienes unos datos que te gustaría guardar en un fichero para su posterior análisis. Te explicamos como guardarlos en un fichero, por ejemplo, **.txt**. Si también quieres aprender como leer un fichero en Python te lo explicamos en este otro post.

Lo primero que debemos de hacer es crear un objeto para el fichero, con el nombre que queramos. Al igual que vimos en el post de leer ficheros, además del nombre se puede pasar un segundo parámetro que indica el modo en el que se tratará el fichero. Los más relevantes en este caso son los siguientes. Para más información consulta la documentación oficial.

 - ‘w’: Borra el fichero si ya existiese y crea uno nuevo con el nombre indicado.
 - ‘a’: Añadirá el contenido al final del fichero si ya existiese (append end Inglés)
 - ‘x’: Si ya existe el fichero se devuelve un error.

Por lo tanto con la siguiente línea estamos creando un fichero con el nombre ***datos_guardados.txt***.

In [None]:
# Abre un nuevo fichero
fichero = open("datos_guardados.txt", 'w')

Si por lo contrario queremos añadir el contenido al ya existente en un fichero de antes, podemos hacerlo en el modo ***append*** como hemos indicado.

In [None]:
# Abre un nuevo y añade el contenido al final
fichero = open("datos_guardados.txt", 'a')

###Método write()
Ya hemos visto como crear el fichero. Veamos ahora como podemos añadir contenido. Empecemos escribiendo un texto.

In [None]:
fichero = open("datos_guardados.txt", 'w')
fichero.write("Contenido a escribir")
fichero.close()

Por lo tanto si ahora abrimos el fichero datos_guardados.txt, veremos como efectivamente contiene una línea con Contenido a escribir. ¿A que es fácil?

Es muy importante el uso de ***close()*** ya que si dejamos el fichero abierto, podríamos llegar a tener un comportamiento inesperado que queremos evitar. Por lo tanto, siempre que se abre un fichero es necesario cerrarlo cuando hayamos acabado.

Compliquemos un poco más las cosas. Ahora vamos a guardar una lista de elementos en el fichero, donde cada elemento de la lista se almacenará en una línea distinta.

In [2]:
# Abrimos el fichero
fichero = open("datos_guardados.txt", 'w')

# Tenemos unos datos que queremos guardar
lista = ["Manzana", "Pera", "Plátano"]

# Guardamos la lista en el fichero
for linea in lista:
    fichero.write(linea + "\n")

# Cerramos el fichero
fichero.close()

In [None]:
with open("datos_guardados.txt", 'r') as fichero:
    linea = fichero.readline()
    while linea != '':
        print(linea, end='')
        linea = fichero.readline()

Si te fijas, estamos almacenando la línea mas \n. Es importante añadir el salto de línea porque por defecto no se añade, y si queremos que cada elemento de la lista se almacena en una línea distinta, será necesario su uso.
###Método writelines()
También podemos usar el método writelines() y pasarle una lista. Dicho método se encargará de guardar todos los elementos de la lista en el fichero.

In [None]:
fichero = open("datos_guardados.txt", 'w')
lista = ["Manzana", "Pera", "Plátano"]

fichero.writelines(lista)
fichero.close()

# Se guarda
# ManzanaPeraPlátano

Tal vez te hayas dado cuenta de que en realidad lo que se guarda es *ManzanaPeraPlátano*, todo junto. Si queremos que cada elemento se almacene en una línea distinta, deberíamos añadir el salto de línea en cada elemento de la lista como se muestra a continuación.

In [None]:
fichero = open("datos_guardados.txt", 'w')
lista = ["Manzana\n", "Pera\n", "Plátano\n"]

fichero.writelines(lista)
fichero.close()

# Se guarda
# Manzana
# Pera
# Plátano

###Uso del with
Podemos ahorrar una línea de código si hacemos uso de lo siguiente. En este caso nos podemos ahorrar la llamada al ***close()*** ya que se realiza automáticamente. El código anterior se podría reescribir de la siguiente manera.

In [None]:
lista = ["Manzana\n", "Pera\n", "Plátano\n"]
with open("datos_guardados.txt", 'w') as fichero:
     fichero.writelines(lista)

###Ejemplos escribir ficheros en Python
El uso de **‘x’** hace que **si el fichero ya existe se devuelve un error**. En el siguiente código creamos un fichero e inmediatamente después intentamos crear un fichero con el mismo nombre con la opción **‘x’**. Por lo tanto se devolverá un error.

In [None]:
#f = open("mi_fichero.txt", "w")
f = open("mi_fichero.txt", "x")
# Error! Ya existe

En este otro ejemplo vamos a usar un fichero para establecer una comunicación entre dos funciones. A efectos prácticos puede no resultar muy útil, pero es un buen ejemplo para mostrar la lectura y escritura de ficheros.

Tenemos por lo tanto una función ***escribe_fichero()*** que recibe un mensaje y lo escribe en un fichero determinado. Y por otro lado tenemos una función ***lee_fichero()*** que devuelve el mensaje que está escrito en el fichero.

Date cuenta lo interesante del ejemplo, ya que podríamos tener estos dos códigos ejecutándose en diferentes maquinas o procesos, y **podrían comunicarse a través del fichero**. Por un lado se escribe y por el otro se lee.

In [None]:
# Escribe un mensaje en un fichero
def escribe_fichero(mensaje):
    with open('fichero_comunicacion.txt', 'w') as fichero:
        fichero.write(mensaje)

# Leer el mensaje del fichero        
def lee_fichero():
    mensaje = ""
    with open('fichero_comunicacion.txt', 'r') as fichero:
        mensaje = fichero.read()
    # Borra el contenido del fichero para dejarlo vacío
    f = open('fichero_comunicacion.txt', 'w')
    f.close()
    return mensaje

escribe_fichero("Esto es un mensaje")
print(lee_fichero())