**NOTA**: Si detectas algún error en este Colab, pon un mensaje en el foro para que lo podamos solucionar o envía un correo.

# 1 Ficheros de texto

Como sabes, las aplicaciones necesitan guardar información (datos) para poder compartirlos con otras aplicaciones o para reutilizarlos en la misma aplicación.

Los ficheros son conjuntos de datos residentes en sistemas de almacenamiento secundario (disco duro o cualquier otro tipo de memoria). Un tipo particular de ficheros de uso muy extendido son los **ficheros de texto**. Estos contienen una sucesión de caracteres que podemos considerar organizados en una secuencia de líneas.

## 1.1 Lectura y escritura

Para leer y escribir en un fichero en Python, debemos **abrir** el fichero mediante la función ```open()```. Esta función admite distintos parámetros, pero los más comunes son:
* ```file```: la ruta del fichero (obligatorio).
* ```mode```: lectura ```(r)```, escritura ```(w)``` , añadir ```(a)```, `lectura-escritura (r+), `fichero binario```(b)``` y fichero de texto ```(t)```.
* ```encoding```: codificación a utiliar en modo texto. Si no especificamos esto, Python utilizará la codificación por defecto, que podemos averiguar con la llamada a ```sys.getdefaultencoding()```.

Una vez abierto el fichero en **modo escritura**, podemos escribir mediante la función ```write()```. Finalmente, debemos cerrar el fichero para que los cambios surtan efecto mediante la función ```close()```. A continuación puedes ver un ejemplo. Para ver el fichero que se ha creado, simplemente navega en el menú izquierdo de este Colab y haz clic en el icono de explorador de ficheros.

In [1]:
f = open("fichero.txt", mode="wt", encoding="utf-8")

f.write("Esto es un mensaje. ")

f.write("Esto es otro mensaje en la misma línea. \n")

f.write("Esto es un mensaje en una nueva línea.")

f.close()

Para leer de un fichero utilizamos la función ```read()```. En primer lugar, hay que abrir el fichero en **modo lectura**. Después, la función ```read()``` puede recibir el número de caracteres a leer, dejando el puntero en la última posición leída. Si no pasamos ningún parámetro, se leerá hasta el final del fichero:

In [2]:
f = open("fichero.txt", mode="rt", encoding="utf-8")

#leemos 10 caracteres
texto = f.read(10)
print("Leemos 10 caracteres: "+texto)
print(type(texto))

#leemos los restantes
texto = f.read()
print("\n\nLeemos hasta el final del fichero: "+texto)

f.close()

Leemos 10 caracteres: Esto es un
<class 'str'>


Leemos hasta el final del fichero:  mensaje. Esto es otro mensaje en la misma línea. 
Esto es un mensaje en una nueva línea.


## 1.2 Las funciones seek() y tell()

Cuando trabajamos con ficheros, existen dos funciones interesantes. La función ```seek()``` nos permite mover el puntero a una determinada posición que pasamos por parámetro. La función ```tell()``` devuelve la posición actual del puntero. En el siguiente ejemplo, después de leer 10 caracteres movemos de nuevo el puntero a la posición 0:

seek cannot move to arbitrary offset. Only 0 and values from tell() are allowed, other values result in undefined behaviour

In [3]:
f = open("fichero.txt", mode="rt", encoding="utf-8")

#leemos 10 caracteres
texto = f.read(10)
print("Leemos 10 caracteres: "+texto)

pos = f.tell()
print("La posición actual del puntero es ", pos)

#movemos el puntero al inicio y volvemos a leer
f.seek(0)
texto = f.read(10)
print("Volvemos a leer: "+texto)

f.close()

Leemos 10 caracteres: Esto es un
La posición actual del puntero es  10
Volvemos a leer: Esto es un


## 1.3 Leyendo un fichero línea a línea

Aunque la función ```read()``` se utiliza a menudo, Python ofrece otras funciones que nos permiten leer un fichero **línea a línea**. La función ```readline()``` lee, como su nombre indica, una línea del fichero:

In [4]:
f = open("fichero.txt", mode="rt", encoding="utf-8")

texto = f.readline()
print("Leemos una línea: "+texto)

texto = f.readline()
print("Leemos otra línea: "+texto)

f.close()

Leemos una línea: Esto es un mensaje. Esto es otro mensaje en la misma línea. 

Leemos otra línea: Esto es un mensaje en una nueva línea.


Podemos **recorrer un fichero** mediante bucles ```for``` y ```while``` de una manera sencilla. Observa estos ejemplos:

In [5]:
f = open("fichero.txt", mode="rt", encoding="utf-8")

linea = f.readline()
while linea != "" :
  print("he leído: " + linea)
  linea = f.readline()

f.close()

he leído: Esto es un mensaje. Esto es otro mensaje en la misma línea. 

he leído: Esto es un mensaje en una nueva línea.


In [6]:
f = open("fichero.txt", mode="rt", encoding="utf-8")

for linea in f:
  print("he leído: " + linea)

f.close()

#stdout.write() no mete una línea en blanco como un print

he leído: Esto es un mensaje. Esto es otro mensaje en la misma línea. 

he leído: Esto es un mensaje en una nueva línea.


Con la función ```readlines()``` podemos leer todas las líneas del fichero. En este caso, nos devuelve una lista donde cada elemento es una línea leída:

In [7]:
f = open("fichero.txt", mode="rt", encoding="utf-8")

lista_lineas = f.readlines()
print("Lista de líneas leídas: ", lista_lineas)

f.close()

Lista de líneas leídas:  ['Esto es un mensaje. Esto es otro mensaje en la misma línea. \n', 'Esto es un mensaje en una nueva línea.']


En ocasiones queremos añadir información a un fichero ya existente. Esto lo podemos hacer abriendo el fichero con la opción ```a``` y utilizando después la función ```write()```:

In [8]:
f = open("fichero.txt", mode="at", encoding="utf-8")

f.write("Esto es un mensaje añadido. \n")

f.close()

De forma similar a la función ```readlines()```, también tenemos disponible la función ```writelines()``` para escribir en un fichero múltiples líneas. Esta función, recibe como parámetro la lista de líneas a escribir:

In [9]:
f = open("fichero.txt", mode="at", encoding="utf-8")

f.writelines(["Línea añadida de un listado \n", "otra línea añadida \n"])

f.close()

No obstante, también puedes utilizar la opción de lectura-escritura con `r+`, que nos permite realizar ambas operaciones. En el caso de escribir, lo que hace es añadir al fichero y no machacar lo que haya (cosa que sí que hace la opción `w`):

In [10]:
f = open("fichero.txt", mode="r+t", encoding="utf-8")

texto = f.read(10)
print("Leemos 10 caracteres: "+texto)

f.write("Esto es un mensaje añadido. \n")

f.close()

Leemos 10 caracteres: Esto es un


Hasta ahora hemos visto que para trabajar con un fichero es importante tanto abrirlo como cerrarlo. En Python existe un mecanismo que asegura que estas operaciones se hacen automáticamente: un bloque ```with```. Esta estructura es útil para manejar recursos como ficheros. Observa cómo se utilizaría en el siguiente ejemplo:

In [1]:
with open("fichero.txt", mode="rt", encoding="utf-8") as f:
  for linea in f:
    print("he leído: " + linea)

he leído: Esto es un mensaje. Esto es otro mensaje en la misma línea. 

he leído: Esto es un mensaje en una nueva línea.Esto es un mensaje añadido. 

he leído: Línea añadida de un listado 

he leído: otra línea añadida 

he leído: Esto es un mensaje añadido. 



## 1.4 Ejercicios

1. Escribe un programa que genere un fichero de texto con los números del 1 al 5000 y sus cuadrados.
2. Escribe una función que reciba el nombre de un fichero que contiene palabras (cada línea tiene una palabra) y que devuelva la palabra que tiene una longitud máxima y su longitud.
3. Escribe una función que recibe el nombre de un fichero (cada línea puede tener varias palabras) y una letra, y que muestre por pantalla las palabras del fichero que contienen la letra.
4. Escribe una función que reciba el nombre de un fichero y que muestre por pantalla cuántas veces aparece cada palabra.
5. Escribe una función generadora que devuelva una palabra de un fichero cada vez que es llamada.
5. Escribe un función que anonimice el fichero `interview.txt`.
Este fichero contiene una entrevista con Trump, pero su nombre no puede aparecer y hay que cambiarlo a "Mr. X" para anonimizar el fichero. El resultado, será escrito en un fichero `anonymous.txt`.
6. Escribe un programa que lee el nombre del fichero de texto del teclado y muestra por pantalla el texto codificado de forma que sólo las letras minúsculas se sustituyen por las siguientes según el abecedario (una `a` por una `b`, una `b` por una `c`, etc.).

# 2 Otros tipos de ficheros

A parte de ficheros de texto, Python ofrece soporte para leer otros tipos de ficheros, como ficheros **binarios** (p.e. una imagen). La manera de leer un fichero binario consiste en abrir el fichero en modo binario (con la opción `b`). Por tanto, la opción `rb` nos permite abrir el fichero binario para lectura mientras que la opción `wb` nos permite abrirlo para escritura:

In [3]:
f = open('lena.png', 'rb')
contenido = f.read()
print(contenido)

b'\x89PNG\r\n\x1a\n\x00\x00\x00\rIHDR\x00\x00\x00\xe1\x00\x00\x00\xe1\x08\x03\x00\x00\x00\tm"H\x00\x00\x02\x1cPLTE\xff\xff\xff^z\xf7\xd8A.\\\xbd:\xf0\xc0\x06`\xbb:\xfd\xfd\xfe\xea\xc3\x06\xfe\xfb\xff\xf7\xff\xf6\xf7\xff\xf9\x9a\xaa\xe5Yv\xf5\xfe\xfb\xf1\xff\xff\xf9\xe7\xc0\x03\x87\x96\xe5\xff\xf9\xff\xf9\xff\xfdY}\xf7\xb6\xc2\xf0Xs\xeb`\xb9A\xfe\xfb\xf2\xff\xf6\xff\xfe\xfd\xfb\xf2\xff\xff\xfd\xff\xf6\xee\xc1\x06Y\xbf8^y\xfb\xf3\xff\xea\xd3C.\xfd\xff\xf0\xd5;\'\xe4;.\xdcA&\xd6B.\xff\xf8\xf3\xff\xfd\xe2X\xbeA`\xb9FU\xc23\xf0\xff\xf6\xd04\x1e\xcdG+\xd9?5\xe1;3\xff\xda\xd3\xe0?%\xe4\xc7\x00\xf0\xd3j\xe6\xc7\\\x97\xaf\xe4Q~\xece\xb0I\xed\xba\x0feu\xff^|\xee^\xbf)\xf2\xff\xe3\xe0\xf6\xd4\xff\xee\xda\xfa\xdb\xc9\xf3\xc6\xba\xec\xb0\xaa\xe2\x9b\x99\xd1\x8d\x8b\xea\xa5\xa3\xe7\xd0\xd5\xf4\xe2\xe7\xfc\xe4\xc5\xe9\xc2\xa7\xd8\x9e\x8d\xd3yq\xc6UP\xb62\r\xbfO-\xcdlI\xd3\x87d\xde\xb7\xa7\xc1hb\xc01/\xd3\x86v\xbbXG\xc1B3\xc7;\x1f\xafR.\xaf?+\xcbJ\x1d\xe5\xe0\xdf\xb8;$\xe6<\x1f\xe2:>\xdaD\x1d\xcdzk\xc

Una de las ventajas de Python es la cantidad de paquetes que existen. En concreto, el paquete `xlwt` nos permite trabajar con ficheros **Excel**. A continuación tienes un ejemplo de cómo podemos generar un Excel con diferente información. Para profundizar más, puedes consultar la documentación: https://xlwt.readthedocs.io/en/latest/

In [None]:
import xlwt
from xlwt import Workbook

wb = Workbook()

sheet1 = wb.add_sheet("Sheet 1")

sheet1.write(1, 0, 'AAAA')
sheet1.write(2, 0, 'BBBB')
sheet1.write(3, 0, 'CCCC')
sheet1.write(4, 0, 'DDDD')
sheet1.write(5, 0, 'EEEE')
sheet1.write(0, 1, '1111')
sheet1.write(0, 2, '2222')
sheet1.write(0, 3, '3333')
sheet1.write(0, 4, '4444')
sheet1.write(0, 5, '5555')

wb.save("xlwt example.xls")


Otro tipo de ficheros que vamos a trabajar son los ficheros separados por comas (**CSV**). A través del paquete `csv`, podemos leer ficheros de este tipo. Observa el siguiente ejemplo cómo podemos leer cada fila y guardarla en una lista:


In [None]:
import csv
with open('colours.csv', 'r') as file:
    reader = csv.reader(file)
    for row in reader:
        print(row)

En ocasiones, un fichero csv utiliza separadores diferentes como un tabulador. Esto lo podríamos especificar también en la llamada a `reader`:

In [None]:
reader = csv.reader(file, delimiter = "\t")

Si quieres profundizar más, puedes acceder a la documentación: https://docs.python.org/3/library/csv.html