# Ficheros

## Leer y escribir ficheros

- Se abre el fichero con `open(path, modo)`.
- Los modos de apertura son los siguientes:


|Modo|Description|
|----|---|
|`'r'`| Read (default).
|`'w'`| Write (truncate).|
|`'x'`| Write or fail if the file already exists.|
|`'a'`| Append.|
|`'w+'`| Read and write (truncate).|
|`'r+'`| Read and write from the start.|
|`'a+'`| Read and write from the end.|
|`'t'`| Text mode (default).|
|`'b'`| Binary mode.|

- Hay que cerrar el fichero una vez se ha terminado de trabajar con el mismo, con `fichero.close()`

Nota: Normalmente, usamos funciones de más alto nivel para leer ficheros que automáticamente se ocupan del manejo del archivo (abrirlo, cerrarlo, los permisos necesarios, ...)

In [None]:
f = open("tmp/prueba.txt", "w")
f.write("Mi\n")
f.write("primer\n")
f.write("fichero!\n")

In [None]:
type(f)

In [None]:
f.readlines()
f.writelines()

## Métodos de archivos

In [None]:
from utils import midir

In [None]:
midir(f)

In [None]:
f.readable()

In [None]:
f.writable()

In [None]:
f.mode

In [None]:
f.name

In [None]:
f.closed

In [None]:
f.close()

In [None]:
f.closed

## Context managers

- Evitan que tengamos que estar pendientes de cerrar el fichero.
- En general, administran recursos consumidos por nuestro código.

In [None]:
with open('tmp/prueba.txt', 'w') as f:
    f.write('Esto\n')
    f.write('es\n')
    f.write('una\n')
    f.write('prueba\n')

In [None]:
f.closed

- En el caso de abrir ficheros, la instancia `open(path, mode)` actúa de context manager.
- Podemos definir nuestros propios context managers.
- Todos los context managers tienen que tener implementados dos métodos:
```python
def __enter__()
def __exit__()
```

In [None]:
with open('tmp/prueba.txt', 'r') as f: 
    print(dir(f))

- Para leer podemos usar los métodos:
    - `read()` -> Leemos todo el fichero y devolvemos un string
    - `readline()` -> Leemos sólo una línea
    - `readlines()` -> Leemos todas las líneas y las devolvemos como una lista de strings.

In [None]:
with open("tmp/prueba.txt", "r") as f:
    line = f.read()
print(line)

In [None]:
with open("tmp/prueba.txt", "r") as f:
    line = f.readline()
print(line)

In [None]:
with open("tmp/prueba.txt", "r") as f:
    lines = f.readlines()
print(lines)

## Pickle

- Las variables se pueden guardar de forma serializada utilizando la librería `pickle`.
- Esto significa que los objetos conservan su estructura de Python.
    - Archivos `.pkl` sólo pueden leerse desde Python.
- No es seguro! Sólo hacer "unpickle" de archivos en los que confiemos.
- Como alternativa, es mejor usar archivos 
    - `.json` (JSON -> JavaScript Object Notation)
    - `.csv` (CSV -> Comma-Separated Values).
- Sin embargo, es útil para uso propio.
    - Si cargamos un fichero con datos a los cuales limpiamos y damos estructura desde Python, entonces es útil guardar estos datos en un `.pkl` para no tener que volver aplicar el mismo proceso cuando queramos vovler a usarlo. 
- Para guardar:

In [None]:
import pickle

In [None]:
lista = ['hola', 'me', 'guardo']
dicc = {'key': 'info'}
def adios():
    print('Adios!')

In [None]:
with open('tmp/variables.pkl', 'wb') as f:
    pickle.dump(lista, f)
    pickle.dump(dicc, f)
    pickle.dump(adios, f)

- Para leer:

In [None]:
with open('tmp/variables.pkl', 'rb') as f:
    lista_g = pickle.load(f)
    dicc_g = pickle.load(f)
    adios_g = pickle.load(f)

In [None]:
lista_g

In [None]:
dicc_g

In [None]:
adios_g

In [None]:
adios_g()

## JSON

- Formato estandar para almacenar e intercambiar datos (otros: YAML, XML, CSV)
- Python tienen un JSON decoder/encoder.
- Los propios notebooks son documentos tipo `.json`.
- Muy parecidos a un diccionario de Pyhon (pero no son lo mismo!)

In [None]:
import json

In [None]:
dic = {
    'estaciones': {
        'verano': 'calor',
        'invierno': 'frío'
    },
    'números': [0, 5, 2.5]
}

In [None]:
with open('tmp/json_data_1.json', 'w') as f:
    json.dump(dic, f)

In [None]:
with open('tmp/json_data_2.json', 'w') as f:
    json.dump(dic, f, indent=4)

In [None]:
with open('tmp/json_data_1.json', 'r') as f:
    dic_g = json.load(f)

In [None]:
dic_g

- También existen los métodos `dumps()` and `loads()` que interpretan un json que venga como una única string.

In [None]:
json_string = json.dumps(dic)
json_string

In [None]:
type(json_string)

In [None]:
dic_s = json.loads(json_string)
print(dic_s)
type(dic_s)

- Muy útiles para descargar información de la web

In [None]:
import requests

In [None]:
respuesta = requests.get("https://jsonplaceholder.typicode.com/todos")

In [None]:
midir(respuesta)

In [None]:
respuesta.text

In [None]:
import json

In [None]:
json_data = json.loads(respuesta.text)
print(type(json_data))
json_data[:5]

- Por último, también podemos serializar objetos más complejos en un `.json` siempre y cuando implementemos un encoder y un decoder adecuado para ese objeto.