# Ficheros

## Leer y escribir ficheros

- Se abre el fichero con `open(path, modo)`.
- Los modos de apertura son los siguientes:


|Modo|Description|
|----|---|
|`'r'`| Read (default).
|`'w'`| Write (truncate).|
|`'x'`| Write or fail if the file already exists.|
|`'a'`| Append.|
|`'w+'`| Read and write (truncate).|
|`'r+'`| Read and write from the start.|
|`'a+'`| Read and write from the end.|
|`'t'`| Text mode (default).|
|`'b'`| Binary mode.|

- Hay que cerrar el fichero una vez se ha terminado de trabajar con el mismo, con `fichero.close()`

Nota: Normalmente, usamos funciones de más alto nivel para leer ficheros que automáticamente se ocupan del manejo del archivo (abrirlo, cerrarlo, los permisos necesarios, ...)

In [1]:
f = open("tmp/prueba.txt", "w")
f.write("Mi\n")
f.write("primer\n")
f.write("fichero!\n")

9

In [2]:
type(f)

_io.TextIOWrapper

In [3]:
f.readlines()
f.writelines()

UnsupportedOperation: not readable

## Métodos de archivos

In [4]:
from utils import midir

In [5]:
midir(f)

['_CHUNK_SIZE',
 '_checkClosed',
 '_checkReadable',
 '_checkSeekable',
 '_checkWritable',
 '_finalizing',
 'buffer',
 'close',
 'closed',
 'detach',
 'encoding',
 'errors',
 'fileno',
 'flush',
 'isatty',
 'line_buffering',
 'mode',
 'name',
 'newlines',
 'read',
 'readable',
 'readline',
 'readlines',
 'reconfigure',
 'seek',
 'seekable',
 'tell',
 'truncate',
 'writable',
 'write',
 'write_through',
 'writelines']

In [6]:
f.readable()

False

In [7]:
f.writable()

True

In [8]:
f.mode

'w'

In [9]:
f.name

'tmp/prueba.txt'

In [10]:
f.closed

False

In [11]:
f.close()

In [12]:
f.closed

True

## Context managers

- Evitan que tengamos que estar pendientes de cerrar el fichero.
- En general, administran recursos consumidos por nuestro código.

In [16]:
with open('tmp/prueba.txt', 'w') as f:
    f.write('Esto\n')
    f.write('es\n')
    f.write('una\n')
    f.write('prueba\n')

In [17]:
f.closed

True

- En el caso de abrir ficheros, la instancia `open(path, mode)` actúa de context manager.
- Podemos definir nuestros propios context managers.
- Todos los context managers tienen que tener implementados dos métodos:
```python
def __enter__()
def __exit__()
```

In [19]:
with open('tmp/prueba.txt', 'r') as f: 
    print(dir(f))

['_CHUNK_SIZE', '__class__', '__del__', '__delattr__', '__dict__', '__dir__', '__doc__', '__enter__', '__eq__', '__exit__', '__format__', '__ge__', '__getattribute__', '__gt__', '__hash__', '__init__', '__init_subclass__', '__iter__', '__le__', '__lt__', '__ne__', '__new__', '__next__', '__reduce__', '__reduce_ex__', '__repr__', '__setattr__', '__sizeof__', '__str__', '__subclasshook__', '_checkClosed', '_checkReadable', '_checkSeekable', '_checkWritable', '_finalizing', 'buffer', 'close', 'closed', 'detach', 'encoding', 'errors', 'fileno', 'flush', 'isatty', 'line_buffering', 'mode', 'name', 'newlines', 'read', 'readable', 'readline', 'readlines', 'reconfigure', 'seek', 'seekable', 'tell', 'truncate', 'writable', 'write', 'write_through', 'writelines']


- Para leer podemos usar los métodos:
    - `read()` -> Leemos todo el fichero y devolvemos un string
    - `readline()` -> Leemos sólo una línea
    - `readlines()` -> Leemos todas las líneas y las devolvemos como una lista de strings.

In [21]:
with open("tmp/prueba.txt", "r") as f:
    line = f.read()
print(line)

Esto
es
una
prueba



In [23]:
with open("tmp/prueba.txt", "r") as f:
    line = f.readline()
print(line)

Esto



In [24]:
with open("tmp/prueba.txt", "r") as f:
    lines = f.readlines()
print(lines)

['Esto\n', 'es\n', 'una\n', 'prueba\n']


## Pickle

- Las variables se pueden guardar de forma serializada utilizando la librería `pickle`.
- Esto significa que los objetos conservan su estructura de Python.
    - Archivos `.pkl` sólo pueden leerse desde Python.
- No es seguro! Sólo hacer "unpickle" de archivos en los que confiemos.
- Como alternativa, es mejor usar archivos 
    - `.json` (JSON -> JavaScript Object Notation)
    - `.csv` (CSV -> Comma-Separated Values).
- Sin embargo, es útil para uso propio.
    - Si cargamos un fichero con datos a los cuales limpiamos y damos estructura desde Python, entonces es útil guardar estos datos en un `.pkl` para no tener que volver aplicar el mismo proceso cuando queramos vovler a usarlo. 
- Para guardar:

In [25]:
import pickle

In [26]:
lista = ['hola', 'me', 'guardo']
dicc = {'key': 'info'}
def adios():
    print('Adios!')

In [27]:
with open('tmp/variables.pkl', 'wb') as f:
    pickle.dump(lista, f)
    pickle.dump(dicc, f)
    pickle.dump(adios, f)

- Para leer:

In [28]:
with open('tmp/variables.pkl', 'rb') as f:
    lista_g = pickle.load(f)
    dicc_g = pickle.load(f)
    adios_g = pickle.load(f)

In [29]:
lista_g

['hola', 'me', 'guardo']

In [30]:
dicc_g

{'key': 'info'}

In [31]:
adios_g

<function __main__.adios()>

In [32]:
adios_g()

Adios!


## JSON

- Formato estandar para almacenar e intercambiar datos (otros: YAML, XML, CSV)
- Python tienen un JSON decoder/encoder.
- Los propios notebooks son documentos tipo `.json`.
- Muy parecidos a un diccionario de Pyhon (pero no son lo mismo!)

In [33]:
import json

In [34]:
dic = {
    'estaciones': {
        'verano': 'calor',
        'invierno': 'frío'
    },
    'números': [0, 5, 2.5]
}

In [35]:
with open('tmp/json_data_1.json', 'w') as f:
    json.dump(dic, f)

In [36]:
with open('tmp/json_data_2.json', 'w') as f:
    json.dump(dic, f, indent=4)

In [37]:
with open('tmp/json_data_1.json', 'r') as f:
    dic_g = json.load(f)

In [38]:
dic_g

{'estaciones': {'verano': 'calor', 'invierno': 'frío'}, 'números': [0, 5, 2.5]}

- También existen los métodos `dumps()` and `loads()` que interpretan un json que venga como una única string.

In [39]:
json_string = json.dumps(dic)
json_string

'{"estaciones": {"verano": "calor", "invierno": "fr\\u00edo"}, "n\\u00fameros": [0, 5, 2.5]}'

In [40]:
type(json_string)

str

In [41]:
dic_s = json.loads(json_string)
print(dic_s)
type(dic_s)

{'estaciones': {'verano': 'calor', 'invierno': 'frío'}, 'números': [0, 5, 2.5]}


dict

- Muy útiles para descargar información de la web

In [42]:
import requests

In [43]:
respuesta = requests.get("https://jsonplaceholder.typicode.com/todos")

In [44]:
midir(respuesta)

['_content',
 '_content_consumed',
 '_next',
 'apparent_encoding',
 'close',
 'connection',
 'content',
 'cookies',
 'elapsed',
 'encoding',
 'headers',
 'history',
 'is_permanent_redirect',
 'is_redirect',
 'iter_content',
 'iter_lines',
 'json',
 'links',
 'next',
 'ok',
 'raise_for_status',
 'raw',
 'reason',
 'request',
 'status_code',
 'text',
 'url']

In [45]:
respuesta.text

'[\n  {\n    "userId": 1,\n    "id": 1,\n    "title": "delectus aut autem",\n    "completed": false\n  },\n  {\n    "userId": 1,\n    "id": 2,\n    "title": "quis ut nam facilis et officia qui",\n    "completed": false\n  },\n  {\n    "userId": 1,\n    "id": 3,\n    "title": "fugiat veniam minus",\n    "completed": false\n  },\n  {\n    "userId": 1,\n    "id": 4,\n    "title": "et porro tempora",\n    "completed": true\n  },\n  {\n    "userId": 1,\n    "id": 5,\n    "title": "laboriosam mollitia et enim quasi adipisci quia provident illum",\n    "completed": false\n  },\n  {\n    "userId": 1,\n    "id": 6,\n    "title": "qui ullam ratione quibusdam voluptatem quia omnis",\n    "completed": false\n  },\n  {\n    "userId": 1,\n    "id": 7,\n    "title": "illo expedita consequatur quia in",\n    "completed": false\n  },\n  {\n    "userId": 1,\n    "id": 8,\n    "title": "quo adipisci enim quam ut ab",\n    "completed": true\n  },\n  {\n    "userId": 1,\n    "id": 9,\n    "title": "molesti

In [46]:
import json

In [48]:
json_data = json.loads(respuesta.text)
print(type(json_data))
json_data[:5]

<class 'list'>


[{'userId': 1, 'id': 1, 'title': 'delectus aut autem', 'completed': False},
 {'userId': 1,
  'id': 2,
  'title': 'quis ut nam facilis et officia qui',
  'completed': False},
 {'userId': 1, 'id': 3, 'title': 'fugiat veniam minus', 'completed': False},
 {'userId': 1, 'id': 4, 'title': 'et porro tempora', 'completed': True},
 {'userId': 1,
  'id': 5,
  'title': 'laboriosam mollitia et enim quasi adipisci quia provident illum',
  'completed': False}]

- Por último, también podemos serializar objetos más complejos en un `.json` siempre y cuando implementemos un encoder y un decoder adecuado para ese objeto.