In [1]:
import os
import requests

In [2]:
for fn in [
    "items.yaml",
    "data.yaml",
    "docker-compose.yml",
]:
    if fn not in os.listdir():
        print(f"downloading {fn}...")
        with open(fn, "w") as f:
            f.write(
                requests.get(
                    f"https://raw.githubusercontent.com/polyrand/teach/master/02_json-yaml/{fn}"
                ).text
            )
            
    else:
        print(f"{fn} already exists")


items.yaml already exists
data.yaml already exists
docker-compose.yml already exists


# JSON, YAML Y Requests

Autor: Ricardo Ander-Egg Aguilar

* 🖥: https://ricardoanderegg.com/
* 🐦: https://twitter.com/ricardoanderegg
* 👨🏻‍🎓: https://www.linkedin.com/in/ricardoanderegg/

In [3]:
import requests
import json
import yaml
import itertools

## JSON

En primer lugar creamos un diccionario de Python. Podemos hacerlo tan "profundo" como queramos. Por ejemplo podemos poner keys cuyo valor sean listas, que a su vez están compuestas de diccionarios. Podemos usar valores `True`, `False`, `None`, etc. también.

In [4]:
persona = {
    "nombre": "oriol",
    "edad": 28,
    "trabajo": True,
    "hijos": ("maria", "ian"),
    "mascotas": None,
    "ordenadores": [
        {"modelo": "macbook", "versionpython": 3.7},
        {"modelo": "imac", "versionpython": 3.8},
    ],
}

In [5]:
ordenadores = persona["ordenadores"]

In [6]:
ordenador_0 = ordenadores[0]

In [7]:
modelo_0 = ordenador_0["modelo"]

Para acceder a un elemento:

In [8]:
persona["ordenadores"][0]["modelo"]

'macbook'

### Serializar JSON

[Serializar](https://es.wikipedia.org/wiki/Serialización) un objeto nos permite convertirlo a un formato apto para escribirlo en un archivo o enviarlo.

En el caso de la librearía `json`, se puede utilizar 2 funciones.

La función `json.dumps(objeto)` convierte un `objeto` de python (nuestro diccionario por ejemplo) en un objeto de json. Los objetos json son siempre **cadenas de texto**.

In [9]:
str_json = json.dumps(persona)

In [10]:
print(str_json)

{"nombre": "oriol", "edad": 28, "trabajo": true, "hijos": ["maria", "ian"], "mascotas": null, "ordenadores": [{"modelo": "macbook", "versionpython": 3.7}, {"modelo": "imac", "versionpython": 3.8}]}


Es importate tener en cuenta la relación que hay entre los tipos de datos de python y los de json. Por ejemplo tanto una `list` como un `tuple` de python siempre serán un `array` (equivalente a `list` en python).

<div class="table-responsive">
<table class="table table-hover">
<thead>
<tr>
<th>Python</th>
<th>JSON</th>
</tr>
</thead>
<tbody>
<tr>
<td><code>dict</code></td>
<td><code>object</code></td>
</tr>
<tr>
<td><code>list</code>, <code>tuple</code></td>
<td><code>array</code></td>
</tr>
<tr>
<td><code>str</code></td>
<td><code>string</code></td>
</tr>
<tr>
<td><code>int</code>, <code>long</code>, <code>float</code></td>
<td><code>number</code></td>
</tr>
<tr>
<td><code>True</code></td>
<td><code>true</code></td>
</tr>
<tr>
<td><code>False</code></td>
<td><code>false</code></td>
</tr>
<tr>
<td><code>None</code></td>
<td><code>null</code></td>
</tr>
</tbody>
</table>
</div>

Y viceversa también.

<div class="table-responsive">
<table class="table table-hover">
<thead>
<tr>
<th>JSON</th>
<th>Python</th>
</tr>
</thead>
<tbody>
<tr>
<td><code>object</code></td>
<td><code>dict</code></td>
</tr>
<tr>
<td><code>array</code></td>
<td><code>list</code></td>
</tr>
<tr>
<td><code>string</code></td>
<td><code>str</code></td>
</tr>
<tr>
<td><code>number</code> (int)</td>
<td><code>int</code></td>
</tr>
<tr>
<td><code>number</code> (real)</td>
<td><code>float</code></td>
</tr>
<tr>
<td><code>true</code></td>
<td><code>True</code></td>
</tr>
<tr>
<td><code>false</code></td>
<td><code>False</code></td>
</tr>
<tr>
<td><code>null</code></td>
<td><code>None</code></td>
</tr>
</tbody>
</table>
</div>

### Deserializar JSON

Lo contrario al paso anterior. Convertimos unos datos a un objeto de python.

In [11]:
json_dict = json.loads(str_json)
json_dict

{'nombre': 'oriol',
 'edad': 28,
 'trabajo': True,
 'hijos': ['maria', 'ian'],
 'mascotas': None,
 'ordenadores': [{'modelo': 'macbook', 'versionpython': 3.7},
  {'modelo': 'imac', 'versionpython': 3.8}]}

Podemos escribir el `str` **serializado** a un archivo de texto.

In [12]:
with open("jsondata.json", "w") as archivo:
    archivo.write(str_json)

In [13]:
with open("jsondata.json", "r") as archivo:
    datos = archivo.read()
    
a = json.loads(datos)

In [14]:
with open("jsondata.json", "r") as archivo:

    a = json.load(archivo)

También podemos hacer un "2 en 1". En lugar de primero convertir los datos a json con `.dumps(objeto)` y después escribir esos datos a un archivo, podemos directamente serializar los datos a un archivo. En este caso usaremos la función `.dump(objeto, file_handler)`, donde `file_handler` es la variable que hayamos creado para manejar el archivo. En el ejemplo siguiente el `file_handler` sería la variabe que hemos llamado `archivo`.

In [15]:
with open("json2.json", "w") as archivo:
    json.dump(persona, archivo)

In [16]:
with open("jsondata.json", "r") as f:
    data = json.load(f)

In [17]:
data

{'nombre': 'oriol',
 'edad': 28,
 'trabajo': True,
 'hijos': ['maria', 'ian'],
 'mascotas': None,
 'ordenadores': [{'modelo': 'macbook', 'versionpython': 3.7},
  {'modelo': 'imac', 'versionpython': 3.8}]}

**Ejercicio**

Crear un archivo `mis_funciones_json.py` y escribir 2 funciones. Una para convertir un objeto de Python a JSON y guardarlo en un archivo, y otra para leer los contenidos de un archivo JSON y crear un objeto de Python:


```python
import json

import json

## CREAR 2 funciones

def cargar_json(ruta_archivo):

    with open(..., "r") as f:
        ...

    obj = ...

    return obj

def guardar_json(obj, ruta_archivo):

    json_str = json.dumps(...)

    with open(..., "w") as f:
        f.write(...)

    return json_str

```

Importar ambas funciones en nuestro cuaderno:

```python
from mis_funciones_json import cargar_json, guardar_json
```

Y utilizarlas.

## YAML

Casi todo es "igual" que con los archivos json. Nos movemos entre el archivo y diccionarios de python.

Si usamos `.load()` importante que añadamos lo de `Loader=yaml.FullLoader`

In [19]:
import yaml

In [20]:
with open("items.yaml") as f:
    
    items = yaml.load(f, Loader=yaml.FullLoader)

In [21]:
items

{'chubasquero': 1,
 'monedas': 5,
 'libros': 23,
 'espectaculos': 2,
 'sillas': 12,
 'bolis': 6}

Otra opción más práctica es usar `.full_load()`, de esta manera solo tenemos que pasarle la variable `f`.

In [22]:
with open("items.yaml") as f:

    items = yaml.full_load(f)

In [None]:
items

{'chubasquero': 1,
 'monedas': 5,
 'libros': 23,
 'espectaculos': 2,
 'sillas': 12,
 'bolis': 6}

Incluso mejor:

`.safe_load()`

Si no tenemos la certeza del origen del yaml. (Archivos de los que "no nos fiamos")

In [None]:
with open("items.yaml") as f:

    items = yaml.safe_load(f)

In [None]:
items

{'chubasquero': 1,
 'monedas': 5,
 'libros': 23,
 'espectaculos': 2,
 'sillas': 12,
 'bolis': 6}

### Documentos múltiples

En yaml, cuande tenemos una cadena de texto: `---` lo identifica como si fueran documentos diferentes. En este caso tendremos que usar `.full_load_all()`. Esta función nos devuelve un generador. Tambien nos evita tener que usar `Loader=yaml.FullLoader`.

Un generador es como la función `range()` que habíamos usado anteriomente. Conteien unas instrucciones para generar unos datos pero no las ejecuta hasta que se lo pedimos. En este caso le "pediremos" los datos iterando sobre ellos. Es importante hacer esta iteración dentro del `contex manager` (el bloque de `with`). Fuera de este ya no tenemos disponible la variable `f` y nos dará un error.

In [None]:
with open("data.yaml") as f:

    documentos = yaml.full_load_all(f)
    documentos = [doc for doc in documentos]
    
    # for doc in documentos:
    #    print(doc)

In [None]:
documentos[0]["ciudades"][3]

'Madrid'

Tambien podemos escribir nuestro diccionario a un archivo yaml. Igual que con json.

Recomiento ejecutar estas funciones y ver como es el archivo que se crea para entender bien el formato.

In [None]:
usuarios = [
    {"nombre": "antonio lopez", "trabajo": "python developer"},
    {"nombre": "ivan lopez", "trabajo": "python expert"},
    {"nombre": "raymond hettinger", "trabajo": "python boss"},
    {"nombre": "david beazley", "trabajo": "python second boss"},
]

In [None]:
with open("usuarios.yaml", "w") as archivo_usuarios:
    
    yaml.dump(usuarios, archivo_usuarios)

In [None]:
archivos = [
    {
        "deportes": [
            "rugby",
            "futbol",
            "baloncesto",
            "natacion",
            "wushu",
            "tenis",
        ]
    },
    {"countries": ["Pakistan", "USA", "India", "China", "Germany", "France", "Spain"]},
]

In [None]:
archivos

[{'deportes': ['rugby', 'futbol', 'baloncesto', 'natacion', 'wushu', 'tenis']},
 {'countries': ['Pakistan',
   'USA',
   'India',
   'China',
   'Germany',
   'France',
   'Spain']}]

In [None]:
with open("archivos.yaml", "w") as file:
    yaml.dump(archivos, file)

In [None]:
with open("docker-compose.yml") as f:

    docker_config = yaml.safe_load(f)

In [None]:
# lista_puertos = docker_config["services"]["api"]["ports"]

In [None]:
docker_config_nueva = docker_config.copy()

In [None]:
docker_config_nueva["services"]["api"]["ports"] = ["8080:8080"]

In [None]:
docker_config_nueva

{'version': '3.3',
 'services': {'redis': {'image': 'redis:alpine'},
  'api': {'ports': ['8080:8080'],
   'build': {'context': './backend', 'dockerfile': 'backend.dockerfile'},
   'volumes': ['/usr/local/share/db/.:/home/appuser/db/'],
   'depends_on': ['redis'],
   'env_file': ['env-postgres.env', 'env-backend.env']},
  'frontend': {'ports': ['3000:3000'],
   'image': '${DOCKER_IMAGE_FRONTEND}:${TAG-latest}',
   'build': {'context': './frontend', 'dockerfile': 'Dockerfile'},
   'depends_on': ['api']}}}

In [None]:
with open("docker_updated.yaml", "w") as archivo_config_docker:

    yaml.dump(
        docker_config_nueva,
        archivo_config_docker,
        # sort_keys=False,
    )

### IMPORTANTE

YAML tiene una sintaxis bastante amplia.

A continuación os dejo el siguiente archivo:

Es una modificación de https://learnxinyminutes.com/docs/yaml/ . Lo he modificado porque en el tutorial original hay una cosa que la librería yaml de python no puede procesar. Solo hay que ejecutar la siguiente celda para descargar el archivo.

In [None]:
import requests

res = requests.get(
    "https://raw.githubusercontent.com/polyrand/teach/master/archivos/full.yaml"
)

with open("full.yaml", "w") as f:
    f.write(res.text)

A continuación cargamos el YAML. Recomiendo cargarlo a un diccionario de python y tener tambien abierto el archivo en formato texto. Es un yaml donde está explicada toda la sintaxis en los comentarios (lo que empieza con `#`). Asi podéis ir leyéndolo y comparando con el diccionario de Python.

In [None]:
with open("full.yaml", "r") as f:
    full = yaml.full_load(f)

In [None]:
# with open("full.yaml", "r") as f:
#     full = yaml.safe_load(f)

Ejemplo de un archivo `.gif` incluído dentro del YAML.

In [None]:
datos_bytes = full["gif_file"]

In [None]:
with open("prueba.gif", "wb") as f:
    f.write(datos_bytes)

Dejo también el ejemplo que he usado en clase. No funcionará ya que no tenéis el archivo en el ordenador pero como ejemplo puede ir bien.

```python
with open("docker.yaml", "r") as f:
    dock = yaml.load(f, Loader=yaml.FullLoader)

port = dock["services"]["pgadmin"]["deploy"]["labels"][2].split("=")[1]

if int(port) != 5550:
    print("el yaml esta mal configurado")
```

## Vuelta al tema 00/09_librerias

Vamos a crear un módulo de Python con algunas funciones. Así podemos importar ese módulo desde varios sitios sin tener que copiar y pegar las funciones.

NOTA: Con el comando de jupyter `%%writefile <nombre_archivo>` escribimos los contenido de esa celda en `<nombre_archivo>` (¡se sobreescribe!).

Crear y guardo un archivo json.

In [6]:
usuarios = {"marta": 123, "laura": 345, "andrea": 234}

In [7]:
import json

with open("users.json", "w") as f:
    f.write(json.dumps(usuarios))

Ahora voy a crear un módulo llamado `mis_funciones.py`. Dentro habrá 2 funciones, una para leer archivos json y otro para guardarlos.

In [8]:
%%writefile mis_funciones.py

import json


def leer_json(nombre):
    with open(nombre) as f:
        contenidos_archivo = f.read()
        obj = json.loads(contenidos_archivo)

    return obj


def guardar_json(obj, nombre):
    with open(nombre, "w") as f:
        cadena_json = json.dumps(obj)
        f.write(cadena_json)

Overwriting mis_funciones.py


Ahora puedo importar este módulo y sus funciones desde otros sitios:

NOTA: se escribe `import mis_funciones`, **no** `import mis_funciones.py`

In [9]:
from mis_funciones import leer_json, guardar_json

In [10]:
usuarios = leer_json("users.json")

In [11]:
usuarios["andrea"] = 1000

In [12]:
usuarios

{'marta': 123, 'laura': 345, 'andrea': 1000}

In [13]:
guardar_json(usuarios, "users_updated.json")

Mi módulo lo puedo importar también desde otro script de Python.

Aqui estoy creando un script llamado `program.py`. En el script importo el módulo que he creado antes y lo utilizo.

In [14]:
%%writefile program.py
import mis_funciones

usuarios = mis_funciones.leer_json("users.json")

print("Hola, introduce un nuevo valor")

valor = input("Valor: ")

usuarios["andrea"] = valor

mis_funciones.guardar_json(usuarios, "users_updated.json")

print("JSON actualizado")

Writing program.py


*Recuerda*: El símbolo `!` significa que vas a ejecutar un comando como si lo hicieras desde la terminal.

**Importante**: este script utiliza la función `input()`. En un notebook de Jupyter no funcinará correctamente. En un notebook de Google Colab, si.

In [None]:
!python3 program.py