# JSON, YAML Y Requests

Autor: Ricardo Ander-Egg Aguilar

* üñ•: https://ricardoanderegg.com/
* üê¶: https://twitter.com/ricardoanderegg
* üë®üèª‚Äçüéì: https://www.linkedin.com/in/ricardoanderegg/

In [None]:
import requests
import json
import yaml
import itertools

## JSON

En primer lugar creamos un diccionario de Python. Podemos hacerlo tan "profundo" como queramos. Por ejemplo podemos poner keys cuyo valor sean listas, que a su vez est√°n compuestas de diccionarios. Podemos usar valores `True`, `False`, `None`, etc. tambi√©n.

In [None]:
persona = {
    "nombre": "oriol",
    "edad": 28,
    "casado": True,
    "divorciado": False,
    "hijos": ("ricardito", "ian"),
    "mascotas": None,
    "ordenadores": [
        {"modelo": "macbook", "versionpython": 3.7},
        {"modelo": "imac", "versionpython": 3.8},
    ],
}

Para acceder a un elemento:

In [None]:
persona["ordenadores"][0]["modelo"]

'macbook'

### Serializar JSON

[Serializar](https://es.wikipedia.org/wiki/Serializaci√≥n) un objeto nos permite convertirlo a un formato apto para escribirlo en un archivo o enviarlo.

En el caso de la librear√≠a `json`, se puede utilizar 2 funciones.

La funci√≥n `json.dumps(objeto)` convierte un `objeto` de python (nuestro diccionario por ejemplo) en un objeto de json. Los objetos json son siempre **cadenas de texto**.

In [None]:
str_json = json.dumps(persona)
print(str_json)

{"nombre": "oriol", "edad": 28, "casado": true, "divorciado": false, "hijos": ["ricardito", "ian"], "mascotas": null, "ordenadores": [{"modelo": "macbook", "versionpython": 3.7}, {"modelo": "imac", "versionpython": 3.8}]}


Es importate tener en cuenta la relaci√≥n que hay entre los tipos de datos de python y los de json. Por ejemplo tanto una `list` como un `tuple` de python siempre ser√°n un `array` (equivalente a `list` en python).

<div class="table-responsive">
<table class="table table-hover">
<thead>
<tr>
<th>Python</th>
<th>JSON</th>
</tr>
</thead>
<tbody>
<tr>
<td><code>dict</code></td>
<td><code>object</code></td>
</tr>
<tr>
<td><code>list</code>, <code>tuple</code></td>
<td><code>array</code></td>
</tr>
<tr>
<td><code>str</code></td>
<td><code>string</code></td>
</tr>
<tr>
<td><code>int</code>, <code>long</code>, <code>float</code></td>
<td><code>number</code></td>
</tr>
<tr>
<td><code>True</code></td>
<td><code>true</code></td>
</tr>
<tr>
<td><code>False</code></td>
<td><code>false</code></td>
</tr>
<tr>
<td><code>None</code></td>
<td><code>null</code></td>
</tr>
</tbody>
</table>
</div>

Y viceversa tambi√©n.

<div class="table-responsive">
<table class="table table-hover">
<thead>
<tr>
<th>JSON</th>
<th>Python</th>
</tr>
</thead>
<tbody>
<tr>
<td><code>object</code></td>
<td><code>dict</code></td>
</tr>
<tr>
<td><code>array</code></td>
<td><code>list</code></td>
</tr>
<tr>
<td><code>string</code></td>
<td><code>str</code></td>
</tr>
<tr>
<td><code>number</code> (int)</td>
<td><code>int</code></td>
</tr>
<tr>
<td><code>number</code> (real)</td>
<td><code>float</code></td>
</tr>
<tr>
<td><code>true</code></td>
<td><code>True</code></td>
</tr>
<tr>
<td><code>false</code></td>
<td><code>False</code></td>
</tr>
<tr>
<td><code>null</code></td>
<td><code>None</code></td>
</tr>
</tbody>
</table>
</div>

### Deserializar JSON

Lo contrario al paso anterior. Convertimos unos datos a un objeto de python.

In [None]:
json_dict = json.loads(str_json)
json_dict

{'nombre': 'oriol',
 'edad': 28,
 'casado': True,
 'divorciado': False,
 'hijos': ['ricardito', 'ian'],
 'mascotas': None,
 'ordenadores': [{'modelo': 'macbook', 'versionpython': 3.7},
  {'modelo': 'imac', 'versionpython': 3.8}]}

Podemos escribir el `str` **serializado** a un archivo de texto.

In [None]:
with open("jsondata.json", "w") as archivo:
    archivo.write(str_json)

In [None]:
with open("jsondata.json", "r") as archivo:
    datos = archivo.read()

Tambi√©n podemos hacer un "2 en 1". En lugar de primero convertir los datos a json con `.dumps(objeto)` y despu√©s escribir esos datos a un archivo, podemos directamente serializar los datos a un archivo. En este caso usaremos la funci√≥n `.dump(objeto, file_handler)`, donde `file_handler` es la variable que hayamos creado para manejar el archivo. En el ejemplo siguiente el `file_handler` ser√≠a la variabe que hemos llamado `archivo`.

In [None]:
with open("json2.json", "w") as archivo:
    json.dump(persona, archivo)

## YAML

Casi todo es "igual" que con los archivos json. Nos movemos entre el archivo y diccionarios de python.

Si usamos `.load()` importante que a√±adamos lo de `Loader=yaml.FullLoader`

In [None]:
import yaml

In [None]:
with open("items.yml") as f:
    
    items = yaml.load(f, Loader=yaml.FullLoader)

In [None]:
items

{'raincoat': 1,
 'coins': 5,
 'books': 23,
 'spectacles': 2,
 'chairs': 12,
 'pens': 6}

Otra opci√≥n m√°s pr√°ctica es usar `.full_load()`, de esta manera solo tenemos que pasarle la variable `f`.

In [None]:
with open("items.yml") as f:

    items = yaml.full_load(f)

In [None]:
items

{'raincoat': 1,
 'coins': 5,
 'books': 23,
 'spectacles': 2,
 'chairs': 12,
 'pens': 6}

Incluso mejor:

`.safe_load()`

Si no tenemos la certeza del origen del yaml. (Archivos de los que "no nos fiamos")

In [None]:
with open("items.yml") as f:

    items = yaml.safe_load(f)

### Documentos m√∫ltiples

En yaml, cuande tenemos una cadena de texto: `---` lo identifica como si fueran documentos diferentes. En este caso tendremos que usar `.full_load_all()`. Esta funci√≥n nos devuelve un generador. Tambien nos evita tener que usar `Loader=yaml.FullLoader`.

Un generador es como la funci√≥n `range()` que hab√≠amos usado anteriomente. Conteien unas instrucciones para generar unos datos pero no las ejecuta hasta que se lo pedimos. En este caso le "pediremos" los datos iterando sobre ellos. Es importante hacer esta iteraci√≥n dentro del `contex manager` (el bloque de `with`). Fuera de este ya no tenemos disponible la variable `f` y nos dar√° un error.

In [None]:
with open("data.yaml") as f:
    
    documentos = yaml.full_load_all(f)
    
    for doc in documentos:
        print(doc)

{'cities': ['Bratislava', 'Kosice', 'Trnava', 'Moldava', 'Trencin']}
{'companies': ['Eset', 'Slovnaft', 'Duslo Sala', 'Matador Puchov']}


Tambien podemos escribir nuestro diccionario a un archivo yaml. Igual que con json.

Recomiento ejecutar estas funciones y ver como es el archivo que se crea para entender bien el formato.

In [None]:
usuarios = [
    {"nombre": "antonio lopez", "trabajo": "python developer"},
    {"nombre": "ivan lopez", "trabajo": "python expert"},
    {"nombre": "raymond hettinger", "trabajo": "python boss"},
    {"nombre": "david beazley", "trabajo": "python second boss"},
]

In [None]:
with open("usuarios.yaml", "w") as archivo_usuarios:
    
    yaml.dump(usuarios, archivo_usuarios)

In [None]:
archivos = [
    {
        "sports": [
            "soccer",
            "football",
            "basketball",
            "cricket",
            "hockey",
            "table tennis",
        ]
    },
    {"countries": ["Pakistan", "USA", "India", "China", "Germany", "France", "Spain"]},
]

In [None]:
with open("archivo.yaml", "w") as file:
    yaml.dump(archivos, file)

### IMPORTANTE

YAML tiene una sintaxis bastante amplia.

A continuaci√≥n os dejo el siguiente archivo:

Es una modificaci√≥n de https://learnxinyminutes.com/docs/yaml/ . Lo he modificado porque en el tutorial original hay una cosa que la librer√≠a yaml de python no puede procesar. Solo hay que ejecutar la siguiente celda para descargar el archivo.

In [2]:
import requests

res = requests.get(
    "https://raw.githubusercontent.com/polyrand/teach/master/archivos/full.yaml"
)

with open("full.yaml", "w") as f:
    f.write(res.text)

A continuaci√≥n cargamos el YAML. Recomiendo cargarlo a un diccionario de python y tener tambien abierto el archivo en formato texto. Es un yaml donde est√° explicada toda la sintaxis en los comentarios (lo que empieza con `#`). Asi pod√©is ir ley√©ndolo y comparando con el diccionario de Python.

In [None]:
with open("full.yaml", "r") as f:
    full = yaml.full_load(f)

In [None]:
full

{'key': 'value',
 'another_key': 'Another value goes here.',
 'a_number_value': 100,
 'scientific_notation': '1e+12',
 'boolean': True,
 'null_value': None,
 'key with spaces': 'value',
 'however': 'A string, enclosed in quotes.',
 'Keys can be quoted too.': "Useful if you want to put a ':' in your key.",
 'single quotes': "have 'one' escape pattern",
 'double quotes': 'have many: ", \x00, \t, ‚ò∫, \r\n == \r\n, and more.',
 'Superscript two': '\\u00B2',
 'literal_block': "This entire block of text will be the value of the 'literal_block' key,\nwith line breaks being preserved.\n\nThe literal continues until de-dented, and the leading indentation is\nstripped.\n\n    Any lines that are 'more-indented' keep the rest of their indentation -\n    these lines will be indented by 4 spaces.\n",
 'folded_style': "This entire block of text will be the value of 'folded_style', but this time, all newlines will be replaced with a single space.\nBlank lines, like above, are converted to a newline c

Dejo tambi√©n el ejemplo que he usado en clase. No funcionar√° ya que no ten√©is el archivo en el ordenador pero com ejemplo puede ir bien.

```python
with open("docker.yaml", "r") as f:
    dock = yaml.load(f, Loader=yaml.FullLoader)

port = dock["services"]["pgadmin"]["deploy"]["labels"][2].split("=")[1]

if int(port) != 5550:
    print("el yaml esta mal configurado")
```