# JSON

## Definición

JSON (JavaScript Object Notation): Es un estándar utilizado para el intercambio de información entre aplicaciones. Es un formato de archivo de texto que es fáacil de leer tanto por humanos como por máquinas.


JSON está basado estructuralmente en el lenguaje de programación JavaScript y por su definición simple, se puede usar en diferentes lenguajes de programación.

## Estructura

Un objeto JSON es un diccionario, donde para cada ítem:


*   La clave debe ser una cadena de caracteres delimitada por comillas
dobles (")
*   El campo del valor puede ser un número (no se distingue entre enteros, reales u otros), un valor de verdad (en JavaScript se usan las palabras reservadas true y false), una cadena de caracteres (usando comillas dobles como delimitador), un elemento nulo (null), o una lista de estos mismos elementos o nuevamente un objeto JSON (un diccionario con estas propiedades —definido recursivamente—).



## Ejemplo



```
{
    "Nombre": "Douglas",
    "Apellido": "Crockford",
    "pasatiempos": ["trotar", "bucear", "cantar"],
    "edad": 64,
    "empleado": false,
    "jefe": null,
    "hijos": [
        {"Nombre": "Alice", "edad": 16},
        {"Nombre": "Bob", "edad": 8}
    ]
}
```



# JSON y los diccionarios de Python

## Diferencias


*   No todo diccionario en Python es un objeto JSON: Los diccionarios en Python pueden tener como claves números, cadenas delimitadas por el apostrofe o tuplas. Los objetos JSON sólo permite cadenas de caracteres delimitadas únicamente por comillas dobles.
*   Un objeto JSON es “casi” un diccionario en Python, diccionario que usa las palabras false, true, null y no las de Python True, False, None.
*  Es claro, que muchos objetos JSON se pueden escribir directamente en Python, pero no todos y viceversa.



## Ejemplo de un objeto JSON en Python:

---
El objeto JSON

```
 {
   "Nombre": "Douglas",
    "Apellido": "Crockford",
    "pasatiempos": ["trotar", "bucear", "cantar"],
    "edad": 64,
    "empleado": false,
    "jefe": null,
    "hijos": [
        {"Nombre": "Alice", "edad": 16},
        {"Nombre": "Bob", "edad": 8}
    ]
 }
```
---
Se puede escribir como el diccionario de Python así:


```
{
  "Nombre": "Douglas",
  "Apellido": "Crockford",
  "pasatiempos": ["trotar", "bucear", "cantar"],
  "edad": 64,
  "empleado": False,
  "jefe": None,
  "hijos": [
      {"Nombre": "Alice", "edad": 16},
      {"Nombre": "Bob", "edad": 8}
  ]
}
```





## Correspondencias

La siguiente tabla presenta las correspondencias entre los tipos de un objeto JSON y los tipos dentro de un diccionario Python.

Tipo en python     | Tipo en JSON
-------------------|------------------
dict               | object
tuple, list        | arreglo
str                | string
int, float         | number
False              | false
True               | true
None               | null




## Python soporta JSON

Python viene con un módulo llamado json que permite automatizar la tarea de procesar información en este formato, éste se invoca mediante la instrucción



```
import json
```



# Serialización

El proceso de transformar datos en series de bytes para ser enviados por una red o ser guardados como archivo se conoce como serialización. Los archivos JSON se pueden serializar. La librería json expone el método dump() para escribir datos en un archivo. Si se tiene el siguiente diccionario

In [4]:
import json
data = {
  "cientifico": {
    "nombre": "Alan Mathison Turing",
    "edad": "41"
  }
}
with open("json/data_file.json", "w") as write_file:
  json.dump(data, write_file)

## Serialización a texto
El objeto data se puede asignar a un string de la siguiente manera

In [5]:
import json

data = {
  "cientifico": {
    "nombre": "Alan Mathison Turing",
    "edad": "41"
  }
}
json_string = json.dumps(data)
print(json_string, type(json_string))


{"cientifico": {"nombre": "Alan Mathison Turing", "edad": "41"}} <class 'str'>


## Argumentos de la función dump
Es posible especificar el tamaño de la indentación para estructuras anidadas. El siguiente programa establece que la indentación se realiza a 4 espacios y se imprime en forma de árbol expandido hacia la derecha.

In [6]:
import json

data = {
  "cientifico": {
    "nombre": "Alan Mathison Turing",
    "edad": "41"
  }
}

json_string = json.dumps(data, indent=4)
print(json_string)

{
    "cientifico": {
        "nombre": "Alan Mathison Turing",
        "edad": "41"
    }
}


# Deserialización

Es posible cargar un archivo de JSON desde un archivo de la siguiente manera


In [7]:
with open("json/data_file.json", "r") as read_file:
  data = json.load(read_file)
print(data["cientifico"])

{'nombre': 'Alan Mathison Turing', 'edad': '41'}


## Deserialización desde texto

Es posible cargar un archivo de JSON desde un string. En el siguiente código se crea un string (en dos lineas por espacio, para esto se encierra entre tres comillas simples ’’’), luego se carga el objeto JSON a la variable data y por último ésta se imprime

In [9]:
import json

json_string = '''{"cientifico":
{"nombre":"Alan Mathison Turing", "edad": "41"}}'''
data = json.loads(json_string)
print(data)

{'cientifico': {'nombre': 'Alan Mathison Turing', 'edad': '41'}}


# Conversión de archivos JSON a estructuras de Python
Como se observaba en la tabla de correspondencias, JSON maneja null en vez de None, false en vez de False y true en vez de True. Al importar el cóodigo con la librería json se realizan las conversiones internas para poder trabajar cómodamente en Python. Así como se puede apreciar en el ́cóodigo presentado en la siguiente diapositiva.

Para imprimir se utiliza la función pprint del módulo pprint, con el fin de que el resultado aparezca impreso de forma bonita (Pretty Print).

In [10]:
import json
from pprint import pprint
strjson = '''{
"boolean1": null,
"diccionario": {"papa": 2000, "arroz": 5000},
"intValue": 0, "myList": [],
"myList2":["info1", "info2"],
"littleboolean": false, "myEmptyList": null,
"text1": null, "text2": "hello", "value1": null,
"value2": null}'''
data = json.loads(strjson)
pprint(data)

{'boolean1': None,
 'diccionario': {'arroz': 5000, 'papa': 2000},
 'intValue': 0,
 'littleboolean': False,
 'myEmptyList': None,
 'myList': [],
 'myList2': ['info1', 'info2'],
 'text1': None,
 'text2': 'hello',
 'value1': None,
 'value2': None}


# Leer JSON desde internet


## Usando request para leer archivos JSON desde internet

Existe un recurso en línea gratuito llamado JSONPlaceholder para practicar peticiones que se pueden realizar en formato JSON. Para realizar una petición se utiliza el módulo requests así

In [11]:
import json
import requests
from pprint import pprint
response = requests.get(
    "https://jsonplaceholder.typicode.com/todos")
pendientes = json.loads(response.text)
pprint(pendientes)

[{'completed': False, 'id': 1, 'title': 'delectus aut autem', 'userId': 1},
 {'completed': False,
  'id': 2,
  'title': 'quis ut nam facilis et officia qui',
  'userId': 1},
 {'completed': False, 'id': 3, 'title': 'fugiat veniam minus', 'userId': 1},
 {'completed': True, 'id': 4, 'title': 'et porro tempora', 'userId': 1},
 {'completed': False,
  'id': 5,
  'title': 'laboriosam mollitia et enim quasi adipisci quia provident illum',
  'userId': 1},
 {'completed': False,
  'id': 6,
  'title': 'qui ullam ratione quibusdam voluptatem quia omnis',
  'userId': 1},
 {'completed': False,
  'id': 7,
  'title': 'illo expedita consequatur quia in',
  'userId': 1},
 {'completed': True,
  'id': 8,
  'title': 'quo adipisci enim quam ut ab',
  'userId': 1},
 {'completed': False,
  'id': 9,
  'title': 'molestiae perspiciatis ipsa',
  'userId': 1},
 {'completed': True,
  'id': 10,
  'title': 'illo est ratione doloremque quia maiores aut',
  'userId': 1},
 {'completed': True,
  'id': 11,
  'title': 'vero

## Analizando la estructura de un JSON
Al procesar los registros del JSON de pendientes cargados se observa que cada registro posee un usuario userId, un identificador de pendiente id, un título de tarea específico title y un estado completed que indica si la tarea ha sido realizada o no.

Con la siguiente instrucción se obtienen los dos registros iniciales del JSON:



```
pendientes[:2]
```



In [13]:
pprint(pendientes[:2])

[{'completed': False, 'id': 1, 'title': 'delectus aut autem', 'userId': 1},
 {'completed': False,
  'id': 2,
  'title': 'quis ut nam facilis et officia qui',
  'userId': 1}]


# Filtrar información de un archivo JSON

## Saber cuantas tareas ha completado un usuario

Es posible observar que hay varios usuarios cada uno con un identificador único y cada tarea tiene un estado que indica si la tarea se completó o no. Procesaremos este archivo para obtener cuantas tareas ha completado cada usuario y establecer los usuarios que más tareas han completado.

Esto se puede hacer en tres fases:


*   Contar cuántas tareas han completado los usuarios.
*   Ordenar el conteo de tareas pendientes que se han completado.
*  Escoger los usuarios que tienen el mismo nu ́mero de tareas máximo.



### Contar tareas completadas por usuario

In [14]:
pendientes_por_usuario= {}

for pendiente in pendientes:
  if pendiente["completed"]:
      if pendiente["userId"] in pendientes_por_usuario:
        pendientes_por_usuario[pendiente["userId"]] += 1
      else:
        pendientes_por_usuario[pendiente["userId"]] = 1

### Ordenar por nu ́mero de pendientes completos


In [15]:
items_ordenados = sorted(pendientes_por_usuario.items(),key=lambda x: x[1], reverse=True)
maximas_tareas_completadas = items_ordenados[0][1]

### Escoger los usuarios que tienen el número de tareas máximo


In [16]:
usuarios = []
for usuario, num_tareas_completas in items_ordenados:
    if num_tareas_completas == maximas_tareas_completadas:
        usuarios.append(str(usuario))
    else: break
usuarios_con_max = " y ".join(usuarios)
print("los usuarios", usuarios_con_max)
print("han completado ", maximas_tareas_completadas, "tareas")

los usuarios 5 y 10
han completado  12 tareas


## Filtrar usuarios con el máximo número de pendientes
Es posible filtrar las tareas de los usuarios que han hecho la mayor cantidad de pendientes completados y escribirlas en un archivo json. Para esto nos apoyaremos de la función filter que determina a travé2s de una función que retorna un booleano si incluir al elemento en la lista de salida o no

In [17]:
def filtro(pendiente):
  esta_completa = pendiente["completed"]
  esta_en_el_maximo_conteo = str(pendiente["userId"]) in usuarios
  return esta_completa and esta_en_el_maximo_conteo

with open("json/tareas_filtradas.json", "w") as archivo_salida:
  tareas_filtradas = list(filter(filtro, pendientes))
  json.dump(tareas_filtradas, archivo_salida, indent=2)

# Validación de archivos con formato JSON
Es posible validar un archivo de JSON utilizando la páagina web [link](https://jsonlint.com/)

# Sugerencia
Se sugiere consultar un manual de Python o de sus librerías para determinar si ya existe un método para lo que se quiera realizar con JSON.

# Ejercicios

Para el JSON con la estructura mostrada



```
{
  "jadiazcoronado":{
    "nombres": "Juan Antonio", 
    "apellidos": "Díaz Coronado", 
    "edad":19,
    "colombiano":true,
    "deportes":["Fútbol","Ajedrez","Gimnasia"] 
  },
  ...
  "dmlunasol":{
    "nombres": "Dorotea Maritza",
    "apellidos": "Luna Sol",
    "edad":25,
    "colombiano":false,
    "deportes":["Baloncesto","Ajedrez","Gimnasia"]
  }
}
```

*   Imprima los nombres completos (nombre y apellidos) de las personas que practican el deporte ingresado por el usuario.
*   Imprima los nombres completos (nombre y apellidos) de las personas que estén en un rango de edades dado por el usuario.
*  Cree un JSON de deportes como sigue

  ```
  {
    "Ajedrez":["jadiazcoronado",...,"dmlunasol"],
    "Futbol":["jadiazcoronado",...],
    "Gimnasia":["jadiazcoronado,...,"dmlunasol"],
    ...
    "Baloncesto":[...,"dmlunasol"]
  }
  ```
*  Desarrolle un programa que lea dos archivos JSON, y encuentre los componentes clave:valor que son iguales en ambos. Genere un nuevo archivo JSON con las coincidencias exactas entre los dos archivos.
*  Desarrolle un programa que lea un archivo JSON, en el cual se encuentran las notas de los estudiantes del curso. Cada llave corresponde al código de cada estudiante, y su valor es una lista con las notas obtenidas en las actividades del curso. Se debe generar un nuevo archivo JSON que para uno de los estudiantes solo guarde el promedio de las notas obtenidas.
*  Desarrollar un programa que lea un archivo JSON que contiene una serie de cadenas de caracteres en minúscula, cada una con su propia llave. Estas llaves tienen una codificación, a forma de encriptación, en donde las vocales están descritas como otros símbolos: \$ en vez de a, # en vez de e,* en vez de i,¬ en vez de o,y + en vez de u. Una ez leído el archivo, realice una desencriptación de todas las cadenas, es decir, convierta los símbolos a sus vocales correspondientes (si la cadena de entrada es ”h¬l$”, la cadena resultante sería ”hola”), y guarde el resultado en un nuevo archivo JSON.



