### ¿Cómo manejar JSON en Python?

En este artículo, aprenderemos y comprenderemos cómo analizar, leer y escribir
JSON en Python. Veremos diferentes conversiones de JSON en diferentes objetos
Python junto con un bonus.

Estructura

El JSON se construye sobre dos estructuras:

1. Colección de pares nombre/valor. En muchos lenguajes de programación,
solemos referirnos a ella como objeto, registro, estructura, diccionario,
tabla hash, etc.

2. Una lista ordenada de valores. En muchos lenguajes de programación, nos
referimos a esto como un
matriz, vector, lista o secuencia.

Sintaxis

Un objeto es un conjunto desordenado de pares nombre/valor. Cada vez que un objeto
seguido de : dos puntos y los pares nombre/valor van separados por una , coma.

Por ejemplo:

In [6]:
ejemplo = {"nombre": "Jake", "lenguajes de programación": ["Python", "Kotlin"]}

### Conjunto de datos

Vamos a ceñirnos a un único conjunto de datos a lo largo de este artículo por coherencia. Recomiendo marcar, bifurcar o iniciar este repositorio porque tiene uno de los mejores conjuntos de datos en formato JSON.

https://github.com/jdorfman/awesome-json-datasets?tab=readme-ov-file#bitcoin


### Detalles del conjunto de datos

A continuación se ofrece información detallada sobre el conjunto de datos:
Pss: Cómo he conseguido esto, por favor refiérase al ejemplo de bonificación a continuación:

Nombre: Barrios en Reino Unido (Leicestershire)
Enlace: https://data.police.uk/api/leicestershire/neighbourhoods
RangeIndex: 6 entradas, 0 a 5
Columnas de datos (total 2 columnas):


| #  | Column  | Non-Null Count | Dtype  |
|----|---------|----------------|--------|
|  0 |    id   |   6 non-null   | object |
|  1 |    name |   6 non-null   | object |
dtypes: object(2)
memory usage: 224.0+ KB


### Visualización del conjunto de datos

Así es como se ven los datos en formato JSON. Bueno, sé que se ve horrible, pero no todo el tiempo los conjuntos de datos se supone que debe tener un aspecto limpio; es su trabajo para que se vean bien.

Sólo he tomado unas pocas instancias del conjunto de datos, debido a su tamaño.

[{"id":"NC04","name":"City Centre"},{"id":"NC66","name":"Cultural Quarter"},{"id":"NC67" ,"name":"Riverside"},
{"id":"NC68","name":"Clarendon Park"},{"id":"NE06","name":"Belgrave South"},{"id":"NE10","name":"Belgrave North"}]

In [7]:
json_data = '[{"id":"NC04","name":"Centro ciudad"}, {"id":"NC66","name":"Cultural Quarter"}, {"id":"NC67","name":"Riverside"}, {"id":"NC68","name":"Clarendon Park"},{"id":"NE06","name":"Belgrave South"},{"id":"NE10","name":"Belgrave North"}]'

### Importar el módulo

En realidad no necesitamos instalar ningún módulo externo. Es una de esas
bibliotecas integradas en las que no es necesario escribir nada.

__pip install json__

Así que todo lo que tienes que hacer es decir:

__import json__


Nota: Recuerda que import json es un módulo de Python, así que para usarlo necesitas importarlo primero.

In [8]:
import json as js

### Análisis de una cadena JSON (lectura y escritura)

__Conversión de una cadena JSON a Python__

Análisis de una cadena JSON mediante loads() . La función loads() toma una
cadena JSON como entrada y devuelve un diccionario o una lista.

Recuerde, si hay una sola entrada en el conjunto de datos entonces el 
loads() devolverá un diccionario de lo contrario para múltiples entradas como el conjunto de datos anterior el loads() devolverá una lista.

__Entrada única frente a entradas múltiples__

En concreto, un conjunto de datos que sólo tiene una fila se denomina entrada única, mientras que un conjunto de datos con más de dos filas se denomina entradas múltiples. El ejemplo siguiente lo aclara mejor.

### Tabla 1

| Registro | Nombre | Edad | Ciudad    |
|----------|--------|------|-----------|
| 0        | John   | 30   | New York  |

Entrada única - Una Fila


### Tabla 2

| Registro | Nombre | Edad | Ciudad        |
|----------|--------|------|---------------|
| 0        | John   | 30   | New York      |
| 1        | Depp   | 35   | New Brunswick |

Múltiples entradas - Dos Filas



### Sintaxis

La sintaxis de loads() es bastante trivial. Pasamos un único parámetro la mayoría de
las veces, que son los propios datos json.

In [9]:
import json
variable = json.loads(json_data)

### Ejemplo

Utilicemos los datos_json almacenados anteriormente como nuestro conjunto de
datos base y pasémoslos a loads() .

\# Importar módulo json

In [10]:
import json

\# Pasar los datos json al método loads

In [11]:
barrio = json.loads(json_data)

\# Impresión del resultado - lista

In [12]:
print(barrio)
print("")

[{'id': 'NC04', 'name': 'Centro ciudad'}, {'id': 'NC66', 'name': 'Cultural Quarter'}, {'id': 'NC67', 'name': 'Riverside'}, {'id': 'NC68', 'name': 'Clarendon Park'}, {'id': 'NE06', 'name': 'Belgrave South'}, {'id': 'NE10', 'name': 'Belgrave North'}]




\# Comprobación del tipo de la variable

In [13]:
print(type(barrio))
print("")

<class 'list'>



\# Acceso al primer elemento de la lista - Utilización del índice

In [14]:
print(barrio[0])

{'id': 'NC04', 'name': 'Centro ciudad'}


Como he mencionado antes, la función loads() puede devolver una lista o un
diccionario dependiendo de los datos en formato JSON. En este caso, se trata de
una lista, por lo que la salida anterior sería:

~~~
{'id': 'NC04', 'name': 'City Centre'}, 
{'id': 'NC66', 'name': 'Cultural Quarter'}, 
{'id': 'NC67', 'name': 'Riverside'}, 
{'id':"NC68", "name": "Clarendon Park"}, 
{"id": "NE06", "name":"Belgrave South'}, 
{'id': 'NE10', 'name': 'Belgrave North'}

<class 'list'>

{'id': 'NC04', 'name': 'Centro ciudad'}
~~~

### Conversión de datos Python a una cadena JSON

Análisis de un objeto Python usando dumps() . La función dumps() toma un objeto Python como entrada y devuelve una cadena JSON.

### Sintaxis

La sintaxis de dumps() es bastante trivial. Pasamos un único parámetro la mayoría de
las veces, que es el propio objeto Python (lista).

In [15]:
variable = json.dumps(barrio)

### Ejemplo

Utilicemos el vecindario almacenado arriba como nuestro conjunto de datos base, que
es una lista de Python y luego pasarlo a dumps().

\# Importar módulo json

In [16]:
import json

\# Pasar los datos python al método dumps


In [17]:
lista_vecinos = json.dumps(barrio)

\# Comprobación del tipo de la variable

In [18]:
print(type(lista_vecinos))
print("")

<class 'str'>



\# Imprimir el resultado - cadena

In [19]:
print(lista_vecinos)

[{"id": "NC04", "name": "Centro ciudad"}, {"id": "NC66", "name": "Cultural Quarter"}, {"id": "NC67", "name": "Riverside"}, {"id": "NC68", "name": "Clarendon Park"}, {"id": "NE06", "name": "Belgrave South"}, {"id": "NE10", "name": "Belgrave North"}]


Ahora el dumps() toma el objeto python como entrada y luego devuelve una cadena
JSON como como se muestra a continuación:

<clase 'str'>
##### -----------------------------------------------------------------

In [20]:
[{"id": "NC04", "name": "Centro de la ciudad"}, 
 {"id": "NC66", "name": "Barrio Cultural"}, 
 {"id": "NC67", "name": "Riverside"}, 
 {"id":"NC68", "name": "Clarendon Park"}, 
 {"id": "NE06", "name": "Belgrave Sur"}, 
 {"id": "NE10", "name": "Belgrave North"}]

[{'id': 'NC04', 'name': 'Centro de la ciudad'},
 {'id': 'NC66', 'name': 'Barrio Cultural'},
 {'id': 'NC67', 'name': 'Riverside'},
 {'id': 'NC68', 'name': 'Clarendon Park'},
 {'id': 'NE06', 'name': 'Belgrave Sur'},
 {'id': 'NE10', 'name': 'Belgrave North'}]

### Conversión de diferentes objetos Python en cadenas JSON

Ahora, para esta conversión, vamos a utilizar los objetos Python más utilizados en
el día a día como son:

- Diccionario
- Lista 
- Cadena
- Entero

Nota: Recuerda que para la conversión de los objetos Python en una cadena JSON
necesitas utilizar dumps().

En primer lugar, vamos a crear cuatro tipos diferentes de variables que pueden
contener los datos anteriores python

In [21]:
dictt = {"nombre": "John Depp", "edad": 48}
listt = ["John", "Depp", 48]
strr = "John Depp"
intt = 48

Ahora alimentemos estos valores a dumps() y veamos la conversión a una cadena
JSON.

\# Objeto Python 1 - Diccionario

In [22]:
import json
print(json.dumps(dictt))

{"nombre": "John Depp", "edad": 48}


\# Comprobación del tipo

In [23]:
print(type(json.dumps(dictt)))
print("-----------------------------------------------------------")

<class 'str'>
-----------------------------------------------------------


\# Objeto Python 2 - Lista

In [24]:
print(json.dumps(listt))

["John", "Depp", 48]


\# Comprobación del tipo

In [25]:
print(type(json.dumps(listt)))
print("-----------------------------------------------------------")

<class 'str'>
-----------------------------------------------------------


\# Objeto Python 3 - Cadena

In [26]:
print(json.dumps(strr))

"John Depp"


\# Comprobación del tipo

In [27]:
print(type(json.dumps(strr)))
print("-----------------------------------------------------------")

<class 'str'>
-----------------------------------------------------------


\#Objeto Python 4 - Entero

In [28]:
print(json.dumps(intt))

48


\# Comprobación del tipo

In [29]:
print(type(json.dumps(intt)))
print("-----------------------------------------------------------")

<class 'str'>
-----------------------------------------------------------


Ahora no importa qué, el __type__ siempre va a ser un __str__.

In [30]:
{"nombre": "John Depp", "edad": 48}
#<clase 'str'>
#----------------------------------------------------------------------------------
["John", "Depp", 48]
#<clase 'str'>
#----------------------------------------------------------------------------------
"John Depp"
#<clase 'str'>
#----------------------------------------------------------------------------------
48
#<clase 'str'>
#----------------------------------------------------------------------------------

48

Del mismo modo, intenta hacer lo mismo con objetos __float__ , __tuple__ , y __true__ , o <strong>false</strong> y hazme saber los resultados en la sección de comentarios más abajo.

In [31]:
dictt = {"x": 37.5, "y": 52.9}
listt = ["x", 37.5, "y", 52.9]
tuplet = ("x", 37.5, "y", 52.9)

In [32]:
import json
print(json.dumps(dictt))

{"x": 37.5, "y": 52.9}


In [33]:
print(type(json.dumps(dictt)))
print("-----------------------------------------------------------")

<class 'str'>
-----------------------------------------------------------


In [34]:
print(json.dumps(listt))

["x", 37.5, "y", 52.9]


In [35]:
print(type(json.dumps(listt)))
print("-----------------------------------------------------------")

<class 'str'>
-----------------------------------------------------------


In [36]:
print(json.dumps(tuplet))

["x", 37.5, "y", 52.9]


In [37]:
print(type(json.dumps(listt)))
print("-----------------------------------------------------------")

<class 'str'>
-----------------------------------------------------------


In [38]:
dictt2 = {"esta_casado": False, "tiene_hijos": True}
listt2 = ["esta_casado", False, "tiene_hijos", True]
tuplet2 = ("esta_casado", False, "tiene_hijos", True)

In [39]:
print(json.dumps(dictt2))

{"esta_casado": false, "tiene_hijos": true}


In [40]:
print(type(json.dumps(dictt2)))
print("-----------------------------------------------------------")

<class 'str'>
-----------------------------------------------------------


In [41]:
print(json.dumps(listt2))

["esta_casado", false, "tiene_hijos", true]


In [42]:
print(type(json.dumps(listt2)))
print("-----------------------------------------------------------")

<class 'str'>
-----------------------------------------------------------


In [43]:
print(json.dumps(tuplet2))

["esta_casado", false, "tiene_hijos", true]


In [44]:
print(type(json.dumps(listt2)))
print("-----------------------------------------------------------")

<class 'str'>
-----------------------------------------------------------


#### Ejemplo de bonificación

En este ejemplo extra, conocerás la conversión de datos JSON en un marco de
datos. Para ello entender el escenario de abajo:

__Escenario__

Ahora piensa que estás realizando un proyecto de ciencia de datos para quien sea.
Los detalles del proyecto no son tan importantes en este caso. Así que el primer
paso es recopilar los datos, ahora la mayoría de las veces en Kaggle, data.gov o
etc, los datos ya en un formato CSV, pero en este caso, su jefe o profesor le da los
datos que se encuentra en un formato JSON (me pasó a mí). Ahora, ¿cómo hacer
frente a esta situación?

__Solución__

La solución es bastante sencilla, no es ciencia de cohetes, más bien hay que utilizar
__loads()__ y los métodos __pandas.DataFrame()__. Para este ejemplo, utilizaré el conjunto de datos Neighbourhoods in UK (Leicestershire).

\# Importar tanto JSON como la biblioteca Pandas

In [None]:
import json
import pandas as pd

\# Utiliza el método `loads()` para cargar los datos JSON

In [46]:
df = json.loads(json_data)

\# Pasar los datos JSON generados a un dataframe pandas

In [47]:
df = pd.DataFrame(df)
print(df)
print("-----------------------------------------------------------")

     id              name
0  NC04     Centro ciudad
1  NC66  Cultural Quarter
2  NC67         Riverside
3  NC68    Clarendon Park
4  NE06    Belgrave South
5  NE10    Belgrave North
-----------------------------------------------------------


\# Comprobación del tipo de datos

In [48]:
print(type(df))

<class 'pandas.core.frame.DataFrame'>


Después de ejecutar el código anterior, el resultado será un marco de datos de
aspecto ordenado


|# |  id    |     name          |
|--|--------|-------------------|
|0 | NC04   | Centro ciudad     |
|1 | NC66   | Cultural Quarter  |
|2 | NC67   | Riverside         |
|3 | NC68   | Clarendon Park    |
|4 | NE06   | Belgrave South    |
|5 | NE10   | Belgrave North    |

Datos JSON en pandas dataframe

El tipo de datos ahora será como se muestra a continuación:

<clase '__pandas__.core.frame.DataFrame'>

Así es como puedes convertir unos datos JSON de aspecto poco atractivo en un
DataFrame de aspecto atractivo. Para obtener más información sobre el
conjunto de datos utilice __df.info()__ , así es como obtuve "Detalles del conjunto de
datos".

#### Conclusión

Enhorabuena chicos habéis completado con éxito la lectura/implementación de
este bonito artículo "¿Cómo manejar JSON en Python?". Este tutorial cubre todos los
conceptos junto con ejemplos específicos para entender el manejo de datos JSON
en Python. Si tienen algún comentario o sugerencia, por favor usen la sección de
comentarios sabiamente. Espero que hayan aprendido algo nuevo hoy. Estén
atentos a más actualizaciones. Hasta entonces, hasta la próxima. ¡Que tengan un
buen día y cuídense!