# Extrayendo y leyendo informacion desde archivos JSON

Este notebook demuestra cómo extraer y leer información desde archivos JSON utilizando Python y la biblioteca pandas. Se abordan tanto archivos JSON simples como formatos más complejos, con ejemplos prácticos y visualización de datos.


In [None]:
import pandas as pd
import json

## Formato sencillo o predefinido

Se utiliza la función pd.read_json() para leer archivos JSON con un formato predefinido. en este caso columns, existen varios parametros para la orientación dependiendo de la manera en la que se almaceno la información

In [None]:
df_ez = pd.read_json('/content/data1json.json', orient='columns')
df_ez.head()

Unnamed: 0,id,nombre,edad,ciudad
0,1,Juan,28,Bogotá
1,2,Ana,24,Medellín
2,3,Luis,35,Cali


## Cuando el formato es un poco mas complejo como una lista anidada

En archivos JSON más complejos, con listas anidadas, es necesario realizar transformaciones adicionales para normalizar los datos.

In [None]:
with open('/content/example_schools_extended.json') as f:
  #loading the file into a dictionary
  data = json.load(f)

print(data)

{'01M539': {'street_address': '111 Columbia Street', 'city': 'Manhattan', 'scores': {'math': 657, 'reading': 601, 'writing': 601}}, '02M123': {'street_address': '222 Broadway Avenue', 'city': 'Manhattan', 'scores': {'math': 700, 'reading': 650, 'writing': 680}}, '03Q456': {'street_address': '333 Queens Boulevard', 'city': 'Queens', 'scores': {'math': 720, 'reading': 690}}, '04B789': {'street_address': '444 Bronx Road', 'city': 'Bronx', 'scores': {'math': 680, 'writing': 640}}, '05S101': {'street_address': '555 Staten Island Ave', 'city': 'Staten Island', 'scores': {'math': 710, 'reading': 705, 'writing': 700}}, '06M202': {'street_address': '666 Madison Avenue', 'city': 'Manhattan', 'scores': {'reading': 620, 'writing': 615}}, '07Q303': {'street_address': '777 Jamaica Avenue', 'city': 'Queens', 'scores': {'math': 730, 'reading': 720}}, '08B404': {'street_address': '888 Fordham Road', 'city': 'Bronx', 'scores': {'math': 640, 'writing': 630}}, '09S505': {'street_address': '999 Bay Street'

Este código convierte un diccionario JSON en un DataFrame de pandas, extrayendo campos clave como dirección, ciudad y puntajes.Para realizar esto se debe tener muy en cuenta el formato y estructura del archivo de donde se van a extraer los datos.

In [None]:
data_formated = []

for index, columns in data.items():
  data_formated.append([
      index,
      columns.get("street_address"),
      columns.get("city"),
      columns.get("scores", {}).get("math", 0),
      columns.get("scores", {}).get("reading", 0),
      columns.get("scores", {}).get("writing", 0),
  ])

df = pd.DataFrame(data_formated, columns=["school_id", "street_address", "city", "math", "reading", "writing"])
df.head(10)

Unnamed: 0,school_id,street_address,city,math,reading,writing
0,01M539,111 Columbia Street,Manhattan,657,601,601
1,02M123,222 Broadway Avenue,Manhattan,700,650,680
2,03Q456,333 Queens Boulevard,Queens,720,690,0
3,04B789,444 Bronx Road,Bronx,680,0,640
4,05S101,555 Staten Island Ave,Staten Island,710,705,700
5,06M202,666 Madison Avenue,Manhattan,0,620,615
6,07Q303,777 Jamaica Avenue,Queens,730,720,0
7,08B404,888 Fordham Road,Bronx,640,0,630
8,09S505,999 Bay Street,Staten Island,0,680,670
9,10M606,1010 Lexington Avenue,Manhattan,750,740,730


## Conclusión

en este notebook se tratan ejemplos claros y sencillos para trabajar con datos JSON simples y algunos complejos. Es un paso para entender como extraer información de un archivo Json y poder extraer toda esa información y analizarla posteriormente