# Json
Se puede leer un archivo o una cadena en formato json usando el metodo read_json.

In [1]:
import pandas as pd

# Leer el archivo JSON
df = pd.read_json('data/json_data.json')
print(df)

   name  age       city
0  Juan   25     Madrid
1   Ana   30  Barcelona


- **path_or_buf (requerido)**: Especifica el archivo JSON o un objeto similar a un archivo (como una URL o una cadena JSON).

- **orient**: Especifica el formato esperado del JSON. Si no se especifica, pandas intentará inferir el formato. Las opciones son:
    * *'split'*: Diccionario con {'index': [...], 'columns': [...], 'data': [...]}.
    * *'records'*: Lista de diccionarios (cada diccionario es una fila).
    * *'index'*: Diccionario con claves como índices y valores como filas.
    * *'columns'*: Diccionario con claves como columnas y valores como filas.
    * *'values'*: Lista simple de valores sin etiquetas.

- **typ**: Define si el resultado debe ser un DataFrame o una Serie:
    - *'frame'* (por defecto): Devuelve un DataFrame.
    - *'series'*: Devuelve una Serie.

- **lines**: Si es True, interpreta el archivo JSON como un archivo JSON Lines (cada línea es un objeto JSON separado).

- **dtype**: Si es True (por defecto), pandas intentará inferir automáticamente los tipos de datos.

- **compression**: Especifica si el archivo está comprimido (por ejemplo, 'gzip', 'bz2', 'zip', 'xz').

- **chunksize**: Si se especifica, devuelve el objeto en fragmentos de tamaño definido, útil para trabajar con archivos grandes.

## 2. Json Anidados
Para leer json anidados se utiliza el metodo json_normalize.

In [5]:
import pandas as pd

data = [
    {"name": "Juan", 
     "info": {"age": 25, "city": "Madrid"}},
    {"name": "Ana", 
     "info": {"age": 30, "city": "Barcelona"}}
]

df = pd.json_normalize(data)
print(df)

   name  info.age  info.city
0  Juan        25     Madrid
1   Ana        30  Barcelona


In [6]:
import pandas as pd

data = [
    {
        "store": "Madrid",
        "products": [
            {"name": "Camiseta", "price": 20},
            {"name": "Pantalón", "price": 30}
        ]
    },
    {
        "store": "Barcelona",
        "products": [
            {"name": "Sudadera", "price": 25},
            {"name": "Zapatos", "price": 50}
        ]
    }
]

df = pd.json_normalize(data, record_path='products', meta=['store'])
print(df)

       name  price      store
0  Camiseta     20     Madrid
1  Pantalón     30     Madrid
2  Sudadera     25  Barcelona
3   Zapatos     50  Barcelona


In [7]:
df = pd.json_normalize(data, record_path='products', meta=['store'], record_prefix='product_', meta_prefix='meta_')
print(df)

  product_name  product_price meta_store
0     Camiseta             20     Madrid
1     Pantalón             30     Madrid
2     Sudadera             25  Barcelona
3      Zapatos             50  Barcelona
