# JSON
---

JSON (JavaScript Object Notation) es un formato de archivo estándar abierto y un formato de intercambio de datos que utiliza texto legible por humanos para almacenar y transmitir objetos de datos que consisten en pares y matrices de atributo-valor (u otros valores serializables).

JSON Lines es un formato de archivo donde cada línea es un valor JSON válido.

JSONLoader utiliza un esquema jq específico para analizar los archivos JSON. Utiliza el paquete jq python. Consulte este manual para obtener documentación detallada de la sintaxis de jq.

In [2]:
import json
from langchain.document_loaders import JSONLoader
from pathlib import Path
from pprint import pprint

In [3]:
file_path = "../../example_data/fake-chat.json"
data = json.loads(Path(file_path).read_text())

In [4]:
pprint(data)

{'image': {'creation_timestamp': 1675549016, 'uri': 'image_of_the_chat.jpg'},
 'is_still_participant': True,
 'joinable_mode': {'link': '', 'mode': 1},
 'magic_words': [],
 'messages': [{'content': 'Bye!',
               'sender_name': 'User 2',
               'timestamp_ms': 1675597571851},
              {'content': 'Oh no worries! Bye',
               'sender_name': 'User 1',
               'timestamp_ms': 1675597435669},
              {'content': 'No Im sorry it was my mistake, the blue one is not '
                          'for sale',
               'sender_name': 'User 2',
               'timestamp_ms': 1675596277579},
              {'content': 'I thought you were selling the blue one!',
               'sender_name': 'User 1',
               'timestamp_ms': 1675595140251},
              {'content': 'Im not interested in this bag. Im interested in the '
                          'blue one!',
               'sender_name': 'User 1',
               'timestamp_ms': 1675595109305},
   

# Using JSONLoader
---

Supongamos que estamos interesados ​​en extraer los valores del campo de contenido dentro de la clave de mensajes de los datos `JSON`. Esto se puede hacer fácilmente a través de `JSONLoader` como se muestra a continuación.

### JSON file

In [7]:
# #!pip install jq

In [12]:
loader = JSONLoader(
    file_path="../../example_data/fake-chat.json",
    jq_schema=".messages[].content",
)

data = loader.load()

pprint(data)

[Document(page_content='Bye!', metadata={'source': '/Users/rigobertosanchez/Learning/LangChain/example_data/fake-chat.json', 'seq_num': 1}),
 Document(page_content='Oh no worries! Bye', metadata={'source': '/Users/rigobertosanchez/Learning/LangChain/example_data/fake-chat.json', 'seq_num': 2}),
 Document(page_content='No Im sorry it was my mistake, the blue one is not for sale', metadata={'source': '/Users/rigobertosanchez/Learning/LangChain/example_data/fake-chat.json', 'seq_num': 3}),
 Document(page_content='I thought you were selling the blue one!', metadata={'source': '/Users/rigobertosanchez/Learning/LangChain/example_data/fake-chat.json', 'seq_num': 4}),
 Document(page_content='Im not interested in this bag. Im interested in the blue one!', metadata={'source': '/Users/rigobertosanchez/Learning/LangChain/example_data/fake-chat.json', 'seq_num': 5}),
 Document(page_content='Here is $129', metadata={'source': '/Users/rigobertosanchez/Learning/LangChain/example_data/fake-chat.json', 