¡Claro! Vamos a explicarlo de la forma más sencilla posible.

## 1\. ¿Qué es **JSON**?
- **JSON** (JavaScript Object Notation) es un formato de texto muy popular para **almacenar y transmitir** datos (por ejemplo, entre un servidor y un cliente).  
- Es un texto con una estructura parecida a los diccionarios de Python, pero en realidad es un **string**.

## 2\. ¿Qué significa “**serializar**” y “**deserializar**”?
- **Serializar** (o _serialize_): convertir tu objeto de Python (diccionarios, listas, tuplas, etc.) en un **string JSON**.  
  - En otras palabras, transformar algo como `{"nombre": "Juan", "edad": 30}` (un diccionario Python) en un texto como `"{"nombre": "Juan", "edad": 30}"` (un string JSON).
- **Deserializar** (o _deserialize_): lo contrario, convertir un **string JSON** en un objeto de Python.  
  - Ejemplo: convertir el texto `"{"nombre": "Juan", "edad": 30}"` (JSON) en un diccionario Python real `{"nombre": "Juan", "edad": 30}`.

## 3\. Diferencia entre `dump()` / `dumps()` y `load()` / `loads()`

### `dump()` y `dumps()`
Ambas sirven para **serializar** (convertir a JSON).  
- **`dump(data, archivo)`**  
  - Toma tus datos en Python (por ejemplo, un diccionario) y los **escribe** en un **archivo** (u objeto que funcione como archivo).  
  - No devuelve nada (generalmente no devuelven un valor útil).  
  - Ejemplo:
    ```python
    with open("data_file.json", "w") as write_file:
        json.dump(data, write_file, indent=4)
    ```
    Aquí, `data` se convierte en texto JSON y se guarda dentro de `data_file.json`.

- **`dumps(data)`**  
  - Toma tus datos en Python y los **convierte** en un **string** con formato JSON.  
  - **No** escribe directamente a un archivo, sino que te da el string para que lo uses donde quieras (puedes imprimirlo, enviarlo por red, guardarlo en una base de datos, etc.).  
  - Ejemplo:
    ```python
    json_str = json.dumps(data, indent=4)
    ```
    `json_str` será algo así como `"{"user": {"name": "William Williams", "age": 93}}"` (pero con saltos de línea y espacios si le pusiste `indent=4`).

### `load()` y `loads()`
Ambas sirven para **deserializar** (convertir de JSON a Python).
- **`load(archivo)`**  
  - Lee un **archivo** que contiene datos en formato JSON y los convierte en un objeto Python.  
  - Ejemplo:
    ```python
    with open("data_file.json", "r") as read_file:
        data = json.load(read_file)
    ```
    Aquí, `data` volvería a ser el diccionario original.  

- **`loads(cadena_json)`**  
  - Toma un **string** que contiene texto JSON y lo convierte en un objeto de Python.  
  - Ejemplo:
    ```python
    decoded_data = json.loads('{"nombre": "Juan", "edad": 30}')
    ```
    Aquí, `decoded_data` sería el diccionario `{"nombre": "Juan", "edad": 30}`.

## 4\. Aplicándolo a tu ejemplo
```python
data = {
    "user": {
        "name": "William Williams", 
        "age": 93
    }
}

with open("data_file.json", "w") as write_file:
    json.dump(data, write_file, indent=4 )
```
- Con `json.dump(...)` escribimos el diccionario `data` directamente en el archivo `"data_file.json"` como texto JSON.

```python
json_str = json.dumps(data, indent=4)
```
- Aquí convertimos `data` a un **string** JSON (`json_str`).  
  - Se guarda en la variable `json_str`. Ese string lo podríamos imprimir o mandar por la red, etc.

```python
blackjack_hand = (8, "Q")
encoded_hand = json.dumps(blackjack_hand)
decoded_hand = json.loads(encoded_hand)
```
1. `json.dumps(blackjack_hand)` -> *serializa* la tupla `(8, "Q")` a un string JSON, por ejemplo: `"[8, "Q"]"`.  
2. `json.loads(encoded_hand)` -> *deserializa* ese string `"[8, "Q"]"` de nuevo a un objeto de Python, que normalmente será `[8, "Q"]` como lista (ojo, las tuplas se suelen convertir a listas cuando se hace JSON, porque JSON no tiene tipo “tupla”).

```python
response = requests.get("https://jsonplaceholder.typicode.com/todos")
todos = json.loads(response.text)
```
1. `response.text` es un string con el JSON que te devolvió el servidor.  
2. `json.loads(response.text)` convierte ese string JSON en un objeto Python (según lo que contenga, suele ser una lista o diccionario).

## 5\. Resumen rápido:

- **`dump()`**: Convierte objetos Python a JSON y **lo escribe en un archivo**.  
- **`dumps()`**: Convierte objetos Python a JSON y te lo devuelve como un **string**.  
- **`load()`**: Lee **desde un archivo** con datos JSON y lo convierte a un objeto Python.  
- **`loads()`**: Toma un **string** con texto JSON y lo convierte a un objeto Python.

**Serializar** = convertir de Python a JSON (para guardarlo o enviarlo).  
**Deserializar** = convertir de JSON a Python (para usarlo en tu programa).

¡Y eso es todo! Con estos conceptos, ya sabes por qué se usa `dump()` en algunos contextos (cuando escribes/lees archivos) y `dumps()` en otros (cuando quieres manejar el string directamente). Y lo mismo con `load()` y `loads()`.

# Serializing JSON Data 

In [1]:
import json
import pandas as pd

In [2]:
#dump() --> use to write date to file-like objetct. serilize to json file
#dumps() -> seilize intro a string, when we want to use it somewhere else or use it. 




In [3]:
data = {
    "user": {
        "name": "William Williams", 
        "age": 93
    }
}



In [4]:
with open("data_file.json", "w") as write_file:
    json.dump(data, write_file, indent=4 )

In [5]:
json_str = json.dumps(data, indent=4)
json_str

'{\n    "user": {\n        "name": "William Williams",\n        "age": 93\n    }\n}'

In [6]:
pd.read_json("data_file.json")

Unnamed: 0,user
name,William Williams
age,93


# Deserializing JSON Data

In [7]:
import json

In [8]:
blackjack_hand = (8, "Q")
enconded_hand = json.dumps(blackjack_hand)
enconded_hand

'[8, "Q"]'

In [9]:
decoded_hand = json.loads(enconded_hand)

In [10]:
decoded_hand

[8, 'Q']

In [11]:
type(decoded_hand)

list

In [12]:
decoded_hand

[8, 'Q']

In [13]:
blackjack_hand == tuple(decoded_hand)

True

# Working With JSON Data

### practicando dict.get(key, default) 



El método `get` de los diccionarios en Python (**`dict.get(key, default)`**) funciona de esta manera:

1. Busca la **clave** (`key`) en el diccionario.
2. Si **encuentra** esa clave, **devuelve** el valor asociado a ella.
3. Si **no encuentra** la clave, **devuelve** el valor que pusiste como `default`. (Por defecto, este valor suele ser `None` si no se especifica).


In [14]:
mi_dicc = {"nombre": "Juan", 
           "edad": 30}
mi_dicc

{'nombre': 'Juan', 'edad': 30}

In [15]:
valor_nombre = mi_dicc.get("nombre", "No existe")
valor_nombre

'Juan'

In [16]:
valor_nombre = mi_dicc["nombre"]
valor_nombre

'Juan'

In [17]:
mi_dicc.get("edad")

30

In [18]:
mi_dicc.get("pais")

In [19]:
mi_dicc.get("edad", 0) + 1


31

In [20]:
todos_by_user = {}

for todo in todos:
    #print(todo)
    todos_by_user[todo["userId"]] = todos_by_user.get(todo["userId"],0) +1

NameError: name 'todos' is not defined

In [None]:
todos_by_user

### Ejercicio de clase

In [21]:
import json
import requests

In [22]:
response = requests.get("https://jsonplaceholder.typicode.com/todos")
if response.status_code == 200:
    print("conectado")
else:
    print(response.status_code)

    

SSLError: HTTPSConnectionPool(host='jsonplaceholder.typicode.com', port=443): Max retries exceeded with url: /todos (Caused by SSLError(SSLZeroReturnError(6, 'TLS/SSL connection has been closed (EOF) (_ssl.c:1147)')))

In [None]:
todos = json.loads(response.text) # response.text nos trae el string que deserializamos con loads()

In [None]:
type(todos)

In [None]:
todos[0:2]

In [None]:
"""

todos_by_user = {}

for todo in todos:
    if todo["completed"]:
        todos_by_user[todo["userId"]] = todos_by_user.get(todo["userId"], 0) + 1
"""


In [None]:
# PROBLEM:  We want to figure out which users have completed the most TODO items
# SOLUTION:by creating a new dictionary called todos_by_user, which will map each 'userId' to the number of TODOs that they have completed.
todos_by_user = {}

for todo in todos:
    #print(todo)
   
    if todo["completed"]:
        #print(todo)
        try: 
            todos_by_user[todo["userId"]] += 1  #“Get the user’s count in a dictionary with this code right here.” And we’ll increment it by 1.
        except KeyError:
            todos_by_user[todo["userId"]] = 1 #  But if the user is not already present in our dictionary, we’ll see a KeyError, and so we’ll need to catch that by typing except KeyError: and then we’ll create a new user in the dictionary, setting their completed TODOs count to 1. 
      

In [None]:
todos_by_user
#03:31 Now we have to determine what the highest number of completed items is, 
#as well as who’s completed that many items. This code I’m typing now is going to create a new list 
#of tuples with each tuple containing the person as well as how many items they’ve computed.

In [None]:
top_user = sorted(todos_by_user.items(), key=lambda x:x[1], reverse=True) 

#is going to create a new list of tuples with each tuple containing the person as well as how many items they’ve computed.
# The tuples will be sorted in descending order by the number of items completed.

In [None]:
max_completed = top_user[0][1]
max_completed

In [None]:
users = []

for user, num_completed in top_user:
    if num_completed < max_completed:
        break
    users.append(str(user))

max_users = " and ".join(users)

print(f" users (s) {max_users} completed {max_completed} TODOs")

In [None]:
# should have a JSON file containing only the TODO items completed by users 5 and 10.

In [None]:
#todo is a dict
def keep(todo):
    is_completed = todo["completed"]
    has_max_count = todo["userId"] in users
    return is_completed and has_max_count


with open("filtered_data_file.json", "w") as data_file:
    filtered_todos = list(filter(keep, todos))
    json.dump(filtered_todos, data_file, indent=2)

    
    

### Repaso con GPT

#### Ejempplo de petición

In [None]:
import requests

In [None]:
url = "https://jsonplaceholder.typicode.com/todos"

In [None]:
reponse = requests.get(url) # Hacemos requests.get(url) para obtener la respuesta.

In [None]:
if response.status_code == 200: #evisamos response.status_code para ver si fue 200 (OK).
    print("Contectado! Tenemos datos json")
    print("Estos son los primeros 300 caracteres")
    print(response.text[:300]) # response.text nos devuelve el string con los datos en formato JSON.
else:
    print(f"Error {response.status_code}")

#### Deserializar: de string JSON a objetos Python -> Convierte un string JSON en un objeto Python.

In [None]:
import json
# Supongamos que 'response.text' tiene un string JSON
todos = json.loads(response.text)
print(type(todos))
print(todos[:2])

In [None]:
# Observa:

# todos seguramente sea una lista de diccionarios. Cada diccionario representa un "TODO" con la forma:

print(f"primer elemento de la lista de diccionarios {todos[0]}")
print(f"según elemento de la lista de diccionarios {todos[1]}")


##### Ejercicio 1
Haz una petición a la misma URL de jsonplaceholder.typicode.com/todos.
Deserializa el JSON en un objeto Python.
Imprime:
El tipo de ese objeto (type(todos)).
Los primeros 5 TODOs.
El segundo TODO completo (todos[1]).
El valor del title del primer TODO.

In [None]:
import requests

In [None]:
url = "https://jsonplaceholder.typicode.com/todos"

In [None]:
response = requests.get(url)

In [None]:
if reponse.status_code == 200:
    print("Código obtenido")
    print(f"Estas son las primeras líneas {response.text[:200]}" )
else:
    print(f"Problema {response.status_code}")

In [None]:
with open("save_file", "w") as file:
    json.

In [None]:
# Ahora abría que deserializarlo

In [None]:
import json

In [None]:
todos = json.loads(response.text)

In [None]:
print(type(todos))
print(f"Este es el primer valor {todos[0]}")

#### Manipular y analizar la lista de “TODOs”

El objetivo en el video es descubrir qué usuario(s) completaron más TODOs. Para ello:

Creamos un diccionario todos_by_user que acumule cuántos TODOs (tareas) completó cada usuario.
Contamos solo los TODOs que tienen "completed": True.

In [None]:
todos_by_user = {} # Creamos un diccionario todos_by_user que acumule cuántos TODOs (tareas) completó cada usuario.
# Contamos solo los TODOs que tienen "completed": True.

for todo in todos:
    if todo["completed"]:  # Solo contamos si está "completed" == True
        user_id = todo["userId"]  # Por ejemplo, 1, 2, 3...
        todos_by_user[user_id] =  todos_by_user.get(user_id, 0) + 1
        

print(todos_by_user)
    

In [None]:
### quiero practicar esto en thor, entonces me descargo los todos

In [None]:
with open("data.json", "w") as write_file:
    json.dump(todo, write_file, indent=4)