## Actividad 2: Datos JSON en Python desde una API

 Exploraremos cómo trabajar con un conjunto amplio de datos JSON. Nos enfocaremos en técnicas para manipular estos datos y extraer información valiosa de ellos.

Para comenzar, utilizaremos una fuente de datos JSON en línea, JSONPlaceholder. Esta es una API pública que nos proporciona una gran cantidad de datos JSON, ideal para practicar y desarrollar prototipos. Empezaremos nuestra actividad importando el módulo esencial json en Python, y además, necesitaremos el módulo requests para realizar solicitudes a la API y obtener los datos:

In [12]:
import json
import requests


Con los módulos `json` y `requests` en Python, podemos acceder fácilmente a datos JSON de fuentes en línea. Utilizaremos la API de JSONPlaceholder para demostrar cómo realizar una solicitud web y recibir datos. Para esto, definiremos una variable llamada `respuesta` que almacenará la información obtenida del servidor web tras realizar nuestra solicitud.

In [13]:
# Realizar una solicitud HTTP a una fuente de datos JSON
url = "http://jsonplaceholder.typicode.com/todos" 
respuesta_api = requests.get(url)

# Convertir la respuesta en formato JSON a una estructura de datos de Python
lista_tareas = json.loads(respuesta_api.text)


 utilizamos `requests.get` para obtener datos de la API JSONPlaceholder. Luego, usamos json.loads para convertir la respuesta, que es una cadena JSON, en una lista de diccionarios de Python que podemos manipular y analizar más fácilmente.

Para que veas cómo funciona esto en la práctica, veamos los primeros dos elementos de nuestra lista procesada

In [14]:
# Mostrando los primeros dos elementos de la lista de tareas
print("Primeros dos elementos de la lista de tareas:", lista_tareas[:2])


Primeros dos elementos de la lista de tareas: [{'userId': 1, 'id': 1, 'title': 'delectus aut autem', 'completed': False}, {'userId': 1, 'id': 2, 'title': 'quis ut nam facilis et officia qui', 'completed': False}]


Cada objeto de tarea en nuestra lista de datos JSON tiene varios atributos clave. Estos incluyen un `'userId'` que identifica al usuario responsable de la tarea, un `'id'` único para cada tarea, un `'title`' que proporciona una descripción breve de la tarea, y un campo `'completed`' que indica si la tarea ha sido finalizada o no.

Nuestro objetivo es identificar qué usuarios han finalizado más tareas TODO. Para esto, crearemos un diccionario llamado` tareas_por_usuario`. Este diccionario vinculará cada `'userId`' con el total de tareas TODO que ha completado dicho usuario.

Vamos a crear un diccionario para llevar un seguimiento del número de tareas completadas por cada usuario y luego ordenaremos a los usuarios en función de este número.

In [15]:
# Inicializando el diccionario para contabilizar las tareas completadas por usuario
tareas_completadas_por_usuario = {}


Ahora procederemos a calcular el número de tareas completadas por cada usuario. Para esto, utilizaremos un bucle for que recorrerá la lista de tareas.

In [16]:
# Recorrer la lista de tareas
for tarea in lista_tareas:
    if tarea["completed"]:
        usuario_id = tarea["userId"]
        try:
            # Intentar incrementar el contador para el usuario existente
            tareas_completadas_por_usuario[usuario_id] += 1
        except KeyError:
            # Si el usuario no está en el diccionario, agregarlo con un contador de 1
            tareas_completadas_por_usuario[usuario_id] = 1


Este código recorre la lista de tareas y, para cada tarea completada, intenta incrementar el contador de tareas asociado al `userId`. Si se encuentra con un `KeyError` (lo que indica que el `userId` no existe en el diccionario), añade una nueva entrada para ese usuario con un contador inicial de 1.

A continuación, necesitamos averiguar cuál es el mayor número de tareas completadas y qué usuarios han alcanzado esa cifra. Para esto, vamos a generar una lista de tuplas, donde cada tupla representará a un usuario y el número total de tareas que ha completado.

In [17]:
# Ordenar los usuarios por número de tareas completadas
usuarios_ordenados = sorted(tareas_completadas_por_usuario.items(), key=lambda x: x[1], reverse=True)


Aquí, `tareas_completadas_por_usuario.items()` convierte el diccionario en una lista de tuplas. Cada tupla contiene `(userId, número_de_tareas_completadas`). La función `sorted()` ordena estas tuplas basándose en el número de tareas completadas (`x[1]` en la función lambda), y el parámetro `reverse=True` asegura que la lista esté ordenada en orden descendente (es decir, desde el número más alto al más bajo).

Dado que la lista está ordenada en orden descendente, el primer elemento (`usuarios_ordenados[0]`) será la tupla que contiene el mayor número de tareas completadas. Esta tupla tiene dos elementos: userId y el número de tareas completadas.

In [21]:

# Determinar el máximo número de tareas completadas
max_completadas = usuarios_ordenados[0][1]



Al acceder al segundo elemento de esta tupla con [1] (es decir, `usuarios_ordenados[0][1]`), obtenemos el número máximo de tareas completadas. Esto se debe a que es el primer valor en la lista ordenada de manera descendente, lo que significa que es el número más alto de tareas completadas por cualquier usuario.


Para identificar a los usuarios que han completado la cantidad máxima de tareas, primero crearemos una lista llamada `usuarios_max = []`. Esta lista almacenará los IDs de los usuarios que descubramos que han completado el mayor número de tareas.

In [19]:
# Lista para almacenar los usuarios que han completado el máximo número de tareas
usuarios_max = []



Finalmente creamos un bucle para dentificar y mostrar los usuarios que han completado la mayor cantidad de tareas TODO y los imprimimimos:




In [22]:
# Recorrer la lista de usuarios ordenados
for usuario, num_completadas in usuarios_ordenados:
    if num_completadas < max_completadas:
        break
    usuarios_max.append(str(usuario))

# Crear una cadena con los usuarios que más tareas completaron
usuarios_max_str = " y ".join(usuarios_max)

print(f"Usuario(s) {usuarios_max_str} completaron {max_completadas} tareas")


Usuario(s) 5 y 10 y 5 y 10 completaron 12 tareas


¡Felicitaciones por completar esta actividad! Aquí tienes un resumen de lo que has aprendido:

1. **Manejo de Módulos en Python:**
   Has usado los módulos `json` y `requests` para trabajar con datos JSON. El módulo `json` te permite serializar y deserializar datos, mientras que `requests` es esencial para realizar solicitudes HTTP a APIs.

2. **Obtención y Procesamiento de Datos JSON:**
   Aprendiste a hacer solicitudes web para obtener datos JSON de una API y a convertir esos datos en objetos nativos de Python para su análisis y manipulación.

3. **Serialización y Deserialización de Datos:**
   Comprendiste los conceptos de serialización (convertir objetos de Python a JSON) y deserialización (convertir JSON a objetos de Python), esenciales para el intercambio de datos entre aplicaciones y servicios.

4. **Análisis y Filtrado de Datos:**
   Practicaste cómo filtrar y procesar datos, como identificar usuarios que han completado la mayor cantidad de tareas TODO en un conjunto de datos, utilizando estructuras de control y manejo de excepciones en Python.

5. **Creación de Estructuras de Datos y Algoritmos:**
   Desarrollaste habilidades para crear estructuras de datos como diccionarios y listas, y algoritmos para analizar y organizar información en Python.
