# Análisis de Logs en JSON  
### Uso de listas, diccionarios y sets en Python
En este ejercicio trabajaremos con un archivo JSON que contiene registros (logs) reales de un sistema web.  
El objetivo es practicar estructuras de datos en Python usando **listas**, **diccionarios**, **sets**, **comprehensions**, etc.


## Dataset: logs.json

El archivo contiene una lista de registros con información sobre usuarios, acciones, IPs y estados de respuesta.

Cada registro es un diccionario:

```json
{
    "user": "ana",
    "action": "login",
    "ip": "192.168.1.10",
    "status": 200,
    "timestamp": "2025-01-14T10:23:11"
}


In [3]:
import json

with open('logs.json', 'r') as file:
    logs = json.load(file)

for key, value in logs[0].items():
    print(f"{key} key type: {type(key)} - value: {value} value type: {type(value)}")

user key type: <class 'str'> - value: carlos value type: <class 'str'>
action key type: <class 'str'> - value: failed_login value type: <class 'str'>
ip key type: <class 'str'> - value: 192.168.100.53 value type: <class 'str'>
status key type: <class 'str'> - value: 200 value type: <class 'int'>
timestamp key type: <class 'str'> - value: 2025-01-14T08:00:16 value type: <class 'str'>
resource key type: <class 'str'> - value: /login value type: <class 'str'>


# Ejercicios

Debes resolver los siguientes ejercicios.  
Puedes usar **listas**, **sets** o **diccionarios**

### **Ejercicio 1 — Contar acciones realizadas en los logs**
Crea una función que cuente cuántas veces aparece cada acción dentro de la lista de logs.

- **Function name:** `count_actions`
- **Entrada:** lista de diccionarios (`list[dict]`)
- **Salida:** diccionario con acción → número de ocurrencias (`dict[str, int]`)

In [27]:
from collections import defaultdict

def count_actions(logs: list[dict]) -> dict[str, int]:
    """
    Counts the number of each unique action appearing on the logs. 

        Args:
            logs (list[dict]): list of logs with actions from different users
        
        Returns:
            actions_counter (dict[str, int]): a dictionary whose key is the id of the action and the value is the number of times appearing on the logs

        Raises:
            TypeError: if input is not a list of dicts
            KeyError: if any log doesn't have the key `action`
    """

    if not isinstance(logs, list):
        raise TypeError("The input needs to be a list of dicts")

    actions_counter = defaultdict(lambda: 0)

    for i, log in enumerate(logs):
        if not isinstance(log, dict):
            raise TypeError("The input needs to be a list of dicts")
        if "action" not in log:
            raise KeyError(f"Log in index {i} is missing required key 'action'")
        actions_counter[log["action"]] +=1

    return dict(actions_counter)

long_dict = [{"action": "read"} for _ in range(10000000)]

count_actions(long_dict)

{'read': 10000000}

In [28]:
# Implementacion pythonic

from collections import Counter

def count_actions_fast(logs):
    return Counter(log["action"] for log in logs)

count_actions_fast(long_dict)

Counter({'read': 10000000})

### **Ejercicio 2 — Obtener lista de usuarios únicos**
Crea una función que devuelva un conjunto con todos los usuarios distintos presentes en los logs.

- **Function name:** `get_unique_users`
- **Entrada:** lista de diccionarios (`list[dict]`)
- **Salida:** conjunto de strings (`set[str]`)

In [30]:
def get_unique_users(logs: list[dict]) -> set[str]:
    return {log.get("user") for log in logs} 

get_unique_users([{"user":"AM"}, {}])

{'AM', None}

### **Ejercicio 3 — Detectar qué usuarios han tenido errores (`status == 4XX`).**
Crea una función que devuelva 

- **Function name:** `filter_by_status`
- **Entrada:**  
  - lista de diccionarios (`list[dict]`)  
- **Salida:** conjunto de strings (`set[str]`)

In [41]:
def filter_by_status(logs):
    return {
        log["user"]
        for log in logs
        if isinstance(log.get("status"), int) and 400 <= log.get("status") < 500
    }

filter_by_status([{"user":"ana", "status": 399}, {"user":"AM", "status":400}, {"user":"AM"}])

{'AM'}

### **Ejercicio 4 — Obtener IPs únicas de los logs**
Crea una función que extraiga todas las direcciones IP de los logs, sin repetir ninguna.

- **Function name:** `get_unique_ips`
- **Entrada:** lista de diccionarios (`list[dict]`)
- **Salida:** conjunto de strings (`set[str]`)

In [44]:
def get_unique_ips(logs):
    return {log.get("ip") for log in logs}

get_unique_ips(logs)

{'192.168.100.34',
 '172.16.0.202',
 '192.168.1.142',
 '192.168.1.159',
 '172.16.0.100',
 '192.168.1.236',
 '192.168.1.16',
 '192.168.100.46',
 '172.16.0.78',
 '192.168.1.12',
 '192.168.100.74',
 '172.16.0.52',
 '10.0.0.91',
 '192.168.1.89',
 '172.16.0.227',
 '192.168.100.37',
 '192.168.1.140',
 '192.168.100.188',
 '172.16.0.246',
 '192.168.1.107',
 '10.0.0.128',
 '192.168.1.137',
 '172.16.0.124',
 '192.168.100.43',
 '172.16.0.230',
 '192.168.100.170',
 '10.0.0.232',
 '172.16.0.147',
 '172.16.0.72',
 '192.168.1.139',
 '192.168.1.42',
 '192.168.100.41',
 '172.16.0.22',
 '172.16.0.209',
 '192.168.1.110',
 '172.16.0.244',
 '192.168.1.221',
 '192.168.1.177',
 '172.16.0.210',
 '192.168.100.42',
 '172.16.0.60',
 '10.0.0.3',
 '192.168.1.99',
 '10.0.0.58',
 '192.168.1.176',
 '172.16.0.53',
 '192.168.1.13',
 '192.168.100.6',
 '192.168.1.161',
 '10.0.0.81',
 '192.168.1.154',
 '192.168.100.141',
 '10.0.0.32',
 '192.168.100.252',
 '10.0.0.189',
 '192.168.1.233',
 '10.0.0.251',
 '172.16.0.90',
 '10

### **Ejercicio 5 — Encontrar el usuario con más acciones registradas**
Crea una función que determine qué usuario aparece más veces en los logs.

- **Function name:** `most_frequent_user`
- **Entrada:** lista de diccionarios (`list[dict]`)
- **Salida:** string con nombre del usuario (`str`)

In [60]:
def most_frequent_user(logs):
    counts = Counter(log["user"] for log in logs)
    return max(counts, key=counts.get)

most_frequent_user(logs)

'diego'

### Ejercicio Final — `run_selected_exercise`

**Descripción:**  
Crea una función llamada **`run_selected_exercise`** que reciba dos entradas:

1. **`json_path`** (str):  
   Un *path absoluto* hacia un archivo JSON local.  
   Este JSON contiene una **lista de diccionarios** que simulan logs del sistema.

2. **`exercise_number`** (int):  
   Puede ser **1, 2, 3, 4 o 5**.  
   Este número indica qué ejercicio anterior debe ejecutarse.

La función debe:

- Leer el archivo JSON desde `json_path`.
- Cargar la lista de diccionarios de logs.
- En función del número recibido:
  - Llamar internamente a la función correspondiente al ejercicio **1**, **2**, **3**, **4** o **5**.
- Recibir el resultado del ejercicio elegido.
- **Imprimir** ese resultado por pantalla usando `print`.

**Entradas:**
- `json_path` (str) — ruta absoluta a un archivo JSON.
- `exercise_number` (int) — número de ejercicio a ejecutar (1, 2, 3, 4 o 5).

**Salida:**
- Ninguna salida de retorno.  
- La función **imprime** por pantalla el resultado del ejercicio seleccionado.

**Nombre de la función:**  
`run_selected_exercise`


In [69]:
def run_selected_exercise(json_path: str, exercise_number: int) -> None:

    with open(json_path) as f:
        json_data = json.load(f)
    
    match exercise_number:
        case 1:
            f = count_actions
        case 2:
            f = get_unique_users
        case 3:
            f = filter_by_status
        case 4:
            f = get_unique_ips
        case 5:
            f = most_frequent_user

    return f(json_data)

run_selected_exercise("logs.json",1)

{'failed_login': 475,
 'api_request': 519,
 'view_page': 531,
 'delete_item': 514,
 'update_profile': 477,
 'upload_file': 520,
 'change_password': 486,
 'login': 471,
 'logout': 534,
 'download_file': 473}