# Análisis de Logs en JSON  
### Uso de listas, diccionarios y sets en Python
En este ejercicio trabajaremos con un archivo JSON que contiene registros (logs) reales de un sistema web.  
El objetivo es practicar estructuras de datos en Python usando **listas**, **diccionarios**, **sets**, **comprehensions**, etc.


## Dataset: logs.json

El archivo contiene una lista de registros con información sobre usuarios, acciones, IPs y estados de respuesta.

Cada registro es un diccionario:

```json
{
    "user": "ana",
    "action": "login",
    "ip": "192.168.1.10",
    "status": 200,
    "timestamp": "2025-01-14T10:23:11"
}


In [1]:
import json

with open('logs.json', 'r') as file:
    logs = json.load(file)

for key, value in logs[0].items():
    print(f"{key} key type: {type(key)} - value: {value} value type: {type(value)}")

user key type: <class 'str'> - value: carlos value type: <class 'str'>
action key type: <class 'str'> - value: failed_login value type: <class 'str'>
ip key type: <class 'str'> - value: 192.168.100.53 value type: <class 'str'>
status key type: <class 'str'> - value: 200 value type: <class 'int'>
timestamp key type: <class 'str'> - value: 2025-01-14T08:00:16 value type: <class 'str'>
resource key type: <class 'str'> - value: /login value type: <class 'str'>


# Ejercicios

Debes resolver los siguientes ejercicios.  
Puedes usar **listas**, **sets** o **diccionarios**

### **Ejercicio 1 — Contar acciones realizadas en los logs**
Crea una función que cuente cuántas veces aparece cada acción dentro de la lista de logs.

- **Function name:** `count_actions`
- **Entrada:** lista de diccionarios (`list[dict]`)
- **Salida:** diccionario con acción → número de ocurrencias (`dict[str, int]`)

In [3]:
def count_actions(logs ):
    action_counts = {}
    for log in logs:
        action = log.get('action')
        if action:
            if action in action_counts:
                action_counts[action] += 1
            else:
                action_counts[action] = 1
    return action_counts

print(count_actions(logs))

{'failed_login': 475, 'api_request': 519, 'view_page': 531, 'delete_item': 514, 'update_profile': 477, 'upload_file': 520, 'change_password': 486, 'login': 471, 'logout': 534, 'download_file': 473}


### **Ejercicio 2 — Obtener lista de usuarios únicos**
Crea una función que devuelva un conjunto con todos los usuarios distintos presentes en los logs.

- **Function name:** `get_unique_users`
- **Entrada:** lista de diccionarios (`list[dict]`)
- **Salida:** conjunto de strings (`set[str]`)

In [4]:
def get_unique_users(logs):
    users = set()
    for log in logs:
        user = log.get('user')
        users.add(user)
    return users
print(get_unique_users(logs))

{'carlos', 'pablo', 'luis', 'laura', 'ana', 'sofia', 'diego', 'guest', 'maria', 'admin'}


### **Ejercicio 3 — Detectar qué usuarios han tenido errores (`status == 4XX`).**
Crea una función que devuelva 

- **Function name:** `filter_by_status`
- **Entrada:**  
  - lista de diccionarios (`list[dict]`)  
- **Salida:** conjunto de strings (`set[str]`)

In [7]:
def filter_by_status(logs):
    error_users = set()
    for log in logs:
        status = str (log.get('status'))
        if status.startswith('4'):
            user = log.get('user')
            error_users.add(user)
    return error_users
print(filter_by_status(logs))

{'carlos', 'luis', 'pablo', 'laura', 'diego', 'sofia', 'ana', 'guest', 'maria', 'admin'}


### **Ejercicio 4 — Obtener IPs únicas de los logs**
Crea una función que extraiga todas las direcciones IP de los logs, sin repetir ninguna.

- **Function name:** `get_unique_ips`
- **Entrada:** lista de diccionarios (`list[dict]`)
- **Salida:** conjunto de strings (`set[str]`)

In [8]:
def get_unique_ips(logs):
    ips = set()
    for log in logs:
        ip = log.get('ip')
        ips.add(ip)
    return ips
print(get_unique_ips(logs))

{'192.168.100.231', '10.0.0.113', '192.168.100.191', '172.16.0.4', '192.168.1.145', '192.168.100.82', '172.16.0.221', '10.0.0.56', '10.0.0.193', '172.16.0.2', '192.168.100.54', '192.168.1.241', '192.168.1.39', '172.16.0.101', '172.16.0.89', '192.168.1.4', '172.16.0.40', '192.168.1.248', '192.168.100.171', '192.168.100.86', '192.168.1.47', '10.0.0.22', '192.168.1.64', '172.16.0.177', '10.0.0.37', '10.0.0.252', '192.168.100.22', '172.16.0.6', '192.168.1.9', '10.0.0.159', '192.168.1.211', '172.16.0.83', '192.168.1.133', '192.168.1.192', '10.0.0.76', '192.168.1.163', '192.168.1.38', '10.0.0.204', '192.168.1.148', '172.16.0.121', '10.0.0.52', '10.0.0.90', '10.0.0.15', '192.168.1.160', '192.168.1.20', '10.0.0.237', '192.168.100.106', '192.168.1.71', '172.16.0.73', '192.168.1.83', '172.16.0.46', '192.168.100.238', '192.168.1.202', '10.0.0.236', '172.16.0.119', '10.0.0.44', '192.168.100.39', '172.16.0.115', '192.168.1.237', '192.168.1.117', '192.168.1.226', '192.168.100.5', '192.168.100.27', '

### **Ejercicio 5 — Encontrar el usuario con más acciones registradas**
Crea una función que determine qué usuario aparece más veces en los logs.

- **Function name:** `most_frequent_user`
- **Entrada:** lista de diccionarios (`list[dict]`)
- **Salida:** string con nombre del usuario (`str`)

In [9]:
def most_frequent_user(logs):
    user_counts = {}
    for log in logs:
        user = log.get('user')
        if user:
            if user in user_counts:
                user_counts[user] += 1
            else:
                user_counts[user] = 1
    most_frequent = max(user_counts, key=user_counts.get)
    return most_frequent
print(most_frequent_user(logs))

diego


### Ejercicio Final — `run_selected_exercise`

**Descripción:**  
Crea una función llamada **`run_selected_exercise`** que reciba dos entradas:

1. **`json_path`** (str):  
   Un *path absoluto* hacia un archivo JSON local.  
   Este JSON contiene una **lista de diccionarios** que simulan logs del sistema.

2. **`exercise_number`** (int):  
   Puede ser **1, 2, 3, 4 o 5**.  
   Este número indica qué ejercicio anterior debe ejecutarse.

La función debe:

- Leer el archivo JSON desde `json_path`.
- Cargar la lista de diccionarios de logs.
- En función del número recibido:
  - Llamar internamente a la función correspondiente al ejercicio **1**, **2**, **3**, **4** o **5**.
- Recibir el resultado del ejercicio elegido.
- **Imprimir** ese resultado por pantalla usando `print`.

**Entradas:**
- `json_path` (str) — ruta absoluta a un archivo JSON.
- `exercise_number` (int) — número de ejercicio a ejecutar (1, 2, 3, 4 o 5).

**Salida:**
- Ninguna salida de retorno.  
- La función **imprime** por pantalla el resultado del ejercicio seleccionado.

**Nombre de la función:**  
`run_selected_exercise`


In [11]:
def run_selected_exercise(json_path, exercise_number):
    with open(json_path, 'r') as file:
        logs = json.load(file)

    if exercise_number == 1:
        return count_actions(logs)
    elif exercise_number == 2:
        return get_unique_users(logs)
    elif exercise_number == 3:
        return filter_by_status(logs)
    elif exercise_number == 4:
        return get_unique_ips(logs)
    elif exercise_number == 5:
        return most_frequent_user(logs)
    else:
        return "Invalid exercise number."
    
# Example usage:
result = run_selected_exercise('logs.json', 5)
print(result)

diego
