### Inciso 2.1 – Total de transacciones y promedio por cliente

In [6]:
# Primero hay que instalar PyMongo para poder hacer el trabajo: pip install pymongo

from pymongo import MongoClient

# Conexión al clúster
client = MongoClient("mongodb+srv://carlolvgjunior:vniYLQFBa0yBkuSM@lab8.nmnfq4n.mongodb.net/?retryWrites=true&w=majority&appName=lab8")

# Seleccionamos base y colecciones
db = client["sample_analytics"]
customers = db["customers"]

# Pipeline de agregación
pipeline = [
    {
        "$lookup": {
            "from": "accounts",
            "localField": "accounts",
            "foreignField": "account_id",
            "as": "account_data"
        }
    },
    { "$unwind": "$account_data" },
    {
        "$lookup": {
            "from": "transactions",
            "localField": "account_data.account_id",
            "foreignField": "account_id",
            "as": "transactions_info"
        }
    },
    { "$unwind": "$transactions_info" },
    { "$unwind": "$transactions_info.transactions" },
    {
        "$addFields": {
            "full_name": "$name",
            "city": {
                "$let": {
                    "vars": {
                        "parts": { "$split": ["$address", ","] }
                    },
                    "in": {
                        "$cond": [
                            { "$gte": [ { "$size": "$$parts" }, 2 ] },
                            { "$trim": { "input": { "$arrayElemAt": [ "$$parts", 1 ] } } },
                            "N/A"
                        ]
                    }
                }
            }
        }
    },
    {
        "$group": {
            "_id": "$_id",
            "full_name": { "$first": "$full_name" },
            "city": { "$first": "$city" },
            "total_transactions": { "$sum": 1 },
            "avg_amount": { "$avg": "$transactions_info.transactions.amount" }
        }
    },
    { "$sort": { "total_transactions": -1 } }
]


# Ejecutar pipeline
resultados = customers.aggregate(pipeline)

# Mostrar resultados
for doc in resultados:
    nombre = doc["full_name"]
    print(f"Cliente: {nombre}")
    print(f"Ciudad: {doc['city']}")
    print(f"#️Total Transacciones: {doc['total_transactions']}")

    if doc["avg_amount"] is not None:
        print(f"Promedio: {round(doc['avg_amount'], 2)}")
    else:
        print(f"Promedio: N/A")

    print("-" * 40)


Cliente: Ashley Rodriguez
Ciudad: MI 51943
#️Total Transacciones: 471
Promedio: 4926.95
----------------------------------------
Cliente: John Williams
Ciudad: N/A
#️Total Transacciones: 443
Promedio: 4985.15
----------------------------------------
Cliente: Phillip Obrien
Ciudad: Box 5207
APO AE 07226
#️Total Transacciones: 421
Promedio: 4962.69
----------------------------------------
Cliente: Travis White
Ciudad: DC 15272
#️Total Transacciones: 409
Promedio: 4888.57
----------------------------------------
Cliente: Aaron Perez
Ciudad: MS 55765
#️Total Transacciones: 404
Promedio: 5152.12
----------------------------------------
Cliente: Stacey Mccall
Ciudad: MO 06535
#️Total Transacciones: 403
Promedio: 4827.92
----------------------------------------
Cliente: Megan Tanner
Ciudad: OK 38895
#️Total Transacciones: 401
Promedio: 5040.8
----------------------------------------
Cliente: Angela Leblanc
Ciudad: DE 44975
#️Total Transacciones: 401
Promedio: 5000.28
-------------------------

Para resolver el inciso 2.1 utilicé un pipeline de agregación implementado en Python con PyMongo, el objetivo era unir las colecciones customers, accounts y transactions mediante $lookup y $unwind. Ya que las transacciones están almacenadas como un arreglo anidado dentro de cada documento tuve que descomponerlo con un doble $unwind para acceder individualmente a cada transacción, el nombre del cliente se obtuvo directamente del campo name, mientras que la ciudad se extrajo a partir del campo address, que es una cadena de texto, aplicando $split y $arrayElemAt con validación para evitar errores, por último agrupé los resultados por cliente usando $group, calculando el total de transacciones con $sum y el monto promedio con $avg, ordenando de forma descendente por cantidad de transacciones con $sort.

### Inciso 2.2 – Clasificación de clientes por balance total

In [9]:
from pymongo import MongoClient

# Conectarse al clúster
client = MongoClient("mongodb+srv://carlolvgjunior:vniYLQFBa0yBkuSM@lab8.nmnfq4n.mongodb.net/?retryWrites=true&w=majority&appName=lab8")
db = client["sample_analytics"]
customers = db["customers"]

# Definir el pipeline
pipeline = [
    {
        "$lookup": {
            "from": "accounts",
            "localField": "accounts",
            "foreignField": "account_id",
            "as": "account_data"
        }
    },
    { "$unwind": "$account_data" },
    {
        "$group": {
            "_id": "$_id",
            "full_name": { "$first": "$name" },
            "total_balance": { "$sum": "$account_data.limit" }
        }
    },
    {
        "$addFields": {
            "category": {
                "$switch": {
                    "branches": [
                        { "case": { "$lt": ["$total_balance", 5000] }, "then": "Bajo" },
                        { "case": { "$lte": ["$total_balance", 20000] }, "then": "Medio" }
                    ],
                    "default": "Alto"
                }
            }
        }
    },
    {
        "$project": {
            "_id": 0,
            "nombre": "$full_name",
            "categoria": "$category"
        }
    }
]

# Ejecutar el pipeline
resultados = customers.aggregate(pipeline)

# Mostrar resultados
for doc in resultados:
    print(f"Cliente: {doc['nombre']}")
    print(f"Categoría: {doc['categoria']}")
    print("-" * 40)

Cliente: Michael Davila MD
Categoría: Alto
----------------------------------------
Cliente: Wendy Thomas
Categoría: Alto
----------------------------------------
Cliente: Curtis Walter
Categoría: Alto
----------------------------------------
Cliente: Craig Koch
Categoría: Alto
----------------------------------------
Cliente: Elizabeth Moore
Categoría: Alto
----------------------------------------
Cliente: Matthew Allen
Categoría: Medio
----------------------------------------
Cliente: Cory Grant
Categoría: Alto
----------------------------------------
Cliente: Michael Lewis
Categoría: Medio
----------------------------------------
Cliente: Chelsea Wells
Categoría: Alto
----------------------------------------
Cliente: Gabriel Romero
Categoría: Alto
----------------------------------------
Cliente: Mary Reeves
Categoría: Alto
----------------------------------------
Cliente: Karen Wise
Categoría: Alto
----------------------------------------
Cliente: James Martin
Categoría: Alto
-----

Para este inciso se usamos un pipeline que une la colección customers con accounts mediante $lookup, seguido de $unwind para así procesar cada cuenta individualmente, posteriormente, con $group, se sumó el campo limit de todas las cuentas asociadas a cada cliente para obtener su balance total, por último, con este valor, se clasificó a los clientes en tres categorías (Bajo, Medio y Alto) usando el operador $switch, y finalmente se proyectó el nombre completo y la categoría.

### Inciso 2.3 – Cliente con mayor balance total por ciudad

In [10]:
from pymongo import MongoClient

# Conectar al clúster
client = MongoClient("mongodb+srv://carlolvgjunior:vniYLQFBa0yBkuSM@lab8.nmnfq4n.mongodb.net/?retryWrites=true&w=majority&appName=lab8")
db = client["sample_analytics"]
customers = db["customers"]

# Pipeline
pipeline = [
    {
        "$lookup": {
            "from": "accounts",
            "localField": "accounts",
            "foreignField": "account_id",
            "as": "account_data"
        }
    },
    { "$unwind": "$account_data" },
    {
        "$group": {
            "_id": "$_id",
            "name": { "$first": "$name" },
            "address": { "$first": "$address" },
            "total_balance": { "$sum": "$account_data.limit" }
        }
    },
    {
        "$addFields": {
            "city": {
                "$let": {
                    "vars": {
                        "parts": { "$split": ["$address", ","] }
                    },
                    "in": {
                        "$cond": [
                            { "$gte": [{ "$size": "$$parts" }, 2] },
                            { "$trim": { "input": { "$arrayElemAt": ["$$parts", 1] } } },
                            "N/A"
                        ]
                    }
                }
            }
        }
    },
    {
        "$sort": {
            "city": 1,
            "total_balance": -1
        }
    },
    {
        "$group": {
            "_id": "$city",
            "nombre": { "$first": "$name" },
            "ciudad": { "$first": "$city" },
            "total_balance": { "$first": "$total_balance" }
        }
    },
    {
        "$project": {
            "_id": 0,
            "nombre": 1,
            "ciudad": 1,
            "total_balance": 1
        }
    }
]

# Ejecutar
resultados = customers.aggregate(pipeline)

# Imprimir
for doc in resultados:
    print(f"Ciudad: {doc['ciudad']}")
    print(f"Cliente: {doc['nombre']}")
    print(f"Balance Total: {doc['total_balance']}")
    print("-" * 40)

Ciudad: DE 32862
Cliente: Douglas Johnson
Balance Total: 60000
----------------------------------------
Ciudad: CA 43689
Cliente: Paul Flores
Balance Total: 50000
----------------------------------------
Ciudad: OK 91293
Cliente: Tracy Winters
Balance Total: 60000
----------------------------------------
Ciudad: NY 76487
Cliente: James Moore
Balance Total: 30000
----------------------------------------
Ciudad: FL 97317
Cliente: Matthew Chapman
Balance Total: 50000
----------------------------------------
Ciudad: OH 10383
Cliente: Sean Hopkins
Balance Total: 30000
----------------------------------------
Ciudad: KY 21914
Cliente: Shirley Rodriguez
Balance Total: 40000
----------------------------------------
Ciudad: Box 7388
APO AA 53337
Cliente: Alex Turner
Balance Total: 40000
----------------------------------------
Ciudad: PA 61387
Cliente: Cody Schmitt
Balance Total: 40000
----------------------------------------
Ciudad: MN 14798
Cliente: Chelsea Clay
Balance Total: 20000
---------

Para este inciso se usamos un pipeline que conecta la colección customers con accounts mediante $lookup, seguido de $unwind para procesar individualmente cada cuenta y luego agrupar por cliente con $group para calcular su balance total, la ciudad se extrajo desde el campo address utilizando $split y $arrayElemAt, ya que es una cadena de texto y no un objeto, por último, se ordenaron los clientes por ciudad y balance descendente con $sort, y se agrupó por ciudad con $group para obtener únicamente al cliente con mayor balance en cada una. Finalmente, se proyectó el nombre, ciudad y balance total.

### Inciso 2.4 – Top 10 transacciones más altas de los últimos 6 meses con datos del cliente

In [None]:
from pymongo import MongoClient
from datetime import datetime

client = MongoClient("mongodb+srv://carlolvgjunior:vniYLQFBa0yBkuSM@lab8.nmnfq4n.mongodb.net/?retryWrites=true&w=majority&appName=lab8")
db = client["sample_analytics"]

pipeline = [
    { "$unwind": "$transactions" },
    { "$sort": { "transactions.amount": -1 } },
    { "$limit": 10 },
    {
        "$lookup": {
            "from": "accounts",
            "localField": "account_id",
            "foreignField": "account_id",
            "as": "cuenta"
        }
    },
    { "$unwind": "$cuenta" },
    {
        "$lookup": {
            "from": "customers",
            "localField": "cuenta.account_id",
            "foreignField": "accounts",
            "as": "cliente"
        }
    },
    { "$unwind": "$cliente" },
    {
        "$project": {
            "_id": 0,
            "cliente": "$cliente.name",
            "email": "$cliente.email",
            "monto": "$transactions.amount",
            "fecha": "$transactions.date",
            "tipo": "$transactions.transaction_code",
            "simbolo": "$transactions.symbol"
        }
    }
]

resultados = db["transactions"].aggregate(pipeline)

for doc in resultados:
    print(f"Cliente: {doc['cliente']}")
    print(f"Email: {doc['email']}")
    print(f"Monto: Q{doc['monto']}")
    print(f"Fecha: {doc['fecha'].strftime('%Y-%m-%d')}")
    print(f"Tipo: {doc['tipo']} - Símbolo: {doc['simbolo']}")
    print("-" * 40)

Cliente: Christopher Mercado
Email: brianpowell@yahoo.com
Monto: Q9999
Fecha: 2014-07-29
Tipo: buy - Símbolo: fb
----------------------------------------
Cliente: Sandra Davila
Email: rgraham@hotmail.com
Monto: Q9999
Fecha: 2016-02-29
Tipo: sell - Símbolo: fb
----------------------------------------
Cliente: Felicia Perez
Email: xperez@yahoo.com
Monto: Q9999
Fecha: 2008-12-18
Tipo: buy - Símbolo: amd
----------------------------------------
Cliente: David Warren
Email: jennifer49@gmail.com
Monto: Q9999
Fecha: 2003-07-18
Tipo: buy - Símbolo: adbe
----------------------------------------
Cliente: Andrea Mcmillan
Email: andrewlowe@yahoo.com
Monto: Q9999
Fecha: 2013-10-09
Tipo: buy - Símbolo: znga
----------------------------------------
Cliente: Annette Watts
Email: meganwilliams@hotmail.com
Monto: Q9999
Fecha: 2016-10-28
Tipo: buy - Símbolo: fb
----------------------------------------
Cliente: Megan Tanner
Email: jamesgregory@gmail.com
Monto: Q9999
Fecha: 1990-05-01
Tipo: sell - Símbolo:

Se extrajeron las 10 transacciones con mayor monto utilizando $unwind, $sort y $limit sobre el arreglo de transacciones. Luego, se usaron dos $lookup para relacionar cada transacción con su cuenta y con el cliente correspondiente. Finalmente, se proyectaron los campos solicitados, incluyendo el nombre, email, monto, tipo, símbolo y la fecha correcta desde el campo transactions.date.

### Inciso 2.5 – Variación porcentual entre la transacción más antigua y la más reciente por cliente

In [26]:
from pymongo import MongoClient

client = MongoClient("mongodb+srv://carlolvgjunior:vniYLQFBa0yBkuSM@lab8.nmnfq4n.mongodb.net/?retryWrites=true&w=majority&appName=lab8")
db = client["sample_analytics"]
transactions = db["transactions"]

pipeline = [
    { "$unwind": "$transactions" },
    {
        "$lookup": {
            "from": "accounts",
            "localField": "account_id",
            "foreignField": "account_id",
            "as": "cuenta"
        }
    },
    { "$unwind": "$cuenta" },
    {
        "$lookup": {
            "from": "customers",
            "localField": "cuenta.account_id",
            "foreignField": "accounts",
            "as": "cliente"
        }
    },
    { "$unwind": "$cliente" },
    {
        "$group": {
            "_id": "$cliente._id",
            "nombre": { "$first": "$cliente.name" },
            "transacciones": {
                "$push": {
                    "fecha": "$transactions.date",
                    "monto": "$transactions.amount"
                }
            }
        }
    }
]

resultados = transactions.aggregate(pipeline)

from datetime import datetime

for doc in resultados:
    trans = sorted(doc["transacciones"], key=lambda x: x["fecha"])
    if len(trans) >= 2:
        monto_antiguo = trans[0]["monto"]
        monto_reciente = trans[-1]["monto"]
        if monto_antiguo and monto_antiguo != 0:
            variacion = ((monto_reciente - monto_antiguo) / monto_antiguo) * 100
            print(f"Cliente: {doc['nombre']}")
            print(f"Variación: {round(variacion, 2)}%")
            print("-" * 40)

Cliente: Jonathan Hines
Variación: -9.87%
----------------------------------------
Cliente: Kara Thomas
Variación: -83.76%
----------------------------------------
Cliente: Cheryl Herring
Variación: 300.33%
----------------------------------------
Cliente: Katherine Andrews
Variación: 18.01%
----------------------------------------
Cliente: Robert Obrien
Variación: -25.78%
----------------------------------------
Cliente: Denise Curtis
Variación: -92.59%
----------------------------------------
Cliente: Tonya Vega
Variación: 931.69%
----------------------------------------
Cliente: Megan Lewis
Variación: -64.32%
----------------------------------------
Cliente: James Gibson
Variación: 47.46%
----------------------------------------
Cliente: Dr. Matthew Archer
Variación: 27.56%
----------------------------------------
Cliente: David Obrien
Variación: -0.12%
----------------------------------------
Cliente: Jocelyn Mayo
Variación: -31.03%
----------------------------------------
Cliente:

Se agruparon las transacciones por cliente con $group para obtener sus fechas y montos. Luego, usando Python, se ordenaron cronológicamente para calcular la variación porcentual entre la transacción más antigua y la más reciente. Solo se incluyeron clientes con al menos dos transacciones.

### Inciso 2.6 – Agrupar transacciones por mes y tipo, y calcular total y promedio

In [27]:
from pymongo import MongoClient

client = MongoClient("mongodb+srv://carlolvgjunior:vniYLQFBa0yBkuSM@lab8.nmnfq4n.mongodb.net/?retryWrites=true&w=majority&appName=lab8")
db = client["sample_analytics"]
transactions = db["transactions"]

pipeline = [
    { "$unwind": "$transactions" },
    {
        "$addFields": {
            "mes": {
                "$dateToString": { "format": "%Y-%m", "date": "$transactions.date" }
            }
        }
    },
    {
        "$group": {
            "_id": {
                "mes": "$mes",
                "tipo": "$transactions.transaction_code"
            },
            "total_transacciones": { "$sum": 1 },
            "promedio_monto": { "$avg": "$transactions.amount" }
        }
    },
    {
        "$project": {
            "_id": 0,
            "mes": "$_id.mes",
            "tipo": "$_id.tipo",
            "total_transacciones": 1,
            "promedio_monto": { "$round": ["$promedio_monto", 2] }
        }
    },
    { "$sort": { "mes": 1, "tipo": 1 } }
]

resultados = transactions.aggregate(pipeline)

for doc in resultados:
    print(f"Mes: {doc['mes']}")
    print(f"Tipo: {doc['tipo']}")
    print(f"Total: {doc['total_transacciones']}")
    print(f"Promedio: Q{doc['promedio_monto']}")
    print("-" * 40)

Mes: 1962-03
Tipo: sell
Total: 1
Promedio: Q727.0
----------------------------------------
Mes: 1962-05
Tipo: buy
Total: 1
Promedio: Q6360.0
----------------------------------------
Mes: 1962-06
Tipo: buy
Total: 1
Promedio: Q5024.0
----------------------------------------
Mes: 1962-11
Tipo: sell
Total: 1
Promedio: Q5573.0
----------------------------------------
Mes: 1963-01
Tipo: buy
Total: 1
Promedio: Q8064.0
----------------------------------------
Mes: 1963-02
Tipo: buy
Total: 1
Promedio: Q5303.0
----------------------------------------
Mes: 1963-02
Tipo: sell
Total: 1
Promedio: Q7700.0
----------------------------------------
Mes: 1963-03
Tipo: buy
Total: 1
Promedio: Q6116.0
----------------------------------------
Mes: 1963-05
Tipo: buy
Total: 2
Promedio: Q7507.0
----------------------------------------
Mes: 1963-05
Tipo: sell
Total: 1
Promedio: Q8932.0
----------------------------------------
Mes: 1963-07
Tipo: sell
Total: 1
Promedio: Q547.0
-------------------------------------

Se accedió a cada transacción con $unwind y se creó un campo de mes con $dateToString. Luego se agruparon por mes y tipo de transacción (transaction_code) usando $group, y se calculó el total de transacciones y el monto promedio por grupo, redondeando los resultados con $round.

### Inciso 2.7 – Clientes que NO han realizado ninguna transacción

In [28]:
from pymongo import MongoClient

client = MongoClient("mongodb+srv://carlolvgjunior:vniYLQFBa0yBkuSM@lab8.nmnfq4n.mongodb.net/?retryWrites=true&w=majority&appName=lab8")
db = client["sample_analytics"]

pipeline = [
    {
        "$lookup": {
            "from": "transactions",
            "localField": "accounts",
            "foreignField": "account_id",
            "as": "transacciones"
        }
    },
    {
        "$match": {
            "transacciones": { "$eq": [] }
        }
    },
    {
        "$project": {
            "_id": 0,
            "name": 1,
            "email": 1,
            "address": 1,
            "accounts": 1
        }
    }
]

inactivos = list(db["customers"].aggregate(pipeline))

# Guardar en nueva colección
if inactivos:
    db["inactive_customers"].drop()  # limpiar antes si existe
    db["inactive_customers"].insert_many(inactivos)
    print(f"Se guardaron {len(inactivos)} clientes en 'inactive_customers'")
else:
    print("No se encontraron clientes inactivos.")

No se encontraron clientes inactivos.


Se utilizó $lookup entre customers y transactions para identificar clientes cuyos account_id no tienen transacciones asociadas. Sin embargo, en el dataset proporcionado todos los clientes tienen al menos una transacción, por lo que no se insertó ningún documento en la colección inactive_customers.

### Inciso 2.8 – Resumen por tipo de cuenta en account_summaries

In [29]:
from pymongo import MongoClient

client = MongoClient("mongodb+srv://carlolvgjunior:vniYLQFBa0yBkuSM@lab8.nmnfq4n.mongodb.net/?retryWrites=true&w=majority&appName=lab8")
db = client["sample_analytics"]
accounts = db["accounts"]

pipeline = [
    { "$unwind": "$products" },
    {
        "$group": {
            "_id": "$products",
            "total_cuentas": { "$sum": 1 },
            "promedio_balance": { "$avg": "$limit" }
        }
    },
    {
        "$project": {
            "_id": 0,
            "tipo": "$_id",
            "total_cuentas": 1,
            "promedio_balance": { "$round": ["$promedio_balance", 2] }
        }
    }
]

resumen = list(accounts.aggregate(pipeline))

# Guardar o actualizar en account_summaries
db["account_summaries"].drop()  # eliminar previo si existe
db["account_summaries"].insert_many(resumen)

print(f"Resumen guardado con {len(resumen)} tipos de cuenta en 'account_summaries'")

Resumen guardado con 6 tipos de cuenta en 'account_summaries'


Se descompuso el campo products de cada cuenta con $unwind y se agruparon por tipo para calcular el total de cuentas y el balance promedio (limit). Luego, los resultados se almacenaron en la colección account_summaries, eliminando previamente su contenido si existía.

### Inciso 2.9 – Clientes de alto valor en high_value_customers

In [30]:
from pymongo import MongoClient

client = MongoClient("mongodb+srv://carlolvgjunior:vniYLQFBa0yBkuSM@lab8.nmnfq4n.mongodb.net/?retryWrites=true&w=majority&appName=lab8")
db = client["sample_analytics"]

pipeline = [
    {
        "$lookup": {
            "from": "accounts",
            "localField": "accounts",
            "foreignField": "account_id",
            "as": "cuentas"
        }
    },
    {
        "$lookup": {
            "from": "transactions",
            "localField": "accounts",
            "foreignField": "account_id",
            "as": "transacciones"
        }
    },
    {
        "$addFields": {
            "total_balance": { "$sum": "$cuentas.limit" },
            "total_transacciones": { "$size": "$transacciones" }
        }
    },
    {
        "$match": {
            "total_balance": { "$gt": 30000 },
            "total_transacciones": { "$gt": 5 }
        }
    },
    {
        "$project": {
            "_id": 0,
            "nombre": "$name",
            "email": 1,
            "total_balance": 1,
            "total_transacciones": 1
        }
    }
]

resultados = list(db["customers"].aggregate(pipeline))

# Guardar en high_value_customers
db["high_value_customers"].drop()
db["high_value_customers"].insert_many(resultados)

print(f"Se guardaron {len(resultados)} clientes en 'high_value_customers'")

Se guardaron 83 clientes en 'high_value_customers'


Se unieron las colecciones customers, accounts y transactions con $lookup para obtener el balance total y el número de transacciones por cliente. Luego, se filtraron aquellos con balance mayor a 30,000 y más de 5 transacciones, y se almacenaron en la colección high_value_customers.

### Inciso 2.10 – Clasificación de clientes según promedio mensual de transacciones (último año)

In [33]:
from pymongo import MongoClient
from datetime import datetime, timedelta, timezone

client = MongoClient("mongodb+srv://carlolvgjunior:vniYLQFBa0yBkuSM@lab8.nmnfq4n.mongodb.net/?retryWrites=true&w=majority&appName=lab8")
db = client["sample_analytics"]

# Calcular fecha límite
hoy = datetime.now(timezone.utc)
limite = datetime(2016, 1, 1, tzinfo=timezone.utc)

pipeline = [
    { "$unwind": "$transactions" },
    {
        "$match": {
            "transactions.date": { "$gte": limite }
        }
    },
    {
        "$lookup": {
            "from": "accounts",
            "localField": "account_id",
            "foreignField": "account_id",
            "as": "cuenta"
        }
    },
    { "$unwind": "$cuenta" },
    {
        "$lookup": {
            "from": "customers",
            "localField": "cuenta.account_id",
            "foreignField": "accounts",
            "as": "cliente"
        }
    },
    { "$unwind": "$cliente" },
    {
        "$group": {
            "_id": "$cliente._id",
            "nombre": { "$first": "$cliente.name" },
            "transacciones_anuales": { "$sum": 1 }
        }
    },
    {
        "$addFields": {
            "promedio_mensual": {
                "$round": [
                    { "$divide": ["$transacciones_anuales", 12] },
                    1
                ]
            },
            "categoria": {
                "$switch": {
                    "branches": [
                        { "case": { "$lt": [{ "$divide": ["$transacciones_anuales", 12] }, 2] }, "then": "infrequent" },
                        { "case": { "$lte": [{ "$divide": ["$transacciones_anuales", 12] }, 5] }, "then": "regular" }
                    ],
                    "default": "frequent"
                }
            }
        }
    },
    {
        "$project": {
            "_id": 0,
            "nombre": 1,
            "promedio_mensual": 1,
            "categoria": 1
        }
    },
    { "$sort": { "promedio_mensual": -1 } }
]

resultados = db["transactions"].aggregate(pipeline)

for doc in resultados:
    print(f"Cliente: {doc['nombre']}")
    print(f"Promedio mensual: {doc['promedio_mensual']}")
    print(f"Categoría: {doc['categoria']}")
    print("-" * 40)

Cliente: Jeffrey Reeves
Promedio mensual: 9.3
Categoría: frequent
----------------------------------------
Cliente: Robert Burns
Promedio mensual: 8.8
Categoría: frequent
----------------------------------------
Cliente: Samuel Perry
Promedio mensual: 8.8
Categoría: frequent
----------------------------------------
Cliente: Edward Owen
Promedio mensual: 8.5
Categoría: frequent
----------------------------------------
Cliente: Kenneth Green
Promedio mensual: 8.4
Categoría: frequent
----------------------------------------
Cliente: Ashley Lindsey
Promedio mensual: 7.8
Categoría: frequent
----------------------------------------
Cliente: Vincent Rose
Promedio mensual: 7.8
Categoría: frequent
----------------------------------------
Cliente: Alvin Larson
Promedio mensual: 7.5
Categoría: frequent
----------------------------------------
Cliente: Scott Fisher
Promedio mensual: 7.5
Categoría: frequent
----------------------------------------
Cliente: Richard Benson
Promedio mensual: 7.1
Categ

Se seleccionaron las transacciones realizadas desde enero de 2016 en adelante, ya que el dataset no contiene datos recientes. Luego se agruparon por cliente para contar las transacciones anuales, se calculó su promedio mensual dividiendo entre 12 y se clasificaron en tres categorías según su frecuencia. Finalmente, se proyectaron el nombre, el promedio redondeado a un decimal y su categoría.