### Inciso 2.1 – Total de transacciones y promedio por cliente

In [6]:
# Primero hay que instalar PyMongo para poder hacer el trabajo: pip install pymongo

from pymongo import MongoClient

# Conexión al clúster
client = MongoClient("mongodb+srv://carlolvgjunior:vniYLQFBa0yBkuSM@lab8.nmnfq4n.mongodb.net/?retryWrites=true&w=majority&appName=lab8")

# Seleccionamos base y colecciones
db = client["sample_analytics"]
customers = db["customers"]

# Pipeline de agregación
pipeline = [
    {
        "$lookup": {
            "from": "accounts",
            "localField": "accounts",
            "foreignField": "account_id",
            "as": "account_data"
        }
    },
    { "$unwind": "$account_data" },
    {
        "$lookup": {
            "from": "transactions",
            "localField": "account_data.account_id",
            "foreignField": "account_id",
            "as": "transactions_info"
        }
    },
    { "$unwind": "$transactions_info" },
    { "$unwind": "$transactions_info.transactions" },
    {
        "$addFields": {
            "full_name": "$name",
            "city": {
                "$let": {
                    "vars": {
                        "parts": { "$split": ["$address", ","] }
                    },
                    "in": {
                        "$cond": [
                            { "$gte": [ { "$size": "$$parts" }, 2 ] },
                            { "$trim": { "input": { "$arrayElemAt": [ "$$parts", 1 ] } } },
                            "N/A"
                        ]
                    }
                }
            }
        }
    },
    {
        "$group": {
            "_id": "$_id",
            "full_name": { "$first": "$full_name" },
            "city": { "$first": "$city" },
            "total_transactions": { "$sum": 1 },
            "avg_amount": { "$avg": "$transactions_info.transactions.amount" }
        }
    },
    { "$sort": { "total_transactions": -1 } }
]


# Ejecutar pipeline
resultados = customers.aggregate(pipeline)

# Mostrar resultados
for doc in resultados:
    nombre = doc["full_name"]
    print(f"Cliente: {nombre}")
    print(f"Ciudad: {doc['city']}")
    print(f"#️Total Transacciones: {doc['total_transactions']}")

    if doc["avg_amount"] is not None:
        print(f"Promedio: {round(doc['avg_amount'], 2)}")
    else:
        print(f"Promedio: N/A")

    print("-" * 40)


Cliente: Ashley Rodriguez
Ciudad: MI 51943
#️Total Transacciones: 471
Promedio: 4926.95
----------------------------------------
Cliente: John Williams
Ciudad: N/A
#️Total Transacciones: 443
Promedio: 4985.15
----------------------------------------
Cliente: Phillip Obrien
Ciudad: Box 5207
APO AE 07226
#️Total Transacciones: 421
Promedio: 4962.69
----------------------------------------
Cliente: Travis White
Ciudad: DC 15272
#️Total Transacciones: 409
Promedio: 4888.57
----------------------------------------
Cliente: Aaron Perez
Ciudad: MS 55765
#️Total Transacciones: 404
Promedio: 5152.12
----------------------------------------
Cliente: Stacey Mccall
Ciudad: MO 06535
#️Total Transacciones: 403
Promedio: 4827.92
----------------------------------------
Cliente: Megan Tanner
Ciudad: OK 38895
#️Total Transacciones: 401
Promedio: 5040.8
----------------------------------------
Cliente: Angela Leblanc
Ciudad: DE 44975
#️Total Transacciones: 401
Promedio: 5000.28
-------------------------

Para resolver el inciso 2.1 utilicé un pipeline de agregación implementado en Python con PyMongo, el objetivo era unir las colecciones customers, accounts y transactions mediante $lookup y $unwind. Ya que las transacciones están almacenadas como un arreglo anidado dentro de cada documento tuve que descomponerlo con un doble $unwind para acceder individualmente a cada transacción, el nombre del cliente se obtuvo directamente del campo name, mientras que la ciudad se extrajo a partir del campo address, que es una cadena de texto, aplicando $split y $arrayElemAt con validación para evitar errores, por último agrupé los resultados por cliente usando $group, calculando el total de transacciones con $sum y el monto promedio con $avg, ordenando de forma descendente por cantidad de transacciones con $sort.

### Inciso 2.2 – Clasificación de clientes por balance total

In [9]:
from pymongo import MongoClient

# Conectarse al clúster
client = MongoClient("mongodb+srv://carlolvgjunior:vniYLQFBa0yBkuSM@lab8.nmnfq4n.mongodb.net/?retryWrites=true&w=majority&appName=lab8")
db = client["sample_analytics"]
customers = db["customers"]

# Definir el pipeline
pipeline = [
    {
        "$lookup": {
            "from": "accounts",
            "localField": "accounts",
            "foreignField": "account_id",
            "as": "account_data"
        }
    },
    { "$unwind": "$account_data" },
    {
        "$group": {
            "_id": "$_id",
            "full_name": { "$first": "$name" },
            "total_balance": { "$sum": "$account_data.limit" }
        }
    },
    {
        "$addFields": {
            "category": {
                "$switch": {
                    "branches": [
                        { "case": { "$lt": ["$total_balance", 5000] }, "then": "Bajo" },
                        { "case": { "$lte": ["$total_balance", 20000] }, "then": "Medio" }
                    ],
                    "default": "Alto"
                }
            }
        }
    },
    {
        "$project": {
            "_id": 0,
            "nombre": "$full_name",
            "categoria": "$category"
        }
    }
]

# Ejecutar el pipeline
resultados = customers.aggregate(pipeline)

# Mostrar resultados
for doc in resultados:
    print(f"Cliente: {doc['nombre']}")
    print(f"Categoría: {doc['categoria']}")
    print("-" * 40)

Cliente: Michael Davila MD
Categoría: Alto
----------------------------------------
Cliente: Wendy Thomas
Categoría: Alto
----------------------------------------
Cliente: Curtis Walter
Categoría: Alto
----------------------------------------
Cliente: Craig Koch
Categoría: Alto
----------------------------------------
Cliente: Elizabeth Moore
Categoría: Alto
----------------------------------------
Cliente: Matthew Allen
Categoría: Medio
----------------------------------------
Cliente: Cory Grant
Categoría: Alto
----------------------------------------
Cliente: Michael Lewis
Categoría: Medio
----------------------------------------
Cliente: Chelsea Wells
Categoría: Alto
----------------------------------------
Cliente: Gabriel Romero
Categoría: Alto
----------------------------------------
Cliente: Mary Reeves
Categoría: Alto
----------------------------------------
Cliente: Karen Wise
Categoría: Alto
----------------------------------------
Cliente: James Martin
Categoría: Alto
-----

Para este inciso se usamos un pipeline que une la colección customers con accounts mediante $lookup, seguido de $unwind para así procesar cada cuenta individualmente, posteriormente, con $group, se sumó el campo limit de todas las cuentas asociadas a cada cliente para obtener su balance total, por último, con este valor, se clasificó a los clientes en tres categorías (Bajo, Medio y Alto) usando el operador $switch, y finalmente se proyectó el nombre completo y la categoría.