# M√©trica 3_4_03 ‚Äî Bienes muebles adquiridos por el declarante por compraventa

| Escenario                                                  | Condici√≥n                     | Resultado            |
| :--------------------------------------------------------- | :---------------------------- | :------------------- |
| No hay bienes muebles                                      | ‚Äî                             | ‚ö™ **SIN_DATO**       |
| Bien mueble no pertenece al declarante                     | `titular ‚â† ‚ÄúDECLARANTE‚Äù`      | ‚ö™ **N/A**            |
| N√∫mero de bienes por compraventa dentro del rango esperado | ‚Äî                             | üü¢ **CUMPLE (0)**    |
| N√∫mero de bienes por compraventa fuera del rango esperado  | `< Q1` o `> Q3` o umbral fijo | üî¥ **NO_CUMPLE (1)** |


In [None]:
import traceback
from pymongo import MongoClient, UpdateOne
from config import MONGO_URI, DB_NAME, SOURCE_COLLECTION_NAME, METRICS_COLLECTION_NAME

METRIC_ID = "3_4_03_BIENES_COMPRAVENTA_DECLARANTE"
BATCH_SIZE = 10000  # üîß tama√±o de lote

# Umbrales estimados por nivel jer√°rquico (ajustables seg√∫n an√°lisis SESNA)
UMBRAL_POR_NIVEL = {
    "OPERATIVO": (0, 2),
    "ENLACE": (0, 3),
    "JEFE_DEPARTAMENTO": (0, 4),
    "DIRECTOR": (0, 5),
    "SUBDIRECTOR": (0, 5),
    "TITULAR": (0, 6),
}

def extraer_lista(doc, path):
    try:
        partes = path.split(".")
        actuales = [doc]
        for p in partes:
            siguientes = []
            for actual in actuales:
                if isinstance(actual, dict):
                    valor = actual.get(p)
                    if valor is None:
                        continue
                    if isinstance(valor, list):
                        siguientes.extend(valor)
                    else:
                        siguientes.append(valor)
                elif isinstance(actual, list):
                    for sub in actual:
                        if isinstance(sub, dict):
                            valor = sub.get(p)
                            if valor is None:
                                continue
                            if isinstance(valor, list):
                                siguientes.extend(valor)
                            else:
                                siguientes.append(valor)
            actuales = siguientes
        return [a for a in actuales if isinstance(a, dict)]
    except:
        return []

def extraer_valor(doc, path):
    try:
        partes = path.split(".")
        actual = doc
        for p in partes:
            if isinstance(actual, dict):
                actual = actual.get(p)
            elif isinstance(actual, list) and len(actual) > 0:
                actual = actual[0].get(p)
            else:
                return None
        return actual
    except:
        return None

def evaluar_metrica(doc):
    bienes = extraer_lista(doc, "declaracion.situacionPatrimonial.bienesMuebles.bienMueble")
    nivel = str(extraer_valor(doc, "declaracion.situacionPatrimonial.datosEmpleoCargoComision.nivel") or "").upper()

    if not bienes:
        return "SIN_DATO"
    if not nivel:
        return "SIN_DATO"

    n_declarante_compra = 0
    for b in bienes:
        titular = str(b.get("titular", "")).upper()
        forma = str(b.get("formaAdquisicion", "")).upper()

        if titular in ["DECLARANTE", "DECLARANTE Y PAREJA", "DECLARANTE Y TERCERO"]:
            if any(k in forma for k in ["COMPRA", "COMPRA-VENTA", "COMPRAVENTA"]):
                n_declarante_compra += 1

    if nivel not in UMBRAL_POR_NIVEL:
        return "SIN_DATO"

    q1, q3 = UMBRAL_POR_NIVEL[nivel]
    if n_declarante_compra < q1 or n_declarante_compra > q3:
        return "NO_CUMPLE"
    return "CUMPLE"

def procesar_metrica():
    client = MongoClient(MONGO_URI, serverSelectionTimeoutMS=5000)
    db = client[DB_NAME]
    src = db[SOURCE_COLLECTION_NAME]
    tgt = db[METRICS_COLLECTION_NAME]

    total_docs = src.estimated_document_count()
    print(f"üöÄ Procesando {METRIC_ID} con {total_docs:,} documentos...\n")

    skip = 0
    procesados = 0
    lote = 0

    try:
        while True:
            cursor = list(src.find({}, {
                "_id": 1,
                "declaracion.situacionPatrimonial.bienesMuebles.bienMueble": 1,
                "declaracion.situacionPatrimonial.datosEmpleoCargoComision.nivel": 1
            }).skip(skip).limit(BATCH_SIZE))

            if not cursor:
                break

            operaciones = []
            for doc in cursor:
                try:
                    resultado = evaluar_metrica(doc)
                except Exception as e:
                    resultado = "SIN_DATO"
                    print(f"[Error doc {doc.get('_id')}] {e}")

                operaciones.append(UpdateOne(
                    {"_id": doc["_id"]},
                    {"$set": {METRIC_ID: resultado}},
                    upsert=True
                ))

            if operaciones:
                tgt.bulk_write(operaciones)
                procesados += len(operaciones)
                lote += 1
                print(f"  üîÑ Lote {lote:,} ‚Üí {procesados:,}/{total_docs:,} procesados", flush=True)

            skip += BATCH_SIZE

        print("\n‚úÖ Procesamiento completado.")
        print(f"Total final: {procesados:,}/{total_docs:,} documentos actualizados.")

    except Exception:
        traceback.print_exc()
    finally:
        client.close()
        print("üîí Conexi√≥n cerrada.\n")

if __name__ == "__main__":
    procesar_metrica()
