# MÃ©trica 3_4_01 â€” RelaciÃ³n entre inmuebles adquiridos por compraventa y nivel jerÃ¡rquico

| Escenario                                                                       | CondiciÃ³n       | Resultado            |
| :------------------------------------------------------------------------------ | :-------------- | :------------------- |
| No hay bienes inmuebles                                                         | â€”               | âšª **SIN_DATO**       |
| No hay nivel jerÃ¡rquico declarado                                               | â€”               | âšª **SIN_DATO**       |
| NÃºmero de bienes comprados dentro del rango normal (Q1â€“Q3 del grupo jerÃ¡rquico) | â€”               | ðŸŸ¢ **CUMPLE (0)**    |
| NÃºmero de bienes comprados fuera del rango esperado                             | `< Q1` o `> Q3` | ðŸ”´ **NO_CUMPLE (1)** |


In [None]:
import traceback
from pymongo import MongoClient, UpdateOne
from config import MONGO_URI, DB_NAME, SOURCE_COLLECTION_NAME, METRICS_COLLECTION_NAME

METRIC_ID = "3_4_01_RELACION_COMPRAVENTA_NIVEL_JERARQUICO"
BATCH_SIZE = 10000  # ðŸ”§ nÃºmero de documentos por lote

# Si SESNA define umbrales fijos por nivel, puedes configurarlos aquÃ­
CUARTILES_POR_NIVEL = {
    "OPERATIVO": (0, 2),
    "ENLACE": (0, 3),
    "JEFE_DEPARTAMENTO": (0, 4),
    "DIRECTOR": (0, 5),
    "SUBDIRECTOR": (0, 5),
    "TITULAR": (0, 6),
}

def extraer_lista(doc, path):
    """Extrae una lista desde un path anidado."""
    try:
        partes = path.split(".")
        actuales = [doc]
        for p in partes:
            siguientes = []
            for actual in actuales:
                if isinstance(actual, dict):
                    valor = actual.get(p)
                    if valor is None:
                        continue
                    if isinstance(valor, list):
                        siguientes.extend(valor)
                    else:
                        siguientes.append(valor)
                elif isinstance(actual, list):
                    for sub in actual:
                        if isinstance(sub, dict):
                            valor = sub.get(p)
                            if valor is None:
                                continue
                            if isinstance(valor, list):
                                siguientes.extend(valor)
                            else:
                                siguientes.append(valor)
            actuales = siguientes
        return [a for a in actuales if isinstance(a, dict)]
    except:
        return []


def extraer_valor(doc, path):
    """Extrae un valor Ãºnico (nivel jerÃ¡rquico)."""
    try:
        partes = path.split(".")
        actual = doc
        for p in partes:
            if isinstance(actual, dict):
                actual = actual.get(p)
            elif isinstance(actual, list) and len(actual) > 0:
                actual = actual[0].get(p)
            else:
                return None
        return actual
    except:
        return None


def evaluar_metrica(doc):
    bienes = extraer_lista(doc, "declaracion.situacionPatrimonial.bienesInmuebles.bienInmueble")
    nivel = str(extraer_valor(doc, "declaracion.situacionPatrimonial.datosEmpleoCargoComision.nivel") or "").upper()

    if not bienes:
        return "SIN_DATO"
    if not nivel:
        return "SIN_DATO"

    n_compraventa = sum(
        1 for b in bienes if str(b.get("formaAdquisicion", "")).upper() in ["COMPRA", "COMPRA-VENTA", "COMPRAVENTA"]
    )

    if nivel not in CUARTILES_POR_NIVEL:
        return "SIN_DATO"

    q1, q3 = CUARTILES_POR_NIVEL[nivel]
    if n_compraventa < q1 or n_compraventa > q3:
        return "NO_CUMPLE"
    return "CUMPLE"


def procesar_metrica():
    client = MongoClient(MONGO_URI, serverSelectionTimeoutMS=5000)
    db = client[DB_NAME]
    src = db[SOURCE_COLLECTION_NAME]
    tgt = db[METRICS_COLLECTION_NAME]

    total_docs = src.estimated_document_count()
    print(f"ðŸš€ Procesando {METRIC_ID} con {total_docs:,} documentos...\n")

    skip = 0
    procesados = 0
    lote = 0

    try:
        while True:
            cursor = list(src.find({}, {
                "_id": 1,
                "declaracion.situacionPatrimonial.bienesInmuebles.bienInmueble": 1,
                "declaracion.situacionPatrimonial.datosEmpleoCargoComision.nivel": 1
            }).skip(skip).limit(BATCH_SIZE))

            if not cursor:
                break

            operaciones = []
            for doc in cursor:
                try:
                    resultado = evaluar_metrica(doc)
                except Exception as e:
                    resultado = "SIN_DATO"
                    print(f"[Error doc {doc.get('_id')}] {e}")

                operaciones.append(UpdateOne(
                    {"_id": doc["_id"]},
                    {"$set": {METRIC_ID: resultado}},
                    upsert=True
                ))

            if operaciones:
                tgt.bulk_write(operaciones)
                procesados += len(operaciones)
                lote += 1
                print(f"  ðŸ”„ Lote {lote:,} â†’ {procesados:,}/{total_docs:,} procesados", flush=True)

            skip += BATCH_SIZE

        print("\nâœ… Procesamiento completado.")
        print(f"Total final: {procesados:,}/{total_docs:,} documentos actualizados.")

    except Exception:
        traceback.print_exc()
    finally:
        client.close()
        print("ðŸ”’ ConexiÃ³n cerrada.")


if __name__ == "__main__":
    procesar_metrica()


ðŸš€ Procesando 3_4_01_RELACION_COMPRAVENTA_NIVEL_JERARQUICO con 8,942,592 documentos...

  ðŸ”„ Lote 1 â†’ 10,000/8,942,592 procesados
  ðŸ”„ Lote 2 â†’ 20,000/8,942,592 procesados
  ðŸ”„ Lote 3 â†’ 30,000/8,942,592 procesados
  ðŸ”„ Lote 4 â†’ 40,000/8,942,592 procesados
  ðŸ”„ Lote 5 â†’ 50,000/8,942,592 procesados
  ðŸ”„ Lote 6 â†’ 60,000/8,942,592 procesados
  ðŸ”„ Lote 7 â†’ 70,000/8,942,592 procesados
  ðŸ”„ Lote 8 â†’ 80,000/8,942,592 procesados
  ðŸ”„ Lote 9 â†’ 90,000/8,942,592 procesados
  ðŸ”„ Lote 10 â†’ 100,000/8,942,592 procesados
  ðŸ”„ Lote 11 â†’ 110,000/8,942,592 procesados
  ðŸ”„ Lote 12 â†’ 120,000/8,942,592 procesados
  ðŸ”„ Lote 13 â†’ 130,000/8,942,592 procesados
  ðŸ”„ Lote 14 â†’ 140,000/8,942,592 procesados
  ðŸ”„ Lote 15 â†’ 150,000/8,942,592 procesados
  ðŸ”„ Lote 16 â†’ 160,000/8,942,592 procesados
  ðŸ”„ Lote 17 â†’ 170,000/8,942,592 procesados
  ðŸ”„ Lote 18 â†’ 180,000/8,942,592 procesados
  ðŸ”„ Lote 19 â†’ 190,000/8,942,592 procesados
  ðŸ”„ Lote 20 â