In [5]:
import os
import time
import requests
import pandas as pd
from tqdm import tqdm


In [8]:
import requests
import pandas as pd
from tqdm import tqdm

# ---------------------------------------------
# CONFIGURACI√ìN
# ---------------------------------------------
BASE_URL = "https://www.datos.gov.co/resource/jbjy-vk9h.json"
LIMIT = 10000
ANIOS = list(range(2015, 2026))  # de 2015 a 2025

CAMPOS = [
    "nombre_entidad", "nit_entidad", "departamento", "ciudad",
    "tipo_de_contrato", "modalidad_de_contratacion", "fecha_de_firma",
    "fecha_de_inicio_del_contrato", "fecha_de_fin_del_contrato",
    "valor_del_contrato", "proveedor_adjudicado", "documento_proveedor",
    "descripcion_del_proceso", "objeto_del_contrato", "urlproceso",
]

df_total = pd.DataFrame()

# ---------------------------------------------
# DESCARGA POR A√ëO
# ---------------------------------------------
for year in ANIOS:
    print(f"\nüìÖ Descargando contratos de INTERVENTOR√çA del a√±o {year}...")
    offset = 0
    lote = 0
    year_data = []

    # Filtro de a√±o usando rango de fechas
    start_date = f"{year}-01-01T00:00:00"
    end_date = f"{year}-12-31T23:59:59"
    where_clause = (
        f"tipo_de_contrato like '%Interventor%' "
        f"AND fecha_de_firma between '{start_date}' and '{end_date}'"
    )

    with tqdm(total=None, desc=f"A√±o {year}", unit="lote") as pbar:
        while True:
            params = {
                "$select": ",".join(CAMPOS),
                "$where": where_clause,
                "$limit": LIMIT,
                "$offset": offset
            }

            response = requests.get(BASE_URL, params=params)

            if response.status_code != 200:
                print(f"‚ö†Ô∏è Error {response.status_code} en el lote {lote} del a√±o {year}")
                break

            batch = response.json()
            if not batch:
                print(f"‚úÖ A√±o {year} completado ({lote} lotes descargados)")
                break

            df_batch = pd.DataFrame(batch)
            year_data.append(df_batch)

            offset += LIMIT
            lote += 1
            pbar.update(1)
            pbar.set_postfix({"Registros": len(df_batch), "Offset": offset})

    if year_data:
        df_year = pd.concat(year_data, ignore_index=True)
        df_year["a√±o"] = year
        df_total = pd.concat([df_total, df_year], ignore_index=True)
        print(f"üìä Total {len(df_year):,} registros del a√±o {year}")

print("\n‚úÖ Descarga completa")
print(f"üìà Total general: {len(df_total):,} contratos de interventor√≠a")



üìÖ Descargando contratos de INTERVENTOR√çA del a√±o 2015...


A√±o 2015: 0lote [00:00, ?lote/s]


‚úÖ A√±o 2015 completado (0 lotes descargados)

üìÖ Descargando contratos de INTERVENTOR√çA del a√±o 2016...


A√±o 2016: 1lote [00:02,  2.41s/lote, Registros=4, Offset=1e+4]


‚úÖ A√±o 2016 completado (1 lotes descargados)
üìä Total 4 registros del a√±o 2016

üìÖ Descargando contratos de INTERVENTOR√çA del a√±o 2017...


A√±o 2017: 1lote [00:07,  7.77s/lote, Registros=79, Offset=1e+4]


‚úÖ A√±o 2017 completado (1 lotes descargados)
üìä Total 79 registros del a√±o 2017

üìÖ Descargando contratos de INTERVENTOR√çA del a√±o 2018...


A√±o 2018: 1lote [00:12, 12.69s/lote, Registros=635, Offset=1e+4]


‚úÖ A√±o 2018 completado (1 lotes descargados)
üìä Total 635 registros del a√±o 2018

üìÖ Descargando contratos de INTERVENTOR√çA del a√±o 2019...


A√±o 2019: 1lote [00:04,  4.64s/lote, Registros=879, Offset=1e+4]


‚úÖ A√±o 2019 completado (1 lotes descargados)
üìä Total 879 registros del a√±o 2019

üìÖ Descargando contratos de INTERVENTOR√çA del a√±o 2020...


A√±o 2020: 1lote [00:06,  6.27s/lote, Registros=966, Offset=1e+4]


‚úÖ A√±o 2020 completado (1 lotes descargados)
üìä Total 966 registros del a√±o 2020

üìÖ Descargando contratos de INTERVENTOR√çA del a√±o 2021...


A√±o 2021: 1lote [00:09,  9.19s/lote, Registros=1163, Offset=1e+4]


‚úÖ A√±o 2021 completado (1 lotes descargados)
üìä Total 1,163 registros del a√±o 2021

üìÖ Descargando contratos de INTERVENTOR√çA del a√±o 2022...


A√±o 2022: 1lote [00:13, 13.26s/lote, Registros=1979, Offset=1e+4]


‚úÖ A√±o 2022 completado (1 lotes descargados)
üìä Total 1,979 registros del a√±o 2022

üìÖ Descargando contratos de INTERVENTOR√çA del a√±o 2023...


A√±o 2023: 1lote [00:29, 29.03s/lote, Registros=2677, Offset=1e+4]


‚úÖ A√±o 2023 completado (1 lotes descargados)
üìä Total 2,677 registros del a√±o 2023

üìÖ Descargando contratos de INTERVENTOR√çA del a√±o 2024...


A√±o 2024: 1lote [00:19, 19.75s/lote, Registros=1562, Offset=1e+4]


‚úÖ A√±o 2024 completado (1 lotes descargados)
üìä Total 1,562 registros del a√±o 2024

üìÖ Descargando contratos de INTERVENTOR√çA del a√±o 2025...


A√±o 2025: 1lote [00:16, 16.03s/lote, Registros=1262, Offset=1e+4]

‚úÖ A√±o 2025 completado (1 lotes descargados)
üìä Total 1,262 registros del a√±o 2025

‚úÖ Descarga completa
üìà Total general: 11,206 contratos de interventor√≠a





In [10]:
df_total

Unnamed: 0,nombre_entidad,nit_entidad,departamento,ciudad,tipo_de_contrato,modalidad_de_contratacion,fecha_de_firma,fecha_de_inicio_del_contrato,fecha_de_fin_del_contrato,valor_del_contrato,proveedor_adjudicado,documento_proveedor,descripcion_del_proceso,objeto_del_contrato,urlproceso,a√±o
0,MINISTERIO DE EDUCACION NACIONAL (MEN),899999001,Distrito Capital de Bogot√°,Bogot√°,Interventor√≠a,Concurso de m√©ritos abierto,2016-06-23T00:00:00.000,2016-06-20T00:00:00.000,2016-12-31T00:00:00.000,448499078,C & M Asesor√≠a y Consultor√≠a S.A.S- BIC absorb...,830061474,¬ìREALIZAR LA INTERVENTOR√çA INTEGRAL (ADMINISTR...,¬ìREALIZAR LA INTERVENTOR√çA INTEGRAL (ADMINISTR...,{'url': 'https://community.secop.gov.co/Public...,2016
1,FONDO ROTATORIO,8605110716,Distrito Capital de Bogot√°,No Definido,Interventor√≠a,Concurso de m√©ritos abierto,2016-08-04T00:00:00.000,2016-07-25T00:00:00.000,2016-12-31T00:00:00.000,57482000,PANIVI DIEZ,No Definido,CONTRATAR LA INTERVENTOR√çA T√âCNICA; ADMINISTRA...,CONTRATAR LA INTERVENTOR√çA T√âCNICA; ADMINISTRA...,{'url': 'https://community.secop.gov.co/Public...,2016
2,FUERZA AEROESPACIAL COLOMBIANA,899999102,Distrito Capital de Bogot√°,Bogot√°,Interventor√≠a,Concurso de m√©ritos abierto,2016-11-02T00:00:00.000,2016-11-01T00:00:00.000,2018-03-31T00:00:00.000,526587388,MEDINA & RIVERA INGENIEROS ASOCIADOS S.A.S.,830013230,INTERVENTOR√çA T√âCNICA; ADMINISTRATIVA; FINANCI...,INTERVENTOR√çA T√âCNICA; ADMINISTRATIVA; FINANCI...,{'url': 'https://community.secop.gov.co/Public...,2016
3,FUERZA AEROESPACIAL COLOMBIANA,899999102,Distrito Capital de Bogot√°,Bogot√°,Interventor√≠a,Concurso de m√©ritos abierto,2016-11-02T00:00:00.000,2016-11-01T00:00:00.000,2018-03-31T00:00:00.000,526587388,MEDINA & RIVERA INGENIEROS ASOCIADOS S.A.S.,830013230,INTERVENTOR√çA T√âCNICA; ADMINISTRATIVA; FINANCI...,INTERVENTOR√çA T√âCNICA; ADMINISTRATIVA; FINANCI...,{'url': 'https://community.secop.gov.co/Public...,2016
4,FONDO DE VIGILANCIA Y SEGURIDAD DE BOGOT√Å D.C ...,860526499,No Definido,No Definido,Interventor√≠a,Concurso de m√©ritos abierto,2017-02-10T00:00:00.000,2017-01-17T00:00:00.000,2017-10-16T00:00:00.000,893297074,CONSORCIO CANTON,9007946104,El contratista se obliga con la SCJ a prestar ...,El contratista se obliga con la SCJ a prestar ...,{'url': 'https://community.secop.gov.co/Public...,2017
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
11201,MUNICIPIO DE TAME,800102801,Arauca,Tame,Interventor√≠a,Concurso de m√©ritos abierto,2025-10-08T00:00:00.000,2025-10-14T00:00:00.000,2025-12-28T00:00:00.000,74115125,CCO GROUP SAS,9014822138,INTERVENTORIA TECNICA; ADMINISTRATIVA; FINANCI...,INTERVENTORIA TECNICA; ADMINISTRATIVA; FINANCI...,{'url': 'https://community.secop.gov.co/Public...,2025
11202,MUNICIPIO DE FIRAVITOBA,891856288,Boyac√°,Firavitoba,Interventor√≠a,Concurso de m√©ritos abierto,2025-09-23T00:00:00.000,2025-10-16T00:00:00.000,2026-12-16T00:00:00.000,57738000,Mercedes Cubides,40386691,INTERVENTOR√çA T√âCNICA; ADMINISTRATIVA; FINANCI...,INTERVENTOR√çA T√âCNICA; ADMINISTRATIVA; FINANCI...,{'url': 'https://community.secop.gov.co/Public...,2025
11203,INVIAS,800215807,Distrito Capital de Bogot√°,Bogot√°,Interventor√≠a,Concurso de m√©ritos abierto,2025-09-04T00:00:00.000,2025-10-02T00:00:00.000,2025-12-31T00:00:00.000,3300000000,CONSORCIO APPLUS VIAL 010,No Definido,INTERVENTOR√çA INTEGRAL DE LA OPERACI√ìN; MANTEN...,INTERVENTOR√çA INTEGRAL DE LA OPERACI√ìN; MANTEN...,{'url': 'https://community.secop.gov.co/Public...,2025
11204,GOBERNACION DE NARI√ëO,800103923,Nari√±o,Pasto,Interventor√≠a,Concurso de m√©ritos abierto,2025-09-01T00:00:00.000,2025-10-20T00:00:00.000,2026-04-20T00:00:00.000,148535321,CONSORCIO PTAR OSPINA 2025,No Definido,INTERVENTOR√çA T√âCNICA; ADMINISTRATIVA; FINANCI...,INTERVENTOR√çA T√âCNICA; ADMINISTRATIVA; FINANCI...,{'url': 'https://community.secop.gov.co/Public...,2025


In [11]:
df_total.info()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 11206 entries, 0 to 11205
Data columns (total 16 columns):
 #   Column                        Non-Null Count  Dtype 
---  ------                        --------------  ----- 
 0   nombre_entidad                11206 non-null  object
 1   nit_entidad                   11206 non-null  object
 2   departamento                  11206 non-null  object
 3   ciudad                        11206 non-null  object
 4   tipo_de_contrato              11206 non-null  object
 5   modalidad_de_contratacion     11206 non-null  object
 6   fecha_de_firma                11206 non-null  object
 7   fecha_de_inicio_del_contrato  10897 non-null  object
 8   fecha_de_fin_del_contrato     11206 non-null  object
 9   valor_del_contrato            11206 non-null  object
 10  proveedor_adjudicado          11206 non-null  object
 11  documento_proveedor           11206 non-null  object
 12  descripcion_del_proceso       11206 non-null  object
 13  objeto_del_contr