In [8]:
import pandas as pd
import time  # Para medir el tiempo de carga (opcional)

def cargar_base_datos(ruta):
    print("Iniciando la carga del archivo 'base_final_s.csv'... Por favor, espera.")
    
    try:
        # Medir el tiempo de carga (opcional)
        inicio = time.time()
        
        # Cargar el archivo CSV
        base = pd.read_csv(ruta, sep='|', engine='c', low_memory=False)
        
        # Tiempo transcurrido (opcional)
        fin = time.time()
        tiempo_carga = fin - inicio
        
        print(f"Carga completada exitosamente en {tiempo_carga:.2f} segundos.")
        print(f"Dimensiones del DataFrame: {base.shape}")
        return base
    
    except FileNotFoundError:
        print("ERROR: No se pudo cargar el archivo. El archivo 'base_final_s.csv' no se encuentra en la ruta especificada.")
        return None
    except pd.errors.EmptyDataError:
        print("ERROR: No se pudo cargar el archivo. El archivo 'base_final_s.csv' está vacío.")
        return None
    except pd.errors.ParserError:
        print("ERROR: No se pudo cargar el archivo. Hay un problema con el formato del CSV (separador o estructura).")
        return None
    except MemoryError:
        print("ERROR: No se pudo cargar el archivo. El archivo es demasiado grande para la memoria disponible.")
        return None
    except Exception as e:
        print(f"ERROR: No se pudo cargar el archivo. Detalle del error: {str(e)}")
        return None

# Ruta al archivo
ruta_archivo = '../01_Datos/base_final_s.csv'

# Ejecutar la carga
base = cargar_base_datos(ruta_archivo)

# Verificar si se cargó correctamente
if base is not None:
    print("")
    
else:
    print("No se puede proceder porque la carga falló.")

Iniciando la carga del archivo 'base_final_s.csv'... Por favor, espera.
Carga completada exitosamente en 37.99 segundos.
Dimensiones del DataFrame: (5340181, 24)



In [1]:
import asyncio
import nest_asyncio
from playwright.async_api import async_playwright
import requests
from bs4 import BeautifulSoup
import pandas as pd

# Cargamos la información necesaria para el procesamiento
base = pd.read_csv('../01_Datos/base_final_s.csv', sep='|') #,engine ='c', low_memory=False

# Aplicamos nest_asyncio
nest_asyncio.apply()

async def download_csv_excel_from_divipola(playwright) -> pd.DataFrame:
    browser = await playwright.chromium.launch(headless=True)
    context = await browser.new_context()
    page = await context.new_page()
    await page.goto("https://www.datos.gov.co/Mapas-Nacionales/DIVIPOLA-C-digos-municipios/gdxc-w37w/about_data")
    
    await page.get_by_role("button", name="Exportar").click()
    await page.get_by_test_id("export-type-select").locator("#selected-text").click()
    await page.get_by_role("option", name="CSV para Excel", exact=True).locator("div").nth(1).click()
    
    async with page.expect_download() as download_info:
        await page.get_by_test_id("export-download-button").click()
    download = await download_info.value
    
    csv_path = await download.path()
    df = pd.read_csv(csv_path)
    
    await context.close()
    await browser.close()
    
    return df

async def main():
    global df
    async with async_playwright() as playwright:
        df = await download_csv_excel_from_divipola(playwright)
        print(df.head())

await main()
base

   Código Departamento Nombre Departamento  Código Municipio Nombre Municipio  \
0                    5           ANTIOQUIA              5001         MEDELLÍN   
1                    5           ANTIOQUIA              5002        ABEJORRAL   
2                    5           ANTIOQUIA              5004         ABRIAQUÍ   
3                    5           ANTIOQUIA              5021       ALEJANDRÍA   
4                    5           ANTIOQUIA              5030            AMAGÁ   

  Tipo: Municipio / Isla / Área no municipalizada    longitud   Latitud  
0                                       Municipio  -75,581775  6,246631  
1                                       Municipio  -75,428739  5,789315  
2                                       Municipio  -76,064304  6,632282  
3                                       Municipio  -75,141346  6,376061  
4                                       Municipio  -75,702188  6,038708  


Unnamed: 0.1,Unnamed: 0,Tipo_Entidad,Nombre_Tipo_Entidad,Codigo_Entidad,Nombre_Entidad,Fecha_Corte,Tipo_de_persona,Sexo,Tamaño_de_empresa,Tipo_de_crédito,...,margen_adicional,Montos_desembolsados,Numero_de_creditos_desembolsados,Grupo_Etnico,Antiguedad_de_la_empresa,Tipo_de_Tasa,Rango_monto_desembolsado,Clase_deudor,Codigo_CIIU,Codigo_Municipio
0,7,1,BC-ESTABLECIMIENTO BANCARIO,39,Banco Davivienda,01/12/2023,Natural,Masculino,Microempresa,Comercial ordinario,...,0.0,231573,6,Sin información (1),No aplica(1),FS,Hasta 1 SMLMV,Deudor de la entidad,10.0,17001.0
1,16,1,BC-ESTABLECIMIENTO BANCARIO,39,Banco Davivienda,08/12/2023,Natural,Masculino,No aplica,Consumo,...,0.0,6697643.3,1,Sin información (1),No aplica(1),FS,Mayor a 5 SMLMV menor o igual a 10 SMLMV,Deudor de la entidad,10.0,68547.0
2,18,1,BC-ESTABLECIMIENTO BANCARIO,6,Itaú,01/12/2023,Natural,Masculino,No aplica,Consumo,...,0.0,13744221.05,19,Sin información (1),No aplica(1),FS,Mayor a 1 SMLMV menor o igual a 3 SMLMV,Deudor de la entidad,10.0,68001.0
3,23,1,BC-ESTABLECIMIENTO BANCARIO,53,Banco W S.A.,08/12/2023,Natural,Femenino,Microempresa,Crédito productivo,...,0.0,1625400,1,Sin información (1),0 a 5 años,FS,Mayor a 1 SMLMV y menor o igual a 2 SMLMV,Deudor nuevo en la entidad,1410.0,41551.0
4,34,1,BC-ESTABLECIMIENTO BANCARIO,42,Scotiabank Colpatria S.A.,22/12/2023,Natural,Masculino,No aplica,Consumo,...,0.0,2172362,10,Sin información (1),No aplica(1),FS,Mayor a 1 SMLMV menor o igual a 3 SMLMV,Deudor de la entidad,4321.0,13001.0
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
5340176,40814415,1,BC-ESTABLECIMIENTO BANCARIO,30,Banco Caja Social S.A.,22/12/2023,Jurídica,No aplica,Microempresa,Comercial ordinario,...,0.0,838032.11,8,No aplica,No aplica(1),FS,Hasta 1 SMLMV,Deudor de la entidad,6201.0,68001.0
5340177,40814418,4,CF-COMPAÑÍA DE FINANCIAMIENTO,26,Tuya,01/12/2023,Natural,Masculino,No aplica,Consumo,...,0.0,17000,1,Sin información (1),No aplica(1),FS,Hasta 1 SMLMV,Deudor de la entidad,81.0,5579.0
5340178,40814432,1,BC-ESTABLECIMIENTO BANCARIO,7,Bancolombia,15/12/2023,Jurídica,No aplica,Gran empresa,Comercial ordinario,...,0.0,1236381,6,No aplica,más de 5 y hasta 10 años,FS,Hasta 1 SMLMV,Deudor de la entidad,4651.0,25214.0
5340179,40814433,1,BC-ESTABLECIMIENTO BANCARIO,7,Bancolombia,29/12/2023,Natural,Femenino,No aplica,Consumo,...,0.0,3080000,9,Sin información (1),No aplica(1),FS,Hasta 1 SMLMV,Deudor de la entidad,10.0,25785.0
