#Maestría en "Analítica de Datos"
---
Nombre: Juan Carlos Díaz González

Código: XXX
Fecha: agosto 28 de 2025
---
Descripción: Este libro trabaja un ejercicio de procesamiento en paralelo

#1.Cargar librerías

In [1]:
import pandas as pd
import numpy as np
import os

In [2]:
from google.colab import drive
drive.mount('/content/drive')

Mounted at /content/drive


In [3]:
url_folder_csv="/content/drive/MyDrive/BIG_DATA/tutelas_con_providencias"

# 2.Carga/obtención de información

In [7]:
# Lista de archivos
listado_archivos = [f for f in os.listdir(url_folder_csv) if f.endswith(".csv")]
print(listado_archivos)

['2021.csv', '2022.csv', '2023.csv', '2024.csv', '2025.csv']


In [8]:
# Crear estructura del Dataframe
columnas_nombre=[
    "clasificacion",
    "num_expediente",
    "fecha_radica",
    "demandante",
    "demandado",
    "primera_instancia",
    "segunda_instancia",
    "num_23Digitos",
    "providencia",
    "fechaSentencia"
]

df_tutelas = pd.DataFrame(columns=columnas_nombre)
display(df_tutelas)

Unnamed: 0,clasificacion,num_expediente,fecha_radica,demandante,demandado,primera_instancia,segunda_instancia,num_23Digitos,providencia,fechaSentencia


##2.a.Procesamiento secuencial (uno tras otro)

In [12]:
# Cargar los datos de los archivos en el Dataframe

df_list=[]  # Lista de df resultante de los datos de cada uno de los csv
for archivo_nombre in listado_archivos:
    ruta_archivo= os.path.join(url_folder_csv, archivo_nombre)   # Ruta completa del archivo
    print(ruta_archivo)

    df_temporal = pd.read_csv(ruta_archivo, sep=';', header=None, encoding='latin-1', on_bad_lines='skip', low_memory=False)
    # Agregar nombres de columnas al df creado
    df_temporal.columns=columnas_nombre
    if (len(df_temporal.columns)==len(columnas_nombre)):
        df_list.append(df_temporal)
        print (f"archivo {archivo_nombre} cargado exitosamente")
    else:
        print(f"archivo no trabajado {archivo_nombre} no tiene 10 columnas")

#------- una vez termine de cargar todos los CSV combinar en el dataframe df_tutelas
if df_list:
    df_tutelas1 = pd.concat(df_list, ignore_index=True)      # ignore_index para que no repita los índices de los diferentes archivos
    # remplazar las palabras "NULL" por none
    df_tutelas1.replace ("NULL", None, inplace=True)
    display(df_tutelas1.head())

/content/drive/MyDrive/BIG_DATA/tutelas_con_providencias/2021.csv
archivo 2021.csv cargado exitosamente
/content/drive/MyDrive/BIG_DATA/tutelas_con_providencias/2022.csv
archivo 2022.csv cargado exitosamente
/content/drive/MyDrive/BIG_DATA/tutelas_con_providencias/2023.csv
archivo 2023.csv cargado exitosamente
/content/drive/MyDrive/BIG_DATA/tutelas_con_providencias/2024.csv
archivo 2024.csv cargado exitosamente
/content/drive/MyDrive/BIG_DATA/tutelas_con_providencias/2025.csv
archivo 2025.csv cargado exitosamente


Unnamed: 0,clasificacion,num_expediente,fecha_radica,demandante,demandado,primera_instancia,segunda_instancia,num_23Digitos,providencia,fechaSentencia
0,ï»¿Acciones de Tutela,T8531729,2021-12-16 00:00:00,VAZQUEZ CUADROS BAYRON EMILIO Y OTROS EN REPRE...,SOCIEDAD DE ACTIVOS ESPECIALES S.A.E. S.A.S.,"BOGOTA,CUNDINAMARCA, TRIBUNAL SUPERIOR DE BOGO...",--,--,--,
1,Acciones de Tutela,T8531726,2021-12-16 00:00:00,ESCORCIA JORGE ARMANDO,ALCALDIA MUNICIPAL DE SANTA LUCIA,"SANTA LUCIA,ATLANTICO, JUZGADO 1 PROMISCUO MUN...","SABANALARGA,ATLANTICO, JUZGADO 2 PROMISCUO DEL...",--,--,
2,Acciones de Tutela,T8531728,2021-12-16 00:00:00,ARCINIEGAS MEDRANO CLEMENCIA,COLPENCIONES Y OTRO,"BARRANQUILLA,ATLANTICO, JUZGADO 11 LABORAL DEL...","BARRANQUILLA,ATLANTICO, TRIBUNAL SUPERIOR SALA...",--,T-274/22,2022-07-28 00:00:00.000
3,Acciones de Tutela,T8531723,2021-12-16 00:00:00,SERRANO ROJAS CAMILO ANDRES,SECRETARIA DE MOVILIDAD DE CAQUEZA,"CAQUEZA,CUNDINAMARCA, JUZGADO 1 PROMISCUO MUNI...",--,--,--,
4,Acciones de Tutela,T8531727,2021-12-16 00:00:00,GOMEZ QUINTERO EDILSA MARIA,CAJACOPI EPS Y OTRO,"CURUMANI,CESAR, JUZGADO PROMISCUO MUNICIPAL","CHIRIGUANA,CESAR, JUZGADO PENAL DEL CIRCUITO",--,--,


##2.b. Procesamiento en paralelo (todos al tiempo)

In [10]:
from concurrent.futures import ThreadPoolExecutor, as_completed

In [14]:
def cargar_data_desde_archivo_csv (ruta_archivo):
    try:
        df_temporal = pd.read_csv(ruta_archivo, sep=';', header=None, encoding='latin-1', on_bad_lines='skip', low_memory=False)
        # Agregar nombres de columnas al df creado
        df_temporal.columns=columnas_nombre
        if (len(df_temporal.columns)==len(columnas_nombre)):
            print (f"archivo {os.path.basename(ruta_archivo)} cargado exitosamente")
            return df_temporal
        else:
            print(f"archivo no trabajado {os.path.basename(ruta_archivo)} no tiene 10 columnas")
            return None
    except Exception as e:
        print(f"Error al procesar el archivo: {os.path.basename(ruta_archivo)}: {str(e)}")
        return None

In [15]:
df_list=[]  # Lista de df resultante de los datos de cada uno de los csv
with ThreadPoolExecutor() as executor:
    future_to_file = {executor.submit(cargar_data_desde_archivo_csv, os.path.join(url_folder_csv, archivo_nombre)):archivo_nombre for archivo_nombre in listado_archivos}
    for future in as_completed(future_to_file):
        df = future.result()
        if df is not None:
            df_list.append(df)

#------- una vez termine de cargar todos los CSV combinar en el dataframe df_tutelas
if df_list:
    df_tutelas2 = pd.concat(df_list, ignore_index=True)      # ignore_index para que no repita los índices de los diferentes archivos
    # remplazar las palabras "NULL" por none
    df_tutelas2.replace ("NULL", None, inplace=True)
    display(df_tutelas2.head())

archivo 2021.csv cargado exitosamente
archivo 2022.csv cargado exitosamente
archivo 2025.csv cargado exitosamente
archivo 2023.csv cargado exitosamente
archivo 2024.csv cargado exitosamente


Unnamed: 0,clasificacion,num_expediente,fecha_radica,demandante,demandado,primera_instancia,segunda_instancia,num_23Digitos,providencia,fechaSentencia
0,ï»¿Acciones de Tutela,T8531729,2021-12-16 00:00:00,VAZQUEZ CUADROS BAYRON EMILIO Y OTROS EN REPRE...,SOCIEDAD DE ACTIVOS ESPECIALES S.A.E. S.A.S.,"BOGOTA,CUNDINAMARCA, TRIBUNAL SUPERIOR DE BOGO...",--,--,--,
1,Acciones de Tutela,T8531726,2021-12-16 00:00:00,ESCORCIA JORGE ARMANDO,ALCALDIA MUNICIPAL DE SANTA LUCIA,"SANTA LUCIA,ATLANTICO, JUZGADO 1 PROMISCUO MUN...","SABANALARGA,ATLANTICO, JUZGADO 2 PROMISCUO DEL...",--,--,
2,Acciones de Tutela,T8531728,2021-12-16 00:00:00,ARCINIEGAS MEDRANO CLEMENCIA,COLPENCIONES Y OTRO,"BARRANQUILLA,ATLANTICO, JUZGADO 11 LABORAL DEL...","BARRANQUILLA,ATLANTICO, TRIBUNAL SUPERIOR SALA...",--,T-274/22,2022-07-28 00:00:00.000
3,Acciones de Tutela,T8531723,2021-12-16 00:00:00,SERRANO ROJAS CAMILO ANDRES,SECRETARIA DE MOVILIDAD DE CAQUEZA,"CAQUEZA,CUNDINAMARCA, JUZGADO 1 PROMISCUO MUNI...",--,--,--,
4,Acciones de Tutela,T8531727,2021-12-16 00:00:00,GOMEZ QUINTERO EDILSA MARIA,CAJACOPI EPS Y OTRO,"CURUMANI,CESAR, JUZGADO PROMISCUO MUNICIPAL","CHIRIGUANA,CESAR, JUZGADO PENAL DEL CIRCUITO",--,--,
