# **Análisis contratación Escuela Superior de Administración Pública 2020-2024**

## Introducción

En este documento se presenta la aplicación de diferentes metodologías estudiadas en el curso de Programación II de la Maestría en Inteligencia de Negocios de la Universidad de Externado de Colombia. Lo anterior, se da en un ambiente de análisis y comprensión del fenómeno de la contratación pública a partir de la exploración de  diferentes escenarios aplicados a la realidad de las Entidades Públicas de Colombia. 

En este sentido, se exploran y analizan los resultados del modelo de efectos fijos del panel de datos de la contratación de la Escuela Superior de Administración Pública como individuo de análisis del 2020 a 2024 según los datos abiertos publicados por la Agencia Nacional de Contratación Pública - Colombia Compra Efienciete sobre el data set [SECOP II - Contratos Electrónicos](https://www.datos.gov.co/Gastos-Gubernamentales/SECOP-II-Contratos-Electr-nicos/jbjy-vk9h/about_data).

 De esta forma, se exploran ambientes y técnicas propicios en el contexto del aprendizaje sobre programación y en la aplicación de métodos estadísticos para la profundización y reconocimiento del fenómeno de estudio a la luz del procesamiento, depuración y análisis de la información, todos ellos necesarios en el actual contexto en donde es indispensable el uso de herramientas para la gestión de los datos y de la información en las organizaciones para el análisis y la toma de decisiones sobre los fenónemos que les afectan.

## Objetivo general

Analizar el efecto que tiene el tiempo de ejecución del proceso de contratación sobre el valor total de los contratos en la Escuela Superior de Administración Pública.

## Objetivos específicos

*$1.$* Explorar métodos de limpieza, depuración y automatización de la bases datos de contratos de la Escuela Superior de Administración Pública a partir del uso y aprovechamiento de los datos e información de del data set [SECOP II - Contratos Electrónicos](https://www.datos.gov.co/Gastos-Gubernamentales/SECOP-II-Contratos-Electr-nicos/jbjy-vk9h/about_data)


*$2.$* Aplicar técnicas para medir el efecto del tiempo de ejecución de la contratación pública sobre el valor de los contratos celebrados por la Escuela Superior de Administración Pública durante el período 2020-2024

*$3.$* Analizar el fenómeno de la contratación pública con Colombia con el propósito de brindar recomendaciones sobre el buen manejo de los recursos públicos a los sujetos responsables de su ejecución

## Antecedentes

A partir de la adopción de los principios de la Función Administrativa (Art. 209) de la Constitución Política de 1991, el Sector Público Colombiano ha desarrollado diferentes acciones para sinterizar un Sistema de Gestión que responda a las necesidades de articulación de los elementos que intervienen al momento de dirigir la gestión pública  hacia “el mejor desempeño institucional y a la consecución de resultados para la satisfacción de las necesidades y el goce efectivo de los derechos de los ciudadanos, en el marco de la legalidad y la integridad” (DAFP, 2019, p. 19).
<!--  -->
El Sistema de Gestión vigente (Art. 133 - Ley 1753 de 2015) integra el Sistema de Desarrollo Administrativo (Ley 489 de 1998), el Sistema de Gestión de la Calidad (Ley 872 de 2003) y se articula con el Sistema de Control Interno (Ley 87 de 1993 y del Art. 27 al 19 de la Ley 489); que finalmente constituyen el MIPG como el mecanismo que facilita la integración y articulación de los Sistemas de Planeación y Gestión que hasta el momento existían en la entidades públicas colombianas (Decreto 1499 de 2017), integró en 2021 a partir del la Política de Gestión y desempeño **Compras y Contatación Pública** con el fin de que las entidades estatales gestionen adecuadamente sus compras y contrataciones públicas a través de herramientas tecnológicas, lineamientos normativos, documentos estándar, técnicas de abastecimiento estratégico e instrumentos de agregación de demanda. 

De esta forma, con esta política la Agencia Nacional de Contratación Pública - Colombia Compra Efienciente, proyecta el suministro de una herramienta como lo es el SECOP II para que las entidades estatales  se alinien con el propósito de generar buenas mejores prácticas en el abastecimiento y contratación y con ello fortalecer la satisfacción de las necesidades públicas (eficacia), con menores recursos (eficiencia), altos estándares de calidad, pluralidad de oferentes y garantía de transparencia y rendición de cuentas.

Sin embargo, aun cuando la integración de lineamientos en materia de contratación pública sea un propósito de la administración pública conducente al buen manejo del prespuesto y a la planeación de las finanzas públicas, esto resulta en un reto su implementación y aprovechamiento para la toma de decisones en el ámbito de la contratación pública. Los procedimientos que rigen la contratación deben verse reflejados en la planeación de la contratación y se deben implementar en contextos de alta incertidumbre que las organizaciones constantemente reflejan.

En este sentido, para evidenciar lo anteriormente expuesto, se trata de analizar el efecto que tiene el tiempo de ejecución de los procesos de contratación sobre el valor de la contratación de la Escuela Superior Pública, vista en este análisis como un individuo sobre el el cual es posible su estudio a la luz de los objetivos planteados en este proyecto y según la información disponible en el data set datos abiertos publicados por la Agencia Nacional de Contratación Pública - Colombia Compra Efienciete sobre el data set [SECOP II - Contratos Electrónicos] (https://www.datos.gov.co/Gastos-Gubernamentales/)


## Metodología

### _Libreriras_

In [131]:
%pip install sodapy
%pip install seaborn
%pip install pandas
%pip install plotly
%pip install linearmodels
%pip install scikit-learn
%pip install seaborn statsmodels patsy matplotlib


^C
Note: you may need to restart the kernel to use updated packages.
Note: you may need to restart the kernel to use updated packages.
Note: you may need to restart the kernel to use updated packages.
Note: you may need to restart the kernel to use updated packages.
Note: you may need to restart the kernel to use updated packages.


In [1]:
#Pandas y Nunmpy
import pandas as pd
import numpy as np
#Transformación de fecha
from datetime import datetime
#Gráficas
#import seaborn as sns
import matplotlib as mpl
import matplotlib.pyplot as plt
from datetime import datetime
import plotly.express as px
import plotly.graph_objects as go
#Se importa la clase PanelOLS, que se utiliza para realizar regresiones lineales en modelos de panel
# o conjuntos de series temporales cruzadas y estimar relaciones lineales.
#from linearmodels.panel import PanelOLS
import pandas as pd
#Se importa la biblioteca "statsmodels" y la renombra como "sm" 
#Statsmodels es una biblioteca que proporciona herramientas y modelos estadísticos para el análisis 
#de datos en Python. Se utiliza comúnmente para realizar análisis de regresión, 
#series de tiempo y otras técnicas estadísticas.
#import statsmodels.api as sm

### _Exploración de la base de datos_

#### _Cargar base de datos_

Se utiliza la base de datos contratos_secop_esap del data set [SECOP II - Contratos Electrónicos] (https://www.datos.gov.co/Gastos-Gubernamentales/)


In [2]:
ar = r'C:\Users\Astrandrea\Documents\AnaConESAP\datos\raw\contratos_secop_esap.csv'

In [4]:
pd.set_option("display.max.columns", 999)
# Se cambia la configuración para ver los números de la forma 1.000.000
pd.options.display.float_format = "{:,.0f}".format
secop = pd.read_csv(ar)
#secop

#### _Descripción de la base de datos_

La base de datos tiene 14.006 contratos y 73 columnas

In [5]:
secop.shape

(14006, 73)

La base de datos tiene 21 variables *numéricas* y 52 variables de *texto*. 

In [6]:
secop.info()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 14006 entries, 0 to 14005
Data columns (total 73 columns):
 #   Column                                                            Non-Null Count  Dtype 
---  ------                                                            --------------  ----- 
 0   Unnamed: 0                                                        14006 non-null  int64 
 1   nombre_entidad                                                    14006 non-null  object
 2   nit_entidad                                                       14006 non-null  int64 
 3   departamento                                                      14006 non-null  object
 4   ciudad                                                            14006 non-null  object
 5   localizaci_n                                                      14006 non-null  object
 6   orden                                                             14006 non-null  object
 7   sector                                  

In [7]:
secop.columns

Index(['Unnamed: 0', 'nombre_entidad', 'nit_entidad', 'departamento', 'ciudad',
       'localizaci_n', 'orden', 'sector', 'rama', 'entidad_centralizada',
       'proceso_de_compra', 'id_contrato', 'referencia_del_contrato',
       'estado_contrato', 'codigo_de_categoria_principal',
       'descripcion_del_proceso', 'tipo_de_contrato',
       'modalidad_de_contratacion', 'justificacion_modalidad_de',
       'fecha_de_firma', 'fecha_de_inicio_del_contrato',
       'fecha_de_fin_del_contrato', 'condiciones_de_entrega',
       'tipodocproveedor', 'documento_proveedor', 'proveedor_adjudicado',
       'es_grupo', 'es_pyme', 'habilita_pago_adelantado', 'liquidaci_n',
       'obligaci_n_ambiental', 'obligaciones_postconsumo', 'reversion',
       'origen_de_los_recursos', 'destino_gasto', 'valor_del_contrato',
       'valor_de_pago_adelantado', 'valor_facturado',
       'valor_pendiente_de_pago', 'valor_pagado', 'valor_amortizado',
       'valor_pendiente_de', 'valor_pendiente_de_ejecucion', 'e

#### _Limpieza de la base de datos_

_Arreglo de fechas_

In [8]:
# Lista de columnas para convertir a datetime
columnas_fecha = ['fecha_de_firma', 'fecha_de_inicio_del_contrato', 'fecha_de_fin_del_contrato',
                  'fecha_de_inicio_de_ejecucion', 'fecha_de_fin_de_ejecucion', 
                  'fecha_inicio_liquidacion', 'fecha_fin_liquidacion']

# Iterar sobre cada columna y aplicar la transformación
for col in columnas_fecha:
    secop[col] = secop[col].str.split('T').str[0]
    secop[col] = pd.to_datetime(secop[col], format='%Y-%m-%d', errors='coerce')

_Extraer el año_

In [9]:
columnas_fecha = [
    'fecha_de_firma', 'fecha_de_inicio_del_contrato', 'fecha_de_fin_del_contrato',
    'fecha_de_inicio_de_ejecucion', 'fecha_de_fin_de_ejecucion',
    'fecha_inicio_liquidacion', 'fecha_fin_liquidacion'
]
# Asegurar que las columnas de fecha son del tipo datetime
for col in columnas_fecha:
    secop[col] = pd.to_datetime(secop[col], errors='coerce')
# Crear nuevas columnas para el año
for col in columnas_fecha:
    secop[f'ano_{col}'] = secop[col].dt.year

_Semestre_

In [10]:
# Asegurándonos de que 'fecha_de_firma' esté en formato datetime
secop['fecha_de_firma'] = pd.to_datetime(secop['fecha_de_firma'])
# Crear la columna 'periodo' con la lógica condicional
secop['periodo'] = secop['fecha_de_firma'].apply(lambda x: 1 if x.month < 7 or (x.month == 7 and x.day <= 31) else 2)


In [11]:
# Primero, convertir ambas columnas a tipo de dato string (cadena de texto)
secop['ano_fecha_de_firma_str'] = secop['ano_fecha_de_firma'].astype(str)
secop['periodo_str'] = secop['periodo'].astype(str)
# Ahora, crear la nueva columna 'periodo' concatenando las dos cadenas con un guion entre ellas
secop['periodo_ano'] = secop['ano_fecha_de_firma_str'] + "-" + secop['periodo_str']

In [12]:
# Contar el número de ocurrencias de cada valor único en la columna 'periodo'
conteo_periodo = secop['periodo_ano'].value_counts()
# Convertir el conteo en un DataFrame para una mejor visualización
tabla_conteo_periodo = conteo_periodo.reset_index().rename(columns={'index': 'Periodo', 'periodo': 'Conteo'})
# Convertir la columna 'periodo_ano' a tipo categórico
secop['periodo_ano'] = secop['periodo_ano'].astype('category')
# Verificar el cambio de tipo de dato
print(secop['periodo_ano'].dtypes)
# Mostrar la tabla de conteo
print(tabla_conteo_periodo)

category
  periodo_ano  count
0      2023-1   2454
1      2022-1   2381
2      2021-1   2168
3      2020-2   1833
4      2024-1   1426
5      2021-2   1171
6      2023-2   1146
7      2020-1    791
8      2022-2    636


_Dirección Territorial_

In [13]:
mapeo_nit_entidad = {
    899999054: "Sede_Principal_ESAP",
    800117519: "Antioquia",
    800117522: "Atlántico_Cesar_Magdalena_La_Guajira",
    800248529: "Bolivar_Córdoba_Sucre_San Andrés",
    800117524: "Boyacá_Casanare",
    800117525: "Caldas",
    800117537: "Cauca",
    830011682: "Cundinamarca",
    813006956: "Huila_Caquetá_Putumayo",
    800117530: "Meta_Guainía_Guaviare_Vaupés_Vichada_Amazonas",
    800117534: "Nariño_Alto Putumayo",
    800145876: "Norte_Santander - Arauca",
    800117537: "Quindío_Risaralda",
    800117540: "Santander",
    800117541: "Tolima",
    800117545: "Valle"
}

In [14]:
secop['nombre_sede'] = secop['nit_entidad'].apply(lambda x: mapeo_nit_entidad.get(x, 'Otro'))

In [15]:
# Contar el número de ocurrencias de cada valor único en la columna 'nombre_sede'
conteo_nombre_sede = secop['nombre_sede'].value_counts()
# Convertir el conteo en un DataFrame para una mejor visualización
tabla_conteo_nombre_sede = conteo_nombre_sede.reset_index().rename(columns={'index': 'Nombre_Sede', 'nombre_sede': 'Conteo'})
# Mostrar la tabla de conteo
print(tabla_conteo_nombre_sede)

                                           Conteo  count
0                             Sede_Principal_ESAP   5861
1                Bolivar_Córdoba_Sucre_San Andrés    736
2                            Nariño_Alto Putumayo    634
3                          Huila_Caquetá_Putumayo    607
4                                    Cundinamarca    604
5   Meta_Guainía_Guaviare_Vaupés_Vichada_Amazonas    602
6                                       Antioquia    598
7            Atlántico_Cesar_Magdalena_La_Guajira    561
8                        Norte_Santander - Arauca    550
9                                 Boyacá_Casanare    539
10                                           Otro    497
11                                         Caldas    470
12                                      Santander    463
13                              Quindío_Risaralda    454
14                                         Tolima    424
15                                          Valle    406


#### _Análisis exploratorio_

##### _Estadísticas descriptivas_

In [16]:
secop.describe()

Unnamed: 0.1,Unnamed: 0,nit_entidad,fecha_de_firma,fecha_de_inicio_del_contrato,fecha_de_fin_del_contrato,valor_del_contrato,valor_de_pago_adelantado,valor_facturado,valor_pendiente_de_pago,valor_pagado,valor_amortizado,valor_pendiente_de,valor_pendiente_de_ejecucion,saldo_cdp,saldo_vigencia,dias_adicionados,presupuesto_general_de_la_nacion_pgn,sistema_general_de_participaciones,sistema_general_de_regal_as,recursos_propios_alcald_as_gobernaciones_y_resguardos_ind_genas_,recursos_de_credito,recursos_propios,codigo_entidad,codigo_proveedor,fecha_de_inicio_de_ejecucion,fecha_de_fin_de_ejecucion,fecha_inicio_liquidacion,fecha_fin_liquidacion,ano_fecha_de_firma,ano_fecha_de_inicio_del_contrato,ano_fecha_de_fin_del_contrato,ano_fecha_de_inicio_de_ejecucion,ano_fecha_de_fin_de_ejecucion,ano_fecha_inicio_liquidacion,ano_fecha_fin_liquidacion,periodo
count,14006,14006,14006,13859,14006,14006,14006,14006,14006,14006,14006,14006,14006,14006,14006,14006,14006,14006,14006,14006,14006,14006,14006,14006,590,590,140,140,14006,13859,14006,590,590,140,140,14006
mean,7002,843770077,2022-03-28 14:34:19.345994752,2022-03-29 17:50:37.362003200,2022-11-02 15:50:55.090675456,44581422,188643,9240378,36927880,7648844,0,188643,36932578,125953767,5653117,5,6803419,0,0,725587,24580,31619619,703134564,710829768,2020-02-13 21:21:21.355932160,2020-12-06 12:24:24.406779648,2023-11-11 23:39:25.714285824,2024-07-25 19:12:00,2022,2022,2022,2020,2020,2023,2024,1
min,0,800117519,2020-01-02 00:00:00,2020-01-01 00:00:00,2020-01-11 00:00:00,0,0,0,-1109333,0,0,0,-1109333,0,0,0,0,0,0,0,0,0,701255226,0,2020-01-03 00:00:00,2020-01-11 00:00:00,2020-03-17 00:00:00,2020-05-28 00:00:00,2020,2020,2020,2020,2020,2020,2020,1
25%,3501,800117534,2021-03-31 00:00:00,2021-04-07 00:00:00,2021-12-07 00:00:00,7570899,0,0,3105000,0,0,0,3105000,9630000,0,0,0,0,0,0,0,5500000,701255226,705778272,2020-01-23 00:00:00,2020-12-28 00:00:00,2023-08-20 12:00:00,2023-12-29 00:00:00,2021,2021,2021,2020,2020,2023,2023,1
50%,7002,813006956,2022-01-26 00:00:00,2022-01-28 00:00:00,2022-09-25 00:00:00,16086666,0,0,10006667,0,0,0,10006667,25684560,0,0,0,0,0,0,0,12264750,704371061,710658172,2020-02-13 00:00:00,2020-12-31 00:00:00,2023-12-26 12:00:00,2024-04-20 00:00:00,2022,2022,2022,2020,2020,2023,2024,1
75%,10504,899999054,2023-05-05 00:00:00,2023-05-05 00:00:00,2023-12-30 00:00:00,34990525,0,5600000,26655657,3330800,0,0,26694181,60260000,0,0,0,0,0,0,0,31157000,704616416,714997258,2020-02-29 00:00:00,2021-01-01 00:00:00,2024-01-02 00:00:00,2025-01-01 06:00:00,2023,2023,2023,2020,2021,2024,2025,2
max,14005,899999054,2024-04-02 00:00:00,2024-04-03 00:00:00,2033-09-05 00:00:00,37085946644,992145291,5431978076,37085946644,4066064668,0,992145291,37085946644,25975030735,24753469302,953,37085946644,0,0,7802190159,109729667,10468565474,704901107,725844302,2020-12-31 00:00:00,2025-04-17 00:00:00,2028-05-05 00:00:00,2029-05-13 00:00:00,2024,2024,2033,2020,2025,2028,2029,2
std,4043,48115336,,,,474892179,11253695,79668421,465110361,53370937,0,11253695,465110324,494509776,261713111,21,335973549,0,0,65972544,1184323,203762785,1620921,12043759,,,,,1,1,2,0,1,2,2,0


##### _Análisis gráfico_

_Número de contratos ESAP según fecha de firma 2020 - 2024_

In [17]:
# Asegurar que 'fecha_de_firma' es un tipo de dato datetime
secop['fecha_de_firma'] = pd.to_datetime(secop['fecha_de_firma'])
# Agrupar y contar por fecha de firma
conteo_fecha = secop.groupby('fecha_de_firma')['fecha_de_firma'].count().reset_index(name='conteo')
# Crear el gráfico utilizando Plotly
fig = px.line(conteo_fecha, x='fecha_de_firma', y='conteo', title='Número de contratos ESAP según fecha de firma 2020 - 2024')
# Mostrar el gráfico
fig.show()

In [18]:
# Calcular el total del número de contratos por año
total_contratos_por_ano = secop.groupby('ano_fecha_de_firma').size().reset_index(name='total_contratos')
# Crear el gráfico utilizando Plotly
fig = px.bar(total_contratos_por_ano, x='ano_fecha_de_firma', y='total_contratos', 
             color='total_contratos',
             labels={'total_contratos': 'Total de Contratos'},
             title='Número de contratos ESAP según año de firma 2020 - 2024')

# Agregar anotaciones de texto para mostrar el total de contratos por año
fig.update_traces(text=total_contratos_por_ano['total_contratos'], textposition='outside')
# Personalizar el diseño del gráfico
fig.update_layout(
    showlegend=False,
    xaxis=dict(tickmode='linear'),
    template='plotly_white'
)

# Mostrar el gráfico
fig.show()

_Número de contratos ESAP por semestre 2020 - 2024_

In [19]:
# Agrupar por 'ano_fecha_de_firma' y 'periodo', y contar el número de contratos
total_contratos_por_ano_periodo = secop.groupby(['ano_fecha_de_firma', 'periodo']).size().reset_index(name='total_contratos')
# Crear el gráfico utilizando Plotly
import plotly.express as px
fig = px.bar(total_contratos_por_ano_periodo, x='ano_fecha_de_firma', y='total_contratos',
             color='periodo', barmode='group',
             labels={'total_contratos': 'Total de Contratos', 'ano_fecha_de_firma': 'Año de Firma', 'periodo': 'Periodo'},
             title='Número de contratos ESAP según año de firma y periodo')

# Personalizar el diseño del gráfico
fig.update_layout(
    xaxis=dict(tickmode='linear', title='Período de Firma'),
    yaxis=dict(title='Total de Contratos'),
    legend_title='Periodo',
    template='plotly_white'
)
# Mostrar el gráfico
fig.show()

_Número de contratos ESAP por tipo de contrato año 2020 - 2024_

In [20]:
# Agrupar por año y tipo de contrato
tipo_contrato_anio_counts = secop.groupby(['ano_fecha_de_firma', 'tipo_de_contrato']).size().unstack(fill_value=0)

# Crear el gráfico
fig = go.Figure()
for tipo in tipo_contrato_anio_counts.columns:
    fig.add_trace(go.Bar(
        x=tipo_contrato_anio_counts.index,
        y=tipo_contrato_anio_counts[tipo],
        name=tipo
    ))

# Actualizar el diseño del gráfico
fig.update_layout(
    barmode='stack',
    title='Número de contratos ESAP según año de firma por tipo de contrato 2020-2024',
    xaxis_title='Año de Firma',
    yaxis_title='Número de contratos',
    legend_title='Tipo de Contrato'
)

_Número de contratos ESAP por tipo de modalidad año 2020 - 2024_

In [21]:
# Agrupar por año y modalidad, y contrato
modalidad_anio_counts = secop.groupby(['ano_fecha_de_firma', 'modalidad_de_contratacion']).size().unstack(fill_value=0)

# Crear el gráfico
fig = go.Figure()
for modalidad in modalidad_anio_counts.columns:
    fig.add_trace(go.Bar(
        x=modalidad_anio_counts.index,
        y=modalidad_anio_counts[modalidad],
        name=modalidad
    ))

# Actualizar el diseño del gráfico
fig.update_layout(
    barmode='stack',
    title='Número de contratos ESAP según año de firma por modalidad de contrato 2020-2024',
    xaxis_title='Año de Firma',
    yaxis_title='Número de contratos',
    legend_title='Modalidad de contratación'
)

# Mostrar el gráfico
fig.show()

_Número de contratos ESAP por Dirección Territorial año 2020 - 2024_

In [22]:
# Agrupar por año y nombre de sede, y contar
sede_anio_counts = secop.groupby(['ano_fecha_de_firma', 'nombre_sede']).size().unstack(fill_value=0)

# Crear el gráfico
fig = go.Figure()
for sede in sede_anio_counts.columns:
    fig.add_trace(go.Bar(
        x=sede_anio_counts.index,
        y=sede_anio_counts[sede],
        name=sede
    ))

# Actualizar el diseño del gráfico
fig.update_layout(
    barmode='stack',
    title='Número de contratos ESAP según año de firma por sede',
    xaxis_title='Año de Firma',
    yaxis_title='Número de contratos',
    legend_title='Sede'
)

# Mostrar el gráfico
fig.show()

_Tiempo entre la fecha de firma de contrato y fecha fin de contrato ESAP año 2020 - 2024 (días)_

In [23]:
# Calcular el tiempo entre la fecha de firma y la fecha de final del contrato y almacenar en una nueva columna 'tiempo_entre_firma_final'
secop['tiempo_entre_firma_fin_dia'] = secop['fecha_de_fin_del_contrato'] - secop['fecha_de_firma']
# Mostrar información del DataFrame resultante
print(secop[['fecha_de_firma', 'fecha_de_fin_del_contrato', 'tiempo_entre_firma_fin_dia']].head())

  fecha_de_firma fecha_de_fin_del_contrato tiempo_entre_firma_fin_dia
0     2023-03-02                2023-04-01                    30 days
1     2023-09-05                2023-12-16                   102 days
2     2020-08-26                2020-12-31                   127 days
3     2021-04-30                2021-12-04                   218 days
4     2023-08-12                2023-12-26                   136 days


In [24]:
# Calcular la diferencia en días
secop['tiempo_entre_firma_fin_dia'] = (secop['fecha_de_fin_del_contrato'] - secop['fecha_de_firma']).dt.days
# Mostrar el resultado
print(secop[['fecha_de_firma', 'fecha_de_fin_del_contrato', 'tiempo_entre_firma_fin_dia']].head())

  fecha_de_firma fecha_de_fin_del_contrato  tiempo_entre_firma_fin_dia
0     2023-03-02                2023-04-01                          30
1     2023-09-05                2023-12-16                         102
2     2020-08-26                2020-12-31                         127
3     2021-04-30                2021-12-04                         218
4     2023-08-12                2023-12-26                         136


In [25]:
# Mostrar estadísticas descriptivas del tiempo entre firma y fecha final del contrato
resumen_tiempo_firma_fin = secop['tiempo_entre_firma_fin_dia'].describe()
# Mostrar el resumen
print(resumen_tiempo_firma_fin)

count   14,006
mean       219
std        276
min       -460
25%        106
50%        184
75%        275
max      3,970
Name: tiempo_entre_firma_fin_dia, dtype: float64


In [26]:
# Filtrar los registros donde el tiempo entre firma y fin es mayor a 365 días
registros_mayores_365 = secop[secop['tiempo_entre_firma_fin_dia'] > 365]
# Mostrar los resultados
print(registros_mayores_365)

       Unnamed: 0                              nombre_entidad  nit_entidad  \
7               7                  ESAP TERRITORIAL ANTIOQUIA    800117519   
34             34                  ESAP TERRITORIAL ANTIOQUIA    800117519   
58             58                  ESAP TERRITORIAL ANTIOQUIA    800117519   
77             77                  ESAP TERRITORIAL ANTIOQUIA    800117519   
99             99                  ESAP TERRITORIAL ANTIOQUIA    800117519   
...           ...                                         ...          ...   
13780       13780  ESCUELA SUPERIOR DE ADMINISTRACIÓN PUBLICA    899999054   
13799       13799  ESCUELA SUPERIOR DE ADMINISTRACIÓN PUBLICA    899999054   
13832       13832  ESCUELA SUPERIOR DE ADMINISTRACIÓN PUBLICA    899999054   
13929       13929  ESCUELA SUPERIOR DE ADMINISTRACIÓN PUBLICA    899999054   
13930       13930  ESCUELA SUPERIOR DE ADMINISTRACIÓN PUBLICA    899999054   

                     departamento    ciudad                    

In [27]:
registros_menores_1 = secop[secop['tiempo_entre_firma_fin_dia'] < 1]
# Mostrar los resultados
print(registros_menores_1)

       Unnamed: 0                              nombre_entidad  nit_entidad  \
361           361                  ESAP TERRITORIAL ANTIOQUIA    800117519   
695           695                  ESAP TERRITORIAL ATLÁNTICO    800117522   
2952         2952                       ESAP TERRITORIAL META    800117530   
3002         3002                       ESAP TERRITORIAL META    800117530   
3107         3107                       ESAP TERRITORIAL META    800117530   
3219         3219                       ESAP TERRITORIAL META    800117530   
3252         3252                       ESAP TERRITORIAL META    800117530   
3604         3604       ESAP TERRITORIAL NARIÑO ALTO PUTUMAYO    800117534   
5050         5050                     ESAP TERRITORIAL TOLIMA    800117541   
5073         5073                     ESAP TERRITORIAL TOLIMA    800117541   
5162         5162                     ESAP TERRITORIAL TOLIMA    800117541   
8108         8108               ESAP TERRITORIAL CUNDINAMARCA   

In [28]:
# Combinar los dos dataframes en uno nuevo
atipicos = pd.concat([registros_mayores_365, registros_menores_1])
# Verificar los resultados combinando los dataframes
print(atipicos)

       Unnamed: 0                              nombre_entidad  nit_entidad  \
7               7                  ESAP TERRITORIAL ANTIOQUIA    800117519   
34             34                  ESAP TERRITORIAL ANTIOQUIA    800117519   
58             58                  ESAP TERRITORIAL ANTIOQUIA    800117519   
77             77                  ESAP TERRITORIAL ANTIOQUIA    800117519   
99             99                  ESAP TERRITORIAL ANTIOQUIA    800117519   
...           ...                                         ...          ...   
8466         8466  ESCUELA SUPERIOR DE ADMINISTRACIÓN PUBLICA    899999054   
8768         8768  ESCUELA SUPERIOR DE ADMINISTRACIÓN PUBLICA    899999054   
10863       10863  ESCUELA SUPERIOR DE ADMINISTRACIÓN PUBLICA    899999054   
11362       11362  ESCUELA SUPERIOR DE ADMINISTRACIÓN PUBLICA    899999054   
11871       11871  ESCUELA SUPERIOR DE ADMINISTRACIÓN PUBLICA    899999054   

                     departamento    ciudad                    

In [29]:
# Ordenar por alguna columna y resetear el índice
atipicos = atipicos.sort_values(by='tiempo_entre_firma_fin_dia').reset_index(drop=True)
# Verificar el dataframe final
print(atipicos)

     Unnamed: 0                              nombre_entidad  nit_entidad  \
0          5162                     ESAP TERRITORIAL TOLIMA    800117541   
1           361                  ESAP TERRITORIAL ANTIOQUIA    800117519   
2          5050                     ESAP TERRITORIAL TOLIMA    800117541   
3          8466  ESCUELA SUPERIOR DE ADMINISTRACIÓN PUBLICA    899999054   
4         10863  ESCUELA SUPERIOR DE ADMINISTRACIÓN PUBLICA    899999054   
..          ...                                         ...          ...   
337        3325       ESAP TERRITORIAL NARIÑO ALTO PUTUMAYO    800117534   
338        3632       ESAP TERRITORIAL NARIÑO ALTO PUTUMAYO    800117534   
339        3347       ESAP TERRITORIAL NARIÑO ALTO PUTUMAYO    800117534   
340        3358       ESAP TERRITORIAL NARIÑO ALTO PUTUMAYO    800117534   
341        3521       ESAP TERRITORIAL NARIÑO ALTO PUTUMAYO    800117534   

                   departamento       ciudad  \
0                        Tolima  No Def

In [30]:
# Guardar el dataframe como un archivo CSV
atipicos.to_csv('../../datos/Raw/atipicos_contratos_secop_esap.csv')

In [31]:
# Filtrar los registros donde el tiempo entre firma y fin NO es mayor a 365 días ni menor a 1 día
secopf = secop[(secop['tiempo_entre_firma_fin_dia'] <= 365) & (secop['tiempo_entre_firma_fin_dia'] >= 1)]

# Verificar la cantidad de registros antes y después de la eliminación
print("Original Data: %d" % len(secop))
print("Data after removing specified records: %d" % len(secopf))

Original Data: 14006
Data after removing specified records: 13664


_Tiempo entre la fecha de firma de contrato y fecha fin de contrato ESAP año 2020 - 2024 (meses)_

In [32]:
# Convertir las fechas a datetime
secopf['fecha_de_firma'] = pd.to_datetime(secopf['fecha_de_firma'])
secopf['fecha_de_fin_del_contrato'] = pd.to_datetime(secopf['fecha_de_fin_del_contrato'])

# Calcular la diferencia en días y luego convertir a meses
diferencia_dias = (secopf['fecha_de_fin_del_contrato'] - secopf['fecha_de_firma']).dt.days
secopf['tiempo_entre_firma_fin_meses'] = (diferencia_dias / 30.44).astype(int)

# Mostrar el resultado
print(secopf[['fecha_de_firma', 'fecha_de_fin_del_contrato', 'tiempo_entre_firma_fin_meses']].head())

  fecha_de_firma fecha_de_fin_del_contrato  tiempo_entre_firma_fin_meses
0     2023-03-02                2023-04-01                             0
1     2023-09-05                2023-12-16                             3
2     2020-08-26                2020-12-31                             4
3     2021-04-30                2021-12-04                             7
4     2023-08-12                2023-12-26                             4




A value is trying to be set on a copy of a slice from a DataFrame.
Try using .loc[row_indexer,col_indexer] = value instead

See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html#returning-a-view-versus-a-copy



A value is trying to be set on a copy of a slice from a DataFrame.
Try using .loc[row_indexer,col_indexer] = value instead

See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html#returning-a-view-versus-a-copy



A value is trying to be set on a copy of a slice from a DataFrame.
Try using .loc[row_indexer,col_indexer] = value instead

See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html#returning-a-view-versus-a-copy



In [33]:
# Mostrar estadísticas descriptivas del tiempo entre firma e inicio
resumen_tiempo_firma_inicio = secopf['tiempo_entre_firma_fin_meses'].describe()
# Mostrar el resumen
print(resumen_tiempo_firma_inicio)

count   13,664
mean         6
std          3
min          0
25%          3
50%          6
75%          8
max         11
Name: tiempo_entre_firma_fin_meses, dtype: float64


In [34]:
secopf

Unnamed: 0.1,Unnamed: 0,nombre_entidad,nit_entidad,departamento,ciudad,localizaci_n,orden,sector,rama,entidad_centralizada,proceso_de_compra,id_contrato,referencia_del_contrato,estado_contrato,codigo_de_categoria_principal,descripcion_del_proceso,tipo_de_contrato,modalidad_de_contratacion,justificacion_modalidad_de,fecha_de_firma,fecha_de_inicio_del_contrato,fecha_de_fin_del_contrato,condiciones_de_entrega,tipodocproveedor,documento_proveedor,proveedor_adjudicado,es_grupo,es_pyme,habilita_pago_adelantado,liquidaci_n,obligaci_n_ambiental,obligaciones_postconsumo,reversion,origen_de_los_recursos,destino_gasto,valor_del_contrato,valor_de_pago_adelantado,valor_facturado,valor_pendiente_de_pago,valor_pagado,valor_amortizado,valor_pendiente_de,valor_pendiente_de_ejecucion,estado_bpin,c_digo_bpin,anno_bpin,saldo_cdp,saldo_vigencia,espostconflicto,dias_adicionados,puntos_del_acuerdo,pilares_del_acuerdo,urlproceso,nombre_representante_legal,nacionalidad_representante_legal,domicilio_representante_legal,tipo_de_identificaci_n_representante_legal,identificaci_n_representante_legal,g_nero_representante_legal,presupuesto_general_de_la_nacion_pgn,sistema_general_de_participaciones,sistema_general_de_regal_as,recursos_propios_alcald_as_gobernaciones_y_resguardos_ind_genas_,recursos_de_credito,recursos_propios,codigo_entidad,codigo_proveedor,objeto_del_contrato,ultima_actualizacion,fecha_de_inicio_de_ejecucion,fecha_de_fin_de_ejecucion,fecha_inicio_liquidacion,fecha_fin_liquidacion,ano_fecha_de_firma,ano_fecha_de_inicio_del_contrato,ano_fecha_de_fin_del_contrato,ano_fecha_de_inicio_de_ejecucion,ano_fecha_de_fin_de_ejecucion,ano_fecha_inicio_liquidacion,ano_fecha_fin_liquidacion,periodo,ano_fecha_de_firma_str,periodo_str,periodo_ano,nombre_sede,tiempo_entre_firma_fin_dia,tiempo_entre_firma_fin_meses
0,0,ESAP TERRITORIAL ANTIOQUIA,800117519,Antioquia,Medellín,"Colombia, Antioquia , Medellín",Nacional,Educación Nacional,Ejecutivo,Centralizada,CO1.BDOS.4108988,CO1.PCCNTR.4722204,DT1-ANT-020-2023,Modificado,V1.93151500,6-Prestar servicios profesionales para apoyar ...,Prestación de servicios,Contratación directa,Servicios profesionales y apoyo a la gestión,2023-03-02,2023-03-03,2023-04-01,A convenir,Cédula de Ciudadanía,1020481709,Maria Camila Jaramillo Taborda,No,No,No,No,No,No,No,Recursos Propios,Inversión,41461333,0,4021333,37440000,4021333,0,0,37440000,No Válido,No Definido,No D,41600000,0,No,0,No aplica,No aplica,{'url': 'https://community.secop.gov.co/Public...,Maria Camila Jaramillo Taborda,CO,Carrera 52 Número 51-19 apto 902,Cédula de Ciudadanía,1020481709,Femenino,0,0,0,0,0,41461333,704428523,713215440,6-Prestar servicios profesionales para apoyar ...,,NaT,NaT,NaT,NaT,2023,2023,2023,,,,,1,2023,1,2023-1,Antioquia,30,0
1,1,ESAP TERRITORIAL ANTIOQUIA,800117519,Antioquia,Medellín,"Colombia, Antioquia , Medellín",Nacional,Educación Nacional,Ejecutivo,Centralizada,CO1.BDOS.4905445,CO1.PCCNTR.5352713,DT1-ANT-096-2023,En ejecución,V1.93151500,Prestar servicios profesionales para el desarr...,Prestación de servicios,Contratación directa,Servicios profesionales y apoyo a la gestión,2023-09-05,2023-09-06,2023-12-16,A convenir,Cédula de Ciudadanía,1039099329,HEMERSON MARMOLEJO MERCADO,No,No,No,No,No,No,No,Recursos Propios,Inversión,11220000,0,9460000,1760000,9460000,0,0,1760000,No Válido,No Definido,No D,158400000,0,No,0,No aplica,No aplica,{'url': 'https://community.secop.gov.co/Public...,hemerson marmolejo mercado,CO,No Definido,Cédula de Ciudadanía,1039099329,No Definido,0,0,0,0,0,11220000,704428523,723177309,Prestar servicios profesionales para el desarr...,,NaT,NaT,NaT,NaT,2023,2023,2023,,,,,2,2023,2,2023-2,Antioquia,102,3
2,2,ESAP TERRITORIAL ANTIOQUIA,800117519,Antioquia,Medellín,"Colombia, Antioquia , Medellín",Nacional,Educación Nacional,Ejecutivo,Centralizada,CO1.BDOS.1417960,CO1.PCCNTR.1799260,DT1-ANT-029-2020,terminado,V1.80111600,Prestar servicios de apoyo a la gestión en la ...,Prestación de servicios,Contratación directa,Servicios profesionales y apoyo a la gestión,2020-08-26,2020-08-27,2020-12-31,A convenir,Cédula de Ciudadanía,71993147,NORBEY DE JESUS AGUIRRE OCAMPO,No,No,No Definido,No,No,No,No,Recursos Propios,Inversión,5166667,0,2666667,2500000,2666667,0,0,2500000,No Válido,No Definido,2020,304083333,0,No,0,No aplica,No aplica,{'url': 'https://community.secop.gov.co/Public...,NORBEY DE JESUS AGUIRRE OCAMPO,CO,No Definido,Sin Descripcion,Sin Descripcion,No Definido,0,0,0,0,0,5166667,704428523,710330432,Prestar servicios de apoyo a la gestión en la ...,2021-04-15T00:00:00.000,NaT,NaT,NaT,NaT,2020,2020,2020,,,,,2,2020,2,2020-2,Antioquia,127,4
3,3,ESAP TERRITORIAL ANTIOQUIA,800117519,Antioquia,Medellín,"Colombia, Antioquia , Medellín",Nacional,Educación Nacional,Ejecutivo,Centralizada,CO1.BDOS.1948517,CO1.PCCNTR.2477156,DT1-ANT-012 DE 2021,En ejecución,V1.93151500,Prestar servicios de apoyo en el componente de...,Prestación de servicios,Contratación directa,Servicios profesionales y apoyo a la gestión,2021-04-30,2021-05-04,2021-12-04,A convenir,Cédula de Ciudadanía,1027943668,Carlos Alberto Mosquera Cordoba,No,No,No,No,No,No,No,Recursos Propios,Inversión,9450000,0,0,9450000,0,0,0,9450000,No Válido,No Definido,2021,396900000,0,No,0,No aplica,No aplica,{'url': 'https://community.secop.gov.co/Public...,Carlos Alberto Mosquera Cordoba,CO,No Definido,Cédula de Ciudadanía,1027943668,No Definido,0,0,0,0,0,9450000,704428523,710353962,Prestar servicios de apoyo en el componente de...,,NaT,NaT,NaT,NaT,2021,2021,2021,,,,,1,2021,1,2021-1,Antioquia,218,7
4,4,ESAP TERRITORIAL ANTIOQUIA,800117519,Antioquia,Medellín,"Colombia, Antioquia , Medellín",Nacional,Educación Nacional,Ejecutivo,Centralizada,CO1.BDOS.4829408,CO1.PCCNTR.5293902,DT1-ANT-084-2023,En ejecución,V1.93151500,Prestar servicios profesionales para el desarr...,Prestación de servicios,Contratación directa,Servicios profesionales y apoyo a la gestión,2023-08-12,2023-08-12,2023-12-26,A convenir,Cédula de Ciudadanía,1041147932,john alexander uribe ramos,No,Si,No,No,No,No,No,Recursos Propios,Inversión,14850000,0,8800000,6050000,8800000,0,0,6050000,No Válido,No Definido,No D,29700000,0,No,0,No aplica,No aplica,{'url': 'https://community.secop.gov.co/Public...,JOHN ALEXANDER URIBE RAMOS,CO,No Definido,Cédula de Ciudadanía,1041147932,No Definido,0,0,0,0,0,14850000,704428523,710373507,Prestar servicios profesionales para el desarr...,,NaT,NaT,NaT,NaT,2023,2023,2023,,,,,2,2023,2,2023-2,Antioquia,136,4
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
14001,14001,ESCUELA SUPERIOR DE ADMINISTRACIÓN PUBLICA,899999054,Distrito Capital de Bogotá,Bogotá,"Colombia, Bogotá, Bogotá",Nacional,Servicio Público,Ejecutivo,Centralizada,CO1.BDOS.1441522,CO1.PCCNTR.1830050,BOG-742-2020,Cerrado,V1.80111600,Prestar servicios de apoyo a la gestión en el ...,Prestación de servicios,Contratación directa,Servicios profesionales y apoyo a la gestión,2020-09-10,2020-09-12,2021-01-01,A convenir,Cédula de Ciudadanía,1233902468,Laura Vanessa Romero Umaña,No,No,No,No,No,No,No,Recursos Propios,Inversión,5625000,0,4583333,1041667,4583333,0,0,1041667,No Válido,No Definido,2023,45000000,0,No,0,No aplica,No aplica,{'url': 'https://community.secop.gov.co/Public...,Laura Vanessa Romero Umaña,CO,Cra 112 a # 136 a 19,Cédula de Ciudadanía,1233902468,Femenino,0,0,0,0,0,5625000,701255226,710323635,Prestar servicios de apoyo a la gestión en el ...,2020-09-18T00:00:00.000,NaT,NaT,NaT,NaT,2020,2020,2021,,,,,2,2020,2,2020-2,Sede_Principal_ESAP,113,3
14002,14002,ESCUELA SUPERIOR DE ADMINISTRACIÓN PUBLICA,899999054,Distrito Capital de Bogotá,Bogotá,"Colombia, Bogotá, Bogotá",Nacional,Servicio Público,Ejecutivo,Centralizada,CO1.BDOS.2324411,CO1.PCCNTR.3067815,BOG-1165-2021,En ejecución,V1.82101500,Adquirir pendones y backings para la sede cent...,Suministros,Selección abreviada subasta inversa,Suministro de bienes y servicios de caracterís...,2021-11-30,2021-12-03,2021-12-31,A convenir,No Definido,30210450,HARTMANN IMPRESORES,No,Si,No,No,No,No,No,Recursos Propios,Inversión,49618000,0,0,49618000,0,0,0,49618000,No Válido,No Definido,2021,63517878,0,No,0,No aplica,No aplica,{'url': 'https://community.secop.gov.co/Public...,CLAUDIA MARCELA SERRANO SUAREZ,CO,No Definido,Cédula de Ciudadanía,30210450,Femenino,0,0,0,0,0,49618000,701255226,708701040,Adquirir pendones y backings para la sede cent...,,NaT,NaT,NaT,NaT,2021,2021,2021,,,,,2,2021,2,2021-2,Sede_Principal_ESAP,31,1
14003,14003,ESCUELA SUPERIOR DE ADMINISTRACIÓN PUBLICA,899999054,Distrito Capital de Bogotá,Bogotá,"Colombia, Bogotá, Bogotá",Nacional,Servicio Público,Ejecutivo,Centralizada,CO1.BDOS.4392016,CO1.PCCNTR.4950643,BOG-990-2023,En ejecución,V1.93151500,Prestar servicios tecnológicos en el proceso d...,Prestación de servicios,Contratación directa,Servicios profesionales y apoyo a la gestión,2023-05-13,2023-05-20,2024-01-01,No Definido,Cédula de Ciudadanía,79403844,JESUS ANONIO QUITIAN USMA,No,No,No,No,No,No,No,Recursos Propios,Inversión,24901334,0,20608000,4293334,20608000,0,0,4293334,No Válido,No Definido,No D,35420000,0,No,0,No aplica,No aplica,{'url': 'https://community.secop.gov.co/Public...,Jesus Antonio Quitian Usma,CO,Calle 2 72B 70,Cédula de Ciudadanía,79403844,No Definido,0,0,0,0,0,24901334,701255226,708976733,Prestar servicios tecnológicos en el proceso d...,,NaT,NaT,NaT,NaT,2023,2023,2024,,,,,1,2023,1,2023-1,Sede_Principal_ESAP,233,7
14004,14004,ESCUELA SUPERIOR DE ADMINISTRACIÓN PUBLICA,899999054,Distrito Capital de Bogotá,Bogotá,"Colombia, Bogotá, Bogotá",Nacional,Servicio Público,Ejecutivo,Centralizada,CO1.BDOS.1484361,CO1.PCCNTR.1888934,BOG-797-2020,Cerrado,V1.80111600,Prestar los servicios profesionales para adela...,Prestación de servicios,Contratación directa,Servicios profesionales y apoyo a la gestión,2020-10-10,2020-10-19,2020-12-31,A convenir,Cédula de Ciudadanía,1015394471,Pedro Nel Rojas Oliveros,No,No,No,No,No,No,No,Recursos Propios,Inversión,22200000,0,9800000,12400000,9800000,0,0,12400000,No Válido,No Definido,2023,23433333,0,No,0,No aplica,No aplica,{'url': 'https://community.secop.gov.co/Public...,PEDRO NEL ROJAS OLIVEROS,CO,No Definido,Cédula de Ciudadanía,1015394471,No Definido,0,0,0,0,0,22200000,701255226,711353037,Prestar los servicios profesionales para adela...,2023-12-04T00:00:00.000,NaT,NaT,NaT,NaT,2020,2020,2020,,,,,2,2020,2,2020-2,Sede_Principal_ESAP,82,2


In [35]:
# Calcular el promedio de tiempo entre firma y fecha final del contrato en días
secopf['tiempo_entre_firma_fin'] = (secopf['fecha_de_fin_del_contrato'] - secopf['fecha_de_firma']).dt.days
promedio_tiempo_por_dia = secopf.groupby('fecha_de_firma')['tiempo_entre_firma_fin'].mean().reset_index()

# Convertir el promedio de días a meses
promedio_tiempo_por_dia['tiempo_entre_firma_fin'] /= 30  # Aproximadamente 30 días por mes

# Crear una gráfica lineal del promedio del tiempo entre firma y fin por día en meses
fig = px.line(promedio_tiempo_por_dia, x='fecha_de_firma', y='tiempo_entre_firma_fin',
              labels={'tiempo_entre_firma_fin': 'Promedio Tiempo entre firma y fin (meses)'},
              title='Promedio meses entre la fecha de firma de contrato y fecha fin de contrato ESAP año 2020 - 2024')

# Mostrar la gráfica
fig.show()



A value is trying to be set on a copy of a slice from a DataFrame.
Try using .loc[row_indexer,col_indexer] = value instead

See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html#returning-a-view-versus-a-copy



_Valor de contratos ESAP según fecha de firma 2020 - 2024 (días)_

In [36]:
# Mostrar estadísticas descriptivas valor del contrato
resumen_valor_contrato = secopf['valor_del_contrato'].describe()
# Mostrar el resumen
print(resumen_valor_contrato)

count           13,664
mean        36,561,760
std        279,500,427
min                  0
25%          8,085,152
50%         16,613,333
75%         35,310,000
max     24,800,000,000
Name: valor_del_contrato, dtype: float64


In [210]:
# Filtrar los registros donde el valor del contrato es mayor a 1000,000,000
contratos_altos = secopf[secopf['valor_del_contrato'] > 200000000]
print(contratos_altos)

       Unnamed: 0                              nombre_entidad  nit_entidad  \
645           645                  ESAP TERRITORIAL ATLÁNTICO    800117522   
667           667                  ESAP TERRITORIAL ATLÁNTICO    800117522   
1001         1001                  ESAP TERRITORIAL ATLÁNTICO    800117522   
1085         1085                  ESAP TERRITORIAL ATLÁNTICO    800117522   
5555         5555            ESAP TERRITORIAL VALLE DEL CAUCA    800117545   
...           ...                                         ...          ...   
13493       13493  ESCUELA SUPERIOR DE ADMINISTRACIÓN PUBLICA    899999054   
13520       13520  ESCUELA SUPERIOR DE ADMINISTRACIÓN PUBLICA    899999054   
13621       13621  ESCUELA SUPERIOR DE ADMINISTRACIÓN PUBLICA    899999054   
13741       13741  ESCUELA SUPERIOR DE ADMINISTRACIÓN PUBLICA    899999054   
13953       13953  ESCUELA SUPERIOR DE ADMINISTRACIÓN PUBLICA    899999054   

                     departamento        ciudad  \
645         

In [209]:
contratos_negativos = secop[secop['valor_del_contrato'] < 0]
print(contratos_negativos)

Empty DataFrame
Columns: [Unnamed: 0, nombre_entidad, nit_entidad, departamento, ciudad, localizaci_n, orden, sector, rama, entidad_centralizada, proceso_de_compra, id_contrato, referencia_del_contrato, estado_contrato, codigo_de_categoria_principal, descripcion_del_proceso, tipo_de_contrato, modalidad_de_contratacion, justificacion_modalidad_de, fecha_de_firma, fecha_de_inicio_del_contrato, fecha_de_fin_del_contrato, condiciones_de_entrega, tipodocproveedor, documento_proveedor, proveedor_adjudicado, es_grupo, es_pyme, habilita_pago_adelantado, liquidaci_n, obligaci_n_ambiental, obligaciones_postconsumo, reversion, origen_de_los_recursos, destino_gasto, valor_del_contrato, valor_de_pago_adelantado, valor_facturado, valor_pendiente_de_pago, valor_pagado, valor_amortizado, valor_pendiente_de, valor_pendiente_de_ejecucion, estado_bpin, c_digo_bpin, anno_bpin, saldo_cdp, saldo_vigencia, espostconflicto, dias_adicionados, puntos_del_acuerdo, pilares_del_acuerdo, urlproceso, nombre_represen

In [211]:
# Combinar los dataframes de contratos altos y contratos negativos
atipicos2 = pd.concat([contratos_altos, contratos_negativos]).drop_duplicates()
print("Contratos mayores a 200,000,000:", contratos_altos.shape[0])
print("Contratos menores a 0:", contratos_negativos.shape[0])
print("Total contratos filtrados:", atipicos2.shape[0])

Contratos mayores a 200,000,000: 96
Contratos menores a 0: 0
Total contratos filtrados: 96


In [212]:
# Ordenar por alguna columna y resetear el índice
atipicos2 = atipicos2.sort_values(by='valor_del_contrato').reset_index(drop=True)
# Verificar el dataframe final
print(atipicos2)

    Unnamed: 0                              nombre_entidad  nit_entidad  \
0          645                  ESAP TERRITORIAL ATLÁNTICO    800117522   
1          667                  ESAP TERRITORIAL ATLÁNTICO    800117522   
2        10884  ESCUELA SUPERIOR DE ADMINISTRACIÓN PUBLICA    899999054   
3         1085                  ESAP TERRITORIAL ATLÁNTICO    800117522   
4        12820  ESCUELA SUPERIOR DE ADMINISTRACIÓN PUBLICA    899999054   
..         ...                                         ...          ...   
91       12986  ESCUELA SUPERIOR DE ADMINISTRACIÓN PUBLICA    899999054   
92       10997  ESCUELA SUPERIOR DE ADMINISTRACIÓN PUBLICA    899999054   
93       11670  ESCUELA SUPERIOR DE ADMINISTRACIÓN PUBLICA    899999054   
94        9548  ESCUELA SUPERIOR DE ADMINISTRACIÓN PUBLICA    899999054   
95        8834  ESCUELA SUPERIOR DE ADMINISTRACIÓN PUBLICA    899999054   

                  departamento        ciudad  \
0                    Atlántico  Barranquilla   
1  

In [456]:
# Guardar el dataframe como un archivo CSV
atipicos2.to_csv('../../datos/Raw/atipicos2_contratos_secop_esap.csv')

In [457]:
# Filtrar los registros donde el tiempo entre firma y fin NO es mayor a 365 días ni menor a 1 día
secopf2 = secopf[(secopf['valor_del_contrato'] <= 200000000) & (secopf['valor_del_contrato'] >= 1)]
# Verificar la cantidad de registros antes y después de la eliminación
print("Original Data: %d" % len(secopf))
print("Data after removing specified records: %d" % len(secopf2))

Original Data: 13664
Data after removing specified records: 13139


In [458]:
# Asegurar que 'fecha_de_firma' es un tipo de dato datetime
secopf2['fecha_de_firma'] = pd.to_datetime(secopf2['fecha_de_firma'])
# Agrupar y sumar el valor del contrato por fecha de firma
valor_fecha = secopf2.groupby('fecha_de_firma')['valor_del_contrato'].sum().reset_index()
# Crear el gráfico utilizando Plotly
fig = px.line(valor_fecha, x='fecha_de_firma', y='valor_del_contrato', title='Valor total de contratos ESAP según fecha de firma 2020 - 2024')
# Mostrar el gráfico
fig.show()



A value is trying to be set on a copy of a slice from a DataFrame.
Try using .loc[row_indexer,col_indexer] = value instead

See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html#returning-a-view-versus-a-copy



_Valor de contratos ESAP según fecha de firma 2020 - 2024 (meses)_

In [459]:
# Asegurar que 'fecha_de_firma' es un tipo de dato datetime
secopf2['fecha_de_firma'] = pd.to_datetime(secopf2['fecha_de_firma'])
# Extraer el mes y el año de la fecha de firma
secopf2['mes_ano_firma'] = secopf2['fecha_de_firma'].dt.to_period('M')
# Agrupar y sumar el valor del contrato por mes y año de firma
valor_por_mes = secopf2.groupby('mes_ano_firma')['valor_del_contrato'].sum().reset_index()
# Convertir 'mes_ano_firma' a datetime para el gráfico
valor_por_mes['mes_ano_firma'] = valor_por_mes['mes_ano_firma'].dt.to_timestamp()
# Crear el gráfico utilizando Plotly
fig = px.line(valor_por_mes, x='mes_ano_firma', y='valor_del_contrato', 
              title='Valor total de contratos ESAP por mes 2020 - 2024',
              labels={'valor_del_contrato': 'Valor del Contrato', 'mes_ano_firma': 'Mes y Año'})

# Mostrar el gráfico
fig.show()



A value is trying to be set on a copy of a slice from a DataFrame.
Try using .loc[row_indexer,col_indexer] = value instead

See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html#returning-a-view-versus-a-copy



A value is trying to be set on a copy of a slice from a DataFrame.
Try using .loc[row_indexer,col_indexer] = value instead

See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html#returning-a-view-versus-a-copy



In [460]:
# Extraer el mes y el año de la fecha de firma
secopf2['mes_ano_firma'] = secopf2['fecha_de_firma'].dt.to_period('M')
# Agrupar y calcular el valor promedio del contrato por mes y año de firma
valor_promedio_por_mes = secopf2.groupby('mes_ano_firma')['valor_del_contrato'].mean().reset_index()
# Convertir 'mes_ano_firma' a datetime para el gráfico
valor_promedio_por_mes['mes_ano_firma'] = valor_promedio_por_mes['mes_ano_firma'].dt.to_timestamp()
# Crear el gráfico utilizando Plotly
fig = px.line(valor_promedio_por_mes, x='mes_ano_firma', y='valor_del_contrato', 
              title='Valor promedio de contratos ESAP por mes 2020 - 2024',
              labels={'valor_del_contrato': 'Valor Promedio del Contrato', 'mes_ano_firma': 'Mes y Año'})
# Mostrar el gráfico
fig.show()



A value is trying to be set on a copy of a slice from a DataFrame.
Try using .loc[row_indexer,col_indexer] = value instead

See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html#returning-a-view-versus-a-copy



## Modelo

In [461]:
### Análisis de valores nulos
# Verificación de valores nulos
secopf2.isnull().sum()

Unnamed: 0                      0
nombre_entidad                  0
nit_entidad                     0
departamento                    0
ciudad                          0
                               ..
nombre_sede                     0
tiempo_entre_firma_fin_dia      0
tiempo_entre_firma_fin_meses    0
tiempo_entre_firma_fin          0
mes_ano_firma                   0
Length: 89, dtype: int64

In [462]:
### Análisis de valores duplicados
# Verificación de valores duplicados
secopf2=secopf2.drop_duplicates()

In [463]:
### Análisis de la variable objetivo
# Distribución de la variable objetivo
secopf2['valor_del_contrato'].value_counts()

valor_del_contrato
5625000     336
11350620    301
9450000     180
29440584    140
38880000    120
           ... 
27071000      1
9362500       1
15620000      1
23891000      1
9624575       1
Name: count, Length: 4237, dtype: int64

In [464]:
### Arreglo de la variable objetivo
# Reemplazo de los valores de la variable objetivo
secopf2['valor_del_contrato'] = secopf2['valor_del_contrato'].replace({'<=50K': 0, '>50K': 1, '<=50K.': 0, '>50K.': 1})
secopf2['valor_del_contrato'].value_counts()

valor_del_contrato
5625000     336
11350620    301
9450000     180
29440584    140
38880000    120
           ... 
27071000      1
9362500       1
15620000      1
23891000      1
9624575       1
Name: count, Length: 4237, dtype: int64

In [465]:
### Análisis de las variables numéricas
# Estadísticas descriptivas de las variables numéricas
secopf2.describe()

Unnamed: 0.1,Unnamed: 0,nit_entidad,fecha_de_firma,fecha_de_inicio_del_contrato,fecha_de_fin_del_contrato,valor_del_contrato,valor_de_pago_adelantado,valor_facturado,valor_pendiente_de_pago,valor_pagado,valor_amortizado,valor_pendiente_de,valor_pendiente_de_ejecucion,saldo_cdp,saldo_vigencia,dias_adicionados,presupuesto_general_de_la_nacion_pgn,sistema_general_de_participaciones,sistema_general_de_regal_as,recursos_propios_alcald_as_gobernaciones_y_resguardos_ind_genas_,recursos_de_credito,recursos_propios,codigo_entidad,codigo_proveedor,fecha_de_inicio_de_ejecucion,fecha_de_fin_de_ejecucion,fecha_inicio_liquidacion,fecha_fin_liquidacion,ano_fecha_de_firma,ano_fecha_de_inicio_del_contrato,ano_fecha_de_fin_del_contrato,ano_fecha_de_inicio_de_ejecucion,ano_fecha_de_fin_de_ejecucion,ano_fecha_inicio_liquidacion,ano_fecha_fin_liquidacion,periodo,tiempo_entre_firma_fin_dia,tiempo_entre_firma_fin_meses,tiempo_entre_firma_fin
count,13139,13139,13139,13009,13139,13139,13139,13139,13139,13139,13139,13139,13139,13139,13139,13139,13139,13139,13139,13139,13139,13139,13139,13139,571,571,105,105,13139,13009,13139,571,571,105,105,13139,13139,13139,13139
mean,6882,842046858,2022-03-16 13:59:37.532536576,2022-03-17 09:01:10.566530816,2022-09-16 23:03:26.865058304,26920725,2315,7940266,19719532,7196185,0,2315,19724541,119636608,0,5,987793,0,0,179647,26202,23623710,703195184,710798755,2020-02-13 17:39:11.663747584,2020-11-30 20:45:48.861646336,2023-07-21 11:12:00,2023-12-31 00:13:42.857142784,2022,2022,2022,2020,2020,2023,2024,1,184,6,184
min,0,800117519,2020-01-02 00:00:00,2020-01-01 00:00:00,2020-02-11 00:00:00,217323,0,0,-1109333,0,0,0,-1109333,0,0,0,0,0,0,0,0,0,701255226,0,2020-01-03 00:00:00,2020-01-16 00:00:00,2020-03-17 00:00:00,2020-05-28 00:00:00,2020,2020,2020,2020,2020,2020,2020,1,1,0,1
25%,3426,800117534,2021-03-25 00:00:00,2021-04-05 00:00:00,2021-11-15 00:00:00,8800000,0,0,4160000,0,0,0,4160000,10800000,0,0,0,0,0,0,0,6000000,701255226,705952745,2020-01-23 00:00:00,2020-12-28 00:00:00,2023-07-21 00:00:00,2023-12-23 00:00:00,2021,2021,2021,2020,2020,2023,2023,1,100,3,100
50%,6796,800248529,2022-01-26 00:00:00,2022-01-28 00:00:00,2022-08-22 00:00:00,17833333,0,0,10733337,0,0,0,10762667,27127985,0,0,0,0,0,0,0,13701680,704371061,710674680,2020-02-13 00:00:00,2020-12-31 00:00:00,2023-12-26 00:00:00,2024-03-01 00:00:00,2022,2022,2022,2020,2020,2023,2024,1,182,5,182
75%,10328,899999054,2023-03-23 00:00:00,2023-03-23 00:00:00,2023-12-23 00:00:00,35443332,0,6320666,27490667,4416667,0,0,27511591,62600000,0,0,0,0,0,0,0,31677624,704616416,714692844,2020-02-29 00:00:00,2021-01-01 00:00:00,2024-01-01 00:00:00,2024-06-26 00:00:00,2023,2023,2023,2020,2021,2024,2024,2,266,8,266
max,14005,899999054,2024-04-02 00:00:00,2024-04-03 00:00:00,2025-01-01 00:00:00,199920000,30413863,171379999,199112321,171379999,0,30413863,199112321,17632968562,0,334,199112321,0,0,87066500,109729667,196565413,704901107,725844302,2020-12-31 00:00:00,2021-01-01 00:00:00,2025-01-02 00:00:00,2026-07-01 00:00:00,2024,2024,2025,2020,2021,2025,2026,2,365,11,365
std,4018,47819434,,,,26717308,265332,18002479,24244094,17602746,0,265332,24246901,396142135,0,18,6794182,0,0,2585323,1222759,26064411,1613287,12243605,,,,,1,1,1,0,0,1,1,0,101,3,101


In [466]:
### Análisis de las variables categóricas
# Estadísticas descriptivas de las variables categóricas
secopf.describe(include='object')

Unnamed: 0,nombre_entidad,departamento,ciudad,localizaci_n,orden,sector,rama,entidad_centralizada,proceso_de_compra,id_contrato,referencia_del_contrato,estado_contrato,codigo_de_categoria_principal,descripcion_del_proceso,tipo_de_contrato,modalidad_de_contratacion,justificacion_modalidad_de,condiciones_de_entrega,tipodocproveedor,documento_proveedor,proveedor_adjudicado,es_grupo,es_pyme,habilita_pago_adelantado,liquidaci_n,obligaci_n_ambiental,obligaciones_postconsumo,reversion,origen_de_los_recursos,destino_gasto,estado_bpin,c_digo_bpin,anno_bpin,espostconflicto,puntos_del_acuerdo,pilares_del_acuerdo,urlproceso,nombre_representante_legal,nacionalidad_representante_legal,domicilio_representante_legal,tipo_de_identificaci_n_representante_legal,identificaci_n_representante_legal,g_nero_representante_legal,objeto_del_contrato,ultima_actualizacion,ano_fecha_de_firma_str,periodo_str,nombre_sede
count,13664,13664,13664,13664,13664,13664,13664,13664,13652,13664,13664,13664,13664,13664,13664,13664,13664,13664,13664,13664,13664,13664,13664,13664,13664,13664,13664,13664,13664,13664,13664,13664,13664,13664,13664,13664,13664,13664,13664,13664,13664,13664,13664,13664,6093,13664,13664,13664
unique,16,16,14,16,1,2,1,1,13453,13487,12683,8,185,9764,13,12,17,5,5,7512,7493,2,2,3,2,2,1,1,2,3,2,8,8,1,1,1,13488,7369,15,2544,7,4443,3,9984,785,5,2,16
top,ESCUELA SUPERIOR DE ADMINISTRACIÓN PUBLICA,Distrito Capital de Bogotá,Bogotá,"Colombia, Bogotá, Bogotá",Nacional,Educación Nacional,Ejecutivo,Centralizada,CO1.BDOS.5730372,CO1.PCCNTR.5630392,ESAP-PS-002-2023,En ejecución,V1.93151500,Prestar servicios profesionales para apoyar la...,Prestación de servicios,Contratación directa,Servicios profesionales y apoyo a la gestión,A convenir,Cédula de Ciudadanía,12972865,OSCAR AVILA SANTACRUZ,No,No,No,No,No,No,No,Recursos Propios,Inversión,No Válido,No Definido,No D,No,No aplica,No aplica,{'url': 'https://community.secop.gov.co/Public...,Sin Descripcion,CO,No Definido,Cédula de Ciudadanía,Sin Descripcion,No Definido,Prestar servicios profesionales para apoyar la...,2023-11-20T00:00:00.000,2023,1,Sede_Principal_ESAP
freq,5774,5774,5774,5774,13664,6881,13664,13664,7,4,6,6297,9418,60,12919,13237,12678,9932,12578,12,12,13651,12661,11729,13544,13652,13664,13664,12010,12390,13505,13505,5655,13664,13664,13664,7,167,13374,8865,8076,5416,9900,60,214,3530,9050,5774


In [467]:
#Inclusión del código UNSPSC Codeset Spanish Translation
frecuencias = secopf2['codigo_de_categoria_principal'].value_counts()
# Mostrar las frecuencias
print(frecuencias)

codigo_de_categoria_principal
V1.93151500    9414
V1.80111600    3125
V1.80131500     107
UNSPECIFIED     100
V1.78181500      21
               ... 
V1.72153200       1
V1.40141700       1
V1.72101506       1
V1.78121500       1
V1.86132000       1
Name: count, Length: 159, dtype: int64


In [468]:
#Arreglar variable codigo_de_categoria_principal
# Eliminar el texto 'V1.' de la columna especificada
secopf2['codigo_de_categoria_principal'] = secopf2['codigo_de_categoria_principal'].str.replace('V1.', '')
secopf2['codigo_de_categoria_principal'] = secopf2['codigo_de_categoria_principal'].str.replace(' ', '', regex=True)
# Mostrar el DataFrame modificado
print(secopf2.codigo_de_categoria_principal)


0        93151500
1        93151500
2        80111600
3        93151500
4        93151500
           ...   
14001    80111600
14002    82101500
14003    93151500
14004    80111600
14005    93151500
Name: codigo_de_categoria_principal, Length: 13139, dtype: object


In [469]:
mapeo_codigo_de_categoria_principal = {
14111530: 'Papel notas autoadhesivas',
14111800: 'Papeles uso comercial',
15101506: 'Gasolina',
22101527: 'Transportes integrados carga',
25174201: 'Sacos dirección ',
25191513: 'Kit mantenimiento vehículo soporte en tierra',
26111700: 'Baterías, pilas y accesorios ',
26111705: 'Pilas secas',
26121500: 'Alambre eléctrico ',
27141000: 'Herramientas carrocería',
31161800: 'Arandelas',
31162800: 'Ferretería en general',
39121321: 'Ferretería y accesorios caja eléctrica',
40101701: 'Aires acondicionados',
40141700: 'Material ferretería y accesorios ',
41113637: 'Medidores voltaje o corriente',
41113700: 'Instrumentos medición y comprobación comunicación electrónica',
42172002: 'Kits primera respuesta para servicios médicos emergencia',
43201807: 'Unidades cintas',
43211500: 'Computadores',
43222800: 'Equipo telefonía',
43231500: 'Software funcional específico la empresa ',
43231507: 'Software manejo proyectos',
43231511: 'Software sistemas expertos',
43232005: 'Software edición música o sonido',
43232500: 'Software educativo o referencia',
43233203: 'Software manejo seguridad red o redes privadas virtuales vpn',
44103103: 'Tóner para impresoras o fax',
44121700: 'Instrumentos escritura',
45111616: 'Proyectores video',
46182000: 'Protección la respiración ',
52151701: 'Utensilios para servir para uso doméstico',
53101900: 'Trajes',
53102700: 'Uniformes',
55101500: 'Publicaciones impresas',
55121715: 'Banderas o accesorios',
56101522: 'Sillas brazos',
60101600: 'Diplomas o certificados educativos',
60103502: 'Libros recursos o actividades del gobierno',
60105409: 'Materiales enseñanza  publicidad o comercialización marcas',
60131000: 'Instrumentos teclado ',
60141100: 'Juegos',
70111700: 'Parques, jardines y huertos',
70151904: 'Silvicultura',
72101500: 'apoyo para la construcción',
72101501: 'todero',
72101506: 'mantenimiento ascensores',
72101507: 'Servicio mantenimiento edificios',
72101511: 'Servicio instalación o mantenimiento y aires acondi',
72102103: 'exterminación o fumigación',
72102105: 'Captura animales',
72102900: 'mantenimiento y reparación instalaciones',
72103300: 'mantenimiento y reparación infraestructura',
72121400: 'construcción edificios públicos especializados',
72151003: 'Servicio mantenimiento y reparación sistemas calefacción',
72151200: 'construcción y mantenimiento HVAC calefacción y aire acondicionado',
72151500: 'sistemas eléctricos ',
72151514: 'Servicio mantenimiento energía emergencia o reserva',
72151603: 'Servicio instalación equipos sonido especializados',
72152500: 'instalación pisos ',
72153002: 'Servicio instalación y reparación vidrios en ventanas',
72153200: 'recubrimiento, impermeabilización protección contra clima y fuego',
72153204: 'Servicio impermeabilización',
73151904: 'impresión industrial offset',
73152108: 'Servicio mantenimiento y reparación equipos eléctricos',
77111500: 'seguridad ambienta',
78101801: 'transporte carga por carretera (en camión) en área local',
78101802: 'Servicios transporte carga por carretera',
78102200: 'Servicios postales paqueteo y courrier',
78111502: 'Viajes en aviones comerciales',
78111800: 'Transporte pasajeros por carretera',
78111803: 'buses contratados',
78121500: 'Empaque',
78181500: 'mantenimiento y reparación vehículos',
78181502: 'Reparación transmisiones',
78181507: 'Reparación y mantenimiento automotor y camiones ligeros',
80101500: 'consultoría negocios y administración corporativa',
80101504: 'asesoramiento sobre planificación estratégica',
80101600: 'Gerencia proyectos',
80101604: 'Planificación o administración proyectos',
80111500: 'Desarrollo recursos humanos ',
80111600: 'personal temporal',
80111601: 'Asistencia oficina o administrativa temporal',
80111607: 'Necesidades dotación personal jurídico temporal',
80111614: 'Servicios temporales ingeniería  ',
80111701: 'contratación personal',
80121600: 'derecho comercial',
80121604: 'Derecho patentes, marcas o derechos autor',
80131500: 'Alquiler y arrendamiento propiedades o edificaciones',
80131502: 'Arrendamiento instalaciones comerciales o industriales',
80131600: 'Ventas propiedades y edificios',
80131802: 'avalúo inmuebles',
80141600: 'Actividades ventas y promoción negocios',
80141602: 'relaciones públicas ',
80141606: 'Cumplimiento del mercadeo directo',
80141607: 'Gestión eventos',
80141625: 'Servicio gestión programas incentivos',
80141627: 'Servicio gestión publicidad cooperativa o compartida',
80141701: 'venta directa',
80141705: 'subastas',
80141902: 'Reuniones y eventos',
80141903: 'Talento o entretenimiento',
80161502: 'planificación reuniones',
80161504: 'oficina',
81101500: 'Ingeniería civil',
81101701: 'ingeniería eléctrica',
81111500: 'Ingeniería software o hardware',
81111503: 'Diseño integración sistemas',
81111507: 'programación aplicaciones bases datos (erp)',
81111508: 'implementación aplicaciones',
81111800: 'sistemas y administración componentes sistemas',
81111805: 'Mantenimiento o soporte sistemas patentados o autorizados',
81111819: 'garantía calidad',
81112205: 'Mantenimiento software sistemas gestión bases datos',
81112211: 'Mantenimiento software planificación recursos empresariales',
81112401: 'Alquiler hardware computadores',
81112500: 'alquiler o arrendamiento licencias software computado',
81112501: 'Servicio licencias del software del computador',
81141601: 'Logística',
81161501: 'Servicio administración aplicaciones software',
82101500: 'Publicidad impresa',
82101508: 'Publicidad en páginas amarillas',
82101604: 'Publicidad en los cines ',
82121500: 'Impresión',
82121502: 'Tipografía',
82121503: 'Impresión digital',
82131600: 'Fotógrafos y cinematógrafos',
83121700: 'comunicación masiva',
84111500: 'Servicios contables',
84131600: 'Seguros vida, salud y accidentes ',
85101600: 'Personas soporte prestación salud',
85101604: 'asistencia personal médico',
85101605: 'Auxiliares salud a domicilio',
85121502: 'consulta médicos atención primaria',
85121503: 'control médicos atención primaria',
85121800: 'Laboratorios médicos',
86111600: 'Educación adultos',
86121800: 'Escuelas profesionales ',
86132000: 'educación y capacitación en administración',
90101603: 'cáterin',
90111600: 'Facilidades para encuentros',
90111603: 'Salas reuniones o banquetes',
90111800: 'Cuartos hotel ',
90121500: 'Agentes viajes ',
90121502: 'Agencias viajes',
90141700: 'Deportes aficionados y recreacionales',
90151800: 'Carnavales y ferias ',
93101500: 'Cuerpos políticos',
93131500: 'Programas refugiados',
93141500: 'Desarrollo y servicios sociales ',
93141506: 'bienestar social',
93141700: 'Cultura',
93141701: 'Organizaciones eventos culturales',
93151500: 'Administración pública',
93151501: 'Servicios financieros o  gestión  administrativa',
93151503: 'Programas privatización',
95121913: 'Universidad',
95122306: 'Gimnasio'
}

In [470]:
secopf2 = secopf2.replace('UNSPECIFIED', pd.NA)
# Lista de columnas donde deseas hacer el reemplazo
columnas = ['codigo_de_categoria_principal']
# Reemplazar 'UNSPECIFIED' por NaN solo en las columnas especificadas
for columna in columnas:
    secopf2[columna] = secopf2[columna].replace('UNSPECIFIED', pd.NA)

In [471]:
secopf2['codigo_de_categoria_principal'] = secopf2['codigo_de_categoria_principal'].astype('Int64')

In [472]:
secopf2['producto'] = secopf2['codigo_de_categoria_principal'].map(mapeo_codigo_de_categoria_principal)
print(secopf2[['codigo_de_categoria_principal', 'producto']].head())

   codigo_de_categoria_principal                producto
0                       93151500  Administración pública
1                       93151500  Administración pública
2                       80111600       personal temporal
3                       93151500  Administración pública
4                       93151500  Administración pública


In [473]:
# Contar el número de ocurrencias de cada valor único en la columna 'producto'
conteo_producto = secopf2['producto'].value_counts()
# Convertir el conteo en un DataFrame para una mejor visualización
tabla_conteo_producto = conteo_producto.reset_index().rename(columns={'index': 'Producto', 'producto': 'Conteo'})
# Mostrar la tabla de conteo
print(tabla_conteo_producto)

                                                Conteo  count
0                               Administración pública   9414
1                                    personal temporal   3125
2    Alquiler y arrendamiento propiedades o edifica...    107
3                 mantenimiento y reparación vehículos     21
4                    Personas soporte prestación salud     19
..                                                 ...    ...
152                                       Silvicultura      1
153  recubrimiento, impermeabilización protección c...      1
154                  Material ferretería y accesorios       1
155                           mantenimiento ascensores      1
156         educación y capacitación en administración      1

[157 rows x 2 columns]


In [474]:
# Reemplazar NA por una cadena vacía '' en la columna 'producto'
secopf2['producto'] = secopf2['producto'].fillna('')
# Verificación para asegurarse de que no hay más valores nulos en 'producto'
print(secopf2['producto'].isnull().sum())

0


In [475]:
secopf2['producto'] = secopf2['producto'].astype('object')

In [476]:
### Análisis de valores nulos
print(secopf2.isnull().sum())

Unnamed: 0                      0
nombre_entidad                  0
nit_entidad                     0
departamento                    0
ciudad                          0
                               ..
tiempo_entre_firma_fin_dia      0
tiempo_entre_firma_fin_meses    0
tiempo_entre_firma_fin          0
mes_ano_firma                   0
producto                        0
Length: 90, dtype: int64


_preprocesamiento_

In [477]:
#### preprocesamiento de datos
from sklearn.preprocessing import OneHotEncoder, StandardScaler
from sklearn.impute import SimpleImputer
from sklearn.compose import ColumnTransformer
# Separación de las variables predictoras y la variable objetivo
X = secopf2.drop('valor_del_contrato', axis=1)
y = secopf2['valor_del_contrato']
print(X.info())


<class 'pandas.core.frame.DataFrame'>
Index: 13139 entries, 0 to 14005
Data columns (total 89 columns):
 #   Column                                                            Non-Null Count  Dtype         
---  ------                                                            --------------  -----         
 0   Unnamed: 0                                                        13139 non-null  int64         
 1   nombre_entidad                                                    13139 non-null  object        
 2   nit_entidad                                                       13139 non-null  int64         
 3   departamento                                                      13139 non-null  object        
 4   ciudad                                                            13139 non-null  object        
 5   localizaci_n                                                      13139 non-null  object        
 6   orden                                                             13139 non

In [396]:
secopf2['fecha_de_firma'] = secopf2['fecha_de_firma'].astype('object')
secopf2['fecha_de_inicio_del_contrato'] = secopf2['fecha_de_inicio_del_contrato'].astype('object')
secopf2['fecha_de_fin_del_contrato'] = secopf2['fecha_de_fin_del_contrato'].astype('object')
secopf2['fecha_de_inicio_de_ejecucion'] = secopf2['fecha_de_inicio_de_ejecucion'].astype('object')
secopf2['fecha_de_fin_de_ejecucion'] = secopf2['fecha_de_fin_de_ejecucion'].astype('object')
secopf2['fecha_inicio_liquidacion'] = secopf2['fecha_inicio_liquidacion'].astype('object')
secopf2['fecha_fin_liquidacion'] = secopf2['fecha_fin_liquidacion'].astype('object')
secopf2['ano_fecha_de_firma'] = secopf2['fecha_fin_liquidacion'].astype('object')

In [478]:
### En X buscamos las columnas categoricas y las numericas
# Identificación de las columnas numéricas y categóricas
columnas_numericas = X.select_dtypes(include='number').columns
columnas_numericas

Index(['Unnamed: 0', 'nit_entidad', 'codigo_de_categoria_principal',
       'valor_de_pago_adelantado', 'valor_facturado',
       'valor_pendiente_de_pago', 'valor_pagado', 'valor_amortizado',
       'valor_pendiente_de', 'valor_pendiente_de_ejecucion', 'saldo_cdp',
       'saldo_vigencia', 'dias_adicionados',
       'presupuesto_general_de_la_nacion_pgn',
       'sistema_general_de_participaciones', 'sistema_general_de_regal_as',
       'recursos_propios_alcald_as_gobernaciones_y_resguardos_ind_genas_',
       'recursos_de_credito', 'recursos_propios', 'codigo_entidad',
       'codigo_proveedor', 'ano_fecha_de_firma',
       'ano_fecha_de_inicio_del_contrato', 'ano_fecha_de_fin_del_contrato',
       'ano_fecha_de_inicio_de_ejecucion', 'ano_fecha_de_fin_de_ejecucion',
       'ano_fecha_inicio_liquidacion', 'ano_fecha_fin_liquidacion', 'periodo',
       'tiempo_entre_firma_fin_dia', 'tiempo_entre_firma_fin_meses',
       'tiempo_entre_firma_fin'],
      dtype='object')

In [479]:
columnas_categoricas = X.select_dtypes(include='object').columns
columnas_categoricas 

Index(['nombre_entidad', 'departamento', 'ciudad', 'localizaci_n', 'orden',
       'sector', 'rama', 'entidad_centralizada', 'proceso_de_compra',
       'id_contrato', 'referencia_del_contrato', 'estado_contrato',
       'descripcion_del_proceso', 'tipo_de_contrato',
       'modalidad_de_contratacion', 'justificacion_modalidad_de',
       'condiciones_de_entrega', 'tipodocproveedor', 'documento_proveedor',
       'proveedor_adjudicado', 'es_grupo', 'es_pyme',
       'habilita_pago_adelantado', 'liquidaci_n', 'obligaci_n_ambiental',
       'obligaciones_postconsumo', 'reversion', 'origen_de_los_recursos',
       'destino_gasto', 'estado_bpin', 'c_digo_bpin', 'anno_bpin',
       'espostconflicto', 'puntos_del_acuerdo', 'pilares_del_acuerdo',
       'urlproceso', 'nombre_representante_legal',
       'nacionalidad_representante_legal', 'domicilio_representante_legal',
       'tipo_de_identificaci_n_representante_legal',
       'identificaci_n_representante_legal', 'g_nero_representante_leg

In [366]:
#columnas_categoricas = ['nombre_entidad', 'departamento', 'ciudad', 'orden',
       'sector', 'proceso_de_compra',
       'tipo_de_contrato','modalidad_de_contratacion', 'condiciones_de_entrega', 
       'es_grupo', 'es_pyme', 'origen_de_los_recursos', 'tipo_de_identificaci_n_representante_legal',
       'g_nero_representante_legal','nombre_sede']

In [367]:
#X = X[list(columnas_numericas) + columnas_categoricas]

In [485]:
### Definimos los pasos para el preprocesamiento de los datos
transfomacion_OHE = OneHotEncoder(sparse_output=False, handle_unknown='ignore')
### Ejemplo de uso
print(transfomacion_OHE.fit_transform(X[['nombre_sede']]))
print(transfomacion_OHE.fit_transform(X[columnas_categoricas]).shape)


[[1. 0. 0. ... 0. 0. 0.]
 [1. 0. 0. ... 0. 0. 0.]
 [1. 0. 0. ... 0. 0. 0.]
 ...
 [0. 0. 0. ... 1. 0. 0.]
 [0. 0. 0. ... 1. 0. 0.]
 [0. 0. 0. ... 1. 0. 0.]]


MemoryError: Unable to allocate 9.61 GiB for an array with shape (13139, 98183) and data type float64

In [481]:
### SimpleImputer
transformacion_nan= SimpleImputer(strategy='constant', fill_value='Desconocido')
pd.DataFrame(transformacion_nan.fit_transform(X[['nombre_sede']])).value_counts()

Sede_Principal_ESAP                              5265
Bolivar_Córdoba_Sucre_San Andrés                  735
Nariño_Alto Putumayo                              599
Huila_Caquetá_Putumayo                            586
Cundinamarca                                      581
Meta_Guainía_Guaviare_Vaupés_Vichada_Amazonas     578
Antioquia                                         570
Atlántico_Cesar_Magdalena_La_Guajira              555
Norte_Santander - Arauca                          537
Boyacá_Casanare                                   519
Otro                                              492
Santander                                         449
Quindío_Risaralda                                 440
Caldas                                            423
Tolima                                            410
Valle                                             400
Name: count, dtype: int64

In [482]:
transformacion_nan = SimpleImputer

In [483]:
### Normalización de las variables numéricas
transformacion_escalar = StandardScaler()
pd.DataFrame(transformacion_escalar.fit_transform(X[columnas_numericas])).describe()

Unnamed: 0,0,1,2,3,4,5,6,7,8,9,10,11,12,13,14,15,16,17,18,19,20,21,22,23,24,25,26,27,28,29,30,31
count,13139,13139,13039,13139,13139,13139,13139,13139,13139,13139,13139,13139,13139,13139,13139,13139,13139,13139,13139,13139,13139,13139,13009,13139,571,571,105,105,13139,13139,13139,13139
mean,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0
std,1,1,1,1,1,1,1,0,1,1,1,0,1,1,0,0,1,1,1,1,1,1,1,1,0,1,1,1,1,1,1,1
min,-2,-1,-11,0,0,-1,0,0,0,-1,0,0,0,0,0,0,0,0,-1,-1,-58,-1,-1,-2,0,-1,-3,-3,-1,-2,-2,-2
25%,-1,-1,-1,0,0,-1,0,0,0,-1,0,0,0,0,0,0,0,0,-1,-1,0,-1,-1,-1,0,-1,0,0,-1,-1,-1,-1
50%,0,-1,1,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,1,0,0,0,0,0,-1,0,0,-1,0,0,0
75%,1,1,1,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,1,0,1,1,1,0,1,1,0,1,1,1,1
max,2,1,1,115,9,7,9,0,115,7,44,0,19,29,0,0,34,90,7,1,1,2,2,2,0,1,2,2,1,2,2,2


In [486]:
### Transformación de las variables
from sklearn.pipeline import Pipeline
from sklearn.compose import ColumnTransformer
from sklearn.impute import SimpleImputer  # Asumiendo que la imputación se hace con SimpleImputer
from sklearn.preprocessing import OneHotEncoder, StandardScaler  # Codificación y escalado

transformacion_nan = SimpleImputer(strategy='most_frequent')
transformacion_OHE = OneHotEncoder(handle_unknown='ignore')

# Creación de los pasos para el preprocesamiento
pasos = [
    ('imputacion', transformacion_nan),
    ('codificacion', transfomacion_OHE),]

# Creación del preprocesador

preprocesador_categorical = ColumnTransformer(
    transformers=[('CAT',Pipeline(pasos), columnas_categoricas)])

preprocsador_numerico = ColumnTransformer(
    transformers=[('escalar', transformacion_escalar, columnas_numericas)])

Transformacion_Columnas = ColumnTransformer(
    transformers=[
        ('num', preprocsador_numerico, columnas_numericas),
        ('cat', preprocesador_categorical, columnas_categoricas)
    ])

Transformacion_Columnas.fit(X)

pd.DataFrame(Transformacion_Columnas.transform(X)).head() 

MemoryError: Unable to allocate 9.61 GiB for an array with shape (13139, 98181) and data type float64

In [412]:
import joblib

In [351]:
joblib.dump(Transformacion_Columnas, 'preprocesador.gz')

['preprocesador.gz']

In [352]:
new_column_tranformer = joblib.load('preprocesador.gz')
new_column_tranformer

In [413]:
columnas_numericas=Transformacion_Columnas.transformers_[0][2]
columnas_numericas

AttributeError: 'ColumnTransformer' object has no attribute 'transformers_'

In [354]:
columnas_categoricas=Transformacion_Columnas.named_transformers_['cat'].named_transformers_['CAT'][-1].get_feature_names_out()
columnas_categoricas

array(['x0_ESAP TERRITORIAL ANTIOQUIA', 'x0_ESAP TERRITORIAL ATLÁNTICO',
       'x0_ESAP TERRITORIAL BOLIVAR', ..., 'x14_Sede_Principal_ESAP',
       'x14_Tolima', 'x14_Valle'], dtype=object)

In [355]:
from sklearn.preprocessing import OneHotEncoder
encoder = OneHotEncoder(sparse_output=True)

In [356]:
pd.DataFrame(Transformacion_Columnas.transform(X), columns=np.concatenate([columnas_numericas, columnas_categoricas])).head()

Unnamed: 0.1,Unnamed: 0,nit_entidad,codigo_de_categoria_principal,valor_de_pago_adelantado,valor_facturado,valor_pendiente_de_pago,valor_pagado,valor_amortizado,valor_pendiente_de,valor_pendiente_de_ejecucion,saldo_cdp,saldo_vigencia,dias_adicionados,presupuesto_general_de_la_nacion_pgn,sistema_general_de_participaciones,sistema_general_de_regal_as,recursos_propios_alcald_as_gobernaciones_y_resguardos_ind_genas_,recursos_de_credito,recursos_propios,codigo_entidad,codigo_proveedor,ano_fecha_de_firma,ano_fecha_de_inicio_del_contrato,ano_fecha_de_fin_del_contrato,ano_fecha_de_inicio_de_ejecucion,ano_fecha_de_fin_de_ejecucion,ano_fecha_inicio_liquidacion,ano_fecha_fin_liquidacion,periodo,tiempo_entre_firma_fin_dia,tiempo_entre_firma_fin_meses,tiempo_entre_firma_fin,x0_ESAP TERRITORIAL ANTIOQUIA,x0_ESAP TERRITORIAL ATLÁNTICO,x0_ESAP TERRITORIAL BOLIVAR,x0_ESAP TERRITORIAL BOYACA CASANARE,x0_ESAP TERRITORIAL CALDAS,x0_ESAP TERRITORIAL CAUCA,x0_ESAP TERRITORIAL CUNDINAMARCA,x0_ESAP TERRITORIAL HUILA-CAQUETA Y BAJO PUTUMAYO,x0_ESAP TERRITORIAL META,x0_ESAP TERRITORIAL NARIÑO ALTO PUTUMAYO,x0_ESAP TERRITORIAL NORTE DE SANTANDER ARAUCA,x0_ESAP TERRITORIAL QUINDIO RISARALDA,x0_ESAP TERRITORIAL SANTANDER,x0_ESAP TERRITORIAL TOLIMA,x0_ESAP TERRITORIAL VALLE DEL CAUCA,x0_ESCUELA SUPERIOR DE ADMINISTRACIÓN PUBLICA,x1_Antioquia,x1_Atlántico,x1_Bolívar,x1_Boyacá,x1_Caldas,x1_Cauca,x1_Cundinamarca,x1_Distrito Capital de Bogotá,x1_Huila,x1_Meta,x1_Nariño,x1_Norte de Santander,x1_Risaralda,x1_Santander,x1_Tolima,x1_Valle del Cauca,x2_Barranquilla,x2_Bogotá,x2_Bucaramanga,x2_Cali,x2_Cartagena,x2_Cúcuta,x2_Fusagasugá,x2_Medellín,x2_Neiva,x2_No Definido,x2_Pasto,x2_Pereira,x2_Tunja,x2_Villavicencio,x3_Nacional,x4_Educación Nacional,x4_Servicio Público,x5_CO1.BDOS.1021067,x5_CO1.BDOS.1021333,x5_CO1.BDOS.1021342,x5_CO1.BDOS.1021429,x5_CO1.BDOS.1021436,x5_CO1.BDOS.1021601,x5_CO1.BDOS.1021712,x5_CO1.BDOS.1021945,x5_CO1.BDOS.1021988,x5_CO1.BDOS.1022019,x5_CO1.BDOS.1022034,x5_CO1.BDOS.1022037,x5_CO1.BDOS.1022048,x5_CO1.BDOS.1022147,x5_CO1.BDOS.1022365,x5_CO1.BDOS.1022366,x5_CO1.BDOS.1022502,x5_CO1.BDOS.1022616,x5_CO1.BDOS.1022631,x5_CO1.BDOS.1022634,x5_CO1.BDOS.1022714,x5_CO1.BDOS.1022904,x5_CO1.BDOS.1022915,x5_CO1.BDOS.1026468,x5_CO1.BDOS.1026508,x5_CO1.BDOS.1026517,x5_CO1.BDOS.1026566,x5_CO1.BDOS.1026731,x5_CO1.BDOS.1026771,x5_CO1.BDOS.1026795,x5_CO1.BDOS.1026931,x5_CO1.BDOS.1026963,x5_CO1.BDOS.1026989,x5_CO1.BDOS.1027221,x5_CO1.BDOS.1027223,x5_CO1.BDOS.1027333,x5_CO1.BDOS.1027887,x5_CO1.BDOS.1027964,x5_CO1.BDOS.1028423,x5_CO1.BDOS.1028703,x5_CO1.BDOS.1029823,x5_CO1.BDOS.1030055,x5_CO1.BDOS.1030388,x5_CO1.BDOS.1030466,x5_CO1.BDOS.1030512,x5_CO1.BDOS.1030523,x5_CO1.BDOS.1030528,x5_CO1.BDOS.1031638,x5_CO1.BDOS.1031660,x5_CO1.BDOS.1031861,x5_CO1.BDOS.1032077,x5_CO1.BDOS.1032185,x5_CO1.BDOS.1032650,x5_CO1.BDOS.1032754,x5_CO1.BDOS.1032847,x5_CO1.BDOS.1033058,x5_CO1.BDOS.1033115,x5_CO1.BDOS.1033215,x5_CO1.BDOS.1033216,x5_CO1.BDOS.1033919,x5_CO1.BDOS.1033927,x5_CO1.BDOS.1034032,x5_CO1.BDOS.1034136,x5_CO1.BDOS.1036198,x5_CO1.BDOS.1036768,x5_CO1.BDOS.1036798,x5_CO1.BDOS.1036935,x5_CO1.BDOS.1037151,x5_CO1.BDOS.1038142,x5_CO1.BDOS.1038168,x5_CO1.BDOS.1038186,x5_CO1.BDOS.1038434,x5_CO1.BDOS.1038906,x5_CO1.BDOS.1039036,x5_CO1.BDOS.1040478,x5_CO1.BDOS.1040724,x5_CO1.BDOS.1040768,x5_CO1.BDOS.1040809,x5_CO1.BDOS.1040822,x5_CO1.BDOS.1041006,x5_CO1.BDOS.1041008,x5_CO1.BDOS.1041219,x5_CO1.BDOS.1041557,x5_CO1.BDOS.1041754,x5_CO1.BDOS.1041797,x5_CO1.BDOS.1041812,x5_CO1.BDOS.1041954,x5_CO1.BDOS.1042230,x5_CO1.BDOS.1042267,x5_CO1.BDOS.1043786,x5_CO1.BDOS.1043829,x5_CO1.BDOS.1043838,x5_CO1.BDOS.1044293,x5_CO1.BDOS.1044314,x5_CO1.BDOS.1044423,x5_CO1.BDOS.1044471,x5_CO1.BDOS.1044593,x5_CO1.BDOS.1044605,x5_CO1.BDOS.1044708,x5_CO1.BDOS.1044863,x5_CO1.BDOS.1044887,x5_CO1.BDOS.1044889,x5_CO1.BDOS.1045081,x5_CO1.BDOS.1045736,x5_CO1.BDOS.1045803,x5_CO1.BDOS.1045806,x5_CO1.BDOS.1046916,x5_CO1.BDOS.1047085,x5_CO1.BDOS.1047541,x5_CO1.BDOS.1047573,x5_CO1.BDOS.1047751,x5_CO1.BDOS.1047788,x5_CO1.BDOS.1047812,x5_CO1.BDOS.1047813,x5_CO1.BDOS.1047821,x5_CO1.BDOS.1047900,x5_CO1.BDOS.1048103,x5_CO1.BDOS.1048222,x5_CO1.BDOS.1048257,x5_CO1.BDOS.1048951,x5_CO1.BDOS.1049006,x5_CO1.BDOS.1049009,x5_CO1.BDOS.1049135,x5_CO1.BDOS.1049221,x5_CO1.BDOS.1049448,x5_CO1.BDOS.1049802,x5_CO1.BDOS.1050902,x5_CO1.BDOS.1052634,x5_CO1.BDOS.1052900,x5_CO1.BDOS.1052901,x5_CO1.BDOS.1053307,x5_CO1.BDOS.1053828,x5_CO1.BDOS.1053941,x5_CO1.BDOS.1054323,x5_CO1.BDOS.1054558,x5_CO1.BDOS.1055254,x5_CO1.BDOS.1055337,x5_CO1.BDOS.1055751,x5_CO1.BDOS.1055766,x5_CO1.BDOS.1055793,x5_CO1.BDOS.1055939,x5_CO1.BDOS.1056037,x5_CO1.BDOS.1056509,x5_CO1.BDOS.1056557,x5_CO1.BDOS.1056749,x5_CO1.BDOS.1057216,x5_CO1.BDOS.1058030,x5_CO1.BDOS.1058056,x5_CO1.BDOS.1058073,x5_CO1.BDOS.1058177,x5_CO1.BDOS.1058455,x5_CO1.BDOS.1058483,x5_CO1.BDOS.1058509,x5_CO1.BDOS.1058520,x5_CO1.BDOS.1058693,x5_CO1.BDOS.1058726,x5_CO1.BDOS.1058814,x5_CO1.BDOS.1058823,x5_CO1.BDOS.1059523,x5_CO1.BDOS.1060856,x5_CO1.BDOS.1060997,x5_CO1.BDOS.1061354,x5_CO1.BDOS.1061695,x5_CO1.BDOS.1061735,x5_CO1.BDOS.1061805,x5_CO1.BDOS.1061867,x5_CO1.BDOS.1062436,x5_CO1.BDOS.1062651,x5_CO1.BDOS.1063104,x5_CO1.BDOS.1063339,x5_CO1.BDOS.1063581,x5_CO1.BDOS.1063896,x5_CO1.BDOS.1063914,x5_CO1.BDOS.1063922,x5_CO1.BDOS.1063965,x5_CO1.BDOS.1063974,x5_CO1.BDOS.1064040,x5_CO1.BDOS.1064312,x5_CO1.BDOS.1064436,x5_CO1.BDOS.1064448,x5_CO1.BDOS.1064459,x5_CO1.BDOS.1064568,x5_CO1.BDOS.1064731,x5_CO1.BDOS.1065219,x5_CO1.BDOS.1065368,x5_CO1.BDOS.1065641,x5_CO1.BDOS.1065688,x5_CO1.BDOS.1066112,x5_CO1.BDOS.1066413,x5_CO1.BDOS.1068192,x5_CO1.BDOS.1068763,x5_CO1.BDOS.1068784,x5_CO1.BDOS.1068818,x5_CO1.BDOS.1069312,x5_CO1.BDOS.1069354,x5_CO1.BDOS.1069509,x5_CO1.BDOS.1069735,x5_CO1.BDOS.1069860,x5_CO1.BDOS.1070864,x5_CO1.BDOS.1071151,x5_CO1.BDOS.1071736,x5_CO1.BDOS.1071984,x5_CO1.BDOS.1072607,x5_CO1.BDOS.1072631,x5_CO1.BDOS.1073548,x5_CO1.BDOS.1073666,x5_CO1.BDOS.1074013,x5_CO1.BDOS.1074091,x5_CO1.BDOS.1074440,x5_CO1.BDOS.1074663,x5_CO1.BDOS.1075013,x5_CO1.BDOS.1075349,x5_CO1.BDOS.1076141,x5_CO1.BDOS.1076709,x5_CO1.BDOS.1077221,x5_CO1.BDOS.1077480,x5_CO1.BDOS.1078007,x5_CO1.BDOS.1079076,x5_CO1.BDOS.1079433,x5_CO1.BDOS.1079487,x5_CO1.BDOS.1079654,x5_CO1.BDOS.1079693,x5_CO1.BDOS.1079779,x5_CO1.BDOS.1079819,x5_CO1.BDOS.1079845,x5_CO1.BDOS.1080189,x5_CO1.BDOS.1080601,x5_CO1.BDOS.1080788,x5_CO1.BDOS.1080798,x5_CO1.BDOS.1081169,x5_CO1.BDOS.1081178,x5_CO1.BDOS.1081864,x5_CO1.BDOS.1083403,x5_CO1.BDOS.1084416,x5_CO1.BDOS.1084431,x5_CO1.BDOS.1084481,x5_CO1.BDOS.1084604,x5_CO1.BDOS.1084772,x5_CO1.BDOS.1085171,x5_CO1.BDOS.1085175,x5_CO1.BDOS.1085467,x5_CO1.BDOS.1085675,x5_CO1.BDOS.1085798,x5_CO1.BDOS.1085922,x5_CO1.BDOS.1085950,x5_CO1.BDOS.1086100,x5_CO1.BDOS.1086118,x5_CO1.BDOS.1086157,x5_CO1.BDOS.1086208,x5_CO1.BDOS.1086336,x5_CO1.BDOS.1087338,x5_CO1.BDOS.1087710,x5_CO1.BDOS.1087720,x5_CO1.BDOS.1087890,x5_CO1.BDOS.1088274,x5_CO1.BDOS.1088290,x5_CO1.BDOS.1088463,x5_CO1.BDOS.1088718,x5_CO1.BDOS.1088771,x5_CO1.BDOS.1089126,x5_CO1.BDOS.1089456,x5_CO1.BDOS.1090238,x5_CO1.BDOS.1090385,x5_CO1.BDOS.1090591,x5_CO1.BDOS.1091574,x5_CO1.BDOS.1092561,x5_CO1.BDOS.1092609,x5_CO1.BDOS.1093474,x5_CO1.BDOS.1093705,x5_CO1.BDOS.1094340,x5_CO1.BDOS.1094515,x5_CO1.BDOS.1094595,x5_CO1.BDOS.1095036,x5_CO1.BDOS.1095232,x5_CO1.BDOS.1095386,x5_CO1.BDOS.1095721,x5_CO1.BDOS.1096142,x5_CO1.BDOS.1097259,x5_CO1.BDOS.1097393,x5_CO1.BDOS.1097495,x5_CO1.BDOS.1097600,x5_CO1.BDOS.1097656,x5_CO1.BDOS.1097666,x5_CO1.BDOS.1097672,x5_CO1.BDOS.1097827,x5_CO1.BDOS.1097944,x5_CO1.BDOS.1098249,x5_CO1.BDOS.1098292,x5_CO1.BDOS.1098692,x5_CO1.BDOS.1099139,x5_CO1.BDOS.1103137,x5_CO1.BDOS.1103170,x5_CO1.BDOS.1103260,x5_CO1.BDOS.1103265,x5_CO1.BDOS.1103272,x5_CO1.BDOS.1103353,x5_CO1.BDOS.1103640,x5_CO1.BDOS.1104018,x5_CO1.BDOS.1104838,x5_CO1.BDOS.1105983,x5_CO1.BDOS.1105995,x5_CO1.BDOS.1106115,x5_CO1.BDOS.1106218,x5_CO1.BDOS.1106515,x5_CO1.BDOS.1107404,x5_CO1.BDOS.1108035,x5_CO1.BDOS.1108368,x5_CO1.BDOS.1108623,x5_CO1.BDOS.1109054,x5_CO1.BDOS.1109075,x5_CO1.BDOS.1109161,x5_CO1.BDOS.1109436,x5_CO1.BDOS.1110290,x5_CO1.BDOS.1110579,x5_CO1.BDOS.1110642,x5_CO1.BDOS.1110661,x5_CO1.BDOS.1110723,x5_CO1.BDOS.1110749,x5_CO1.BDOS.1110801,x5_CO1.BDOS.1111171,x5_CO1.BDOS.1111449,x5_CO1.BDOS.1111457,x5_CO1.BDOS.1111500,x5_CO1.BDOS.1111536,x5_CO1.BDOS.1111852,x5_CO1.BDOS.1111919,x5_CO1.BDOS.1112219,x5_CO1.BDOS.1112420,x5_CO1.BDOS.1112639,x5_CO1.BDOS.1112713,x5_CO1.BDOS.1112795,x5_CO1.BDOS.1112893,x5_CO1.BDOS.1112953,x5_CO1.BDOS.1113132,x5_CO1.BDOS.1113165,x5_CO1.BDOS.1113236,x5_CO1.BDOS.1113452,x5_CO1.BDOS.1113588,x5_CO1.BDOS.1113665,x5_CO1.BDOS.1113671,x5_CO1.BDOS.1113853,x5_CO1.BDOS.1114235,x5_CO1.BDOS.1114709,x5_CO1.BDOS.1117275,x5_CO1.BDOS.1117487,x5_CO1.BDOS.1117555,x5_CO1.BDOS.1117558,x5_CO1.BDOS.1117754,x5_CO1.BDOS.1117824,x5_CO1.BDOS.1118122,x5_CO1.BDOS.1118212,x5_CO1.BDOS.1118227,x5_CO1.BDOS.1118642,x5_CO1.BDOS.1119693,x5_CO1.BDOS.1119710,x5_CO1.BDOS.1119942,x5_CO1.BDOS.1120005,x5_CO1.BDOS.1120141,x5_CO1.BDOS.1120195,x5_CO1.BDOS.1120509,x5_CO1.BDOS.1120662,x5_CO1.BDOS.1120700,x5_CO1.BDOS.1120751,x5_CO1.BDOS.1121402,x5_CO1.BDOS.1121915,x5_CO1.BDOS.1121966,x5_CO1.BDOS.1122394,x5_CO1.BDOS.1122485,x5_CO1.BDOS.1122499,x5_CO1.BDOS.1122519,x5_CO1.BDOS.1122601,x5_CO1.BDOS.1122718,x5_CO1.BDOS.1122921,x5_CO1.BDOS.1122957,x5_CO1.BDOS.1123046,x5_CO1.BDOS.1123112,x5_CO1.BDOS.1123410,x5_CO1.BDOS.1123916,x5_CO1.BDOS.1124047,x5_CO1.BDOS.1124209,x5_CO1.BDOS.1124361,x5_CO1.BDOS.1124481,x5_CO1.BDOS.1124487,x5_CO1.BDOS.1124532,x5_CO1.BDOS.1124551,x5_CO1.BDOS.1124612,x5_CO1.BDOS.1124661,x5_CO1.BDOS.1124816,x5_CO1.BDOS.1124887,x5_CO1.BDOS.1125119,x5_CO1.BDOS.1125207,x5_CO1.BDOS.1125252,x5_CO1.BDOS.1125302,x5_CO1.BDOS.1125538,x5_CO1.BDOS.1125672,x5_CO1.BDOS.1125717,x5_CO1.BDOS.1125719,x5_CO1.BDOS.1125734,x5_CO1.BDOS.1126114,x5_CO1.BDOS.1126540,x5_CO1.BDOS.1126827,x5_CO1.BDOS.1126970,x5_CO1.BDOS.1127026,x5_CO1.BDOS.1127157,x5_CO1.BDOS.1127163,x5_CO1.BDOS.1127203,x5_CO1.BDOS.1127223,x5_CO1.BDOS.1127767,x5_CO1.BDOS.1128113,x5_CO1.BDOS.1128213,x5_CO1.BDOS.1129814,x5_CO1.BDOS.1130285,x5_CO1.BDOS.1130752,x5_CO1.BDOS.1130953,x5_CO1.BDOS.1130954,x5_CO1.BDOS.1131108,x5_CO1.BDOS.1131172,x5_CO1.BDOS.1131174,...,x5_CO1.BDOS.5664921,x5_CO1.BDOS.5664936,x5_CO1.BDOS.5665648,x5_CO1.BDOS.5665715,x5_CO1.BDOS.5665805,x5_CO1.BDOS.5665807,x5_CO1.BDOS.5665864,x5_CO1.BDOS.5666003,x5_CO1.BDOS.5666247,x5_CO1.BDOS.5666282,x5_CO1.BDOS.5666289,x5_CO1.BDOS.5666359,x5_CO1.BDOS.5666627,x5_CO1.BDOS.5666803,x5_CO1.BDOS.5667680,x5_CO1.BDOS.5667954,x5_CO1.BDOS.5668317,x5_CO1.BDOS.5669071,x5_CO1.BDOS.5669122,x5_CO1.BDOS.5669170,x5_CO1.BDOS.5669223,x5_CO1.BDOS.5669290,x5_CO1.BDOS.5669403,x5_CO1.BDOS.5669564,x5_CO1.BDOS.5669575,x5_CO1.BDOS.5669745,x5_CO1.BDOS.5670465,x5_CO1.BDOS.5672568,x5_CO1.BDOS.5675549,x5_CO1.BDOS.5675570,x5_CO1.BDOS.5675660,x5_CO1.BDOS.5676004,x5_CO1.BDOS.5676127,x5_CO1.BDOS.5676301,x5_CO1.BDOS.5676807,x5_CO1.BDOS.5677018,x5_CO1.BDOS.5677567,x5_CO1.BDOS.5678325,x5_CO1.BDOS.5678836,x5_CO1.BDOS.5680046,x5_CO1.BDOS.5681057,x5_CO1.BDOS.5681065,x5_CO1.BDOS.5681409,x5_CO1.BDOS.5681428,x5_CO1.BDOS.5681444,x5_CO1.BDOS.5681837,x5_CO1.BDOS.5682203,x5_CO1.BDOS.5682247,x5_CO1.BDOS.5682498,x5_CO1.BDOS.5682537,x5_CO1.BDOS.5682578,x5_CO1.BDOS.5682591,x5_CO1.BDOS.5682678,x5_CO1.BDOS.5682687,x5_CO1.BDOS.5683019,x5_CO1.BDOS.5683110,x5_CO1.BDOS.5683950,x5_CO1.BDOS.5684098,x5_CO1.BDOS.5684500,x5_CO1.BDOS.5684539,x5_CO1.BDOS.5684582,x5_CO1.BDOS.5684681,x5_CO1.BDOS.5684867,x5_CO1.BDOS.5685032,x5_CO1.BDOS.5685614,x5_CO1.BDOS.5685627,x5_CO1.BDOS.5685770,x5_CO1.BDOS.5686456,x5_CO1.BDOS.5686790,x5_CO1.BDOS.5687802,x5_CO1.BDOS.5688531,x5_CO1.BDOS.5689305,x5_CO1.BDOS.5690111,x5_CO1.BDOS.5690470,x5_CO1.BDOS.5690764,x5_CO1.BDOS.5691073,x5_CO1.BDOS.5691197,x5_CO1.BDOS.5691411,x5_CO1.BDOS.5691447,x5_CO1.BDOS.5691604,x5_CO1.BDOS.5691608,x5_CO1.BDOS.5693625,x5_CO1.BDOS.5694147,x5_CO1.BDOS.5694263,x5_CO1.BDOS.5694982,x5_CO1.BDOS.5695085,x5_CO1.BDOS.5695380,x5_CO1.BDOS.5695866,x5_CO1.BDOS.5695929,x5_CO1.BDOS.5695962,x5_CO1.BDOS.5696630,x5_CO1.BDOS.5696790,x5_CO1.BDOS.5696885,x5_CO1.BDOS.5697958,x5_CO1.BDOS.5699320,x5_CO1.BDOS.5701082,x5_CO1.BDOS.5702166,x5_CO1.BDOS.5703141,x5_CO1.BDOS.5703415,x5_CO1.BDOS.5703988,x5_CO1.BDOS.5704476,x5_CO1.BDOS.5704543,x5_CO1.BDOS.5705113,x5_CO1.BDOS.5705177,x5_CO1.BDOS.5705487,x5_CO1.BDOS.5705660,x5_CO1.BDOS.5706431,x5_CO1.BDOS.5708031,x5_CO1.BDOS.5708948,x5_CO1.BDOS.5709082,x5_CO1.BDOS.5709117,x5_CO1.BDOS.5709200,x5_CO1.BDOS.5709232,x5_CO1.BDOS.5709298,x5_CO1.BDOS.5711575,x5_CO1.BDOS.5711890,x5_CO1.BDOS.5711997,x5_CO1.BDOS.5712023,x5_CO1.BDOS.5712191,x5_CO1.BDOS.5712223,x5_CO1.BDOS.5712236,x5_CO1.BDOS.5712261,x5_CO1.BDOS.5712403,x5_CO1.BDOS.5712506,x5_CO1.BDOS.5712520,x5_CO1.BDOS.5712528,x5_CO1.BDOS.5712546,x5_CO1.BDOS.5712707,x5_CO1.BDOS.5712808,x5_CO1.BDOS.5712969,x5_CO1.BDOS.5712990,x5_CO1.BDOS.5713072,x5_CO1.BDOS.5713117,x5_CO1.BDOS.5713742,x5_CO1.BDOS.5713789,x5_CO1.BDOS.5713884,x5_CO1.BDOS.5714185,x5_CO1.BDOS.5714366,x5_CO1.BDOS.5714659,x5_CO1.BDOS.5714913,x5_CO1.BDOS.5715391,x5_CO1.BDOS.5715420,x5_CO1.BDOS.5715544,x5_CO1.BDOS.5716054,x5_CO1.BDOS.5717432,x5_CO1.BDOS.5722243,x5_CO1.BDOS.5722704,x5_CO1.BDOS.5723417,x5_CO1.BDOS.5723806,x5_CO1.BDOS.5724431,x5_CO1.BDOS.5727029,x5_CO1.BDOS.5727427,x5_CO1.BDOS.5727889,x5_CO1.BDOS.5728269,x5_CO1.BDOS.5728378,x5_CO1.BDOS.5728765,x5_CO1.BDOS.5729779,x5_CO1.BDOS.5729988,x5_CO1.BDOS.5730372,x5_CO1.BDOS.5730403,x5_CO1.BDOS.5731725,x5_CO1.BDOS.5731898,x5_CO1.BDOS.5732393,x5_CO1.BDOS.5732961,x5_CO1.BDOS.5733197,x5_CO1.BDOS.5735177,x5_CO1.BDOS.5735343,x5_CO1.BDOS.5736012,x5_CO1.BDOS.5736030,x5_CO1.BDOS.5736158,x5_CO1.BDOS.5736213,x5_CO1.BDOS.5737043,x5_CO1.BDOS.5737050,x5_CO1.BDOS.5737626,x5_CO1.BDOS.5737762,x5_CO1.BDOS.5738287,x5_CO1.BDOS.5739082,x5_CO1.BDOS.5739589,x5_CO1.BDOS.5739827,x5_CO1.BDOS.5739829,x5_CO1.BDOS.5740144,x5_CO1.BDOS.5740678,x5_CO1.BDOS.5740811,x5_CO1.BDOS.5741063,x5_CO1.BDOS.5741334,x5_CO1.BDOS.5741446,x5_CO1.BDOS.5741802,x5_CO1.BDOS.5741938,x5_CO1.BDOS.5742198,x5_CO1.BDOS.5742206,x5_CO1.BDOS.5742520,x5_CO1.BDOS.5744195,x5_CO1.BDOS.5745715,x5_CO1.BDOS.5745802,x5_CO1.BDOS.5746076,x5_CO1.BDOS.5746349,x5_CO1.BDOS.5746565,x5_CO1.BDOS.5746856,x5_CO1.BDOS.5747095,x5_CO1.BDOS.5747218,x5_CO1.BDOS.5747220,x5_CO1.BDOS.5747392,x5_CO1.BDOS.5747435,x5_CO1.BDOS.5747681,x5_CO1.BDOS.5747844,x5_CO1.BDOS.5747903,x5_CO1.BDOS.5747909,x5_CO1.BDOS.5747917,x5_CO1.BDOS.5748071,x5_CO1.BDOS.5748415,x5_CO1.BDOS.5749318,x5_CO1.BDOS.5749495,x5_CO1.BDOS.5749552,x5_CO1.BDOS.5750005,x5_CO1.BDOS.5750120,x5_CO1.BDOS.5750174,x5_CO1.BDOS.5750403,x5_CO1.BDOS.5750790,x5_CO1.BDOS.5751487,x5_CO1.BDOS.5751535,x5_CO1.BDOS.5751915,x5_CO1.BDOS.5754678,x5_CO1.BDOS.5754756,x5_CO1.BDOS.5755129,x5_CO1.BDOS.5755677,x5_CO1.BDOS.5755849,x5_CO1.BDOS.5757093,x5_CO1.BDOS.5758222,x5_CO1.BDOS.5759692,x5_CO1.BDOS.5760824,x5_CO1.BDOS.5761765,x5_CO1.BDOS.5766356,x5_CO1.BDOS.5766732,x5_CO1.BDOS.5767098,x5_CO1.BDOS.5767112,x5_CO1.BDOS.5767802,x5_CO1.BDOS.5768228,x5_CO1.BDOS.5768933,x5_CO1.BDOS.5769310,x5_CO1.BDOS.5769482,x5_CO1.BDOS.5769954,x5_CO1.BDOS.5770356,x5_CO1.BDOS.5773106,x5_CO1.BDOS.5773630,x5_CO1.BDOS.5773839,x5_CO1.BDOS.5773905,x5_CO1.BDOS.5775150,x5_CO1.BDOS.5775868,x5_CO1.BDOS.5776174,x5_CO1.BDOS.5776556,x5_CO1.BDOS.5776611,x5_CO1.BDOS.5776661,x5_CO1.BDOS.5776691,x5_CO1.BDOS.5776835,x5_CO1.BDOS.5776876,x5_CO1.BDOS.5776910,x5_CO1.BDOS.5777566,x5_CO1.BDOS.5778230,x5_CO1.BDOS.5778711,x5_CO1.BDOS.5778757,x5_CO1.BDOS.5778844,x5_CO1.BDOS.5788357,x5_CO1.BDOS.5790053,x5_CO1.BDOS.5790079,x5_CO1.BDOS.5790149,x5_CO1.BDOS.5790310,x5_CO1.BDOS.5790695,x5_CO1.BDOS.5791225,x5_CO1.BDOS.5791315,x5_CO1.BDOS.5791347,x5_CO1.BDOS.5792623,x5_CO1.BDOS.5794803,x5_CO1.BDOS.5795572,x5_CO1.BDOS.5796346,x5_CO1.BDOS.5796472,x5_CO1.BDOS.5796783,x5_CO1.BDOS.5797131,x5_CO1.BDOS.5797541,x5_CO1.BDOS.5798093,x5_CO1.BDOS.5798323,x5_CO1.BDOS.5798467,x5_CO1.BDOS.5798712,x5_CO1.BDOS.5799552,x5_CO1.BDOS.5800047,x5_CO1.BDOS.5800309,x5_CO1.BDOS.5800555,x5_CO1.BDOS.5803087,x5_CO1.BDOS.5803419,x5_CO1.BDOS.5803614,x5_CO1.BDOS.5804213,x5_CO1.BDOS.5804302,x5_CO1.BDOS.5804401,x5_CO1.BDOS.5804726,x5_CO1.BDOS.5804731,x5_CO1.BDOS.5806773,x5_CO1.BDOS.5807008,x5_CO1.BDOS.5807062,x5_CO1.BDOS.5807498,x5_CO1.BDOS.5807827,x5_CO1.BDOS.5808188,x5_CO1.BDOS.5809914,x5_CO1.BDOS.5809946,x5_CO1.BDOS.5809948,x5_CO1.BDOS.5809968,x5_CO1.BDOS.5810011,x5_CO1.BDOS.5810297,x5_CO1.BDOS.5810311,x5_CO1.BDOS.5810755,x5_CO1.BDOS.5811074,x5_CO1.BDOS.5815398,x5_CO1.BDOS.5815531,x5_CO1.BDOS.5815878,x5_CO1.BDOS.5815941,x5_CO1.BDOS.5815977,x5_CO1.BDOS.5817010,x5_CO1.BDOS.5817052,x5_CO1.BDOS.5818177,x5_CO1.BDOS.5818214,x5_CO1.BDOS.5818700,x5_CO1.BDOS.5822971,x5_CO1.BDOS.5823558,x5_CO1.BDOS.5824578,x5_CO1.BDOS.5824630,x5_CO1.BDOS.5824777,x5_CO1.BDOS.5824980,x5_CO1.BDOS.5825262,x5_CO1.BDOS.5826727,x5_CO1.BDOS.5827480,x5_CO1.BDOS.5828105,x5_CO1.BDOS.5828319,x5_CO1.BDOS.5828336,x5_CO1.BDOS.5829403,x5_CO1.BDOS.5829710,x5_CO1.BDOS.5829905,x5_CO1.BDOS.5829985,x5_CO1.BDOS.5830093,x5_CO1.BDOS.5830143,x5_CO1.BDOS.5830334,x5_CO1.BDOS.5830378,x5_CO1.BDOS.5830650,x5_CO1.BDOS.5830948,x5_CO1.BDOS.5830996,x5_CO1.BDOS.5831318,x5_CO1.BDOS.5831386,x5_CO1.BDOS.5831387,x5_CO1.BDOS.5831410,x5_CO1.BDOS.5831490,x5_CO1.BDOS.5831822,x5_CO1.BDOS.5831878,x5_CO1.BDOS.5832533,x5_CO1.BDOS.5832809,x5_CO1.BDOS.5832882,x5_CO1.BDOS.5834331,x5_CO1.BDOS.5835885,x5_CO1.BDOS.5836040,x5_CO1.BDOS.5836058,x5_CO1.BDOS.5836986,x5_CO1.BDOS.5837826,x5_CO1.BDOS.5838020,x5_CO1.BDOS.5839549,x5_CO1.BDOS.5840556,x5_CO1.BDOS.5840999,x5_CO1.BDOS.5841882,x5_CO1.BDOS.5842059,x5_CO1.BDOS.5843179,x5_CO1.BDOS.5846160,x5_CO1.BDOS.5846166,x5_CO1.BDOS.5846912,x5_CO1.BDOS.5846951,x5_CO1.BDOS.5847248,x5_CO1.BDOS.5847658,x5_CO1.BDOS.5847877,x5_CO1.BDOS.5848028,x5_CO1.BDOS.5848062,x5_CO1.BDOS.5848100,x5_CO1.BDOS.5848603,x5_CO1.BDOS.5849855,x5_CO1.BDOS.5850949,x5_CO1.BDOS.5851468,x5_CO1.BDOS.5851958,x5_CO1.BDOS.5852387,x5_CO1.BDOS.5852741,x5_CO1.BDOS.5853379,x5_CO1.BDOS.5853609,x5_CO1.BDOS.5855149,x5_CO1.BDOS.5855789,x5_CO1.BDOS.5855953,x5_CO1.BDOS.5856269,x5_CO1.BDOS.5856598,x5_CO1.BDOS.5856818,x5_CO1.BDOS.5857003,x5_CO1.BDOS.5857930,x5_CO1.BDOS.5858464,x5_CO1.BDOS.5859266,x5_CO1.BDOS.5860973,x5_CO1.BDOS.5860992,x5_CO1.BDOS.5861078,x5_CO1.BDOS.5861094,x5_CO1.BDOS.5866836,x5_CO1.BDOS.5871246,x5_CO1.BDOS.5871464,x5_CO1.BDOS.5872884,x5_CO1.BDOS.5873647,x5_CO1.BDOS.5874101,x5_CO1.BDOS.5875458,x5_CO1.BDOS.5877687,x5_CO1.BDOS.5878195,x5_CO1.BDOS.5878996,x5_CO1.BDOS.5879030,x5_CO1.BDOS.5879100,x5_CO1.BDOS.5879240,x5_CO1.BDOS.5880507,x5_CO1.BDOS.5881632,x5_CO1.BDOS.5881861,x5_CO1.BDOS.5882828,x5_CO1.BDOS.5882886,x5_CO1.BDOS.5883312,x5_CO1.BDOS.5884064,x5_CO1.BDOS.5889880,x5_CO1.BDOS.5890160,x5_CO1.BDOS.5890179,x5_CO1.BDOS.5890852,x5_CO1.BDOS.5892049,x5_CO1.BDOS.5892532,x5_CO1.BDOS.5892673,x5_CO1.BDOS.5892837,x5_CO1.BDOS.5893027,x5_CO1.BDOS.5893079,x5_CO1.BDOS.5893109,x5_CO1.BDOS.5893314,x5_CO1.BDOS.5893331,x5_CO1.BDOS.5893455,x5_CO1.BDOS.5893481,x5_CO1.BDOS.5893582,x5_CO1.BDOS.5893785,x5_CO1.BDOS.5893863,x5_CO1.BDOS.5893907,x5_CO1.BDOS.5894286,x5_CO1.BDOS.5895106,x5_CO1.BDOS.5895279,x5_CO1.BDOS.5895811,x6_Arrendamiento de inmuebles,x6_Compraventa,x6_Decreto 092 de 2017,x6_Interventoría,x6_No Especificado,x6_Obra,x6_Otro,x6_Prestación de servicios,x6_Seguros,x6_Servicios financieros,x6_Suministros,x6_Venta muebles,x7_CCE-20-Concurso_Meritos_Sin_Lista_Corta_1Sobre,x7_Contratación Directa (con ofertas),x7_Contratación directa,x7_Contratación régimen especial,x7_Enajenación de bienes con subasta,x7_Mínima cuantía,x7_No Definido,x7_Selección Abreviada de Menor Cuantía,x7_Selección abreviada subasta inversa,x8_A convenir,x8_Como acordado previamente,x8_No Definido,x8_Transporte a cargo del comprador,x8_Transporte incluido,x9_No,x9_Si,x10_No,x10_Si,x11_Distribuido,x11_Recursos Propios,x12_Cédula de Ciudadanía,x12_Cédula de Extranjería,x12_NIT,x12_Otro,x12_Pasaporte,x12_Registro Civil,x12_Sin Descripcion,x13_Femenino,x13_Masculino,x13_No Definido,x14_Antioquia,x14_Atlántico_Cesar_Magdalena_La_Guajira,x14_Bolivar_Córdoba_Sucre_San Andrés,x14_Boyacá_Casanare,x14_Caldas,x14_Cundinamarca,x14_Huila_Caquetá_Putumayo,x14_Meta_Guainía_Guaviare_Vaupés_Vichada_Amazonas,x14_Nariño_Alto Putumayo,x14_Norte_Santander - Arauca,x14_Otro,x14_Quindío_Risaralda,x14_Santander,x14_Sede_Principal_ESAP,x14_Tolima,x14_Valle
0,-2,-1,1,0,0,1,0,0,0,1,0,0,0,0,0,0,0,0,1,1,0,1,1,1,,,,,-1,-2,-2,-2,1,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,1,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,1,0,0,0,0,0,0,1,1,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,...,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,1,0,0,0,0,0,0,1,0,0,0,0,0,0,1,0,0,0,0,1,0,1,0,0,1,1,0,0,0,0,0,0,1,0,0,1,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0
1,-2,-1,1,0,0,-1,0,0,0,-1,0,0,0,0,0,0,0,0,0,1,1,1,1,1,,,,,1,-1,-1,-1,1,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,1,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,1,0,0,0,0,0,0,1,1,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,...,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,1,0,0,0,0,0,0,1,0,0,0,0,0,0,1,0,0,0,0,1,0,1,0,0,1,1,0,0,0,0,0,0,0,0,1,1,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0
2,-2,-1,-1,0,0,-1,0,0,0,-1,0,0,0,0,0,0,0,0,-1,1,0,-1,-1,-2,,,,,1,-1,0,-1,1,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,1,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,1,0,0,0,0,0,0,1,1,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,...,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,1,0,0,0,0,0,0,1,0,0,0,0,0,0,1,0,0,0,0,1,0,1,0,0,1,0,0,0,0,0,0,1,0,0,1,1,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0
3,-2,-1,1,0,0,0,0,0,0,0,1,0,0,0,0,0,0,0,-1,1,0,-1,-1,-1,,,,,-1,0,0,0,1,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,1,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,1,0,0,0,0,0,0,1,1,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,...,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,1,0,0,0,0,0,0,1,0,0,0,0,0,0,1,0,0,0,0,1,0,1,0,0,1,1,0,0,0,0,0,0,0,0,1,1,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0
4,-2,-1,1,0,0,-1,0,0,0,-1,0,0,0,0,0,0,0,0,0,1,0,1,1,1,,,,,1,0,0,0,1,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,1,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,1,0,0,0,0,0,0,1,1,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,...,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,1,0,0,0,0,0,0,1,0,0,0,0,0,0,1,0,0,0,0,1,0,0,1,0,1,1,0,0,0,0,0,0,0,0,1,1,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0


In [357]:
### Entrenamos varios modelos random forest para decidir si una persona gana mas de 50k y escogeremos el mejor modelo.
from sklearn.model_selection import train_test_split
from sklearn.ensemble import RandomForestClassifier
from sklearn.metrics import accuracy_score, classification_report, confusion_matrix
from sklearn.model_selection import GridSearchCV

# Separación de los datos en entrenamiento y prueba

X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=30)

# Creación del modelo

parametros = {'n_estimators': [100, 200, 500],
                'max_depth': [5, 10,  20],
                'min_samples_split': [5, 10,  20],
                'min_samples_leaf': [1, 2, 10]}

modelo = RandomForestClassifier(random_state=30)


# Búsqueda de los mejores hiperparámetros

grid = GridSearchCV(modelo, param_grid=parametros, cv=5, n_jobs=-1)

grid.fit(Transformacion_Columnas.transform(X_train), y_train)


The least populated class in y has only 1 members, which is less than n_splits=5.



MemoryError: Unable to allocate 734. MiB for an array with shape (7357, 13076) and data type float64