# **Análisis contratación Escuela Superior de Administración Pública 2020-2024**

## Introducción

En este documento se presenta la aplicación de diferentes metodologías estudiadas en el curso de Programación II de la Maestría en Inteligencia de Negocios de la Universidad de Externado de Colombia. Lo anterior, se da en un ambiente de análisis y comprensión del fenómeno de la contratación pública a partir de la exploración de  diferentes escenarios aplicados a la realidad de las Entidades Públicas de Colombia. 

En este sentido, se exploran y analizan los resultados del modelo de efectos fijos del panel de datos de la contratación de la Escuela Superior de Administración Pública como individuo de análisis del 2020 a 2024 según los datos abiertos publicados por la Agencia Nacional de Contratación Pública - Colombia Compra Efienciete sobre el data set [SECOP II - Contratos Electrónicos](https://www.datos.gov.co/Gastos-Gubernamentales/SECOP-II-Contratos-Electr-nicos/jbjy-vk9h/about_data).

 De esta forma, se exploran ambientes y técnicas propicios en el contexto del aprendizaje sobre programación y en la aplicación de métodos estadísticos para la profundización y reconocimiento del fenómeno de estudio a la luz del procesamiento, depuración y análisis de la información, todos ellos necesarios en el actual contexto en donde es indispensable el uso de herramientas para la gestión de los datos y de la información en las organizaciones para el análisis y la toma de decisiones sobre los fenónemos que les afectan.

## Objetivo general

Analizar el efecto que tiene el tiempo de ejecución del proceso de contratación sobre el valor total de los contratos en la Escuela Superior de Administración Pública.

## Objetivos específicos

*$1.$* Explorar métodos de limpieza, depuración y automatización de la bases datos de contratos de la Escuela Superior de Administración Pública a partir del uso y aprovechamiento de los datos e información de del data set [SECOP II - Contratos Electrónicos](https://www.datos.gov.co/Gastos-Gubernamentales/SECOP-II-Contratos-Electr-nicos/jbjy-vk9h/about_data)


*$4.$* Aplicar técnicas para medir el efecto del tiempo de ejecución de la contratación pública sobre el valor de los contratos celebrados por la Escuela Superior de Administración Pública durante el período 2020-2024

*$3.$* Analizar el fenómeno de la contratación pública con Colombia con el propósito de brindar recomendaciones sobre el buen manejo de los recursos públicos a los sujetos responsables de su ejecución

## Antecedentes

A partir de la adopción de los principios de la Función Administrativa (Art. 209) de la Constitución Política de 1991, el Sector Público Colombiano ha desarrollado diferentes acciones para sinterizar un Sistema de Gestión que responda a las necesidades de articulación de los elementos que intervienen al momento de dirigir la gestión pública  hacia “el mejor desempeño institucional y a la consecución de resultados para la satisfacción de las necesidades y el goce efectivo de los derechos de los ciudadanos, en el marco de la legalidad y la integridad” (DAFP, 2019, p. 19).
<!--  -->
El Sistema de Gestión vigente (Art. 133 - Ley 1753 de 2015) integra el Sistema de Desarrollo Administrativo (Ley 489 de 1998), el Sistema de Gestión de la Calidad (Ley 872 de 2003) y se articula con el Sistema de Control Interno (Ley 87 de 1993 y del Art. 27 al 19 de la Ley 489); que finalmente constituyen el MIPG como el mecanismo que facilita la integración y articulación de los Sistemas de Planeación y Gestión que hasta el momento existían en la entidades públicas colombianas (Decreto 1499 de 2017), integró en 2021 a partir del la Política de Gestión y desempeño **Compras y Contatación Pública** con el fin de que las entidades estatales gestionen adecuadamente sus compras y contrataciones públicas a través de herramientas tecnológicas, lineamientos normativos, documentos estándar, técnicas de abastecimiento estratégico e instrumentos de agregación de demanda. 

De esta forma, con esta política la Agencia Nacional de Contratación Pública - Colombia Compra Efienciente, proyecta el suministro de una herramienta como lo es el SECOP II para que las entidades estatales  se alinien con el propósito de generar buenas mejores prácticas en el abastecimiento y contratación y con ello fortalecer la satisfacción de las necesidades públicas (eficacia), con menores recursos (eficiencia), altos estándares de calidad, pluralidad de oferentes y garantía de transparencia y rendición de cuentas.

Sin embargo, aun cuando la integración de lineamientos en materia de contratación pública sea un propósito de la administración pública conducente al buen manejo del prespuesto y a la planeación de las finanzas públicas, esto resulta en un reto su implementación y aprovechamiento para la toma de decisones en el ámbito de la contratación pública. Los procedimientos que rigen la contratación deben verse reflejados en la planeación de la contratación y se deben implementar en contextos de alta incertidumbre que las organizaciones constantemente reflejan.

En este sentido, para evidenciar lo anteriormente expuesto, se trata de analizar el efecto que tiene el tiempo de ejecución de los procesos de contratación sobre el valor de la contratación de la Escuela Superior Pública, vista en este análisis como un individuo sobre el el cual es posible su estudio a la luz de los objetivos planteados en este proyecto y según la información disponible en el data set datos abiertos publicados por la Agencia Nacional de Contratación Pública - Colombia Compra Efienciete sobre el data set [SECOP II - Contratos Electrónicos] (https://www.datos.gov.co/Gastos-Gubernamentales/)


### _Libreriras_

In [413]:
!pip install sodapy
!pip install seaborn
!pip install pandas
!pip install plotly
!pip install linearmodels



In [414]:
#Pandas y Nunmpy
import pandas as pd
import numpy as np
#Transformación de fecha
from datetime import datetime
#Gráficas
import seaborn as sns
import matplotlib as mpl
import matplotlib.pyplot as plt
from datetime import datetime
import plotly.express as px
import plotly.graph_objects as go
#Se importa la clase PanelOLS, que se utiliza para realizar regresiones lineales en modelos de panel
# o conjuntos de series temporales cruzadas y estimar relaciones lineales.
from linearmodels.panel import PanelOLS
import pandas as pd
#Se importa la biblioteca "statsmodels" y la renombra como "sm" 
#Statsmodels es una biblioteca que proporciona herramientas y modelos estadísticos para el análisis 
#de datos en Python. Se utiliza comúnmente para realizar análisis de regresión, 
#series de tiempo y otras técnicas estadísticas.
import statsmodels.api as sm

### _Exploración de la base de datos_

#### _Cargar base de datos_

Se utiliza la base de datos contratos_secop_esap del data set [SECOP II - Contratos Electrónicos] (https://www.datos.gov.co/Gastos-Gubernamentales/)


In [415]:
ar = r'C:\Users\Astrandrea\Documents\AnaConESAP\datos\raw\contratos_secop_esap.csv'

In [416]:
pd.set_option("display.max.columns", 999)
# Se cambia la configuración para ver los números de la forma 1.000.000
pd.options.display.float_format = "{:,.0f}".format
secop = pd.read_csv(ar)
secop

Unnamed: 0.1,Unnamed: 0,nombre_entidad,nit_entidad,departamento,ciudad,localizaci_n,orden,sector,rama,entidad_centralizada,proceso_de_compra,id_contrato,referencia_del_contrato,estado_contrato,codigo_de_categoria_principal,descripcion_del_proceso,tipo_de_contrato,modalidad_de_contratacion,justificacion_modalidad_de,fecha_de_firma,fecha_de_fin_del_contrato,condiciones_de_entrega,tipodocproveedor,documento_proveedor,proveedor_adjudicado,es_grupo,es_pyme,habilita_pago_adelantado,liquidaci_n,obligaci_n_ambiental,obligaciones_postconsumo,reversion,origen_de_los_recursos,destino_gasto,valor_del_contrato,valor_de_pago_adelantado,valor_facturado,valor_pendiente_de_pago,valor_pagado,valor_amortizado,valor_pendiente_de,valor_pendiente_de_ejecucion,estado_bpin,c_digo_bpin,anno_bpin,saldo_cdp,saldo_vigencia,espostconflicto,dias_adicionados,puntos_del_acuerdo,pilares_del_acuerdo,urlproceso,nombre_representante_legal,nacionalidad_representante_legal,domicilio_representante_legal,tipo_de_identificaci_n_representante_legal,identificaci_n_representante_legal,g_nero_representante_legal,presupuesto_general_de_la_nacion_pgn,sistema_general_de_participaciones,sistema_general_de_regal_as,recursos_propios_alcald_as_gobernaciones_y_resguardos_ind_genas_,recursos_de_credito,recursos_propios,ultima_actualizacion,codigo_entidad,codigo_proveedor,objeto_del_contrato,fecha_de_inicio_del_contrato,fecha_de_inicio_de_ejecucion,fecha_de_fin_de_ejecucion,fecha_inicio_liquidacion,fecha_fin_liquidacion
0,0,ESCUELA SUPERIOR DE ADMINISTRACIÓN PUBLICA,899999054,Distrito Capital de Bogotá,Bogotá,"Colombia, Bogotá, Bogotá",Nacional,Servicio Público,Ejecutivo,Centralizada,CO1.BDOS.5473717,CO1.PCCNTR.5793225,BOG-245-2024,Activo,V1.93151500,Prestar servicios profesionales como abogado b...,Prestación de servicios,Contratación directa,Servicios profesionales y apoyo a la gestión,2024-01-23T00:00:00.000,2024-10-22T00:00:00.000,A convenir,Cédula de Ciudadanía,1019088195,KATTY BALAGUERA,No,No,No,No,No,No,No,Recursos Propios,Inversión,60568000,0,0,60568000,0,0,0,60568000,No Válido,No Definido,No D,60568000,0,No,0,No aplica,No aplica,{'url': 'https://community.secop.gov.co/Public...,katty jobanna balaguera bustos,CO,No Definido,Cédula de Ciudadanía,1019088195,Femenino,0,0,0,0,0,60568000,2024-01-23T00:00:00.000,701255226,720247055,Prestar servicios profesionales como abogado b...,,,,,
1,1,ESCUELA SUPERIOR DE ADMINISTRACIÓN PUBLICA,899999054,Distrito Capital de Bogotá,Bogotá,"Colombia, Bogotá, Bogotá",Nacional,Servicio Público,Ejecutivo,Centralizada,CO1.BDOS.1645381,CO1.PCCNTR.2109860,BOG-024-2021,En ejecución,V1.80111600,Prestar servicios profesionales para la planea...,Prestación de servicios,Contratación directa,Servicios profesionales y apoyo a la gestión,2021-01-10T00:00:00.000,2021-08-31T00:00:00.000,A convenir,Cédula de Ciudadanía,1022360809,Angie Nataly Ruiz Rodriguez,No,No,No,No,No,No,No,Recursos Propios,Inversión,76293762,0,38146881,38146881,38146881,0,0,38146881,No Válido,No Definido,2021,56902064,0,No,0,No aplica,No aplica,{'url': 'https://community.secop.gov.co/Public...,Angie Nataly Ruiz Rodriguez,CO,No Definido,Cédula de Ciudadanía,1022360809,Femenino,0,0,0,0,0,76293762,,701255226,706380524,Prestar servicios profesionales para la planea...,2021-01-14T00:00:00.000,,,,
2,2,ESCUELA SUPERIOR DE ADMINISTRACIÓN PUBLICA,899999054,Distrito Capital de Bogotá,Bogotá,"Colombia, Bogotá, Bogotá",Nacional,Servicio Público,Ejecutivo,Centralizada,CO1.BDOS.3746547,CO1.PCCNTR.4396488,BOG-005-2023,En ejecución,V1.93151500,PRESTAR SERVICIOS PROFESIONALES REALIZANDO ACO...,Prestación de servicios,Contratación directa,Servicios profesionales y apoyo a la gestión,2023-01-13T00:00:00.000,2023-05-01T00:00:00.000,A convenir,Cédula de Ciudadanía,1026272842,ERIKA ASTRID MENDEZ MORENO,No,No,No Definido,No,No,No,No,Recursos Propios,Funcionamiento,31720000,0,31720000,0,31720000,0,0,0,No Válido,No Definido,No D,31720000,0,No,0,No aplica,No aplica,{'url': 'https://community.secop.gov.co/Public...,ERIKA ASTRID MENDEZ MORENO,CO,CALLE 18 A 6 - 86,Cédula de Ciudadanía,1026272842,Femenino,0,0,0,0,0,31720000,,701255226,709239016,PRESTAR SERVICIOS PROFESIONALES REALIZANDO ACO...,2023-01-13T00:00:00.000,,,,
3,3,ESCUELA SUPERIOR DE ADMINISTRACIÓN PUBLICA,899999054,Distrito Capital de Bogotá,Bogotá,"Colombia, Bogotá, Bogotá",Nacional,Servicio Público,Ejecutivo,Centralizada,CO1.BDOS.4004756,CO1.PCCNTR.4629425,ESAP-PS-CHO-009-2023,Modificado,V1.93151500,Prestar los servicios profesionales líder admi...,Prestación de servicios,Contratación directa,Servicios profesionales y apoyo a la gestión,2023-02-15T00:00:00.000,2024-01-01T00:00:00.000,A convenir,Cédula de Ciudadanía,54259791,GLORIA STELLA MOSQUERA ARIAS,No,No,No,No,No,No,No,Distribuido,Funcionamiento,51030000,0,51030000,4860000,46170000,0,0,4860000,No Válido,No Definido,No D,53460000,0,No,0,No aplica,No aplica,{'url': 'https://community.secop.gov.co/Public...,GLORIA STELLA MOSQUERA ARIAS,CO,No Definido,Cédula de Ciudadanía,54259791,No Definido,51030000,0,0,0,0,0,,701255226,716771035,Prestar los servicios profesionales líder admi...,2023-02-17T00:00:00.000,,,,
4,4,ESCUELA SUPERIOR DE ADMINISTRACIÓN PUBLICA,899999054,Distrito Capital de Bogotá,Bogotá,"Colombia, Bogotá, Bogotá",Nacional,Servicio Público,Ejecutivo,Centralizada,CO1.BDOS.2273409,CO1.PCCNTR.2885861,BOG-947-2021,Cerrado,V1.93151500,Prestar servicios profesionales para hacer la ...,Prestación de servicios,Contratación directa,Servicios profesionales y apoyo a la gestión,2021-09-29T00:00:00.000,2021-12-31T00:00:00.000,A convenir,Cédula de Ciudadanía,28393301,LYDA MILENA GARZA PINZON,No,No,No,No,No,No,No,Recursos Propios,Inversión,11469969,0,7646666,3823303,7646666,0,0,3823303,No Válido,No Definido,2023,16650000,0,No,0,No aplica,No aplica,{'url': 'https://community.secop.gov.co/Public...,LYDA MILENA GARZA PINZON,CO,No Definido,Sin Descripcion,Sin Descripcion,No Definido,0,0,0,0,0,11469969,,701255226,711710996,Prestar servicios profesionales para hacer la ...,2021-09-29T00:00:00.000,,,,
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
5384,5384,ESCUELA SUPERIOR DE ADMINISTRACIÓN PUBLICA,899999054,Distrito Capital de Bogotá,Bogotá,"Colombia, Bogotá, Bogotá",Nacional,Servicio Público,Ejecutivo,Centralizada,CO1.BDOS.5044120,CO1.PCCNTR.5454142,BOG-1647-2023.,En ejecución,V1.93151500,Prestar servicios profesionales para apoyar la...,Prestación de servicios,Contratación directa,Servicios profesionales y apoyo a la gestión,2023-10-13T00:00:00.000,2024-01-01T00:00:00.000,A convenir,Cédula de Ciudadanía,1012404365,PAULA ANDREA MORA SANDOVAL,No,No,No,No,No,No,No,Recursos Propios,Inversión,18821000,0,16008700,2812300,16008700,0,0,2812300,No Válido,No Definido,No D,19470000,0,No,0,No aplica,No aplica,{'url': 'https://community.secop.gov.co/Public...,Mora Sandoval,CO,Diagonal 72 A# 81- 48 sur,Cédula de Ciudadanía,1012404365,Femenino,0,0,0,0,0,18821000,,701255226,709641112,Prestar servicios profesionales para apoyar la...,2023-10-17T00:00:00.000,,,,
5385,5385,ESCUELA SUPERIOR DE ADMINISTRACIÓN PUBLICA,899999054,Distrito Capital de Bogotá,Bogotá,"Colombia, Bogotá, Bogotá",Nacional,Servicio Público,Ejecutivo,Centralizada,CO1.BDOS.3826205,CO1.PCCNTR.4466013,BOG-213-2023,Modificado,V1.93151500,Prestar servicios profesionales para apoyar en...,Prestación de servicios,Contratación directa,Servicios profesionales y apoyo a la gestión,2023-01-24T00:00:00.000,2023-12-30T00:00:00.000,A convenir,Cédula de Ciudadanía,1016048734,Diego Alexander Hernandez Laguna,No,No,No,No,No,No,No,Recursos Propios,Inversión,64431667,0,64431666,1,64431666,0,0,1,No Válido,No Definido,No D,63470000,0,No,4,No aplica,No aplica,{'url': 'https://community.secop.gov.co/Public...,Diego Alexander Hernandez Laguna,CO,No Definido,Sin Descripcion,Sin Descripcion,No Definido,0,0,0,0,0,63470000,,701255226,706542255,Prestar servicios profesionales para apoyar en...,2023-01-26T00:00:00.000,,,,
5386,5386,ESCUELA SUPERIOR DE ADMINISTRACIÓN PUBLICA,899999054,Distrito Capital de Bogotá,Bogotá,"Colombia, Bogotá, Bogotá",Nacional,Servicio Público,Ejecutivo,Centralizada,CO1.BDOS.4521832,CO1.PCCNTR.5053495,BOG-1087-2023,En ejecución,V1.80111703,"Aunar esfuerzos financieros, técnicos, adminis...",Otro,Contratación directa,Contratos o convenios Interadministrativos (va...,2023-06-08T00:00:00.000,2024-01-01T00:00:00.000,No Definido,No Definido,900034001,CONCEJO MUNICIPAL DE NARIÑO CUNDINAMARCA,No,No,No,No,No,No,No,Distribuido,Inversión,0,0,0,0,0,0,0,0,No Válido,No Definido,No D,0,0,No,0,No aplica,No aplica,{'url': 'https://community.secop.gov.co/Public...,DIEGO LUIS MASMELA JIMENEZ,CO,CRA 2 CALLE 6 ESQUINA,Cédula de Ciudadanía,3101908,No Definido,0,0,0,0,0,0,,701255226,721519577,"Aunar esfuerzos financieros, técnicos, adminis...",2023-06-09T00:00:00.000,,,,
5387,5387,ESCUELA SUPERIOR DE ADMINISTRACIÓN PUBLICA,899999054,Distrito Capital de Bogotá,Bogotá,"Colombia, Bogotá, Bogotá",Nacional,Servicio Público,Ejecutivo,Centralizada,CO1.BDOS.4378755,CO1.PCCNTR.4938846,BOG-728-2023,En ejecución,V1.80111703,"Aunar esfuerzos financieros, técnicos, adminis...",Otro,Contratación directa,Contratos o convenios Interadministrativos (va...,2023-05-15T00:00:00.000,2024-01-01T00:00:00.000,No Definido,No Definido,8909825669,CONCEJO MUNICIPAL DE NARIÑO,No,No,No,No,No,No,No,Distribuido,Funcionamiento,0,0,0,0,0,0,0,0,No Válido,No Definido,No D,0,0,No,0,No aplica,No aplica,{'url': 'https://community.secop.gov.co/Public...,Sindy Mariana Lopez Sanchez,CO,No Definido,Cédula de Ciudadanía,1036839874,Femenino,0,0,0,0,0,0,,701255226,713212132,"Aunar esfuerzos financieros, técnicos, adminis...",2023-05-15T00:00:00.000,,,,


#### _Descripción de la base de datos_

In [417]:
secop.shape

(5389, 73)

In [418]:
secop.info()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 5389 entries, 0 to 5388
Data columns (total 73 columns):
 #   Column                                                            Non-Null Count  Dtype 
---  ------                                                            --------------  ----- 
 0   Unnamed: 0                                                        5389 non-null   int64 
 1   nombre_entidad                                                    5389 non-null   object
 2   nit_entidad                                                       5389 non-null   int64 
 3   departamento                                                      5389 non-null   object
 4   ciudad                                                            5389 non-null   object
 5   localizaci_n                                                      5389 non-null   object
 6   orden                                                             5389 non-null   object
 7   sector                                    

In [419]:
secop.columns

Index(['Unnamed: 0', 'nombre_entidad', 'nit_entidad', 'departamento', 'ciudad',
       'localizaci_n', 'orden', 'sector', 'rama', 'entidad_centralizada',
       'proceso_de_compra', 'id_contrato', 'referencia_del_contrato',
       'estado_contrato', 'codigo_de_categoria_principal',
       'descripcion_del_proceso', 'tipo_de_contrato',
       'modalidad_de_contratacion', 'justificacion_modalidad_de',
       'fecha_de_firma', 'fecha_de_fin_del_contrato', 'condiciones_de_entrega',
       'tipodocproveedor', 'documento_proveedor', 'proveedor_adjudicado',
       'es_grupo', 'es_pyme', 'habilita_pago_adelantado', 'liquidaci_n',
       'obligaci_n_ambiental', 'obligaciones_postconsumo', 'reversion',
       'origen_de_los_recursos', 'destino_gasto', 'valor_del_contrato',
       'valor_de_pago_adelantado', 'valor_facturado',
       'valor_pendiente_de_pago', 'valor_pagado', 'valor_amortizado',
       'valor_pendiente_de', 'valor_pendiente_de_ejecucion', 'estado_bpin',
       'c_digo_bpin', 'ann

#### _Limpieza de la base de datos_

_Arreglo de fechas_

In [420]:
# Lista de columnas para convertir a datetime
columnas_fecha = ['fecha_de_firma', 'fecha_de_inicio_del_contrato', 'fecha_de_fin_del_contrato',
                  'fecha_de_inicio_de_ejecucion', 'fecha_de_fin_de_ejecucion', 
                  'fecha_inicio_liquidacion', 'fecha_fin_liquidacion']

# Iterar sobre cada columna y aplicar la transformación
for col in columnas_fecha:
    secop[col] = secop[col].str.split('T').str[0]
    secop[col] = pd.to_datetime(secop[col], format='%Y-%m-%d', errors='coerce')


_Extraer el año_

In [421]:
columnas_fecha = [
    'fecha_de_firma', 'fecha_de_inicio_del_contrato', 'fecha_de_fin_del_contrato',
    'fecha_de_inicio_de_ejecucion', 'fecha_de_fin_de_ejecucion',
    'fecha_inicio_liquidacion', 'fecha_fin_liquidacion'
]

# Asegurar que las columnas de fecha son del tipo datetime
for col in columnas_fecha:
    secop[col] = pd.to_datetime(secop[col], errors='coerce')

# Crear nuevas columnas para el año
for col in columnas_fecha:
    secop[f'ano_{col}'] = secop[col].dt.year

#### _Análisis exploratorio_

##### _Estadísticas descriptivas_

In [422]:
secop.describe()

Unnamed: 0.1,Unnamed: 0,nit_entidad,fecha_de_firma,fecha_de_fin_del_contrato,valor_del_contrato,valor_de_pago_adelantado,valor_facturado,valor_pendiente_de_pago,valor_pagado,valor_amortizado,valor_pendiente_de,valor_pendiente_de_ejecucion,saldo_cdp,saldo_vigencia,dias_adicionados,presupuesto_general_de_la_nacion_pgn,sistema_general_de_participaciones,sistema_general_de_regal_as,recursos_propios_alcald_as_gobernaciones_y_resguardos_ind_genas_,recursos_de_credito,recursos_propios,codigo_entidad,codigo_proveedor,fecha_de_inicio_del_contrato,fecha_de_inicio_de_ejecucion,fecha_de_fin_de_ejecucion,fecha_inicio_liquidacion,fecha_fin_liquidacion,ano_fecha_de_firma,ano_fecha_de_inicio_del_contrato,ano_fecha_de_fin_del_contrato,ano_fecha_de_inicio_de_ejecucion,ano_fecha_de_fin_de_ejecucion,ano_fecha_inicio_liquidacion,ano_fecha_fin_liquidacion
count,5389,5389,5389,5389,5389,5389,5389,5389,5389,5389,5389,5389,5389,5389,5389,5389,5389,5389,5389,5389,5389,5389,5389,5325,402,402,0,0,5389,5325,5389,402,402,0.0,0.0
mean,2694,899999054,2022-03-31 12:28:27.478196480,2022-11-03 02:01:34.859899648,77396645,300533,18609155,61894300,15502345,0,300533,61894300,82025091,11708723,8,9086637,0,0,1550021,42623,53729805,701255226,706696617,2022-03-26 18:08:59.492957696,2020-02-10 04:39:24.179104512,2020-12-18 16:28:39.402984960,NaT,NaT,2022,2022,2022,2020,2021,,
min,0,899999054,2020-01-02 00:00:00,2020-01-11 00:00:00,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,701255226,0,2020-01-03 00:00:00,2020-01-03 00:00:00,2020-01-11 00:00:00,NaT,NaT,2020,2020,2020,2020,2020,,
25%,1347,899999054,2021-03-04 00:00:00,2021-12-23 00:00:00,10640000,0,0,1495000,0,0,0,1495000,14172960,0,0,0,0,0,0,0,4714667,701255226,704996347,2021-03-04 00:00:00,2020-01-17 00:00:00,2020-12-31 00:00:00,NaT,NaT,2021,2021,2021,2020,2020,,
50%,2694,899999054,2022-01-28 00:00:00,2022-12-16 00:00:00,28667500,0,0,9682233,0,0,0,9682233,34006869,0,0,0,0,0,0,0,20650080,701255226,709854137,2022-02-01 00:00:00,2020-02-05 00:00:00,2021-01-01 00:00:00,NaT,NaT,2022,2022,2022,2020,2021,,
75%,4041,899999054,2023-05-18 00:00:00,2023-12-31 00:00:00,59900000,0,19333333,38923571,16808000,0,0,38923571,64000000,0,0,0,0,0,0,0,50922000,701255226,714820404,2023-05-17 00:00:00,2020-02-26 18:00:00,2021-01-01 00:00:00,NaT,NaT,2023,2023,2023,2020,2021,,
max,5388,899999054,2024-01-25 00:00:00,2030-05-31 00:00:00,24800000000,597165425,5431978076,24779360000,4066064668,0,597165425,24779360000,17632968562,24753469302,953,9771882924,0,0,7802190159,109729667,10468565474,701255226,724037858,2024-01-25 00:00:00,2020-12-31 00:00:00,2023-11-01 00:00:00,NaT,NaT,2024,2024,2030,2020,2023,,
std,1556,0,,,569824528,12096545,126749751,549126877,84469808,0,12096545,549126877,498694222,383229129,32,191205226,0,0,106311645,1790763,322970430,0,51473495,,,,,,1,1,1,0,1,,


##### _Análisis gráfico_

_Número de contratos ESAP según fecha de firma 2020 - 2024_

In [423]:
# Asegurar que 'fecha_de_firma' es un tipo de dato datetime
secop['fecha_de_firma'] = pd.to_datetime(secop['fecha_de_firma'])

# Agrupar y contar por fecha de firma
conteo_fecha = secop.groupby('fecha_de_firma')['fecha_de_firma'].count().reset_index(name='conteo')

# Crear el gráfico utilizando Plotly
fig = px.line(conteo_fecha, x='fecha_de_firma', y='conteo', title='Número de contratos ESAP según fecha de firma 2020 - 2024')

# Mostrar el gráfico
fig.show()

_Número de contratos ESAP por año 2020 - 2024_

In [424]:
# Calcular el total del número de contratos por año
total_contratos_por_ano = secop.groupby('ano_fecha_de_firma').size().reset_index(name='total_contratos')

# Crear el gráfico utilizando Plotly
fig = px.bar(total_contratos_por_ano, x='ano_fecha_de_firma', y='total_contratos', 
             color='total_contratos',
             labels={'total_contratos': 'Total de Contratos'},
             title='Número de contratos ESAP según año de firma 2020 - 2024')

# Agregar anotaciones de texto para mostrar el total de contratos por año
fig.update_traces(text=total_contratos_por_ano['total_contratos'], textposition='outside')

# Personalizar el diseño del gráfico
fig.update_layout(
    showlegend=False,
    xaxis=dict(tickmode='linear'),
    template='plotly_white'
)

# Mostrar el gráfico
fig.show()

_Número de contratos ESAP por tipo de contrato año 2020 - 2024_

In [425]:
# Agrupar por año y tipo de contrato
tipo_contrato_anio_counts = secop.groupby(['ano_fecha_de_firma', 'tipo_de_contrato']).size().unstack(fill_value=0)

# Crear el gráfico
fig = go.Figure()
for tipo in tipo_contrato_anio_counts.columns:
    fig.add_trace(go.Bar(
        x=tipo_contrato_anio_counts.index,
        y=tipo_contrato_anio_counts[tipo],
        name=tipo
    ))

# Actualizar el diseño del gráfico
fig.update_layout(
    barmode='stack',
    title='Número de contratos ESAP según año de firma por tipo de contrato 2020-2024',
    xaxis_title='Año de Firma',
    yaxis_title='Número de contratos',
    legend_title='Tipo de Contrato'
)

_Número de contratos ESAP por tipo de modalidad año 2020 - 2024_

In [426]:
# Agrupar por año y modalidad, y contrato
modalidad_anio_counts = secop.groupby(['ano_fecha_de_firma', 'modalidad_de_contratacion']).size().unstack(fill_value=0)

# Crear el gráfico
fig = go.Figure()
for modalidad in modalidad_anio_counts.columns:
    fig.add_trace(go.Bar(
        x=modalidad_anio_counts.index,
        y=modalidad_anio_counts[modalidad],
        name=modalidad
    ))

# Actualizar el diseño del gráfico
fig.update_layout(
    barmode='stack',
    title='Número de contratos ESAP según año de firma por modalidad de contrato 2020-2024',
    xaxis_title='Año de Firma',
    yaxis_title='Número de contratos',
    legend_title='Modalidad de contratación'
)

# Mostrar el gráfico
fig.show()

_Tiempo entre la fecha de firma de contrato y fecha fin de contrato ESAP año 2020 - 2024 (días)_

In [427]:
# Calcular el tiempo entre la fecha de firma y la fecha de final del contrato y almacenar en una nueva columna 'tiempo_entre_firma_final'
secop['tiempo_entre_firma_fin_dia'] = secop['fecha_de_fin_del_contrato'] - secop['fecha_de_firma']
# Mostrar información del DataFrame resultante
print(secop[['fecha_de_firma', 'fecha_de_fin_del_contrato', 'tiempo_entre_firma_fin_dia']].head())

  fecha_de_firma fecha_de_fin_del_contrato tiempo_entre_firma_fin_dia
0     2024-01-23                2024-10-22                   273 days
1     2021-01-10                2021-08-31                   233 days
2     2023-01-13                2023-05-01                   108 days
3     2023-02-15                2024-01-01                   320 days
4     2021-09-29                2021-12-31                    93 days


In [428]:
# Calcular la diferencia en días
secop['tiempo_entre_firma_fin_dia'] = (secop['fecha_de_fin_del_contrato'] - secop['fecha_de_firma']).dt.days
# Mostrar el resultado
print(secop[['fecha_de_firma', 'fecha_de_fin_del_contrato', 'tiempo_entre_firma_fin_dia']].head())

  fecha_de_firma fecha_de_fin_del_contrato  tiempo_entre_firma_fin_dia
0     2024-01-23                2024-10-22                         273
1     2021-01-10                2021-08-31                         233
2     2023-01-13                2023-05-01                         108
3     2023-02-15                2024-01-01                         320
4     2021-09-29                2021-12-31                          93


In [430]:
# Mostrar estadísticas descriptivas del tiempo entre firma y fecha final del contrato
resumen_tiempo_firma_fin = secop['tiempo_entre_firma_fin_dia'].describe()
# Mostrar el resumen
print(resumen_tiempo_firma_fin)

count   5,389
mean      217
std       139
min        -6
25%       118
50%       216
75%       323
max     2,562
Name: tiempo_entre_firma_fin_dia, dtype: float64


In [432]:
# Calcular el promedio de tiempo entre firma y fecha final del contrato
promedio_tiempo_por_dia = secop.groupby('fecha_de_firma')['tiempo_entre_firma_fin_dia'].mean().reset_index()

# Crear una gráfica lineal del promedio del tiempo entre firma y fin por día
fig = px.line(promedio_tiempo_por_dia, x='fecha_de_firma', y='tiempo_entre_firma_fin_dia',
              labels={'tiempo_entre_firma_fin_dia': 'Promedio Tiempo entre firma y fin (días)'},
              title='Promedio días entre la fecha de firma de contrato y fecha fin de contrato ESAP año 2020 - 2024')

# Mostrar la gráfica
fig.show()

_Tiempo entre la fecha de firma de contrato y fecha fin de contrato ESAP año 2020 - 2024 (meses)_

In [433]:
# Convertir las fechas a datetime
secop['fecha_de_firma'] = pd.to_datetime(secop['fecha_de_firma'])
secop['fecha_de_fin_del_contrato'] = pd.to_datetime(secop['fecha_de_fin_del_contrato'])

# Calcular la diferencia en días y luego convertir a meses
diferencia_dias = (secop['fecha_de_fin_del_contrato'] - secop['fecha_de_firma']).dt.days
secop['tiempo_entre_firma_fin_meses'] = (diferencia_dias / 30.44).astype(int)

# Mostrar el resultado
print(secop[['fecha_de_firma', 'fecha_de_fin_del_contrato', 'tiempo_entre_firma_fin_meses']].head())

  fecha_de_firma fecha_de_fin_del_contrato  tiempo_entre_firma_fin_meses
0     2024-01-23                2024-10-22                             8
1     2021-01-10                2021-08-31                             7
2     2023-01-13                2023-05-01                             3
3     2023-02-15                2024-01-01                            10
4     2021-09-29                2021-12-31                             3


In [435]:
# Mostrar estadísticas descriptivas del tiempo entre firma e inicio
resumen_tiempo_firma_inicio = secop['tiempo_entre_firma_fin_meses'].describe()

# Mostrar el resumen
print(resumen_tiempo_firma_inicio)

count   5,389
mean        7
std         5
min         0
25%         3
50%         7
75%        10
max        84
Name: tiempo_entre_firma_fin_meses, dtype: float64


In [436]:
# Calcular el promedio de tiempo entre firma y fecha final del contrato en días
secop['tiempo_entre_firma_fin'] = (secop['fecha_de_fin_del_contrato'] - secop['fecha_de_firma']).dt.days
promedio_tiempo_por_dia = secop.groupby('fecha_de_firma')['tiempo_entre_firma_fin'].mean().reset_index()

# Convertir el promedio de días a meses
promedio_tiempo_por_dia['tiempo_entre_firma_fin'] /= 30  # Aproximadamente 30 días por mes

# Crear una gráfica lineal del promedio del tiempo entre firma y fin por día en meses
fig = px.line(promedio_tiempo_por_dia, x='fecha_de_firma', y='tiempo_entre_firma_fin',
              labels={'tiempo_entre_firma_fin': 'Promedio Tiempo entre firma y fin (meses)'},
              title='Promedio meses entre la fecha de firma de contrato y fecha fin de contrato ESAP año 2020 - 2024')

# Mostrar la gráfica
fig.show()

_Valor de contratos ESAP según fecha de firma 2020 - 2024 (días)_

In [437]:
# Asegurar que 'fecha_de_firma' es un tipo de dato datetime
secop['fecha_de_firma'] = pd.to_datetime(secop['fecha_de_firma'])

# Agrupar y sumar el valor del contrato por fecha de firma
valor_fecha = secop.groupby('fecha_de_firma')['valor_del_contrato'].sum().reset_index()

# Crear el gráfico utilizando Plotly
fig = px.line(valor_fecha, x='fecha_de_firma', y='valor_del_contrato', title='Valor total de contratos ESAP según fecha de firma 2020 - 2024')

# Mostrar el gráfico
fig.show()

In [438]:
# Asegurar que 'fecha_de_firma' es un tipo de dato datetime
secop['fecha_de_firma'] = pd.to_datetime(secop['fecha_de_firma'])

# Agrupar y calcular el valor promedio del contrato por fecha de firma
valor_promedio_fecha = secop.groupby('fecha_de_firma')['valor_del_contrato'].mean().reset_index()

# Crear el gráfico utilizando Plotly
fig = px.line(valor_promedio_fecha, x='fecha_de_firma', y='valor_del_contrato', 
              title='Valor promedio de contratos ESAP según fecha de firma 2020 - 2024',
              labels={'valor_del_contrato': 'Valor Promedio del Contrato'})

# Mostrar el gráfico
fig.show()

_Valor de contratos ESAP según fecha de firma 2020 - 2024 (meses)_

In [439]:
# Asegurar que 'fecha_de_firma' es un tipo de dato datetime
secop['fecha_de_firma'] = pd.to_datetime(secop['fecha_de_firma'])

# Extraer el mes y el año de la fecha de firma
secop['mes_ano_firma'] = secop['fecha_de_firma'].dt.to_period('M')

# Agrupar y sumar el valor del contrato por mes y año de firma
valor_por_mes = secop.groupby('mes_ano_firma')['valor_del_contrato'].sum().reset_index()

# Convertir 'mes_ano_firma' a datetime para el gráfico
valor_por_mes['mes_ano_firma'] = valor_por_mes['mes_ano_firma'].dt.to_timestamp()

# Crear el gráfico utilizando Plotly
fig = px.line(valor_por_mes, x='mes_ano_firma', y='valor_del_contrato', 
              title='Valor total de contratos ESAP por mes 2020 - 2024',
              labels={'valor_del_contrato': 'Valor del Contrato', 'mes_ano_firma': 'Mes y Año'})

# Mostrar el gráfico
fig.show()

In [440]:
# Extraer el mes y el año de la fecha de firma
secop['mes_ano_firma'] = secop['fecha_de_firma'].dt.to_period('M')

# Agrupar y calcular el valor promedio del contrato por mes y año de firma
valor_promedio_por_mes = secop.groupby('mes_ano_firma')['valor_del_contrato'].mean().reset_index()

# Convertir 'mes_ano_firma' a datetime para el gráfico
valor_promedio_por_mes['mes_ano_firma'] = valor_promedio_por_mes['mes_ano_firma'].dt.to_timestamp()

# Crear el gráfico utilizando Plotly
fig = px.line(valor_promedio_por_mes, x='mes_ano_firma', y='valor_del_contrato', 
              title='Valor promedio de contratos ESAP por mes 2020 - 2024',
              labels={'valor_del_contrato': 'Valor Promedio del Contrato', 'mes_ano_firma': 'Mes y Año'})

# Mostrar el gráfico
fig.show()

_Valor de contratos ESAP según fecha de firma 2020 - 2024 (año)_

In [441]:
# Agrupar y sumar el valor del contrato por fecha de firma
valor_fecha = secop.groupby('ano_fecha_de_firma')['valor_del_contrato'].sum().reset_index()

# Crear el gráfico utilizando Plotly
fig = px.line(valor_fecha, x='ano_fecha_de_firma', y='valor_del_contrato', title='Valor total de contratos ESAP según fecha de firma 2020 - 2024')

# Mostrar el gráfico
fig.show()

In [442]:
# Extraer el año de la fecha de firma
secop['ano_firma'] = secop['fecha_de_firma'].dt.year

# Agrupar y calcular el valor promedio del contrato por año de firma
valor_promedio_por_ano = secop.groupby('ano_firma')['valor_del_contrato'].mean().reset_index()

# Crear el gráfico utilizando Plotly
fig = px.line(valor_promedio_por_ano, x='ano_firma', y='valor_del_contrato', 
              title='Valor promedio de contratos ESAP por año 2020 - 2024',
              labels={'valor_del_contrato': 'Valor Promedio del Contrato', 'ano_firma': 'Año'})

# Mostrar el gráfico
fig.show()

## Modelo de análisis

In [455]:
# Convertir todas las fechas a datetime
secop['fecha_de_firma'] = pd.to_datetime(secop['fecha_de_firma'])
secop['fecha_de_inicio_del_contrato'] = pd.to_datetime(secop['fecha_de_inicio_del_contrato'])
secop['fecha_de_fin_del_contrato'] = pd.to_datetime(secop['fecha_de_fin_del_contrato'])
secop['fecha_de_inicio_de_ejecucion'] = pd.to_datetime(secop['fecha_de_inicio_de_ejecucion'])
secop['fecha_de_fin_de_ejecucion'] = pd.to_datetime(secop['fecha_de_fin_de_ejecucion'])
secop['fecha_inicio_liquidacion'] = pd.to_datetime(secop['fecha_inicio_liquidacion'])
secop['fecha_fin_liquidacion'] = pd.to_datetime(secop['fecha_fin_liquidacion'])

# Calcular la diferencia en días
secop['dias_hasta_inicio_contrato'] = (secop['fecha_de_inicio_del_contrato'] - secop['fecha_de_firma']).dt.days
secop['dias_hasta_fin_contrato'] = (secop['fecha_de_fin_del_contrato'] - secop['fecha_de_firma']).dt.days
secop['dias_hasta_inicio_ejecucion'] = (secop['fecha_de_inicio_de_ejecucion'] - secop['fecha_de_firma']).dt.days
secop['dias_hasta_fin_ejecucion'] = (secop['fecha_de_fin_de_ejecucion'] - secop['fecha_de_firma']).dt.days
secop['dias_hasta_inicio_liquidacion'] = (secop['fecha_inicio_liquidacion'] - secop['fecha_de_firma']).dt.days
secop['dias_hasta_fin_liquidacion'] = (secop['fecha_fin_liquidacion'] - secop['fecha_de_firma']).dt.days

In [456]:
secop.columns

Index(['Unnamed: 0', 'nombre_entidad', 'nit_entidad', 'departamento', 'ciudad',
       'localizaci_n', 'orden', 'sector', 'rama', 'entidad_centralizada',
       'proceso_de_compra', 'id_contrato', 'referencia_del_contrato',
       'estado_contrato', 'codigo_de_categoria_principal',
       'descripcion_del_proceso', 'tipo_de_contrato',
       'modalidad_de_contratacion', 'justificacion_modalidad_de',
       'fecha_de_firma', 'fecha_de_fin_del_contrato', 'condiciones_de_entrega',
       'tipodocproveedor', 'documento_proveedor', 'proveedor_adjudicado',
       'es_grupo', 'es_pyme', 'habilita_pago_adelantado', 'liquidaci_n',
       'obligaci_n_ambiental', 'obligaciones_postconsumo', 'reversion',
       'origen_de_los_recursos', 'destino_gasto', 'valor_del_contrato',
       'valor_de_pago_adelantado', 'valor_facturado',
       'valor_pendiente_de_pago', 'valor_pagado', 'valor_amortizado',
       'valor_pendiente_de', 'valor_pendiente_de_ejecucion', 'estado_bpin',
       'c_digo_bpin', 'ann

In [457]:
import statsmodels.api as sm
import statsmodels.formula.api as smf

# Crear el modelo de efectos fijos
modelo_efectos_fijos = smf.ols('valor_del_contrato ~ dias_hasta_inicio_contrato + C(nit_entidad)', data=secop).fit()

# Mostrar los resultados del modelo
print(modelo_efectos_fijos.summary())

                            OLS Regression Results                            
Dep. Variable:     valor_del_contrato   R-squared:                       0.000
Model:                            OLS   Adj. R-squared:                 -0.000
Method:                 Least Squares   F-statistic:                    0.2650
Date:                Sat, 27 Jan 2024   Prob (F-statistic):              0.607
Time:                        04:03:54   Log-Likelihood:            -1.1491e+05
No. Observations:                5325   AIC:                         2.298e+05
Df Residuals:                    5323   BIC:                         2.298e+05
Df Model:                           1                                         
Covariance Type:            nonrobust                                         
                                 coef    std err          t      P>|t|      [0.025      0.975]
----------------------------------------------------------------------------------------------
Intercept           

In [461]:
# Convierte fechas a datetime y calcula la duración en meses
secop['fecha_de_inicio_del_contrato'] = pd.to_datetime(secop['fecha_de_inicio_del_contrato'])
duracion = (secop['fecha_de_inicio_del_contrato'] - secop['fecha_de_firma']) / pd.Timedelta(days=30)

# Reemplazar valores NaN por un valor numérico, por ejemplo, 0
secop['duracion_hasta_inicio_meses'] = duracion.fillna(0).astype(int)

# Opcionalmente, puedes eliminar filas donde la duración es NaN
secop = secop[~duracion.isna()]

# Crear el modelo de efectos fijos
modelo_efectos_fijos = smf.ols('valor_del_contrato ~ dias_hasta_inicio_contrato + dias_hasta_fin_contrato + dias_hasta_inicio_ejecucion + dias_hasta_fin_ejecucion + C(nit_entidad)', data=secop).fit()

# Mostrar los resultados del modelo
print(modelo_efectos_fijos.summary())

                            OLS Regression Results                            
Dep. Variable:     valor_del_contrato   R-squared:                       0.049
Model:                            OLS   Adj. R-squared:                  0.039
Method:                 Least Squares   F-statistic:                     5.086
Date:                Sat, 27 Jan 2024   Prob (F-statistic):           0.000525
Time:                        04:08:53   Log-Likelihood:                -9054.5
No. Observations:                 402   AIC:                         1.812e+04
Df Residuals:                     397   BIC:                         1.814e+04
Df Model:                           4                                         
Covariance Type:            nonrobust                                         
                                  coef    std err          t      P>|t|      [0.025      0.975]
-----------------------------------------------------------------------------------------------
Intercept         