# **Análisis contratación Escuela Superior de Administración Pública 2020-2024**

## Introducción

En este documento se presenta la aplicación de diferentes metodologías estudiadas en el curso de Programación II de la Maestría en Inteligencia de Negocios de la Universidad de Externado de Colombia. Lo anterior, se da en un ambiente de análisis y comprensión del fenómeno de la contratación pública a partir de la exploración de  diferentes escenarios aplicados a la realidad de las Entidades Públicas de Colombia. 

En este sentido, se exploran y analizan los resultados del modelo de efectos fijos del panel de datos de la contratación de la Escuela Superior de Administración Pública como individuo de análisis del 2020 a 2024 según los datos abiertos publicados por la Agencia Nacional de Contratación Pública - Colombia Compra Efienciete sobre el data set [SECOP II - Contratos Electrónicos](https://www.datos.gov.co/Gastos-Gubernamentales/SECOP-II-Contratos-Electr-nicos/jbjy-vk9h/about_data).

 De esta forma, se exploran ambientes y técnicas propicios en el contexto del aprendizaje sobre programación y en la aplicación de métodos estadísticos para la profundización y reconocimiento del fenómeno de estudio a la luz del procesamiento, depuración y análisis de la información, todos ellos necesarios en el actual contexto en donde es indispensable el uso de herramientas para la gestión de los datos y de la información en las organizaciones para el análisis y la toma de decisiones sobre los fenónemos que les afectan.

## Objetivo general

Analizar el efecto que tiene el tiempo de ejecución del proceso de contratación sobre el valor total de los contratos en la Escuela Superior de Administración Pública.

## Objetivos específicos

*$1.$* Explorar métodos de limpieza, depuración y automatización de la bases datos de contratos de la Escuela Superior de Administración Pública a partir del uso y aprovechamiento de los datos e información de del data set [SECOP II - Contratos Electrónicos](https://www.datos.gov.co/Gastos-Gubernamentales/SECOP-II-Contratos-Electr-nicos/jbjy-vk9h/about_data)


*$2.$* Aplicar técnicas para medir el efecto del tiempo de ejecución de la contratación pública sobre el valor de los contratos celebrados por la Escuela Superior de Administración Pública durante el período 2020-2024

*$3.$* Analizar el fenómeno de la contratación pública con Colombia con el propósito de brindar recomendaciones sobre el buen manejo de los recursos públicos a los sujetos responsables de su ejecución

## Antecedentes

A partir de la adopción de los principios de la Función Administrativa (Art. 209) de la Constitución Política de 1991, el Sector Público Colombiano ha desarrollado diferentes acciones para sinterizar un Sistema de Gestión que responda a las necesidades de articulación de los elementos que intervienen al momento de dirigir la gestión pública  hacia “el mejor desempeño institucional y a la consecución de resultados para la satisfacción de las necesidades y el goce efectivo de los derechos de los ciudadanos, en el marco de la legalidad y la integridad” (DAFP, 2019, p. 19).
<!--  -->
El Sistema de Gestión vigente (Art. 133 - Ley 1753 de 2015) integra el Sistema de Desarrollo Administrativo (Ley 489 de 1998), el Sistema de Gestión de la Calidad (Ley 872 de 2003) y se articula con el Sistema de Control Interno (Ley 87 de 1993 y del Art. 27 al 19 de la Ley 489); que finalmente constituyen el MIPG como el mecanismo que facilita la integración y articulación de los Sistemas de Planeación y Gestión que hasta el momento existían en la entidades públicas colombianas (Decreto 1499 de 2017), integró en 2021 a partir del la Política de Gestión y desempeño **Compras y Contatación Pública** con el fin de que las entidades estatales gestionen adecuadamente sus compras y contrataciones públicas a través de herramientas tecnológicas, lineamientos normativos, documentos estándar, técnicas de abastecimiento estratégico e instrumentos de agregación de demanda. 

De esta forma, con esta política la Agencia Nacional de Contratación Pública - Colombia Compra Efienciente, proyecta el suministro de una herramienta como lo es el SECOP II para que las entidades estatales  se alinien con el propósito de generar buenas mejores prácticas en el abastecimiento y contratación y con ello fortalecer la satisfacción de las necesidades públicas (eficacia), con menores recursos (eficiencia), altos estándares de calidad, pluralidad de oferentes y garantía de transparencia y rendición de cuentas.

Sin embargo, aun cuando la integración de lineamientos en materia de contratación pública sea un propósito de la administración pública conducente al buen manejo del prespuesto y a la planeación de las finanzas públicas, esto resulta en un reto su implementación y aprovechamiento para la toma de decisones en el ámbito de la contratación pública. Los procedimientos que rigen la contratación deben verse reflejados en la planeación de la contratación y se deben implementar en contextos de alta incertidumbre que las organizaciones constantemente reflejan.

En este sentido, para evidenciar lo anteriormente expuesto, se trata de analizar el efecto que tiene el tiempo de ejecución de los procesos de contratación sobre el valor de la contratación de la Escuela Superior Pública, vista en este análisis como un individuo sobre el el cual es posible su estudio a la luz de los objetivos planteados en este proyecto y según la información disponible en el data set datos abiertos publicados por la Agencia Nacional de Contratación Pública - Colombia Compra Efienciete sobre el data set [SECOP II - Contratos Electrónicos] (https://www.datos.gov.co/Gastos-Gubernamentales/)


## Metodología

### _Libreriras_

In [1]:
%pip install sodapy
%pip install seaborn
%pip install pandas
%pip install plotly
%pip install linearmodels
%pip install scikit-learn

Note: you may need to restart the kernel to use updated packages.
Note: you may need to restart the kernel to use updated packages.

Note: you may need to restart the kernel to use updated packages.
Note: you may need to restart the kernel to use updated packages.
Note: you may need to restart the kernel to use updated packages.


In [23]:
#Pandas y Nunmpy
import pandas as pd
import numpy as np
#Transformación de fecha
from datetime import datetime
#Gráficas
import seaborn as sns
import matplotlib as mpl
import matplotlib.pyplot as plt
from datetime import datetime
import plotly.express as px
import plotly.graph_objects as go
#Se importa la clase PanelOLS, que se utiliza para realizar regresiones lineales en modelos de panel
# o conjuntos de series temporales cruzadas y estimar relaciones lineales.
from linearmodels.panel import PanelOLS
import pandas as pd
#Se importa la biblioteca "statsmodels" y la renombra como "sm" 
#Statsmodels es una biblioteca que proporciona herramientas y modelos estadísticos para el análisis 
#de datos en Python. Se utiliza comúnmente para realizar análisis de regresión, 
#series de tiempo y otras técnicas estadísticas.
import statsmodels.api as sm

### _Exploración de la base de datos_

#### _Cargar base de datos_

Se utiliza la base de datos contratos_secop_esap del data set [SECOP II - Contratos Electrónicos] (https://www.datos.gov.co/Gastos-Gubernamentales/)


In [24]:
ar = r'C:\Users\Astrandrea\Documents\AnaConESAP\datos\raw\contratos_secop_esap.csv'

In [25]:
pd.set_option("display.max.columns", 999)
# Se cambia la configuración para ver los números de la forma 1.000.000
pd.options.display.float_format = "{:,.0f}".format
secop = pd.read_csv(ar)
secop

Unnamed: 0.1,Unnamed: 0,nombre_entidad,nit_entidad,departamento,ciudad,localizaci_n,orden,sector,rama,entidad_centralizada,proceso_de_compra,id_contrato,referencia_del_contrato,estado_contrato,codigo_de_categoria_principal,descripcion_del_proceso,tipo_de_contrato,modalidad_de_contratacion,justificacion_modalidad_de,fecha_de_firma,fecha_de_inicio_del_contrato,fecha_de_fin_del_contrato,condiciones_de_entrega,tipodocproveedor,documento_proveedor,proveedor_adjudicado,es_grupo,es_pyme,habilita_pago_adelantado,liquidaci_n,obligaci_n_ambiental,obligaciones_postconsumo,reversion,origen_de_los_recursos,destino_gasto,valor_del_contrato,valor_de_pago_adelantado,valor_facturado,valor_pendiente_de_pago,valor_pagado,valor_amortizado,valor_pendiente_de,valor_pendiente_de_ejecucion,estado_bpin,c_digo_bpin,anno_bpin,saldo_cdp,saldo_vigencia,espostconflicto,dias_adicionados,puntos_del_acuerdo,pilares_del_acuerdo,urlproceso,nombre_representante_legal,nacionalidad_representante_legal,domicilio_representante_legal,tipo_de_identificaci_n_representante_legal,identificaci_n_representante_legal,g_nero_representante_legal,presupuesto_general_de_la_nacion_pgn,sistema_general_de_participaciones,sistema_general_de_regal_as,recursos_propios_alcald_as_gobernaciones_y_resguardos_ind_genas_,recursos_de_credito,recursos_propios,codigo_entidad,codigo_proveedor,objeto_del_contrato,ultima_actualizacion,fecha_de_inicio_de_ejecucion,fecha_de_fin_de_ejecucion,fecha_inicio_liquidacion,fecha_fin_liquidacion
0,0,ESAP TERRITORIAL ANTIOQUIA,800117519,Antioquia,Medellín,"Colombia, Antioquia , Medellín",Nacional,Educación Nacional,Ejecutivo,Centralizada,CO1.BDOS.4108988,CO1.PCCNTR.4722204,DT1-ANT-020-2023,Modificado,V1.93151500,6-Prestar servicios profesionales para apoyar ...,Prestación de servicios,Contratación directa,Servicios profesionales y apoyo a la gestión,2023-03-02T00:00:00.000,2023-03-03T00:00:00.000,2023-04-01T00:00:00.000,A convenir,Cédula de Ciudadanía,1020481709,Maria Camila Jaramillo Taborda,No,No,No,No,No,No,No,Recursos Propios,Inversión,41461333,0,4021333,37440000,4021333,0,0,37440000,No Válido,No Definido,No D,41600000,0,No,0,No aplica,No aplica,{'url': 'https://community.secop.gov.co/Public...,Maria Camila Jaramillo Taborda,CO,Carrera 52 Número 51-19 apto 902,Cédula de Ciudadanía,1020481709,Femenino,0,0,0,0,0,41461333,704428523,713215440,6-Prestar servicios profesionales para apoyar ...,,,,,
1,1,ESAP TERRITORIAL ANTIOQUIA,800117519,Antioquia,Medellín,"Colombia, Antioquia , Medellín",Nacional,Educación Nacional,Ejecutivo,Centralizada,CO1.BDOS.4905445,CO1.PCCNTR.5352713,DT1-ANT-096-2023,En ejecución,V1.93151500,Prestar servicios profesionales para el desarr...,Prestación de servicios,Contratación directa,Servicios profesionales y apoyo a la gestión,2023-09-05T00:00:00.000,2023-09-06T00:00:00.000,2023-12-16T00:00:00.000,A convenir,Cédula de Ciudadanía,1039099329,HEMERSON MARMOLEJO MERCADO,No,No,No,No,No,No,No,Recursos Propios,Inversión,11220000,0,9460000,1760000,9460000,0,0,1760000,No Válido,No Definido,No D,158400000,0,No,0,No aplica,No aplica,{'url': 'https://community.secop.gov.co/Public...,hemerson marmolejo mercado,CO,No Definido,Cédula de Ciudadanía,1039099329,No Definido,0,0,0,0,0,11220000,704428523,723177309,Prestar servicios profesionales para el desarr...,,,,,
2,2,ESAP TERRITORIAL ANTIOQUIA,800117519,Antioquia,Medellín,"Colombia, Antioquia , Medellín",Nacional,Educación Nacional,Ejecutivo,Centralizada,CO1.BDOS.1417960,CO1.PCCNTR.1799260,DT1-ANT-029-2020,terminado,V1.80111600,Prestar servicios de apoyo a la gestión en la ...,Prestación de servicios,Contratación directa,Servicios profesionales y apoyo a la gestión,2020-08-26T00:00:00.000,2020-08-27T00:00:00.000,2020-12-31T00:00:00.000,A convenir,Cédula de Ciudadanía,71993147,NORBEY DE JESUS AGUIRRE OCAMPO,No,No,No Definido,No,No,No,No,Recursos Propios,Inversión,5166667,0,2666667,2500000,2666667,0,0,2500000,No Válido,No Definido,2020,304083333,0,No,0,No aplica,No aplica,{'url': 'https://community.secop.gov.co/Public...,NORBEY DE JESUS AGUIRRE OCAMPO,CO,No Definido,Sin Descripcion,Sin Descripcion,No Definido,0,0,0,0,0,5166667,704428523,710330432,Prestar servicios de apoyo a la gestión en la ...,2021-04-15T00:00:00.000,,,,
3,3,ESAP TERRITORIAL ANTIOQUIA,800117519,Antioquia,Medellín,"Colombia, Antioquia , Medellín",Nacional,Educación Nacional,Ejecutivo,Centralizada,CO1.BDOS.1948517,CO1.PCCNTR.2477156,DT1-ANT-012 DE 2021,En ejecución,V1.93151500,Prestar servicios de apoyo en el componente de...,Prestación de servicios,Contratación directa,Servicios profesionales y apoyo a la gestión,2021-04-30T00:00:00.000,2021-05-04T00:00:00.000,2021-12-04T00:00:00.000,A convenir,Cédula de Ciudadanía,1027943668,Carlos Alberto Mosquera Cordoba,No,No,No,No,No,No,No,Recursos Propios,Inversión,9450000,0,0,9450000,0,0,0,9450000,No Válido,No Definido,2021,396900000,0,No,0,No aplica,No aplica,{'url': 'https://community.secop.gov.co/Public...,Carlos Alberto Mosquera Cordoba,CO,No Definido,Cédula de Ciudadanía,1027943668,No Definido,0,0,0,0,0,9450000,704428523,710353962,Prestar servicios de apoyo en el componente de...,,,,,
4,4,ESAP TERRITORIAL ANTIOQUIA,800117519,Antioquia,Medellín,"Colombia, Antioquia , Medellín",Nacional,Educación Nacional,Ejecutivo,Centralizada,CO1.BDOS.4829408,CO1.PCCNTR.5293902,DT1-ANT-084-2023,En ejecución,V1.93151500,Prestar servicios profesionales para el desarr...,Prestación de servicios,Contratación directa,Servicios profesionales y apoyo a la gestión,2023-08-12T00:00:00.000,2023-08-12T00:00:00.000,2023-12-26T00:00:00.000,A convenir,Cédula de Ciudadanía,1041147932,john alexander uribe ramos,No,Si,No,No,No,No,No,Recursos Propios,Inversión,14850000,0,8800000,6050000,8800000,0,0,6050000,No Válido,No Definido,No D,29700000,0,No,0,No aplica,No aplica,{'url': 'https://community.secop.gov.co/Public...,JOHN ALEXANDER URIBE RAMOS,CO,No Definido,Cédula de Ciudadanía,1041147932,No Definido,0,0,0,0,0,14850000,704428523,710373507,Prestar servicios profesionales para el desarr...,,,,,
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
14001,14001,ESCUELA SUPERIOR DE ADMINISTRACIÓN PUBLICA,899999054,Distrito Capital de Bogotá,Bogotá,"Colombia, Bogotá, Bogotá",Nacional,Servicio Público,Ejecutivo,Centralizada,CO1.BDOS.1441522,CO1.PCCNTR.1830050,BOG-742-2020,Cerrado,V1.80111600,Prestar servicios de apoyo a la gestión en el ...,Prestación de servicios,Contratación directa,Servicios profesionales y apoyo a la gestión,2020-09-10T00:00:00.000,2020-09-12T00:00:00.000,2021-01-01T00:00:00.000,A convenir,Cédula de Ciudadanía,1233902468,Laura Vanessa Romero Umaña,No,No,No,No,No,No,No,Recursos Propios,Inversión,5625000,0,4583333,1041667,4583333,0,0,1041667,No Válido,No Definido,2023,45000000,0,No,0,No aplica,No aplica,{'url': 'https://community.secop.gov.co/Public...,Laura Vanessa Romero Umaña,CO,Cra 112 a # 136 a 19,Cédula de Ciudadanía,1233902468,Femenino,0,0,0,0,0,5625000,701255226,710323635,Prestar servicios de apoyo a la gestión en el ...,2020-09-18T00:00:00.000,,,,
14002,14002,ESCUELA SUPERIOR DE ADMINISTRACIÓN PUBLICA,899999054,Distrito Capital de Bogotá,Bogotá,"Colombia, Bogotá, Bogotá",Nacional,Servicio Público,Ejecutivo,Centralizada,CO1.BDOS.2324411,CO1.PCCNTR.3067815,BOG-1165-2021,En ejecución,V1.82101500,Adquirir pendones y backings para la sede cent...,Suministros,Selección abreviada subasta inversa,Suministro de bienes y servicios de caracterís...,2021-11-30T00:00:00.000,2021-12-03T00:00:00.000,2021-12-31T00:00:00.000,A convenir,No Definido,30210450,HARTMANN IMPRESORES,No,Si,No,No,No,No,No,Recursos Propios,Inversión,49618000,0,0,49618000,0,0,0,49618000,No Válido,No Definido,2021,63517878,0,No,0,No aplica,No aplica,{'url': 'https://community.secop.gov.co/Public...,CLAUDIA MARCELA SERRANO SUAREZ,CO,No Definido,Cédula de Ciudadanía,30210450,Femenino,0,0,0,0,0,49618000,701255226,708701040,Adquirir pendones y backings para la sede cent...,,,,,
14003,14003,ESCUELA SUPERIOR DE ADMINISTRACIÓN PUBLICA,899999054,Distrito Capital de Bogotá,Bogotá,"Colombia, Bogotá, Bogotá",Nacional,Servicio Público,Ejecutivo,Centralizada,CO1.BDOS.4392016,CO1.PCCNTR.4950643,BOG-990-2023,En ejecución,V1.93151500,Prestar servicios tecnológicos en el proceso d...,Prestación de servicios,Contratación directa,Servicios profesionales y apoyo a la gestión,2023-05-13T00:00:00.000,2023-05-20T00:00:00.000,2024-01-01T00:00:00.000,No Definido,Cédula de Ciudadanía,79403844,JESUS ANONIO QUITIAN USMA,No,No,No,No,No,No,No,Recursos Propios,Inversión,24901334,0,20608000,4293334,20608000,0,0,4293334,No Válido,No Definido,No D,35420000,0,No,0,No aplica,No aplica,{'url': 'https://community.secop.gov.co/Public...,Jesus Antonio Quitian Usma,CO,Calle 2 72B 70,Cédula de Ciudadanía,79403844,No Definido,0,0,0,0,0,24901334,701255226,708976733,Prestar servicios tecnológicos en el proceso d...,,,,,
14004,14004,ESCUELA SUPERIOR DE ADMINISTRACIÓN PUBLICA,899999054,Distrito Capital de Bogotá,Bogotá,"Colombia, Bogotá, Bogotá",Nacional,Servicio Público,Ejecutivo,Centralizada,CO1.BDOS.1484361,CO1.PCCNTR.1888934,BOG-797-2020,Cerrado,V1.80111600,Prestar los servicios profesionales para adela...,Prestación de servicios,Contratación directa,Servicios profesionales y apoyo a la gestión,2020-10-10T00:00:00.000,2020-10-19T00:00:00.000,2020-12-31T00:00:00.000,A convenir,Cédula de Ciudadanía,1015394471,Pedro Nel Rojas Oliveros,No,No,No,No,No,No,No,Recursos Propios,Inversión,22200000,0,9800000,12400000,9800000,0,0,12400000,No Válido,No Definido,2023,23433333,0,No,0,No aplica,No aplica,{'url': 'https://community.secop.gov.co/Public...,PEDRO NEL ROJAS OLIVEROS,CO,No Definido,Cédula de Ciudadanía,1015394471,No Definido,0,0,0,0,0,22200000,701255226,711353037,Prestar los servicios profesionales para adela...,2023-12-04T00:00:00.000,,,,


#### _Descripción de la base de datos_

La base de datos tiene 14.006 contratos y 73 columnas

In [5]:
secop.shape

(14006, 73)

La base de datos tiene 21 variables *numéricas* y 52 variables de *texto*. 

In [6]:
secop.info()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 14006 entries, 0 to 14005
Data columns (total 73 columns):
 #   Column                                                            Non-Null Count  Dtype 
---  ------                                                            --------------  ----- 
 0   Unnamed: 0                                                        14006 non-null  int64 
 1   nombre_entidad                                                    14006 non-null  object
 2   nit_entidad                                                       14006 non-null  int64 
 3   departamento                                                      14006 non-null  object
 4   ciudad                                                            14006 non-null  object
 5   localizaci_n                                                      14006 non-null  object
 6   orden                                                             14006 non-null  object
 7   sector                                  

In [7]:
secop.columns

Index(['Unnamed: 0', 'nombre_entidad', 'nit_entidad', 'departamento', 'ciudad',
       'localizaci_n', 'orden', 'sector', 'rama', 'entidad_centralizada',
       'proceso_de_compra', 'id_contrato', 'referencia_del_contrato',
       'estado_contrato', 'codigo_de_categoria_principal',
       'descripcion_del_proceso', 'tipo_de_contrato',
       'modalidad_de_contratacion', 'justificacion_modalidad_de',
       'fecha_de_firma', 'fecha_de_inicio_del_contrato',
       'fecha_de_fin_del_contrato', 'condiciones_de_entrega',
       'tipodocproveedor', 'documento_proveedor', 'proveedor_adjudicado',
       'es_grupo', 'es_pyme', 'habilita_pago_adelantado', 'liquidaci_n',
       'obligaci_n_ambiental', 'obligaciones_postconsumo', 'reversion',
       'origen_de_los_recursos', 'destino_gasto', 'valor_del_contrato',
       'valor_de_pago_adelantado', 'valor_facturado',
       'valor_pendiente_de_pago', 'valor_pagado', 'valor_amortizado',
       'valor_pendiente_de', 'valor_pendiente_de_ejecucion', 'e

#### _Limpieza de la base de datos_

_Arreglo de fechas_

In [8]:
# Lista de columnas para convertir a datetime
columnas_fecha = ['fecha_de_firma', 'fecha_de_inicio_del_contrato', 'fecha_de_fin_del_contrato',
                  'fecha_de_inicio_de_ejecucion', 'fecha_de_fin_de_ejecucion', 
                  'fecha_inicio_liquidacion', 'fecha_fin_liquidacion']

# Iterar sobre cada columna y aplicar la transformación
for col in columnas_fecha:
    secop[col] = secop[col].str.split('T').str[0]
    secop[col] = pd.to_datetime(secop[col], format='%Y-%m-%d', errors='coerce')

_Extraer el año_

In [18]:
columnas_fecha = [
    'fecha_de_firma', 'fecha_de_inicio_del_contrato', 'fecha_de_fin_del_contrato',
    'fecha_de_inicio_de_ejecucion', 'fecha_de_fin_de_ejecucion',
    'fecha_inicio_liquidacion', 'fecha_fin_liquidacion'
]

# Asegurar que las columnas de fecha son del tipo datetime
for col in columnas_fecha:
    secop[col] = pd.to_datetime(secop[col], errors='coerce')

# Crear nuevas columnas para el año
for col in columnas_fecha:
    secop[f'ano_{col}'] = secop[col].dt.year

_Semestre_

In [19]:
import pandas as pd

# Asegurándonos de que 'fecha_de_firma' esté en formato datetime
secop['fecha_de_firma'] = pd.to_datetime(secop['fecha_de_firma'])

# Crear la columna 'periodo' con la lógica condicional
secop['periodo'] = secop['fecha_de_firma'].apply(lambda x: 1 if x.month < 7 or (x.month == 7 and x.day <= 31) else 2)


In [20]:
# Primero, convertir ambas columnas a tipo de dato string (cadena de texto)
secop['ano_fecha_de_firma_str'] = secop['ano_fecha_de_firma'].astype(str)
secop['periodo_str'] = secop['periodo'].astype(str)

# Ahora, crear la nueva columna 'periodo' concatenando las dos cadenas con un guion entre ellas
secop['periodo_ano'] = secop['ano_fecha_de_firma_str'] + "-" + secop['periodo_str']

In [22]:
# Contar el número de ocurrencias de cada valor único en la columna 'periodo'
conteo_periodo = secop['periodo_ano'].value_counts()

# Convertir el conteo en un DataFrame para una mejor visualización
tabla_conteo_periodo = conteo_periodo.reset_index().rename(columns={'index': 'Periodo', 'periodo': 'Conteo'})

# Convertir la columna 'periodo_ano' a tipo categórico
secop['periodo_ano'] = secop['periodo_ano'].astype('category')

# Verificar el cambio de tipo de dato
print(secop['periodo_ano'].dtypes)

# Mostrar la tabla de conteo
print(tabla_conteo_periodo)

category
  periodo_ano  count
0      2023-1   2454
1      2022-1   2381
2      2021-1   2168
3      2020-2   1833
4      2024-1   1426
5      2021-2   1171
6      2023-2   1146
7      2020-1    791
8      2022-2    636


_Dirección Territorial_

In [40]:
mapeo_nit_entidad = {
    899999054: "Sede_Principal_ESAP",
    800117519: "Antioquia",
    800117522: "Atlántico_Cesar_Magdalena_La_Guajira",
    800248529: "Bolivar_Córdoba_Sucre_San Andrés",
    800117524: "Boyacá_Casanare",
    800117525: "Caldas",
    800117537: "Cauca",
    830011682: "Cundinamarca",
    813006956: "Huila_Caquetá_Putumayo",
    800117530: "Meta_Guainía_Guaviare_Vaupés_Vichada_Amazonas",
    800117534: "Nariño_Alto Putumayo",
    800145876: "Norte_Santander - Arauca",
    800117537: "Quindío_Risaralda",
    800117540: "Santander",
    800117541: "Tolima",
    800117545: "Valle"
}

In [41]:
secop['nombre_sede'] = secop['nit_entidad'].apply(lambda x: mapeo_nit_entidad.get(x, 'Otro'))

In [42]:
# Contar el número de ocurrencias de cada valor único en la columna 'nombre_sede'
conteo_nombre_sede = secop['nombre_sede'].value_counts()

# Convertir el conteo en un DataFrame para una mejor visualización
tabla_conteo_nombre_sede = conteo_nombre_sede.reset_index().rename(columns={'index': 'Nombre_Sede', 'nombre_sede': 'Conteo'})

# Mostrar la tabla de conteo
print(tabla_conteo_nombre_sede)

                                           Conteo  count
0                             Sede_Principal_ESAP   5861
1                Bolivar_Córdoba_Sucre_San Andrés    736
2                            Nariño_Alto Putumayo    634
3                          Huila_Caquetá_Putumayo    607
4                                    Cundinamarca    604
5   Meta_Guainía_Guaviare_Vaupés_Vichada_Amazonas    602
6                                       Antioquia    598
7            Atlántico_Cesar_Magdalena_La_Guajira    561
8                        Norte_Santander - Arauca    550
9                                 Boyacá_Casanare    539
10                                           Otro    497
11                                         Caldas    470
12                                      Santander    463
13                              Quindío_Risaralda    454
14                                         Tolima    424
15                                          Valle    406


#### _Análisis exploratorio_

##### _Estadísticas descriptivas_

In [23]:
secop.describe()

Unnamed: 0.1,Unnamed: 0,nit_entidad,fecha_de_firma,fecha_de_inicio_del_contrato,fecha_de_fin_del_contrato,valor_del_contrato,valor_de_pago_adelantado,valor_facturado,valor_pendiente_de_pago,valor_pagado,valor_amortizado,valor_pendiente_de,valor_pendiente_de_ejecucion,saldo_cdp,saldo_vigencia,dias_adicionados,presupuesto_general_de_la_nacion_pgn,sistema_general_de_participaciones,sistema_general_de_regal_as,recursos_propios_alcald_as_gobernaciones_y_resguardos_ind_genas_,recursos_de_credito,recursos_propios,codigo_entidad,codigo_proveedor,fecha_de_inicio_de_ejecucion,fecha_de_fin_de_ejecucion,fecha_inicio_liquidacion,fecha_fin_liquidacion,ano_fecha_de_firma,ano_fecha_de_inicio_del_contrato,ano_fecha_de_fin_del_contrato,ano_fecha_de_inicio_de_ejecucion,ano_fecha_de_fin_de_ejecucion,ano_fecha_inicio_liquidacion,ano_fecha_fin_liquidacion
count,14006,14006,14006,13859,14006,14006,14006,14006,14006,14006,14006,14006,14006,14006,14006,14006,14006,14006,14006,14006,14006,14006,14006,14006,590,590,140,140,14006,13859,14006,590,590,140,140
mean,7002,843770077,2022-03-28 14:34:19.345994752,2022-03-29 17:50:37.362003200,2022-11-02 15:50:55.090675456,44581422,188643,9240378,36927880,7648844,0,188643,36932578,125953767,5653117,5,6803419,0,0,725587,24580,31619619,703134564,710829768,2020-02-13 21:21:21.355932160,2020-12-06 12:24:24.406779648,2023-11-11 23:39:25.714285824,2024-07-25 19:12:00,2022,2022,2022,2020,2020,2023,2024
min,0,800117519,2020-01-02 00:00:00,2020-01-01 00:00:00,2020-01-11 00:00:00,0,0,0,-1109333,0,0,0,-1109333,0,0,0,0,0,0,0,0,0,701255226,0,2020-01-03 00:00:00,2020-01-11 00:00:00,2020-03-17 00:00:00,2020-05-28 00:00:00,2020,2020,2020,2020,2020,2020,2020
25%,3501,800117534,2021-03-31 00:00:00,2021-04-07 00:00:00,2021-12-07 00:00:00,7570899,0,0,3105000,0,0,0,3105000,9630000,0,0,0,0,0,0,0,5500000,701255226,705778272,2020-01-23 00:00:00,2020-12-28 00:00:00,2023-08-20 12:00:00,2023-12-29 00:00:00,2021,2021,2021,2020,2020,2023,2023
50%,7002,813006956,2022-01-26 00:00:00,2022-01-28 00:00:00,2022-09-25 00:00:00,16086666,0,0,10006667,0,0,0,10006667,25684560,0,0,0,0,0,0,0,12264750,704371061,710658172,2020-02-13 00:00:00,2020-12-31 00:00:00,2023-12-26 12:00:00,2024-04-20 00:00:00,2022,2022,2022,2020,2020,2023,2024
75%,10504,899999054,2023-05-05 00:00:00,2023-05-05 00:00:00,2023-12-30 00:00:00,34990525,0,5600000,26655657,3330800,0,0,26694181,60260000,0,0,0,0,0,0,0,31157000,704616416,714997258,2020-02-29 00:00:00,2021-01-01 00:00:00,2024-01-02 00:00:00,2025-01-01 06:00:00,2023,2023,2023,2020,2021,2024,2025
max,14005,899999054,2024-04-02 00:00:00,2024-04-03 00:00:00,2033-09-05 00:00:00,37085946644,992145291,5431978076,37085946644,4066064668,0,992145291,37085946644,25975030735,24753469302,953,37085946644,0,0,7802190159,109729667,10468565474,704901107,725844302,2020-12-31 00:00:00,2025-04-17 00:00:00,2028-05-05 00:00:00,2029-05-13 00:00:00,2024,2024,2033,2020,2025,2028,2029
std,4043,48115336,,,,474892179,11253695,79668421,465110361,53370937,0,11253695,465110324,494509776,261713111,21,335973549,0,0,65972544,1184323,203762785,1620921,12043759,,,,,1,1,2,0,1,2,2


##### _Análisis gráfico_

_Número de contratos ESAP según fecha de firma 2020 - 2024_

In [24]:
# Asegurar que 'fecha_de_firma' es un tipo de dato datetime
secop['fecha_de_firma'] = pd.to_datetime(secop['fecha_de_firma'])

# Agrupar y contar por fecha de firma
conteo_fecha = secop.groupby('fecha_de_firma')['fecha_de_firma'].count().reset_index(name='conteo')

# Crear el gráfico utilizando Plotly
fig = px.line(conteo_fecha, x='fecha_de_firma', y='conteo', title='Número de contratos ESAP según fecha de firma 2020 - 2024')

# Mostrar el gráfico
fig.show()

In [25]:
# Calcular el total del número de contratos por año
total_contratos_por_ano = secop.groupby('ano_fecha_de_firma').size().reset_index(name='total_contratos')

# Crear el gráfico utilizando Plotly
fig = px.bar(total_contratos_por_ano, x='ano_fecha_de_firma', y='total_contratos', 
             color='total_contratos',
             labels={'total_contratos': 'Total de Contratos'},
             title='Número de contratos ESAP según año de firma 2020 - 2024')

# Agregar anotaciones de texto para mostrar el total de contratos por año
fig.update_traces(text=total_contratos_por_ano['total_contratos'], textposition='outside')

# Personalizar el diseño del gráfico
fig.update_layout(
    showlegend=False,
    xaxis=dict(tickmode='linear'),
    template='plotly_white'
)

# Mostrar el gráfico
fig.show()

_Número de contratos ESAP por semestre 2020 - 2024_

In [32]:

# Agrupar por 'ano_fecha_de_firma' y 'periodo', y contar el número de contratos
total_contratos_por_ano_periodo = secop.groupby(['ano_fecha_de_firma', 'periodo']).size().reset_index(name='total_contratos')

# Crear el gráfico utilizando Plotly
import plotly.express as px

fig = px.bar(total_contratos_por_ano_periodo, x='ano_fecha_de_firma', y='total_contratos',
             color='periodo', barmode='group',
             labels={'total_contratos': 'Total de Contratos', 'ano_fecha_de_firma': 'Año de Firma', 'periodo': 'Periodo'},
             title='Número de contratos ESAP según año de firma y periodo')

# Personalizar el diseño del gráfico
fig.update_layout(
    xaxis=dict(tickmode='linear', title='Período de Firma'),
    yaxis=dict(title='Total de Contratos'),
    legend_title='Periodo',
    template='plotly_white'
)

# Mostrar el gráfico
fig.show()

_Número de contratos ESAP por tipo de contrato año 2020 - 2024_

In [43]:
# Agrupar por año y tipo de contrato
tipo_contrato_anio_counts = secop.groupby(['ano_fecha_de_firma', 'tipo_de_contrato']).size().unstack(fill_value=0)

# Crear el gráfico
fig = go.Figure()
for tipo in tipo_contrato_anio_counts.columns:
    fig.add_trace(go.Bar(
        x=tipo_contrato_anio_counts.index,
        y=tipo_contrato_anio_counts[tipo],
        name=tipo
    ))

# Actualizar el diseño del gráfico
fig.update_layout(
    barmode='stack',
    title='Número de contratos ESAP según año de firma por tipo de contrato 2020-2024',
    xaxis_title='Año de Firma',
    yaxis_title='Número de contratos',
    legend_title='Tipo de Contrato'
)

_Número de contratos ESAP por tipo de modalidad año 2020 - 2024_

In [612]:
# Agrupar por año y modalidad, y contrato
modalidad_anio_counts = secop.groupby(['ano_fecha_de_firma', 'modalidad_de_contratacion']).size().unstack(fill_value=0)

# Crear el gráfico
fig = go.Figure()
for modalidad in modalidad_anio_counts.columns:
    fig.add_trace(go.Bar(
        x=modalidad_anio_counts.index,
        y=modalidad_anio_counts[modalidad],
        name=modalidad
    ))

# Actualizar el diseño del gráfico
fig.update_layout(
    barmode='stack',
    title='Número de contratos ESAP según año de firma por modalidad de contrato 2020-2024',
    xaxis_title='Año de Firma',
    yaxis_title='Número de contratos',
    legend_title='Modalidad de contratación'
)

# Mostrar el gráfico
fig.show()

_Número de contratos ESAP por Dirección Territorial año 2020 - 2024_

In [45]:
# Asegurándonos de que 'secop' tiene una columna 'nombre_sede' y 'ano_fecha_de_firma'

# Agrupar por año y nombre de sede, y contar
sede_anio_counts = secop.groupby(['ano_fecha_de_firma', 'nombre_sede']).size().unstack(fill_value=0)

# Crear el gráfico
fig = go.Figure()
for sede in sede_anio_counts.columns:
    fig.add_trace(go.Bar(
        x=sede_anio_counts.index,
        y=sede_anio_counts[sede],
        name=sede
    ))

# Actualizar el diseño del gráfico
fig.update_layout(
    barmode='stack',
    title='Número de contratos ESAP según año de firma por sede',
    xaxis_title='Año de Firma',
    yaxis_title='Número de contratos',
    legend_title='Sede'
)

# Mostrar el gráfico
fig.show()

_Tiempo entre la fecha de firma de contrato y fecha fin de contrato ESAP año 2020 - 2024 (días)_

In [46]:
# Calcular el tiempo entre la fecha de firma y la fecha de final del contrato y almacenar en una nueva columna 'tiempo_entre_firma_final'
secop['tiempo_entre_firma_fin_dia'] = secop['fecha_de_fin_del_contrato'] - secop['fecha_de_firma']
# Mostrar información del DataFrame resultante
print(secop[['fecha_de_firma', 'fecha_de_fin_del_contrato', 'tiempo_entre_firma_fin_dia']].head())

  fecha_de_firma fecha_de_fin_del_contrato tiempo_entre_firma_fin_dia
0     2023-03-02                2023-04-01                    30 days
1     2023-09-05                2023-12-16                   102 days
2     2020-08-26                2020-12-31                   127 days
3     2021-04-30                2021-12-04                   218 days
4     2023-08-12                2023-12-26                   136 days


In [47]:
# Calcular la diferencia en días
secop['tiempo_entre_firma_fin_dia'] = (secop['fecha_de_fin_del_contrato'] - secop['fecha_de_firma']).dt.days
# Mostrar el resultado
print(secop[['fecha_de_firma', 'fecha_de_fin_del_contrato', 'tiempo_entre_firma_fin_dia']].head())

  fecha_de_firma fecha_de_fin_del_contrato  tiempo_entre_firma_fin_dia
0     2023-03-02                2023-04-01                          30
1     2023-09-05                2023-12-16                         102
2     2020-08-26                2020-12-31                         127
3     2021-04-30                2021-12-04                         218
4     2023-08-12                2023-12-26                         136


In [49]:
# Mostrar estadísticas descriptivas del tiempo entre firma y fecha final del contrato
resumen_tiempo_firma_fin = secop['tiempo_entre_firma_fin_dia'].describe()
# Mostrar el resumen
print(resumen_tiempo_firma_fin)

count   14,006
mean       219
std        276
min       -460
25%        106
50%        184
75%        275
max      3,970
Name: tiempo_entre_firma_fin_dia, dtype: float64


_Tiempo entre la fecha de firma de contrato y fecha fin de contrato ESAP año 2020 - 2024 (meses)_

In [37]:
# Convertir las fechas a datetime
secop['fecha_de_firma'] = pd.to_datetime(secop['fecha_de_firma'])
secop['fecha_de_fin_del_contrato'] = pd.to_datetime(secop['fecha_de_fin_del_contrato'])

# Calcular la diferencia en días y luego convertir a meses
diferencia_dias = (secop['fecha_de_fin_del_contrato'] - secop['fecha_de_firma']).dt.days
secop['tiempo_entre_firma_fin_meses'] = (diferencia_dias / 30.44).astype(int)

# Mostrar el resultado
print(secop[['fecha_de_firma', 'fecha_de_fin_del_contrato', 'tiempo_entre_firma_fin_meses']].head())

  fecha_de_firma fecha_de_fin_del_contrato  tiempo_entre_firma_fin_meses
0     2023-03-02                2023-04-01                             0
1     2023-09-05                2023-12-16                             3
2     2020-08-26                2020-12-31                             4
3     2021-04-30                2021-12-04                             7
4     2023-08-12                2023-12-26                             4


In [50]:
# Mostrar estadísticas descriptivas del tiempo entre firma e inicio
resumen_tiempo_firma_inicio = secop['tiempo_entre_firma_fin_meses'].describe()

# Mostrar el resumen
print(resumen_tiempo_firma_inicio)

count   14,006
mean         7
std          9
min        -15
25%          3
50%          6
75%          9
max        130
Name: tiempo_entre_firma_fin_meses, dtype: float64


In [51]:
# Calcular el promedio de tiempo entre firma y fecha final del contrato en días
secop['tiempo_entre_firma_fin'] = (secop['fecha_de_fin_del_contrato'] - secop['fecha_de_firma']).dt.days
promedio_tiempo_por_dia = secop.groupby('fecha_de_firma')['tiempo_entre_firma_fin'].mean().reset_index()

# Convertir el promedio de días a meses
promedio_tiempo_por_dia['tiempo_entre_firma_fin'] /= 30  # Aproximadamente 30 días por mes

# Crear una gráfica lineal del promedio del tiempo entre firma y fin por día en meses
fig = px.line(promedio_tiempo_por_dia, x='fecha_de_firma', y='tiempo_entre_firma_fin',
              labels={'tiempo_entre_firma_fin': 'Promedio Tiempo entre firma y fin (meses)'},
              title='Promedio meses entre la fecha de firma de contrato y fecha fin de contrato ESAP año 2020 - 2024')

# Mostrar la gráfica
fig.show()

_Valor de contratos ESAP según fecha de firma 2020 - 2024 (días)_

In [52]:
# Asegurar que 'fecha_de_firma' es un tipo de dato datetime
secop['fecha_de_firma'] = pd.to_datetime(secop['fecha_de_firma'])

# Agrupar y sumar el valor del contrato por fecha de firma
valor_fecha = secop.groupby('fecha_de_firma')['valor_del_contrato'].sum().reset_index()

# Crear el gráfico utilizando Plotly
fig = px.line(valor_fecha, x='fecha_de_firma', y='valor_del_contrato', title='Valor total de contratos ESAP según fecha de firma 2020 - 2024')

# Mostrar el gráfico
fig.show()

_Valor de contratos ESAP según fecha de firma 2020 - 2024 (meses)_

In [55]:
# Asegurar que 'fecha_de_firma' es un tipo de dato datetime
secop['fecha_de_firma'] = pd.to_datetime(secop['fecha_de_firma'])

# Extraer el mes y el año de la fecha de firma
secop['mes_ano_firma'] = secop['fecha_de_firma'].dt.to_period('M')

# Agrupar y sumar el valor del contrato por mes y año de firma
valor_por_mes = secop.groupby('mes_ano_firma')['valor_del_contrato'].sum().reset_index()

# Convertir 'mes_ano_firma' a datetime para el gráfico
valor_por_mes['mes_ano_firma'] = valor_por_mes['mes_ano_firma'].dt.to_timestamp()

# Crear el gráfico utilizando Plotly
fig = px.line(valor_por_mes, x='mes_ano_firma', y='valor_del_contrato', 
              title='Valor total de contratos ESAP por mes 2020 - 2024',
              labels={'valor_del_contrato': 'Valor del Contrato', 'mes_ano_firma': 'Mes y Año'})

# Mostrar el gráfico
fig.show()

In [56]:
# Extraer el mes y el año de la fecha de firma
secop['mes_ano_firma'] = secop['fecha_de_firma'].dt.to_period('M')

# Agrupar y calcular el valor promedio del contrato por mes y año de firma
valor_promedio_por_mes = secop.groupby('mes_ano_firma')['valor_del_contrato'].mean().reset_index()

# Convertir 'mes_ano_firma' a datetime para el gráfico
valor_promedio_por_mes['mes_ano_firma'] = valor_promedio_por_mes['mes_ano_firma'].dt.to_timestamp()

# Crear el gráfico utilizando Plotly
fig = px.line(valor_promedio_por_mes, x='mes_ano_firma', y='valor_del_contrato', 
              title='Valor promedio de contratos ESAP por mes 2020 - 2024',
              labels={'valor_del_contrato': 'Valor Promedio del Contrato', 'mes_ano_firma': 'Mes y Año'})

# Mostrar el gráfico
fig.show()

## Modelo

In [10]:
%pip install ucimlrepo




In [26]:
  
# data (as pandas dataframes) 
X = secop.data.features 
y = secop.data.targets 
  
# metadata 
#print(adult.metadata) 
  
# variable information 
#adult.variables 


AttributeError: 'DataFrame' object has no attribute 'data'