# Pipeline de generación de clusters usando redflags de Compras
El presente notebook permite descargar datos desde la base de datos de Aquiles, y posteriormente cargados en MySQL desde donde se obtienen los clusters y con los cuales se generarán las predicciones

## ETAPA: Adjudicación

### Redflag: Extensión del contrato
This red flag indicator identifies a risk if the contracting authority announces an intention to conclude a contract for a definite term longer than four years.

In [1]:
#Imports necesarios
import pyodbc #odbc para sqlserver
import time #librería necesaria para medir el tiempo de ejecución 
import datetime
import pandas as pd
import numpy as np
from functools import reduce
import os

user = os.environ['chcprocuser']
passw = os.environ['chcprocpass']
server = os.environ['chcprocserver']
db = os.environ['chcprocdb']

# Inicio del "cronómetro"
tInicio = time.time()

# Apertura la conexión a SQL SERVER
cnxn = pyodbc.connect('DRIVER={ODBC Driver 17 for SQL Server};SERVER='+server+';DATABASE='+db+';UID='+user+';PWD='+passw)

# Envío de las querys y lectura de los resultados

# Listado de licitaciones
sqlLic = '''select a.rbhCode
from DCCPProcurement.dbo.prcRFBHeader a
LEFT JOIN DCCPProcurement.dbo.prcRFBDate c on a.rbhCode = c.rbdRFBCode
WHERE YEAR(c.rbdOpeningDate) > 2019
and YEAR(c.rbdOpeningDate) < 2021
AND a.rbhOwnerName != 'Dirección de Compras y Contratación  Pública' 
AND a.rbhProcessSubType in (1, 2, 3, 23, 24, 25,  30) 
AND a.rbhDocumentStatus in (8,9,10, 7, 15, 16)
AND a.rbhProcessType = 1'''

# tiempo en días por licitación
sqlTiempo = '''SELECT a.rbhCode
, (CASE a.rbhContractDuration 
WHEN 5 THEN CONVERT(bigint ,a.rbhContractTime) * 365 
WHEN 4 THEN CONVERT(bigint ,a.rbhContractTime) * 30 
WHEN 3 THEN CONVERT(bigint ,a.rbhContractTime) * 7 
WHEN 2 THEN CONVERT(bigint ,a.rbhContractTime) * 1 
WHEN 1 THEN CONVERT(bigint ,a.rbhContractTime) * 24 
WHEN 0 THEN CONVERT(bigint ,a.rbhContractTime) * 1 
ELSE 0 END) dias
from DCCPProcurement.dbo.prcRFBHeader a
LEFT JOIN DCCPProcurement.dbo.prcRFBDate c on a.rbhCode = c.rbdRFBCode
WHERE YEAR(c.rbdOpeningDate) > 2019
and YEAR(c.rbdOpeningDate) < 2021
AND a.rbhOwnerName != 'Dirección de Compras y Contratación  Pública' 
AND a.rbhProcessSubType in (1, 2, 3, 23, 24, 25,  30) 
AND a.rbhDocumentStatus in (8,9,10, 7, 15, 16)
AND a.rbhProcessType = 1'''

licUniverso = pd.read_sql(sqlLic,cnxn)
durContrat = pd.read_sql(sqlTiempo,cnxn)

# Cerramos la conexión
cnxn.close()

#unimos los dataframes
durCont = licUniverso.merge(durContrat, how='left')

# Calculamos el redflag y dejamos el dataframe en garantias2
durCont2 = durCont.copy()


# aplicamos el filtro mediante un select
durCont2.loc[durCont2['dias']>=1460, 'plazoContratoLargo'] = 1
durCont2.loc[durCont2['dias']<1460, 'plazoContratoLargo'] = 0

# Carga de datos en MySQL
from sqlalchemy import create_engine
import pymysql

engine = create_engine('mysql+pymysql://server:server@192.168.2.2:3306/nuevos', echo = False)
durCont2.to_sql(con=engine, name='plazoContratoLargo', if_exists='replace', index=False)

# Término del "crónometro" y transformaciones a hora, minutos y segundos
tFinal = time.time()
tSegundosGenerico = tFinal - tInicio
tFormateado = str(datetime.timedelta(seconds=tSegundosGenerico))

# Resultados de la primera extracción
print("Terminado, se procesaron "+ str(len(licUniverso)) + " licitaciones, en "+ tFormateado)

Terminado, se procesaron 55442 licitaciones, en 0:00:13.595330


### Oferente novato gana
Supplier has never submitted a bid for another contract

In [2]:
#Imports necesarios
import pyodbc #odbc para sqlserver
import time #librería necesaria para medir el tiempo de ejecución 
import datetime
import pandas as pd
import numpy as np
from functools import reduce

# Inicio del "cronómetro"
tInicio = time.time()

# Apertura la conexión a SQL SERVER
cnxn = pyodbc.connect('DRIVER={ODBC Driver 17 for SQL Server};SERVER='+server+';DATABASE='+db+';UID='+user+';PWD='+passw)

# Envío de las querys y lectura de los resultados

# Listado de licitaciones
sqlLic = '''select a.rbhCode
from DCCPProcurement.dbo.prcRFBHeader a
LEFT JOIN DCCPProcurement.dbo.prcRFBDate c on a.rbhCode = c.rbdRFBCode
WHERE YEAR(c.rbdOpeningDate) > 2019
and YEAR(c.rbdOpeningDate) < 2021
AND a.rbhOwnerName != 'Dirección de Compras y Contratación  Pública' 
AND a.rbhProcessSubType in (1, 2, 3, 23, 24, 25,  30) 
AND a.rbhDocumentStatus in (8,9,10, 7, 15, 16)
AND a.rbhProcessType = 1'''

# tiempo en días por licitación
sqlFechaMinProv = '''SELECT MIN(a.bidTechnicalIssueDate) primerOferta, a.bidOrganization 
FROM DCCPProcurement.dbo.prcBIDQuote a
GROUP BY a.bidOrganization'''

# tiempo en días por licitación
sqlLicOferFechaProv = '''SELECT a.rbhCode, a.rbhExternalCode , b.bidOrganization, b.bidTechnicalIssueDate
FROM DCCPProcurement.dbo.prcRFBHeader a
LEFT JOIN DCCPProcurement.dbo.prcBIDQuote b ON a.rbhCode = b.bidRFBCode
LEFT JOIN DCCPProcurement.dbo.prcRFBDate d ON a.rbhCode = d.rbdRFBCode 
WHERE bidOrganization is not NULL 
AND b.bidIsAwarded > 0
AND YEAR(d.rbdOpeningDate) > 2019
and YEAR(d.rbdOpeningDate) < 2021
AND a.rbhOwnerName != 'Dirección de Compras y Contratación  Pública' 
AND a.rbhProcessSubType in (1, 2, 3, 23, 24, 25,  30) 
AND a.rbhDocumentStatus in (8,9,10, 7, 15, 16)
AND a.rbhProcessType = 1'''

licUniverso = pd.read_sql(sqlLic,cnxn)
fechaMinProv = pd.read_sql(sqlFechaMinProv,cnxn)
licOferFechaProv = pd.read_sql(sqlLicOferFechaProv,cnxn)

# Cerramos la conexión
cnxn.close()

#unimos los dataframes
oferenteNovato = licOferFechaProv.merge(fechaMinProv, how='left', left_on = 'bidOrganization', right_on = 'bidOrganization')

# cambiamos los nulos de fechas por fechas muy lejanas para que en la posterior comparación aparezcan como oferentes nuevos
oferenteNovato.loc[oferenteNovato['primerOferta'].isnull(), 'primerOferta'] = '2099-01-01 00:00:00.000'

# Calculamos el indicador
oferenteNovato['oferenteNovato'] = 0
oferenteNovato.loc[oferenteNovato['bidTechnicalIssueDate'] == oferenteNovato['primerOferta'], 'oferenteNovato'] = 1

#Generamos los dataframes de nodos
oferNovato = oferenteNovato.groupby(['rbhCode'], as_index = False).sum()

# Normalizamos el indicador
oferNovato.loc[oferNovato['oferenteNovato'] > 0, 'oferenteNovato'] = 1

# Carga de datos en MySQL
from sqlalchemy import create_engine
import pymysql

engine = create_engine('mysql+pymysql://server:server@192.168.2.2:3306/nuevos', echo = False)
oferNovato.to_sql(con=engine, name='oferenteNovato', if_exists='replace', index=False)

# Término del "crónometro" y transformaciones a hora, minutos y segundos
tFinal = time.time()
tSegundosGenerico = tFinal - tInicio
tFormateado = str(datetime.timedelta(seconds=tSegundosGenerico))

# Resultados de la primera extracción
print("Terminado, se procesaron "+ str(len(licUniverso)) + " licitaciones, en "+ tFormateado)

Terminado, se procesaron 55442 licitaciones, en 0:00:28.045623


### Presencia de reclamos
Any complaints (formal or informal) from non-winning bidders

In [3]:
#Imports necesarios
import pyodbc #odbc para sqlserver
import time #librería necesaria para medir el tiempo de ejecución 
import datetime
import pandas as pd
import numpy as np
from functools import reduce

# Inicio del "cronómetro"
tInicio = time.time()

# Apertura la conexión a SQL SERVER
cnxn = pyodbc.connect('DRIVER={ODBC Driver 17 for SQL Server};SERVER='+server+';DATABASE='+db+';UID='+user+';PWD='+passw)

# Envío de las querys y lectura de los resultados

# Listado de licitaciones
sqlLic = '''select a.rbhCode
from DCCPProcurement.dbo.prcRFBHeader a
LEFT JOIN DCCPProcurement.dbo.prcRFBDate c on a.rbhCode = c.rbdRFBCode
WHERE YEAR(c.rbdOpeningDate) > 2019
and YEAR(c.rbdOpeningDate) < 2021
AND a.rbhOwnerName != 'Dirección de Compras y Contratación  Pública' 
AND a.rbhProcessSubType in (1, 2, 3, 23, 24, 25,  30) 
AND a.rbhDocumentStatus in (8,9,10, 7, 15, 16)
AND a.rbhProcessType = 1'''

# consulta para obtener si una licitación presenta reclamos
sqlPresentaReclamos = '''SELECT a.rbhCode, (CASE WHEN COUNT(DISTINCT c.idReclamo) > 0 THEN 1 ELSE 0 END) AS presenciaReclamos,
COUNT(DISTINCT c.idReclamo) qrecla
FROM DCCPProcurement.dbo.prcRFBHeader a
LEFT JOIN DCCPReclamos.dbo.Reclamo c ON a.rbhExternalCode = c.NumLicOC
LEFT JOIN DCCPProcurement.dbo.prcRFBDate d ON a.rbhCode = d.rbdRFBCode
WHERE YEAR(d.rbdOpeningDate) > 2019
and YEAR(d.rbdOpeningDate) < 2021
AND a.rbhOwnerName != 'Dirección de Compras y Contratación  Pública' 
AND a.rbhProcessSubType in (1, 2, 3, 23, 24, 25,  30) 
AND a.rbhDocumentStatus in (8,9,10, 7, 15, 16)
AND a.rbhProcessType = 1
GROUP BY a.rbhCode'''

licUniverso = pd.read_sql(sqlLic,cnxn)
presentaReclamos = pd.read_sql(sqlPresentaReclamos,cnxn)

# Cerramos la conexión
cnxn.close()

#unimos los dataframes
presentaReclamos = licUniverso.merge(presentaReclamos, how='left')

# Carga de datos en MySQL
from sqlalchemy import create_engine
import pymysql

engine = create_engine('mysql+pymysql://server:server@192.168.2.2:3306/nuevos', echo = False)
presentaReclamos.to_sql(con=engine, name='presenciaReclamos', if_exists='replace', index=False)

# Término del "crónometro" y transformaciones a hora, minutos y segundos
tFinal = time.time()
tSegundosGenerico = tFinal - tInicio
tFormateado = str(datetime.timedelta(seconds=tSegundosGenerico))

# Resultados de la primera extracción
print("Terminado, se procesaron "+ str(len(licUniverso)) + " licitaciones, en "+ tFormateado)

Terminado, se procesaron 55442 licitaciones, en 0:00:07.425668


### Retraso entre la adjudicación y la firma del contracto
Time between contract award and actual contract signing date (should be less than 3 months according to World Bank) exceeds a reasonable threshold. Note: Actual signing date not available in database, so calculation uses estimated signing date as proxy.

In [4]:
#Imports necesarios
import pyodbc #odbc para sqlserver
import time #librería necesaria para medir el tiempo de ejecución 
import datetime
import pandas as pd
import numpy as np
from functools import reduce

# Inicio del "cronómetro"
tInicio = time.time()

# Apertura la conexión a SQL SERVER
cnxn = pyodbc.connect('DRIVER={ODBC Driver 17 for SQL Server};SERVER='+server+';DATABASE='+db+';UID='+user+';PWD='+passw)

# Envío de las querys y lectura de los resultados

# Listado de licitaciones
sqlLic = '''select a.rbhCode
from DCCPProcurement.dbo.prcRFBHeader a
LEFT JOIN DCCPProcurement.dbo.prcRFBDate c on a.rbhCode = c.rbdRFBCode
WHERE YEAR(c.rbdOpeningDate) > 2019
and YEAR(c.rbdOpeningDate) < 2021
AND a.rbhOwnerName != 'Dirección de Compras y Contratación  Pública' 
AND a.rbhProcessSubType in (1, 2, 3, 23, 24, 25,  30) 
AND a.rbhDocumentStatus in (8,9,10, 7, 15, 16)
AND a.rbhProcessType = 1'''

# consulta para obtener diferencia entre plazos estimado y real de firma de contrato, se hace un poxy con la adjudicación, ya que no tenemos fecha de firma.
sqlDiferenciaFechaFirmas = '''SELECT a.rbhCode, (CASE WHEN (DATEDIFF(DAY, b.rbdAwardDate, b.rbdEstimatedContractSign)) >= 90 THEN 1 ELSE 0 END ) AS retrasoEnFirma,
(CASE WHEN (DATEDIFF(DAY, b.rbdAwardDate, b.rbdEstimatedContractSign)) >= 90 THEN DATEDIFF(DAY, b.rbdAwardDate, b.rbdEstimatedContractSign) - 90 ELSE 0 END ) AS diasderetraso,
b.rbdAwardDate
FROM DCCPProcurement.dbo.prcRFBHeader a
LEFT JOIN DCCPProcurement.dbo.prcRFBDate b ON a.rbhCode = b.rbdRFBCode
WHERE YEAR(b.rbdOpeningDate) > 2019
and YEAR(b.rbdOpeningDate) < 2021
AND a.rbhOwnerName != 'Dirección de Compras y Contratación  Pública' 
AND a.rbhProcessSubType in (1, 2, 3, 23, 24, 25,  30) 
AND a.rbhDocumentStatus in (8,9,10, 7, 15, 16)
AND a.rbhProcessType = 1'''

licUniverso = pd.read_sql(sqlLic,cnxn)
diferenciaFechaFirmas = pd.read_sql(sqlDiferenciaFechaFirmas,cnxn)

# Cerramos la conexión
cnxn.close()

#unimos los dataframes
diferenciaFechaFirmas = licUniverso.merge(diferenciaFechaFirmas, how='left')
diferenciaFechaFirmas.loc[diferenciaFechaFirmas['rbdAwardDate'].isnull(), 'retrasoEnFirma'] = np.nan

# eliminamos los campos que no se utilizarán.
diferenciaFechaFirmas = diferenciaFechaFirmas.drop(['rbdAwardDate'], axis=1)

# Carga de datos en MySQL
from sqlalchemy import create_engine
import pymysql

engine = create_engine('mysql+pymysql://server:server@192.168.2.2:3306/nuevos', echo = False)
diferenciaFechaFirmas.to_sql(con=engine, name='retrasoEnFirma', if_exists='replace', index=False)

# Término del "crónometro" y transformaciones a hora, minutos y segundos
tFinal = time.time()
tSegundosGenerico = tFinal - tInicio
tFormateado = str(datetime.timedelta(seconds=tSegundosGenerico))

# Resultados de la primera extracción
print("Terminado, se procesaron "+ str(len(diferenciaFechaFirmas)) + " licitaciones, en "+ tFormateado)

Terminado, se procesaron 55442 licitaciones, en 0:00:08.521642


### Divergencia entre monto final y monto estimado
Ratio of the total final value and the estimated value is not within a reasonable range Difference between the final value and the estimated value exceeds a reasonable threshold (30% according to OCP)

In [5]:
#Imports necesarios
import pyodbc #odbc para sqlserver
import time #librería necesaria para medir el tiempo de ejecución 
import datetime
import pandas as pd
import numpy as np
from functools import reduce

# Inicio del "cronómetro"
tInicio = time.time()

# Apertura la conexión a SQL SERVER
cnxn = pyodbc.connect('DRIVER={ODBC Driver 17 for SQL Server};SERVER='+server+';DATABASE='+db+';UID='+user+';PWD='+passw)

# Envío de las querys y lectura de los resultados

# Listado de licitaciones
sqlLic = '''select a.rbhCode
from DCCPProcurement.dbo.prcRFBHeader a
LEFT JOIN DCCPProcurement.dbo.prcRFBDate c on a.rbhCode = c.rbdRFBCode
WHERE YEAR(c.rbdOpeningDate) > 2019
and YEAR(c.rbdOpeningDate) < 2021
AND a.rbhOwnerName != 'Dirección de Compras y Contratación  Pública' 
AND a.rbhProcessSubType in (1, 2, 3, 23, 24, 25,  30) 
AND a.rbhDocumentStatus in (8,9,10, 7, 15, 16)
AND a.rbhProcessType = 1'''

# Query para obtener el monto estimado, el monto total comprometido y el ratio
sqlDiferenciaMonto = '''SELECT rbhCode, SUM(rbhEstimatedAmount) AS MontoEstimado, SUM(b.porTotalAmount) AS MontoAdjudicado, 
(SUM(b.porTotalAmount)/NULLIF((SUM(rbhEstimatedAmount)), 0)) AS Desviacion
FROM DCCPProcurement.dbo.prcRFBHeader a 
LEFT JOIN DCCPProcurement.dbo.prcPOHeader b ON a.rbhCode = b.porSourceDocumentNumber
LEFT JOIN DCCPProcurement.dbo.prcRFBDate d ON a.rbhCode = d.rbdRFBCode
WHERE YEAR(d.rbdOpeningDate) > 2019
and YEAR(d.rbdOpeningDate) < 2021
AND a.rbhOwnerName != 'Dirección de Compras y Contratación  Pública' 
AND a.rbhProcessSubType in (1, 2, 3, 23, 24, 25,  30) 
AND a.rbhDocumentStatus in (8,9,10, 7, 15, 16)
AND a.rbhProcessType = 1
GROUP BY rbhCode'''

licUniverso = pd.read_sql(sqlLic,cnxn)
diferenciaMonto = pd.read_sql(sqlDiferenciaMonto,cnxn)


# Cerramos la conexión
cnxn.close()

# Calculamos el indicador
diferenciaMonto.loc[(diferenciaMonto['Desviacion'] > 0.7)&(diferenciaMonto['Desviacion'] < 1.3), 'diferenciaEntreMontos'] = 0
diferenciaMonto.loc[diferenciaMonto['Desviacion'] < 0.7 , 'diferenciaEntreMontos'] = 1
diferenciaMonto.loc[diferenciaMonto['Desviacion'] > 1.3 , 'diferenciaEntreMontos'] = 1
diferenciaMonto['desviaciones'] = diferenciaMonto['MontoEstimado'] - diferenciaMonto['MontoAdjudicado']

# eliminamos las columnas innecesarias
diferenciaMonto = diferenciaMonto.drop(['MontoEstimado', 'MontoAdjudicado', 'Desviacion'], axis=1)

# Carga de datos en MySQL
from sqlalchemy import create_engine
import pymysql

engine = create_engine('mysql+pymysql://server:server@192.168.2.2:3306/nuevos', echo = False)
diferenciaMonto.to_sql(con=engine, name='diferenciaEntreMontos', if_exists='replace', index=False)

# Término del "crónometro" y transformaciones a hora, minutos y segundos
tFinal = time.time()
tSegundosGenerico = tFinal - tInicio
tFormateado = str(datetime.timedelta(seconds=tSegundosGenerico))

# Resultados de la primera extracción
print("Terminado, se procesaron "+ str(len(diferenciaMonto)) + " licitaciones, en "+ tFormateado)

Terminado, se procesaron 55442 licitaciones, en 0:00:44.548843


### Falta de cláusulas de penalización
Penalty clauses missing from contract

In [6]:
#Imports necesarios
import pyodbc #odbc para sqlserver
import time #librería necesaria para medir el tiempo de ejecución 
import datetime
import pandas as pd
import numpy as np
from functools import reduce

# Inicio del "cronómetro"
tInicio = time.time()

# Apertura la conexión a SQL SERVER
cnxn = pyodbc.connect('DRIVER={ODBC Driver 17 for SQL Server};SERVER='+server+';DATABASE='+db+';UID='+user+';PWD='+passw)

# Envío de las querys y lectura de los resultados

# Query para indicador de presencia de multas, este se trata de una estimación ya que, se usan palabras claves para saber si hay multas solicitadas en el formulario
sqlMultas = '''SELECT a.rbhCode,
MIN(CASE WHEN lower(rbcTitle) LIKE '%penal%' THEN 0
                WHEN lower(rbcTitle) LIKE '%sancion%' THEN 0
                WHEN lower(rbcTitle) LIKE '%sanción%' THEN 0
                WHEN lower(rbcTitle) LIKE '%multa%' THEN 0
                WHEN lower(rbcTitle) LIKE '%castigo%' THEN 0
                WHEN lower(rbcTitle) LIKE '%punicion%' THEN 0
                WHEN lower(rbcTitle) LIKE '%punición%' THEN 0
                WHEN lower(rbcTitle) LIKE '%correctivo%' THEN 0
                WHEN lower(rbcTitle) LIKE '%escarmiento%' THEN 0
                WHEN lower(rbcTitle) LIKE '%recargo%' THEN 0
                WHEN lower(rbcTitle) LIKE '%gravamen%' THEN 0
                WHEN lower(rbcTitle) LIKE '%amonestaci%' THEN 0
                WHEN lower(b.rbcDescription) LIKE '%penal%' THEN 0
                WHEN lower(b.rbcDescription) LIKE '%sancion%' THEN 0
                WHEN lower(b.rbcDescription) LIKE '%sanción%' THEN 0
                WHEN lower(b.rbcDescription) LIKE '%multa%' THEN 0
                WHEN lower(b.rbcDescription) LIKE '%castigo%' THEN 0
                WHEN lower(b.rbcDescription) LIKE '%punici%' THEN 0
                WHEN lower(b.rbcDescription) LIKE '%correctivo%' THEN 0
                WHEN lower(b.rbcDescription) LIKE '%escarmiento%' THEN 0
                WHEN lower(b.rbcDescription) LIKE '%imposici%' THEN 0
                WHEN lower(b.rbcDescription) LIKE '%recargo%' THEN 0
                WHEN lower(b.rbcDescription) LIKE '%gravamen%' THEN 0
                WHEN lower(b.rbcDescription) LIKE '%amonestaci%' THEN 0
ELSE 1 END) AS clausulaPenalizacion
FROM DCCPProcurement.dbo.prcRFBHeader a 
LEFT JOIN DCCPProcurement.dbo.prcRFBClause b ON a.rbhCode = b.rbcRFBCode 
LEFT JOIN DCCPProcurement.dbo.prcRFBDate d ON a.rbhCode = d.rbdRFBCode
WHERE YEAR(d.rbdOpeningDate) > 2019
and YEAR(d.rbdOpeningDate) < 2021
AND a.rbhOwnerName != 'Dirección de Compras y Contratación  Pública' 
AND a.rbhProcessSubType in (1, 2, 3, 23, 24, 25,  30) 
AND a.rbhDocumentStatus in (8,9,10, 7, 15, 16)
AND a.rbhProcessType = 1
GROUP BY a.rbhCode'''

multas = pd.read_sql(sqlMultas,cnxn)

# Cerramos la conexión
cnxn.close()

# Carga de datos en MySQL
from sqlalchemy import create_engine
import pymysql

engine = create_engine('mysql+pymysql://server:server@192.168.2.2:3306/nuevos', echo = False)
multas.to_sql(con=engine, name='clausulaPenalizacion', if_exists='replace', index=False)

# Término del "crónometro" y transformaciones a hora, minutos y segundos
tFinal = time.time()
tSegundosGenerico = tFinal - tInicio
tFormateado = str(datetime.timedelta(seconds=tSegundosGenerico))

# Resultados de la primera extracción
print("Terminado, se procesaron "+ str(len(multas)) + " licitaciones, en "+ tFormateado)

Terminado, se procesaron 55442 licitaciones, en 0:06:59.515620


### Procedimiento exitoso sin OC
This red flag indicator signals a risk if the public procurement procedure was successful (there is a winner), but the parties still do not conclude the contract based on the procedure. (The contracting authority has to inform also about this fact and its reasons in the notice.) The occurrence of this situation may be lawful, but – in line with indicator no. 5 above (one of the cases of unsuccessful procedure) – it carries a significant risk, especially because the prerequisites of a relief of the contracting obligation are strict, and in such a case the entity who won the procedure is already known.

In [7]:
#Imports necesarios
import pyodbc #odbc para sqlserver
import time #librería necesaria para medir el tiempo de ejecución 
import datetime
import pandas as pd
import numpy as np
from functools import reduce

# Inicio del "cronómetro"
tInicio = time.time()

# Apertura la conexión a SQL SERVER
cnxn = pyodbc.connect('DRIVER={ODBC Driver 17 for SQL Server};SERVER='+server+';DATABASE='+db+';UID='+user+';PWD='+passw)

# Envío de las querys y lectura de los resultados

# Query para indicador de presencia de multas, este se trata de una estimación ya que, se usan palabras claves para saber si hay multas solicitadas en el formulario
sqlSinContratos = '''SELECT a.rbhCode, (CASE WHEN a.rbhDocumentStatus IN (8,9,10) AND COUNT(b.porID) = 0 THEN 1 WHEN a.rbhDocumentStatus NOT IN (8,9,10) THEN NULL ELSE 0 END) AS sinOC
FROM DCCPProcurement.dbo.prcRFBHeader a
LEFT JOIN DCCPProcurement.dbo.prcPOHeader b ON a.rbhCode = b.porSourceDocumentNumber
LEFT JOIN DCCPProcurement.dbo.prcRFBDate d ON a.rbhCode = d.rbdRFBCode
WHERE YEAR(d.rbdOpeningDate) > 2019
and YEAR(d.rbdOpeningDate) < 2021
AND a.rbhOwnerName != 'Dirección de Compras y Contratación  Pública' 
AND a.rbhProcessSubType in (1, 2, 3, 23, 24, 25,  30) 
AND a.rbhDocumentStatus in (8,9,10, 7, 15, 16)
AND a.rbhProcessType = 1
GROUP BY a.rbhCode, a.rbhDocumentStatus'''

sinContratos = pd.read_sql(sqlSinContratos,cnxn)

# Cerramos la conexión
cnxn.close()

# Carga de datos en MySQL
from sqlalchemy import create_engine
import pymysql

engine = create_engine('mysql+pymysql://server:server@192.168.2.2:3306/nuevos', echo = False)
sinContratos.to_sql(con=engine, name='sinOC', if_exists='replace', index=False)

# Término del "crónometro" y transformaciones a hora, minutos y segundos
tFinal = time.time()
tSegundosGenerico = tFinal - tInicio
tFormateado = str(datetime.timedelta(seconds=tSegundosGenerico))

# Resultados de la primera extracción
print("Terminado, se procesaron "+ str(len(sinContratos)) + " licitaciones, en "+ tFormateado)

Terminado, se procesaron 55442 licitaciones, en 0:00:06.347705


### Valor final del contrato demasiado alto
Payment of unjustified high prices relative to historical average of purchasing entity

In [8]:
#Imports necesarios
import pyodbc #odbc para sqlserver
import time #librería necesaria para medir el tiempo de ejecución 
import datetime
import pandas as pd
import numpy as np
from functools import reduce

# Inicio del "cronómetro"
tInicio = time.time()

# Apertura la conexión a SQL SERVER
cnxn = pyodbc.connect('DRIVER={ODBC Driver 17 for SQL Server};SERVER='+server+';DATABASE='+db+';UID='+user+';PWD='+passw)

# Envío de las querys y lectura de los resultados

# Listado de licitaciones
sqlPromMontoProv = '''SELECT b.porBuyerOrganization , count(DISTINCT a.rbhCode) cantLic, sum(b.porTotalAmount) sumMonto, sum(b.porTotalAmount)/count(DISTINCT a.rbhCode) promMonto
FROM DCCPProcurement.dbo.prcRFBHeader a
LEFT JOIN DCCPProcurement.dbo.prcPOHeader b ON a.rbhCode = b.porSourceDocumentNumber
LEFT JOIN DCCPProcurement.dbo.prcRFBDate d ON a.rbhCode = d.rbdRFBCode
WHERE YEAR(d.rbdOpeningDate) > 2019
and YEAR(d.rbdOpeningDate) < 2021
AND a.rbhOwnerName != 'Dirección de Compras y Contratación  Pública' 
AND a.rbhProcessSubType in (1, 2, 3, 23, 24, 25,  30) 
AND a.rbhDocumentStatus in (8,9,10, 7, 15, 16)
AND a.rbhProcessType = 1
and b.porBuyerOrganization is not NULL 
and b.porBuyerOrganization != ' '
GROUP BY b.porBuyerOrganization'''

# Query para obtener el monto estimado, el monto total comprometido y el ratio
sqlMontoLic = '''SELECT a.rbhCode, a.rbhOrganization, sum(b.porTotalAmount) Monto
FROM DCCPProcurement.dbo.prcRFBHeader a
LEFT JOIN DCCPProcurement.dbo.prcPOHeader b ON a.rbhCode = b.porSourceDocumentNumber
LEFT JOIN DCCPProcurement.dbo.prcRFBDate d ON a.rbhCode = d.rbdRFBCode
WHERE YEAR(d.rbdOpeningDate) > 2019
and YEAR(d.rbdOpeningDate) < 2021
AND a.rbhOwnerName != 'Dirección de Compras y Contratación  Pública' 
AND a.rbhProcessSubType in (1, 2, 3, 23, 24, 25,  30) 
AND a.rbhDocumentStatus in (8,9,10, 7, 15, 16)
AND a.rbhProcessType = 1
GROUP BY a.rbhOrganization, a.rbhCode'''

promMontoProv = pd.read_sql(sqlPromMontoProv,cnxn)
montoLic = pd.read_sql(sqlMontoLic,cnxn)

# Cerramos la conexión
cnxn.close()

#unimos los dataframes
montoAlto = montoLic.merge(promMontoProv, how='left', left_on = 'rbhOrganization', right_on = 'porBuyerOrganization')

#Calculamos el indicador primero con la división de monto por licitación sobre el promedio y luego si esta es mayor que 2, entonces se considera riesgosa.
montoAlto['div'] = montoAlto['Monto']/montoAlto['promMonto']

montoAlto.loc[montoAlto['div'] <= 1.5 , 'desviacionMontoPromedio'] = 0
montoAlto.loc[montoAlto['div'] > 1.5 , 'desviacionMontoPromedio'] = 1

# eliminamos las columnas innecesarias
montoAlto = montoAlto.drop(['rbhOrganization', 'Monto', 'porBuyerOrganization', 'cantLic', 'sumMonto','div'], axis=1)

# Carga de datos en MySQL
from sqlalchemy import create_engine
import pymysql

engine = create_engine('mysql+pymysql://server:server@192.168.2.2:3306/nuevos', echo = False)
montoAlto.to_sql(con=engine, name='desviacionMontoPromedio', if_exists='replace', index=False)

# Término del "crónometro" y transformaciones a hora, minutos y segundos
tFinal = time.time()
tSegundosGenerico = tFinal - tInicio
tFormateado = str(datetime.timedelta(seconds=tSegundosGenerico))

# Resultados de la primera extracción
print("Terminado, se procesaron "+ str(len(montoAlto)) + " licitaciones, en "+ tFormateado)

Terminado, se procesaron 55442 licitaciones, en 0:00:32.355410


### Winning Bid Very Close to Cost Estimates
A winning bid that is too close to confidential project cost estimates or budgets can indicate the leaking of bid information or an unbalanced bidding scheme. Both schemes are usually the result of corruption, as project officials provide such information to a favored bidder to enable it to win. This indicator is triggered if the winning bid is within ± 15% of the buying entity's cost estimate. 

In [9]:
#Imports necesarios
import pyodbc #odbc para sqlserver
import time #librería necesaria para medir el tiempo de ejecución 
import datetime
import pandas as pd
import numpy as np
from functools import reduce

# Inicio del "cronómetro"
tInicio = time.time()

# Apertura la conexión a SQL SERVER
cnxn = pyodbc.connect('DRIVER={ODBC Driver 17 for SQL Server};SERVER='+server+';DATABASE='+db+';UID='+user+';PWD='+passw)

# Envío de las querys y lectura de los resultados

# Obtención de datos de montos adjudicados y montos estimados para saber si lo adjudicado se ajusta mucho a lo estimado
sqlMontosimilar = '''SELECT a.rbhCode, sum(b.porTotalAmount ) montoAdj, sum(case when a.rbhEstimatedAmount is null then 0 else a.rbhEstimatedAmount end) monto , sum(case when a.rbhEstimatedAmount is null then 0 else a.rbhEstimatedAmount end)/(case when sum(b.porTotalAmount) < 1 then 1 else sum(b.porTotalAmount) end) div,
avg(a.rbhEstimatedAmount) as estimado,
sum(b.porTotalAmount) as adjudicado
FROM DCCPProcurement.dbo.prcRFBHeader a
LEFT JOIN DCCPProcurement.dbo.prcPOHeader b ON a.rbhCode = b.porSourceDocumentNumber 
LEFT JOIN DCCPProcurement.dbo.prcRFBDate d ON a.rbhCode = d.rbdRFBCode
WHERE YEAR(d.rbdOpeningDate) > 2019
and YEAR(d.rbdOpeningDate) < 2021
AND a.rbhOwnerName != 'Dirección de Compras y Contratación  Pública' 
AND a.rbhProcessSubType in (1, 2, 3, 23, 24, 25,  30) 
AND a.rbhDocumentStatus in (8,9,10, 7, 15, 16)
AND a.rbhProcessType = 1
GROUP BY a.rbhCode'''

montosimilar = pd.read_sql(sqlMontosimilar,cnxn)

# Cerramos la conexión
cnxn.close()

#Calculamos el indicador primero con la división de monto por licitación sobre el promedio y luego si esta es mayor que 2, entonces se considera riesgosa.
montosimilar.loc[(montosimilar['div'] <= 0.97), 'adjudicacionCercana'] = 0
montosimilar.loc[(montosimilar['div'] >= 1.03), 'adjudicacionCercana'] = 0
montosimilar.loc[(montosimilar['div'] > 0.97) & (montosimilar['div'] < 1.03), 'adjudicacionCercana'] = 1

# eliminamos las columnas innecesarias
montosimilar = montosimilar.drop(['montoAdj', 'monto', 'div'], axis=1)

# Carga de datos en MySQL
from sqlalchemy import create_engine
import pymysql

engine = create_engine('mysql+pymysql://server:server@192.168.2.2:3306/nuevos', echo = False)
montosimilar.to_sql(con=engine, name='adjudicacionCercana', if_exists='replace', index=False)

# Término del "crónometro" y transformaciones a hora, minutos y segundos
tFinal = time.time()
tSegundosGenerico = tFinal - tInicio
tFormateado = str(datetime.timedelta(seconds=tSegundosGenerico))

# Resultados de la primera extracción
print("Terminado, se procesaron "+ str(len(montosimilar)) + " licitaciones, en "+ tFormateado)

Terminado, se procesaron 55442 licitaciones, en 0:00:10.792531


### Código proveedor ausente	
That public buyers are providing insufficient information about the seller of goods, works or services they selected following a procurement procedure.

In [10]:
#Imports necesarios
import pyodbc #odbc para sqlserver
import time #librería necesaria para medir el tiempo de ejecución 
import datetime
import pandas as pd
import numpy as np
from functools import reduce

# Inicio del "cronómetro"
tInicio = time.time()

# Apertura la conexión a SQL SERVER
cnxn = pyodbc.connect('DRIVER={ODBC Driver 17 for SQL Server};SERVER='+server+';DATABASE='+db+';UID='+user+';PWD='+passw)

# Envío de las querys y lectura de los resultados

# Query para indicador de ausencia de codigo proveedor
sqlSinProveedor = '''SELECT a.rbhCode, SUM(CASE WHEN b.porSellerOrganization IS NULL and b.porID is not NULL and b.porBuyerStatus in (4, 5, 6, 12, 13, 14) THEN 1 ELSE 0 END) AS codigoProvAusente
FROM DCCPProcurement.dbo.prcRFBHeader a
LEFT JOIN DCCPProcurement.dbo.prcPOHeader b ON a.rbhCode = b.porSourceDocumentNumber
LEFT JOIN DCCPProcurement.dbo.prcRFBDate d ON a.rbhCode = d.rbdRFBCode
WHERE YEAR(d.rbdOpeningDate) > 2019
and YEAR(d.rbdOpeningDate) < 2021
AND a.rbhOwnerName != 'Dirección de Compras y Contratación  Pública' 
AND a.rbhProcessSubType in (1, 2, 3, 23, 24, 25, 30) 
AND a.rbhDocumentStatus in (8, 9, 10, 7, 15, 16)
AND a.rbhProcessType = 1
GROUP BY a.rbhCode'''

sinProveedor = pd.read_sql(sqlSinProveedor,cnxn)

# Cerramos la conexión
cnxn.close()

# Carga de datos en MySQL
from sqlalchemy import create_engine
import pymysql

engine = create_engine('mysql+pymysql://server:server@192.168.2.2:3306/nuevos', echo = False)
sinProveedor.to_sql(con=engine, name='codigoProvAusente', if_exists='replace', index=False)

# Término del "crónometro" y transformaciones a hora, minutos y segundos
tFinal = time.time()
tSegundosGenerico = tFinal - tInicio
tFormateado = str(datetime.timedelta(seconds=tSegundosGenerico))

# Resultados de la primera extracción
print("Terminado, se procesaron "+ str(len(sinProveedor)) + " licitaciones, en "+ tFormateado)

Terminado, se procesaron 55442 licitaciones, en 0:00:10.076561


### Procedimiento desierto sin justificación ha sido desierta sin justificación
The red flag indicator signals, if the information notice does not specify the reason for the procedure’s lack of success, even though the procedure is unsuccessful (no winner declared).

In [11]:
#Imports necesarios
import pyodbc #odbc para sqlserver
import time #librería necesaria para medir el tiempo de ejecución 
import datetime
import pandas as pd
import numpy as np
from functools import reduce

# Inicio del "cronómetro"
tInicio = time.time()

# Apertura la conexión a SQL SERVER
cnxn = pyodbc.connect('DRIVER={ODBC Driver 17 for SQL Server};SERVER='+server+';DATABASE='+db+';UID='+user+';PWD='+passw)

# Envío de las querys y lectura de los resultados
# Query para indicador de ausencia de codigo proveedor
sqlDesSinJustificacion = '''SELECT rbhCode,
(CASE WHEN
(rbhDocumentStatus = 7 OR rbhdocumentstatus = 15)
AND rbhRevokeJustify IS NULL THEN 1
ELSE 0 END) AS desiertaSinJustificacion
FROM DCCPProcurement.dbo.prcRFBHeader a 
LEFT JOIN DCCPProcurement.dbo.prcRFBDate d ON a.rbhCode = d.rbdRFBCode
WHERE YEAR(d.rbdOpeningDate) > 2019
and YEAR(d.rbdOpeningDate) < 2021
AND a.rbhOwnerName != 'Dirección de Compras y Contratación  Pública' 
AND a.rbhProcessSubType in (1, 2, 3, 23, 24, 25,  30) 
AND a.rbhDocumentStatus in (8,9,10, 7, 15, 16)
AND a.rbhProcessType = 1'''

desSinJustificacion = pd.read_sql(sqlDesSinJustificacion,cnxn)

# Cerramos la conexión
cnxn.close()

# Carga de datos en MySQL
from sqlalchemy import create_engine
import pymysql

engine = create_engine('mysql+pymysql://server:server@192.168.2.2:3306/nuevos', echo = False)
desSinJustificacion.to_sql(con=engine, name='desiertaSinJustificacion', if_exists='replace', index=False)

# Término del "crónometro" y transformaciones a hora, minutos y segundos
tFinal = time.time()
tSegundosGenerico = tFinal - tInicio
tFormateado = str(datetime.timedelta(seconds=tSegundosGenerico))

# Resultados de la primera extracción
print("Terminado, se procesaron "+ str(len(desSinJustificacion)) + " licitaciones, en "+ tFormateado)

Terminado, se procesaron 55442 licitaciones, en 0:00:03.976879


### Licitación cancelada por causa de reclamos
Tender cancelled when there is a complaint about the decision on the winner selection or pre-qualification results with a non-terminal status, that is "Awaits consideration" and "Under consideration". Indicator triggered if cancelled tender bears three or more submitted complaints.


In [12]:
#Imports necesarios
import pyodbc #odbc para sqlserver
import time #librería necesaria para medir el tiempo de ejecución 
import datetime
import pandas as pd
import numpy as np
from functools import reduce

# Inicio del "cronómetro"
tInicio = time.time()

# Apertura la conexión a SQL SERVER
cnxn = pyodbc.connect('DRIVER={ODBC Driver 17 for SQL Server};SERVER='+server+';DATABASE='+db+';UID='+user+';PWD='+passw)

# Envío de las querys y lectura de los resultados
# Query para indicador de ausencia de codigo proveedor
sqlCancelReclamos = '''SELECT a.rbhCode , (CASE WHEN (COUNT(DISTINCT b.idReclamo )) > 3 AND a.rbhDocumentStatus IN (15, 16) THEN 1 ELSE 0 END) AS 'anulacionPorReclamo'
FROM DCCPProcurement.dbo.prcRFBHeader a
LEFT JOIN DCCPReclamos.dbo.Reclamo b ON a.rbhExternalCode = b.numLicOC
LEFT JOIN DCCPProcurement.dbo.prcRFBDate d ON a.rbhCode = d.rbdRFBCode
WHERE YEAR(d.rbdOpeningDate) > 2019
and YEAR(d.rbdOpeningDate) < 2021
AND a.rbhOwnerName != 'Dirección de Compras y Contratación  Pública' 
AND a.rbhProcessSubType in (1, 2, 3, 23, 24, 25,  30) 
AND a.rbhDocumentStatus in (8,9,10, 7, 15, 16)
AND a.rbhProcessType = 1
GROUP BY a.rbhCode, a.rbhDocumentStatus'''

cancelReclamos = pd.read_sql(sqlCancelReclamos,cnxn)

# Cerramos la conexión
cnxn.close()

# Carga de datos en MySQL
from sqlalchemy import create_engine
import pymysql

engine = create_engine('mysql+pymysql://server:server@192.168.2.2:3306/nuevos', echo = False)
cancelReclamos.to_sql(con=engine, name='anulacionPorReclamo', if_exists='replace', index=False)

# Término del "crónometro" y transformaciones a hora, minutos y segundos
tFinal = time.time()
tSegundosGenerico = tFinal - tInicio
tFormateado = str(datetime.timedelta(seconds=tSegundosGenerico))

# Resultados de la primera extracción
print("Terminado, se procesaron "+ str(len(cancelReclamos)) + " licitaciones, en "+ tFormateado)

Terminado, se procesaron 55442 licitaciones, en 0:00:04.829744
