# Pipeline de generación de clusters usando redflags de Compras
El presente notebook permite descargar datos desde la base de datos de Aquiles, y posteriormente cargados en MySQL desde donde se obtienen los clusters y con los cuales se generarán las predicciones

## ETAPA: Licitación

### Redflag: Bids after the deadline accepted
Bids submitted after the admission deadline still accepted

In [2]:
#Imports necesarios
import pyodbc #odbc para sqlserver
import time #librería necesaria para medir el tiempo de ejecución 
import datetime
import pandas as pd
import numpy as np
from functools import reduce
import os

# Inicio del "cronómetro"
tInicio = time.time()

user = os.environ['chcprocuser']
passw = os.environ['chcprocpass']
server = os.environ['chcprocserver']
db = os.environ['chcprocdb']

# Inicio del "cronómetro"
tInicio = time.time()

# Apertura la conexión a SQL SERVER
cnxn = pyodbc.connect('DRIVER={ODBC Driver 17 for SQL Server};SERVER='+server+';DATABASE='+db+';UID='+user+';PWD='+passw)

# Envío de las querys y lectura de los resultados

# Listado de licitaciones
sqlLic = '''select a.rbhCode
from DCCPProcurement.dbo.prcRFBHeader a
LEFT JOIN DCCPProcurement.dbo.prcRFBDate c on a.rbhCode = c.rbdRFBCode
WHERE YEAR(c.rbdOpeningDate) > 2019
AND YEAR(c.rbdOpeningDate) < 2021
AND a.rbhOwnerName != 'Dirección de Compras y Contratación  Pública'
AND rbhEnterprise != 6945
AND a.rbhProcessSubType in (1, 2, 3, 23, 24, 25,  30) 
AND a.rbhDocumentStatus in (8,9,10, 7, 15, 16)
AND a.rbhProcessType = 1
AND a.rbhInformation != 1'''

# Descarga de datos de licitaciones con indicador de si las fechas son incumplidas
sqlFechasInc = '''SELECT a.rbhCode, SUM(case when c.rbdTechnicalBidReception < b.bidTechnicalIssueDate then 1 else 0 end) as flag, max(b.bidTechnicalIssueDate) as date
FROM DCCPProcurement.dbo.prcRFBHeader a
LEFT JOIN DCCPProcurement.dbo.prcBIDQuote b ON a.rbhCode = b.bidRFBCode
LEFT JOIN DCCPProcurement.dbo.prcRFBDate c on a.rbhCode = c.rbdRFBCode
WHERE YEAR(c.rbdOpeningDate) > 2019
AND YEAR(c.rbdOpeningDate) < 2021
AND a.rbhOwnerName != 'Dirección de Compras y Contratación  Pública'
AND rbhEnterprise != 6945
AND a.rbhProcessSubType in (1, 2, 3, 23, 24, 25,  30) 
AND a.rbhDocumentStatus in (8,9,10, 7, 15, 16)
AND a.rbhProcessType = 1
AND a.rbhInformation != 1
GROUP by a.rbhCode'''

licUniverso = pd.read_sql(sqlLic, cnxn)
fechasInc = pd.read_sql(sqlFechasInc, cnxn)


# Cerramos la conexión
cnxn.close()

# generamos el indicador
fechasInc['ofertasFueraPlazo'] = 0
fechasInc.loc[fechasInc['flag'] > 0, 'ofertasFueraPlazo'] = 1
fechasInc.loc[fechasInc['date'].isnull(), 'ofertasFueraPlazo'] = np.nan

np.datetime64('NaT')
# botamos las columnas innecesarias
fechasInc = fechasInc.drop(['flag', 'date'], axis=1)

#unimos los dataframes
fechIncumplidas = licUniverso.merge(fechasInc, how='left')

# Carga de datos en MySQL
from sqlalchemy import create_engine
import pymysql

engine = create_engine('mysql+pymysql://server:server@192.168.2.2:3306/nuevos', echo = False)
fechIncumplidas.to_sql(con=engine, name='ofertasFueraPlazo', if_exists='replace', index=False)

# Término del "crónometro" y transformaciones a hora, minutos y segundos
tFinal = time.time()
tSegundosGenerico = tFinal - tInicio
tFormateado = str(datetime.timedelta(seconds=tSegundosGenerico))

# Resultados de la primera extracción
print("Terminado, se procesaron "+ str(len(fechIncumplidas)) + " licitaciones, en "+ tFormateado)

Terminado, se procesaron 100819 licitaciones, en 0:00:32.772629


### Redflag: Todas las ofertas son demasiado altas
All bids higher than estimated overall costs

In [3]:
#Imports necesarios
import pyodbc #odbc para sqlserver
import time #librería necesaria para medir el tiempo de ejecución 
import datetime
import pandas as pd
import numpy as np
from functools import reduce

# Inicio del "cronómetro"
tInicio = time.time()

# Apertura la conexión a SQL SERVER
cnxn = pyodbc.connect('DRIVER={ODBC Driver 17 for SQL Server};SERVER='+server+';DATABASE='+db+';UID='+user+';PWD='+passw)

# Envío de las querys y lectura de los resultados

# Listado de licitaciones
sqlLic = '''select a.rbhCode
from DCCPProcurement.dbo.prcRFBHeader a
LEFT JOIN DCCPProcurement.dbo.prcRFBDate c on a.rbhCode = c.rbdRFBCode
WHERE YEAR(c.rbdOpeningDate) > 2019
AND YEAR(c.rbdOpeningDate) < 2021
AND a.rbhOwnerName != 'Dirección de Compras y Contratación  Pública'
AND rbhEnterprise != 6945
AND a.rbhProcessSubType in (1, 2, 3, 23, 24, 25,  30) 
AND a.rbhDocumentStatus in (8,9,10, 7, 15, 16)
AND a.rbhProcessType = 1
AND a.rbhInformation != 1'''

# Descarga de datos de licitaciones con contador de  las ofertas que son más altas que el monto disponible 
sqlOfertasAltas = '''SELECT t.rbhCode, SUM(t.cantOfer) as CantidadOfertas,  sum(case when t.porc > 1.0 then 1 else 0 end) as OfertasAltas
FROM 
(
SELECT a.rbhCode ,b.bidOrganization, count(b.bidID) as cantOfer,
case a.rbhEstimatedAmount
WHEN 0 
then sum(c.bitUnitNetPrice * c.bitQuantity) else sum(c.bitUnitNetPrice * c.bitQuantity) / a.rbhEstimatedAmount end as porc
FROM DCCPProcurement.dbo.prcRFBHeader a 
LEFT JOIN DCCPProcurement.dbo.prcBIDQuote b ON a.rbhCode = b.bidRFBCode
LEFT JOIN DCCPProcurement.dbo.prcBIDItem c ON b.bidID = c.bitBID
LEFT JOIN DCCPProcurement.dbo.prcRFBDate d on a.rbhCode = d.rbdRFBCode
WHERE YEAR(d.rbdOpeningDate) > 2019
AND YEAR(d.rbdOpeningDate) < 2021
AND a.rbhOwnerName != 'Dirección de Compras y Contratación  Pública'
AND rbhEnterprise != 6945
AND a.rbhProcessSubType in (1, 2, 3, 23, 24, 25,  30) 
AND a.rbhDocumentStatus in (8,9,10, 7, 15, 16)
AND a.rbhProcessType = 1
and c.bitUnitNetPrice > 1
AND a.rbhCurrency = c.bitCurrency
AND a.rbhInformation != 1
GROUP BY a.rbhCode, a.rbhEstimatedAmount ,b.bidOrganization  
) as t
GROUP BY t.rbhCode'''

licUniverso = pd.read_sql(sqlLic, cnxn)
ofertasAltas = pd.read_sql(sqlOfertasAltas, cnxn)


# Cerramos la conexión
cnxn.close()

# generamos el indicador
ofertasAltas['todasOfertasAltas'] = 0
ofertasAltas.loc[ofertasAltas['OfertasAltas'] == ofertasAltas['CantidadOfertas'], 'todasOfertasAltas'] = 1

#unimos los dataframes
oferAltas = licUniverso.merge(ofertasAltas, how='left')

# Carga de datos en MySQL
from sqlalchemy import create_engine
import pymysql

engine = create_engine('mysql+pymysql://server:server@192.168.2.2:3306/nuevos', echo = False)
oferAltas.to_sql(con=engine, name='todasOfertasAltas', if_exists='replace', index=False)

# Término del "crónometro" y transformaciones a hora, minutos y segundos
tFinal = time.time()
tSegundosGenerico = tFinal - tInicio
tFormateado = str(datetime.timedelta(seconds=tSegundosGenerico))

# Resultados de la primera extracción
print("Terminado, se procesaron "+ str(len(oferAltas)) + " licitaciones, en "+ tFormateado)

Terminado, se procesaron 100819 licitaciones, en 0:19:42.402495


### Redflag: Todas las ofertas son demasiado baja
All bids lower than estimated overall costs

In [4]:
#Imports necesarios
import pyodbc #odbc para sqlserver
import time #librería necesaria para medir el tiempo de ejecución 
import datetime
import pandas as pd
import numpy as np
from functools import reduce

# Inicio del "cronómetro"
tInicio = time.time()

# Apertura la conexión a SQL SERVER
cnxn = pyodbc.connect('DRIVER={ODBC Driver 17 for SQL Server};SERVER='+server+';DATABASE='+db+';UID='+user+';PWD='+passw)

# Envío de las querys y lectura de los resultados

# Listado de licitaciones
sqlLic = '''select a.rbhCode
from DCCPProcurement.dbo.prcRFBHeader a
LEFT JOIN DCCPProcurement.dbo.prcRFBDate c on a.rbhCode = c.rbdRFBCode
WHERE YEAR(c.rbdOpeningDate) > 2019
AND YEAR(c.rbdOpeningDate) < 2021
AND a.rbhOwnerName != 'Dirección de Compras y Contratación  Pública'
AND rbhEnterprise != 6945
AND a.rbhProcessSubType in (1, 2, 3, 23, 24, 25,  30) 
AND a.rbhDocumentStatus in (8,9,10, 7, 15, 16)
AND a.rbhProcessType = 1
AND a.rbhInformation != 1'''

# Descarga de datos de licitaciones con contador de  las ofertas que son menores que el 10% que el monto disponible 
sqlOfertasBajas = '''SELECT t.rbhCode, SUM(t.cantOfer) as CantidadOfertas,  sum(case when t.porc < 0.2 then 1 else 0 end) as OfertasBajas
FROM 
(
SELECT a.rbhCode ,b.bidOrganization, count(b.bidID) as cantOfer,
case a.rbhEstimatedAmount
WHEN 0 
then sum(c.bitUnitNetPrice * c.bitQuantity) else sum(c.bitUnitNetPrice * c.bitQuantity) / a.rbhEstimatedAmount end as porc
FROM DCCPProcurement.dbo.prcRFBHeader a 
LEFT JOIN DCCPProcurement.dbo.prcBIDQuote b ON a.rbhCode = b.bidRFBCode
LEFT JOIN DCCPProcurement.dbo.prcBIDItem c ON b.bidID = c.bitBID
LEFT JOIN DCCPProcurement.dbo.prcRFBDate d on a.rbhCode = d.rbdRFBCode
WHERE YEAR(d.rbdOpeningDate) > 2019
AND YEAR(d.rbdOpeningDate) < 2021
AND a.rbhOwnerName != 'Dirección de Compras y Contratación  Pública'
AND rbhEnterprise != 6945
AND a.rbhProcessSubType in (1, 2, 3, 23, 24, 25,  30) 
AND a.rbhDocumentStatus in (8,9,10, 7, 15, 16)
AND a.rbhProcessType = 1
and c.bitUnitNetPrice > 1
AND a.rbhCurrency = c.bitCurrency
AND a.rbhInformation != 1
GROUP BY a.rbhCode, a.rbhEstimatedAmount ,b.bidOrganization  
) as t
GROUP BY t.rbhCode'''

licUniverso = pd.read_sql(sqlLic, cnxn)
ofertasBajas = pd.read_sql(sqlOfertasBajas, cnxn)


# Cerramos la conexión
cnxn.close()

# generamos el indicador
ofertasBajas['todasOfertasBajas'] = 0
ofertasBajas.loc[ofertasBajas['OfertasBajas'] == ofertasBajas['CantidadOfertas'], 'todasOfertasBajas'] = 1

#unimos los dataframes
oferBajas = licUniverso.merge(ofertasBajas, how='left')

# Carga de datos en MySQL
from sqlalchemy import create_engine
import pymysql

engine = create_engine('mysql+pymysql://server:server@192.168.2.2:3306/nuevos', echo = False)
oferBajas.to_sql(con=engine, name='todasOfertasBajas', if_exists='replace', index=False)

# Término del "crónometro" y transformaciones a hora, minutos y segundos
tFinal = time.time()
tSegundosGenerico = tFinal - tInicio
tFormateado = str(datetime.timedelta(seconds=tSegundosGenerico))

# Resultados de la primera extracción
print("Terminado, se procesaron "+ str(len(oferBajas)) + " licitaciones, en "+ tFormateado)

Terminado, se procesaron 100819 licitaciones, en 0:01:53.666475


### Redflag: El organismo comprador responde de una manera concisa y oportuna a los reclamos de los proveedores
El tiempo entre el reclamo y su respuesta sobrepasa un umbral razonable

In [5]:
#Imports necesarios
import pyodbc #odbc para sqlserver
import time #librería necesaria para medir el tiempo de ejecución 
import datetime
import pandas as pd
import numpy as np
from functools import reduce

# Inicio del "cronómetro"
tInicio = time.time()

# Apertura la conexión a SQL SERVER
cnxn = pyodbc.connect('DRIVER={ODBC Driver 17 for SQL Server};SERVER='+server+';DATABASE='+db+';UID='+user+';PWD='+passw)

# Envío de las querys y lectura de los resultados

# Listado de licitaciones
sqlLic = '''select a.rbhCode
from DCCPProcurement.dbo.prcRFBHeader a
LEFT JOIN DCCPProcurement.dbo.prcRFBDate c on a.rbhCode = c.rbdRFBCode
WHERE YEAR(c.rbdOpeningDate) > 2019
AND YEAR(c.rbdOpeningDate) < 2021
AND a.rbhOwnerName != 'Dirección de Compras y Contratación  Pública'
AND rbhEnterprise != 6945
AND a.rbhProcessSubType in (1, 2, 3, 23, 24, 25,  30) 
AND a.rbhDocumentStatus in (8,9,10, 7, 15, 16)
AND a.rbhProcessType = 1
AND a.rbhInformation != 1'''

# Descarga de datos de licitaciones con indicador de si se considera plazo largo (14 días)
sqlplRespuesta = '''SELECT a.rbhCode, ((COUNT(DISTINCT (CASE WHEN DATEDIFF(HOUR, b.FechaAsignacionReclamoOOPP, c.FechaEnvio) > 336 THEN 1 ELSE 0 END)))-1) AS plazoRespuestaLargo
FROM DCCPProcurement.dbo.prcRFBHeader a
LEFT JOIN DCCPReclamos.dbo.Reclamo b ON a.rbhExternalCode = b.NumLicOC
LEFT JOIN DCCPReclamos.dbo.GestionInternaOOPP c ON b.idReclamo = c.idReclamo
LEFT JOIN DCCPProcurement.dbo.prcRFBDate d on a.rbhCode = d.rbdRFBCode
WHERE YEAR(d.rbdOpeningDate) > 2019
AND YEAR(d.rbdOpeningDate) < 2021
AND a.rbhOwnerName != 'Dirección de Compras y Contratación  Pública'
AND rbhEnterprise != 6945
AND a.rbhProcessSubType in (1, 2, 3, 23, 24, 25,  30) 
AND a.rbhDocumentStatus in (8,9,10, 7, 15, 16)
AND a.rbhProcessType = 1
AND b.FechaAsignacionReclamoOOPP is not null
AND a.rbhInformation != 1
GROUP BY a.rbhCode'''

licUniverso = pd.read_sql(sqlLic, cnxn)
plRespuesta = pd.read_sql(sqlplRespuesta, cnxn)


# Cerramos la conexión
cnxn.close()

#unimos los dataframes
plalarRespuesta = licUniverso.merge(plRespuesta, how='left')
#plalarRespuesta.loc[plalarRespuesta['plazoRespuestaLargo'].isnull(), 'plazoRespuestaLargo'] = 0
# Carga de datos en MySQL
from sqlalchemy import create_engine
import pymysql

engine = create_engine('mysql+pymysql://server:server@192.168.2.2:3306/nuevos', echo = False)
plalarRespuesta.to_sql(con=engine, name='plazoRespuestaLargo', if_exists='replace', index=False)

# Término del "crónometro" y transformaciones a hora, minutos y segundos
tFinal = time.time()
tSegundosGenerico = tFinal - tInicio
tFormateado = str(datetime.timedelta(seconds=tSegundosGenerico))

# Resultados de la primera extracción
print("Terminado, se procesaron "+ str(len(plalarRespuesta)) + " licitaciones, en "+ tFormateado)

Terminado, se procesaron 100819 licitaciones, en 0:00:16.000892


### Redflag: Inicio cierre preguntas fin de semana
Variable que indica si el inicio o cierre del periodo de realización de preguntas se da un fin de semana.

In [6]:
#Imports necesarios
import pyodbc #odbc para sqlserver
import time #librería necesaria para medir el tiempo de ejecución 
import datetime
import pandas as pd
import numpy as np
from functools import reduce

# Inicio del "cronómetro"
tInicio = time.time()

# Apertura la conexión a SQL SERVER
cnxn = pyodbc.connect('DRIVER={ODBC Driver 17 for SQL Server};SERVER='+server+';DATABASE='+db+';UID='+user+';PWD='+passw)

# Envío de las querys y lectura de los resultados

# Listado de licitaciones
sqlLic = '''select a.rbhCode
from DCCPProcurement.dbo.prcRFBHeader a
LEFT JOIN DCCPProcurement.dbo.prcRFBDate c on a.rbhCode = c.rbdRFBCode
WHERE YEAR(c.rbdOpeningDate) > 2019
AND YEAR(c.rbdOpeningDate) < 2021
AND a.rbhOwnerName != 'Dirección de Compras y Contratación  Pública'
AND rbhEnterprise != 6945
AND a.rbhProcessSubType in (1, 2, 3, 23, 24, 25,  30) 
AND a.rbhDocumentStatus in (8,9,10, 7, 15, 16)
AND a.rbhProcessType = 1
AND a.rbhInformation != 1'''

# Descarga de datos de licitaciones cuya fecha de cierre de preguntas corresponde a un fin de semana o un día feriado
sqlFindeSemana = '''SELECT rbhCode
, rbhID IDLic
, d.rbdOpeningDate FechaLic
, rbhExternalCode CodLic
, b.rbdQuestionClose FechaCierrePreg
, DATENAME(dw,b.rbdQuestionClose) diadelasemana
, (CASE DATENAME(dw,b.rbdQuestionClose) WHEN 'Saturday' THEN 1 WHEN 'Sunday' THEN 1 ELSE 0 END) FinDeSemana
, (CASE WHEN (CONVERT(varchar(2), DAY(b.rbdQuestionClose))+ '-' + CONVERT(varchar(2), MONTH(b.rbdQuestionClose))+ '-' +RIGHT(CONVERT(varchar(4), YEAR(b.rbdQuestionClose)),2)) IN ('1-1-02', '10-4-20','01-05-20', '21-05-20', '29-06-20', '16-07-20', '15-08-20', '18-09-20', '19-09-20', '12-10-20', '31-10-20', '08-12-20')
THEN 1 ELSE 0 END) Feriado
FROM DCCPProcurement.dbo.prcRFBHeader a
LEFT JOIN DCCPProcurement.dbo.prcRFBDate b ON a.rbhCode = b.rbdRFBCode
LEFT JOIN DCCPProcurement.dbo.prcRFBDate d ON a.rbhCode = d.rbdRFBCode
WHERE YEAR(d.rbdOpeningDate) > 2019
AND YEAR(d.rbdOpeningDate) < 2021
AND a.rbhOwnerName != 'Dirección de Compras y Contratación  Pública'
AND rbhEnterprise != 6945
AND a.rbhProcessSubType in (1, 2, 3, 23, 24, 25,  30) 
AND a.rbhDocumentStatus in (8,9,10, 7, 15, 16)
AND a.rbhProcessType = 1
AND a.rbhInformation != 1'''

licUniverso = pd.read_sql(sqlLic, cnxn)
findeSemana = pd.read_sql(sqlFindeSemana, cnxn)


# Cerramos la conexión
cnxn.close()

# unimos los dataframes
cierreFinDe = licUniverso.merge(findeSemana, how='left')

# Aplicamos las condiciones para obtener el indicador
#cierreFinDe.loc[cierreFinDe['FinDeSemana'].isnull(), 'FinDeSemana'] = 0
#cierreFinDe.loc[cierreFinDe['Feriado'].isnull(), 'Feriado'] = 0
cierreFinDe['cierrePreguntasFinde'] = 0
cierreFinDe.loc[cierreFinDe['FinDeSemana'] == 1, 'cierrePreguntasFinde'] = 1
cierreFinDe.loc[cierreFinDe['Feriado'] == 1, 'cierrePreguntasFinde'] = 1

# Eliminamos los campos que no se utilizan
cierreFinDe = cierreFinDe.drop(['IDLic', 'FechaLic', 'CodLic', 'diadelasemana', 'FinDeSemana', 'Feriado'], axis=1)

# Carga de datos en MySQL
from sqlalchemy import create_engine
import pymysql

engine = create_engine('mysql+pymysql://server:server@192.168.2.2:3306/nuevos', echo = False)
cierreFinDe.to_sql(con=engine, name='cierrePreguntasFinde', if_exists='replace', index=False)

# Término del "crónometro" y transformaciones a hora, minutos y segundos
tFinal = time.time()
tSegundosGenerico = tFinal - tInicio
tFormateado = str(datetime.timedelta(seconds=tSegundosGenerico))

# Resultados de la primera extracción
print("Terminado, se procesaron "+ str(len(cierreFinDe)) + " licitaciones, en "+ tFormateado)

Terminado, se procesaron 100819 licitaciones, en 0:00:30.408960


### Redflag: Fuera de plazo mínimo de publicación
La licitación no cumple con un estándar mínimo de días de publicación dado el tipo de licitación.

In [7]:
#Imports necesarios
import pyodbc #odbc para sqlserver
import time #librería necesaria para medir el tiempo de ejecución 
import datetime
import pandas as pd
import numpy as np
from functools import reduce

# Inicio del "cronómetro"
tInicio = time.time()

# Apertura la conexión a SQL SERVER
cnxn = pyodbc.connect('DRIVER={ODBC Driver 17 for SQL Server};SERVER='+server+';DATABASE='+db+';UID='+user+';PWD='+passw)

# Envío de las querys y lectura de los resultados

# Listado de licitaciones
sqlLic = '''select a.rbhCode
from DCCPProcurement.dbo.prcRFBHeader a
LEFT JOIN DCCPProcurement.dbo.prcRFBDate c on a.rbhCode = c.rbdRFBCode
WHERE YEAR(c.rbdOpeningDate) > 2019
AND YEAR(c.rbdOpeningDate) < 2021
AND a.rbhOwnerName != 'Dirección de Compras y Contratación  Pública'
AND rbhEnterprise != 6945
AND a.rbhProcessSubType in (1, 2, 3, 23, 24, 25,  30) 
AND a.rbhDocumentStatus in (8,9,10, 7, 15, 16)
AND a.rbhProcessType = 1
AND a.rbhInformation != 1'''

# Descarga de datos de licitaciones que cumplen con el mínimo de plazo de publicación
sqlPerMinPub = '''SELECT rbhCode, rbhID, b.rbdOpeningDate, rbhProcessSubType, b.rbdTechnicalBidReception,
DATEDIFF(DAY, b.rbdOpeningDate, b.rbdTechnicalBidReception) AS PlazoPublicacion,
(CASE WHEN a.rbhProcessSubType = 1 AND DATEDIFF(DAY, b.rbdOpeningDate, b.rbdTechnicalBidReception) < 5 THEN 1
         WHEN a.rbhProcessSubType = 2 AND DATEDIFF(DAY, b.rbdOpeningDate, b.rbdTechnicalBidReception) < 10 THEN 1
         WHEN a.rbhProcessSubType = 3 AND DATEDIFF(DAY, b.rbdOpeningDate, b.rbdTechnicalBidReception) < 20 THEN 1
         WHEN a.rbhProcessSubType = 24 AND DATEDIFF(DAY, b.rbdOpeningDate, b.rbdTechnicalBidReception) < 20 THEN 1
         WHEN a.rbhProcessSubType = 25 AND DATEDIFF(DAY, b.rbdOpeningDate, b.rbdTechnicalBidReception) < 20 THEN 1 
         WHEN a.rbhProcessSubType = 23 AND DATEDIFF(DAY, b.rbdOpeningDate, b.rbdTechnicalBidReception) < 10 THEN 1
         ELSE 0 END) AS fueraPlazoPublica
FROM DCCPProcurement.dbo.prcRFBHeader a
LEFT JOIN DCCPProcurement.dbo.prcRFBDate b ON a.rbhCode = b.rbdRFBCode
WHERE YEAR(b.rbdOpeningDate) > 2019
AND YEAR(b.rbdOpeningDate) < 2021
AND a.rbhOwnerName != 'Dirección de Compras y Contratación  Pública'
AND rbhEnterprise != 6945
AND a.rbhProcessSubType in (1, 2, 3, 23, 24, 25,  30) 
AND a.rbhDocumentStatus in (8,9,10, 7, 15, 16)
AND a.rbhProcessType = 1
AND a.rbhInformation != 1'''

licUniverso = pd.read_sql(sqlLic, cnxn)
perMinPub = pd.read_sql(sqlPerMinPub, cnxn)


# Cerramos la conexión
cnxn.close()

# unimos los dataframes
perMinPublic = licUniverso.merge(perMinPub, how='left')

# Aplicamos las condiciones para obtener el indicador
#perMinPublic.loc[perMinPublic['fueraPlazoPublica'].isnull(), 'fueraPlazoPublica'] = 0

# Eliminamos los campos que no se utilizan
perMinPublic = perMinPublic.drop(['rbhID', 'rbdOpeningDate', 'rbhProcessSubType', 'rbdTechnicalBidReception'], axis=1)

# Carga de datos en MySQL
from sqlalchemy import create_engine
import pymysql

engine = create_engine('mysql+pymysql://server:server@192.168.2.2:3306/nuevos', echo = False)
perMinPublic.to_sql(con=engine, name='fueraPlazoPublica', if_exists='replace', index=False)

# Término del "crónometro" y transformaciones a hora, minutos y segundos
tFinal = time.time()
tSegundosGenerico = tFinal - tInicio
tFormateado = str(datetime.timedelta(seconds=tSegundosGenerico))

# Resultados de la primera extracción
print("Terminado, se procesaron "+ str(len(perMinPublic)) + " licitaciones, en "+ tFormateado)

Terminado, se procesaron 100819 licitaciones, en 0:00:21.556445


### Redflag: Number of bids
Number of bidders significantly less than average for similar item or procuring entity

In [8]:
#Imports necesarios
import pyodbc #odbc para sqlserver
import time #librería necesaria para medir el tiempo de ejecución 
import datetime
import pandas as pd
import numpy as np
from functools import reduce

# Inicio del "cronómetro"
tInicio = time.time()

# Apertura la conexión a SQL SERVER
cnxn = pyodbc.connect('DRIVER={ODBC Driver 17 for SQL Server};SERVER='+server+';DATABASE='+db+';UID='+user+';PWD='+passw)

# Envío de las querys y lectura de los resultados

# Listado de licitaciones
sqlLic = '''select a.rbhCode
from DCCPProcurement.dbo.prcRFBHeader a
LEFT JOIN DCCPProcurement.dbo.prcRFBDate c on a.rbhCode = c.rbdRFBCode
WHERE YEAR(c.rbdOpeningDate) > 2019
AND YEAR(c.rbdOpeningDate) < 2021
AND a.rbhOwnerName != 'Dirección de Compras y Contratación  Pública'
AND rbhEnterprise != 6945
AND a.rbhProcessSubType in (1, 2, 3, 23, 24, 25,  30) 
AND a.rbhDocumentStatus in (8,9,10, 7, 15, 16)
AND a.rbhProcessType = 1
AND a.rbhInformation != 1'''

# Descarga de datos de promedios de ofertas por institución
sqlPromOfertas = '''SELECT a.rbhOrganization, COUNT(DISTINCT b.bidID)/COUNT(DISTINCT a.rbhCode) as promOfertas
FROM DCCPProcurement.dbo.prcRFBHeader a
LEFT JOIN DCCPProcurement.dbo.prcBIDQuote b ON a.rbhCode = b.bidRFBCode
LEFT JOIN DCCPProcurement.dbo.prcRFBDate d ON a.rbhCode = d.rbdRFBCode
WHERE YEAR(d.rbdOpeningDate) > 2019
AND YEAR(d.rbdOpeningDate) < 2021
AND a.rbhOwnerName != 'Dirección de Compras y Contratación  Pública'
AND rbhEnterprise != 6945
AND a.rbhProcessSubType in (1, 2, 3, 23, 24, 25,  30) 
AND a.rbhDocumentStatus in (8,9,10, 7, 15, 16)
AND a.rbhProcessType = 1
AND a.rbhInformation != 1
GROUP BY a.rbhOrganization'''

# Descarga de datos de cantidad de ofertas por licitación
sqlOferXLic = '''SELECT a.rbhCode, a.rbhOrganization, COUNT(DISTINCT b.bidID) AS BidCount
FROM DCCPProcurement.dbo.prcRFBHeader a
LEFT JOIN DCCPProcurement.dbo.prcBIDQuote b ON a.rbhCode = b.bidRFBCode
LEFT JOIN DCCPProcurement.dbo.prcRFBDate d ON a.rbhCode = d.rbdRFBCode
WHERE YEAR(d.rbdOpeningDate) > 2019
AND YEAR(d.rbdOpeningDate) < 2021
AND a.rbhOwnerName != 'Dirección de Compras y Contratación  Pública'
AND rbhEnterprise != 6945
AND a.rbhProcessSubType in (1, 2, 3, 23, 24, 25,  30) 
AND a.rbhDocumentStatus in (8,9,10, 7, 15, 16)
AND a.rbhProcessType = 1 
AND a.rbhInformation != 1
GROUP BY a.rbhCode, a.rbhOrganization'''

licUniverso = pd.read_sql(sqlLic, cnxn)
promOfertas = pd.read_sql(sqlPromOfertas, cnxn)
oferXLic = pd.read_sql(sqlOferXLic, cnxn)

# Cerramos la conexión
cnxn.close()

# unimos los dataframes
tempPromOfer = licUniverso.merge(oferXLic, how='left')
tempPromOfer = tempPromOfer.merge(promOfertas, how='left')

# Aplicamos las condiciones para obtener el indicador
tempPromOfer['cantidadOfertas'] = 0
tempPromOfer.loc[tempPromOfer['BidCount'] < tempPromOfer['promOfertas'], 'cantidadOfertas'] = 1
tempPromOfer.loc[tempPromOfer['BidCount'] == 0, 'cantidadOfertas'] = np.nan

# Carga de datos en MySQL
from sqlalchemy import create_engine
import pymysql

engine = create_engine('mysql+pymysql://server:server@192.168.2.2:3306/nuevos', echo = False)
tempPromOfer.to_sql(con=engine, name='cantidadOfertas', if_exists='replace', index=False)

# Término del "crónometro" y transformaciones a hora, minutos y segundos
tFinal = time.time()
tSegundosGenerico = tFinal - tInicio
tFormateado = str(datetime.timedelta(seconds=tSegundosGenerico))

# Resultados de la primera extracción
print("Terminado, se procesaron "+ str(len(tempPromOfer)) + " licitaciones, en "+ tFormateado)

Terminado, se procesaron 100819 licitaciones, en 0:00:42.185669


### Redflag: Porcentaje reclamos por irregularidad sin respuesta
Porcentaje de reclamos por presunta irregularidad del proceso que quedan sin respuesta por parte del comprador.

In [9]:
#Imports necesarios
import pyodbc #odbc para sqlserver
import time #librería necesaria para medir el tiempo de ejecución 
import datetime
import pandas as pd
import numpy as np
from functools import reduce

# Inicio del "cronómetro"
tInicio = time.time()

# Apertura la conexión a SQL SERVER
cnxn = pyodbc.connect('DRIVER={ODBC Driver 17 for SQL Server};SERVER='+server+';DATABASE='+db+';UID='+user+';PWD='+passw)

# Envío de las querys y lectura de los resultados

# Listado de licitaciones
sqlLic = '''select a.rbhCode
from DCCPProcurement.dbo.prcRFBHeader a
LEFT JOIN DCCPProcurement.dbo.prcRFBDate c on a.rbhCode = c.rbdRFBCode
WHERE YEAR(c.rbdOpeningDate) > 2019
AND YEAR(c.rbdOpeningDate) < 2021
AND a.rbhOwnerName != 'Dirección de Compras y Contratación  Pública'
AND rbhEnterprise != 6945
AND a.rbhProcessSubType in (1, 2, 3, 23, 24, 25,  30) 
AND a.rbhDocumentStatus in (8,9,10, 7, 15, 16)
AND a.rbhProcessType = 1
AND a.rbhInformation != 1'''

# Descarga de datos de porcentajes de respuesta a los reclamos
sqlPorcRespRecla = '''SELECT a.rbhCode, 
CASE WHEN ISNULL(CONVERT(FLOAT, COUNT(b.RespuestaOOPP))/CONVERT(FLOAT, COUNT(b.idReclamo))*100 , 0) < 90 THEN 1 ELSE 0 END as porcReclamosIregularidad ,
ISNULL(CONVERT(FLOAT, COUNT(b.RespuestaOOPP))/CONVERT(FLOAT, COUNT(b.idReclamo))*100 , 0) as porcreclirreg, COUNT(b.idReclamo) recl, COUNT(b.RespuestaOOPP) resp
FROM DCCPProcurement.dbo.prcRFBHeader a
LEFT JOIN DCCPReclamos.dbo.Reclamo b ON a.rbhExternalCode = b.NumLicOC
LEFT JOIN DCCPProcurement.dbo.prcRFBDate d ON a.rbhCode = d.rbdRFBCode
WHERE YEAR(d.rbdOpeningDate) > 2019
AND YEAR(d.rbdOpeningDate) < 2021
AND b.idMotivoReclamo != 1
AND b.idMotivoReclamo != 18
AND a.rbhOwnerName != 'Dirección de Compras y Contratación  Pública'
AND rbhEnterprise != 6945
AND a.rbhProcessSubType in (1, 2, 3, 23, 24, 25,  30) 
AND a.rbhDocumentStatus in (8,9,10, 7, 15, 16)
AND a.rbhProcessType = 1
AND a.rbhInformation != 1
GROUP BY a.rbhCode, a.rbhExternalCode'''


licUniverso = pd.read_sql(sqlLic, cnxn)
porcRespRecla = pd.read_sql(sqlPorcRespRecla, cnxn)


# Cerramos la conexión
cnxn.close()

# unimos los dataframes

porcRespRec = licUniverso.merge(porcRespRecla, how='left')
porcRespRec['porcreclirreg'] = 100 - porcRespRec['porcreclirreg']

# Aplicamos las condiciones para obtener el indicador
#porcRespRec.loc[porcRespRec['porcReclamosIregularidad'].isnull(), 'porcReclamosIregularidad'] = 0
#porcRespRec['porcreclirreg'] = porcRespRec['porcreclirreg'].fillna(0)

# Carga de datos en MySQL
from sqlalchemy import create_engine
import pymysql

engine = create_engine('mysql+pymysql://server:server@192.168.2.2:3306/nuevos', echo = False)
porcRespRec.to_sql(con=engine, name='porcReclamosIregularidad', if_exists='replace', index=False)

# Término del "crónometro" y transformaciones a hora, minutos y segundos
tFinal = time.time()
tSegundosGenerico = tFinal - tInicio
tFormateado = str(datetime.timedelta(seconds=tSegundosGenerico))

# Resultados de la primera extracción
print("Terminado, se procesaron "+ str(len(porcRespRec)) + " licitaciones, en "+ tFormateado)

Terminado, se procesaron 100819 licitaciones, en 0:00:21.048253


### Redflag: Ratio días de publicación preguntas
Ratio que representa la relación entre la cantidad de días para la realización de preguntas, respecto al total de días de publicación de la licitación.

In [10]:
#Imports necesarios
import pyodbc #odbc para sqlserver
import time #librería necesaria para medir el tiempo de ejecución 
import datetime
import pandas as pd
import numpy as np
from functools import reduce

# Inicio del "cronómetro"
tInicio = time.time()

# Apertura la conexión a SQL SERVER
cnxn = pyodbc.connect('DRIVER={ODBC Driver 17 for SQL Server};SERVER='+server+';DATABASE='+db+';UID='+user+';PWD='+passw)

# Envío de las querys y lectura de los resultados

# Listado de licitaciones
sqlLic = '''select a.rbhCode
from DCCPProcurement.dbo.prcRFBHeader a
LEFT JOIN DCCPProcurement.dbo.prcRFBDate c on a.rbhCode = c.rbdRFBCode
WHERE YEAR(c.rbdOpeningDate) > 2019
AND YEAR(c.rbdOpeningDate) < 2021
AND a.rbhOwnerName != 'Dirección de Compras y Contratación  Pública'
AND rbhEnterprise != 6945
AND a.rbhProcessSubType in (1, 2, 3, 23, 24, 25,  30) 
AND a.rbhDocumentStatus in (8,9,10, 7, 15, 16)
AND a.rbhProcessType = 1
AND a.rbhInformation != 1'''

# Descarga de datos de porcentajes de dias para preguntas versus el total publicado
sqlPorcPlazoRespuesta = '''SELECT rbhCode, 
(Convert(Float,((DATEDIFF(day, b.rbdQuestionOpening, b.rbdQuestionClose)))))/nullif((CONVERT(FLOAT,((DATEDIFF(day, b.rbdOpeningDate, b.rbdTechnicalBidReception))))),0) as porc,
case WHEN (Convert(Float,((DATEDIFF(day, b.rbdQuestionOpening, b.rbdQuestionClose)))))/nullif((CONVERT(FLOAT,((DATEDIFF(day, b.rbdOpeningDate, b.rbdTechnicalBidReception))))),0) < 0.3 then 1 else 0 end as ratioDiasPreguntas
FROM DCCPProcurement.dbo.prcRFBHeader a
LEFT JOIN DCCPProcurement.dbo.prcRFBDate b ON a.rbhCode = b.rbdRFBCode
WHERE YEAR(b.rbdOpeningDate) > 2019
AND YEAR(b.rbdOpeningDate) < 2021
AND a.rbhOwnerName != 'Dirección de Compras y Contratación  Pública'
AND rbhEnterprise != 6945
AND a.rbhProcessSubType in (1, 2, 3, 23, 24, 25,  30) 
AND a.rbhDocumentStatus in (8,9,10, 7, 15, 16)
AND a.rbhProcessType = 1 
AND a.rbhInformation != 1'''


licUniverso = pd.read_sql(sqlLic, cnxn)
porcPlazoRespuesta = pd.read_sql(sqlPorcPlazoRespuesta, cnxn)


# Cerramos la conexión
cnxn.close()

# unimos los dataframes
porcPlaResp = licUniverso.merge(porcPlazoRespuesta, how='left')

# Aplicamos las condiciones para obtener el indicador
#porcPlaResp.loc[porcPlaResp['ratioDiasPreguntas'].isnull(), 'ratioDiasPreguntas'] = 0

# Carga de datos en MySQL
from sqlalchemy import create_engine
import pymysql

engine = create_engine('mysql+pymysql://server:server@192.168.2.2:3306/nuevos', echo = False)
porcPlaResp.to_sql(con=engine, name='ratioDiasPreguntas', if_exists='replace', index=False)

# Término del "crónometro" y transformaciones a hora, minutos y segundos
tFinal = time.time()
tSegundosGenerico = tFinal - tInicio
tFormateado = str(datetime.timedelta(seconds=tSegundosGenerico))

# Resultados de la primera extracción
print("Terminado, se procesaron "+ str(len(porcPlaResp)) + " licitaciones, en "+ tFormateado)

Terminado, se procesaron 100819 licitaciones, en 0:00:19.251693


### Redflag: Ratio reclamos irregularidad de ofertas
Ratio que representa la relación entre los reclamos ingresados por presunta irregularidad respecto al total de ofertas recepcionadas.

In [11]:
#Imports necesarios
import pyodbc #odbc para sqlserver
import time #librería necesaria para medir el tiempo de ejecución 
import datetime
import pandas as pd
import numpy as np
from functools import reduce

# Inicio del "cronómetro"
tInicio = time.time()

# Apertura la conexión a SQL SERVER
cnxn = pyodbc.connect('DRIVER={ODBC Driver 17 for SQL Server};SERVER='+server+';DATABASE='+db+';UID='+user+';PWD='+passw)

# Envío de las querys y lectura de los resultados

# Listado de licitaciones
sqlLic = '''select a.rbhCode
from DCCPProcurement.dbo.prcRFBHeader a
LEFT JOIN DCCPProcurement.dbo.prcRFBDate c on a.rbhCode = c.rbdRFBCode
WHERE YEAR(c.rbdOpeningDate) > 2019
AND YEAR(c.rbdOpeningDate) < 2021
AND a.rbhOwnerName != 'Dirección de Compras y Contratación  Pública'
AND rbhEnterprise != 6945
AND a.rbhProcessSubType in (1, 2, 3, 23, 24, 25,  30) 
AND a.rbhDocumentStatus in (8,9,10, 7, 15, 16)
AND a.rbhProcessType = 1
AND a.rbhInformation != 1'''

# Descarga de datos de cantidad de ofertas por licitación 
sqlQOfertas = '''SELECT a.rbhCode, (CONVERT(FLOAT,(COUNT(b.bidID)))) AS 'TotalOfertas'
FROM DCCPProcurement.dbo.prcRFBHeader a
LEFT JOIN DCCPProcurement.dbo.prcBIDQuote b ON a.rbhCode = b.bidRFBCode
LEFT JOIN DCCPReclamos.dbo.Reclamo c ON a.rbhExternalCode = c.numLicOC
LEFT JOIN DCCPProcurement.dbo.prcRFBDate d ON a.rbhCode = d.rbdRFBCode
WHERE YEAR(d.rbdOpeningDate) > 2019
AND YEAR(d.rbdOpeningDate) < 2021
AND a.rbhOwnerName != 'Dirección de Compras y Contratación  Pública'
AND rbhEnterprise != 6945
AND a.rbhProcessSubType in (1, 2, 3, 23, 24, 25,  30) 
AND a.rbhDocumentStatus in (8,9,10, 7, 15, 16)
AND a.rbhProcessType = 1 
AND a.rbhInformation != 1
GROUP BY a.rbhcode'''

# Descarga de datos de cantidad de reclamos por irregularidad
sqlQReclamos = '''SELECT a.rbhCode, (CONVERT(FLOAT,(COUNT(DISTINCT c.idReclamo)))) AS 'ReclamosIrregularidad'
FROM DCCPProcurement.dbo.prcRFBHeader a
LEFT JOIN DCCPProcurement.dbo.prcBIDQuote b ON a.rbhCode = b.bidRFBCode
LEFT JOIN DCCPReclamos.dbo.Reclamo c ON a.rbhExternalCode = c.numLicOC 
LEFT JOIN DCCPProcurement.dbo.prcRFBDate d ON a.rbhCode = d.rbdRFBCode
WHERE YEAR(d.rbdOpeningDate) > 2019
AND YEAR(d.rbdOpeningDate) < 2021
AND a.rbhOwnerName != 'Dirección de Compras y Contratación  Pública'
AND rbhEnterprise != 6945
AND a.rbhProcessSubType in (1, 2, 3, 23, 24, 25,  30) 
AND a.rbhDocumentStatus in (8,9,10, 7, 15, 16)
AND c.idMotivoReclamo != 1
AND c.idMotivoReclamo != 18
AND a.rbhProcessType = 1
AND a.rbhInformation != 1
GROUP BY a.rbhcode'''

licUniverso = pd.read_sql(sqlLic, cnxn)
QOfertas = pd.read_sql(sqlQOfertas, cnxn)
QReclamos = pd.read_sql(sqlQReclamos, cnxn)


# Cerramos la conexión
cnxn.close()

# unimos los dataframes que tienen los datos del indicador
tempRatRecl = QOfertas.merge(QReclamos, how='left')
tempRatRecl2 = licUniverso.merge(tempRatRecl, how='left')

# Reemplazamos los valores nulos por ceros
#tempRatRecl2.loc[tempRatRecl2['ReclamosIrregularidad'].isnull(), 'ReclamosIrregularidad'] = 0
tempRatRecl2.loc[tempRatRecl2['TotalOfertas']== 0, 'TotalOfertas'] = 1

# Calculamos el indicador
tempRatRecl2['ratiovalorreclirreg'] = tempRatRecl2['ReclamosIrregularidad']/tempRatRecl2['TotalOfertas']
tempRatRecl2['ratioReclamosIrregularidad'] = tempRatRecl2['ReclamosIrregularidad']/tempRatRecl2['TotalOfertas']
tempRatRecl2.loc[tempRatRecl2['ratioReclamosIrregularidad'] < 0.1, 'ratioReclamosIrregularidad'] = 0
tempRatRecl2.loc[tempRatRecl2['ratioReclamosIrregularidad'] >= 0.1, 'ratioReclamosIrregularidad'] = 1


# Eliminamos los campos que no se utilizan
ratRecl = tempRatRecl2.drop(['TotalOfertas', 'ReclamosIrregularidad'], axis=1)

# Carga de datos en MySQL
from sqlalchemy import create_engine
import pymysql

engine = create_engine('mysql+pymysql://server:server@192.168.2.2:3306/nuevos', echo = False)
ratRecl.to_sql(con=engine, name='ratioReclamosIrregularidad', if_exists='replace', index=False)

# Término del "crónometro" y transformaciones a hora, minutos y segundos
tFinal = time.time()
tSegundosGenerico = tFinal - tInicio
tFormateado = str(datetime.timedelta(seconds=tSegundosGenerico))

# Resultados de la primera extracción
print("Terminado, se procesaron "+ str(len(ratRecl)) + " licitaciones, en "+ tFormateado)

Terminado, se procesaron 100819 licitaciones, en 0:00:38.537714


### Redflag: Ratio reclamos pago ofertas
Ratio que representa la relación entre los reclamos ingresados por problemas de pago, respecto al total de ofertas recepcionadas.

In [12]:
#Imports necesarios
import pyodbc #odbc para sqlserver
import time #librería necesaria para medir el tiempo de ejecución 
import datetime
import pandas as pd
import numpy as np
from functools import reduce

# Inicio del "cronómetro"
tInicio = time.time()

# Apertura la conexión a SQL SERVER
cnxn = pyodbc.connect('DRIVER={ODBC Driver 17 for SQL Server};SERVER='+server+';DATABASE='+db+';UID='+user+';PWD='+passw)

# Envío de las querys y lectura de los resultados

# Listado de licitaciones
sqlLic = '''select a.rbhCode
from DCCPProcurement.dbo.prcRFBHeader a
LEFT JOIN DCCPProcurement.dbo.prcRFBDate c on a.rbhCode = c.rbdRFBCode
WHERE YEAR(c.rbdOpeningDate) > 2019
AND YEAR(c.rbdOpeningDate) < 2021
AND a.rbhOwnerName != 'Dirección de Compras y Contratación  Pública'
AND rbhEnterprise != 6945
AND a.rbhProcessSubType in (1, 2, 3, 23, 24, 25,  30) 
AND a.rbhDocumentStatus in (8,9,10, 7, 15, 16)
AND a.rbhProcessType = 1
AND a.rbhInformation != 1'''

# Descarga de datos de cantidad de ofertas por licitación 
sqlQOfertas = '''SELECT a.rbhCode, (CONVERT(FLOAT,(COUNT(b.bidID)))) AS 'TotalOfertas'
FROM DCCPProcurement.dbo.prcRFBHeader a
LEFT JOIN DCCPProcurement.dbo.prcBIDQuote b ON a.rbhCode = b.bidRFBCode
LEFT JOIN DCCPReclamos.dbo.Reclamo c ON a.rbhExternalCode = c.numLicOC
LEFT JOIN DCCPProcurement.dbo.prcRFBDate d ON a.rbhCode = d.rbdRFBCode
WHERE YEAR(d.rbdOpeningDate) > 2019
AND YEAR(d.rbdOpeningDate) < 2021
AND a.rbhOwnerName != 'Dirección de Compras y Contratación  Pública'
AND rbhEnterprise != 6945
AND a.rbhProcessSubType in (1, 2, 3, 23, 24, 25,  30) 
AND a.rbhDocumentStatus in (8,9,10, 7, 15, 16)
AND a.rbhProcessType = 1
AND a.rbhInformation != 1
GROUP BY a.rbhcode'''

# Descarga de datos de cantidad de reclamos por pagos
sqlQReclamos = '''SELECT a.rbhCode, (CONVERT(FLOAT,(COUNT(DISTINCT c.idReclamo)))) AS 'ReclamosPago'
FROM DCCPProcurement.dbo.prcRFBHeader a
LEFT JOIN DCCPProcurement.dbo.prcBIDQuote b ON a.rbhCode = b.bidRFBCode
LEFT JOIN DCCPReclamos.dbo.Reclamo c ON a.rbhExternalCode = c.numLicOC 
LEFT JOIN DCCPProcurement.dbo.prcRFBDate d ON a.rbhCode = d.rbdRFBCode
WHERE YEAR(d.rbdOpeningDate) > 2019
AND YEAR(d.rbdOpeningDate) < 2021
AND a.rbhOwnerName != 'Dirección de Compras y Contratación  Pública'
AND rbhEnterprise != 6945
AND a.rbhProcessSubType in (1, 2, 3, 23, 24, 25,  30) 
AND a.rbhDocumentStatus in (8,9,10, 7, 15, 16)
AND (c.idMotivoReclamo = 1 or c.idMotivoReclamo = 18)
AND a.rbhProcessType = 1
AND a.rbhInformation != 1
GROUP BY a.rbhcode'''

licUniverso = pd.read_sql(sqlLic, cnxn)
QOfertas = pd.read_sql(sqlQOfertas, cnxn)
QReclamos = pd.read_sql(sqlQReclamos, cnxn)


# Cerramos la conexión
cnxn.close()

# unimos los dataframes que tienen los datos del indicador
tempRatRecl = QOfertas.merge(QReclamos, how='left')
tempRatRecl2 = licUniverso.merge(tempRatRecl, how='left')

# Reemplazamos los valores nulos por ceros
#tempRatRecl2.loc[tempRatRecl2['ReclamosPago'].isnull(), 'ReclamosPago'] = 0
tempRatRecl2.loc[tempRatRecl2['TotalOfertas']== 0, 'TotalOfertas'] = 1

# Calculamos el indicador
tempRatRecl2['ratioreclpagvalor'] = tempRatRecl2['ReclamosPago']/tempRatRecl2['TotalOfertas']
tempRatRecl2['ratioReclamosPago'] = tempRatRecl2['ReclamosPago']/tempRatRecl2['TotalOfertas']
tempRatRecl2.loc[tempRatRecl2['ratioReclamosPago'] < 0.05, 'ratioReclamosPago'] = 0
tempRatRecl2.loc[tempRatRecl2['ratioReclamosPago'] >= 0.05, 'ratioReclamosPago'] = 1

# Eliminamos los campos que no se utilizan
ratRecl = tempRatRecl2.drop(['TotalOfertas', 'ReclamosPago'], axis=1)

# Carga de datos en MySQL
from sqlalchemy import create_engine
import pymysql

engine = create_engine('mysql+pymysql://server:server@192.168.2.2:3306/nuevos', echo = False)
ratRecl.to_sql(con=engine, name='ratioReclamosPago', if_exists='replace', index=False)

# Término del "crónometro" y transformaciones a hora, minutos y segundos
tFinal = time.time()
tSegundosGenerico = tFinal - tInicio
tFormateado = str(datetime.timedelta(seconds=tSegundosGenerico))

# Resultados de la primera extracción
print("Terminado, se procesaron "+ str(len(ratRecl)) + " licitaciones, en "+ tFormateado)

Terminado, se procesaron 100819 licitaciones, en 0:00:37.786031


### Redflag: Single bid received
Tender featured a single bidder only

In [13]:
import pyodbc #odbc para sqlserver
import time #librería necesaria para medir el tiempo de ejecución 
import datetime
import pandas as pd
import numpy as np
from functools import reduce

# Inicio del "cronómetro"
tInicio = time.time()

# Apertura la conexión a SQL SERVER
cnxn = pyodbc.connect('DRIVER={ODBC Driver 17 for SQL Server};SERVER='+server+';DATABASE='+db+';UID='+user+';PWD='+passw)

# Envío de las querys y lectura de los resultados

# Listado de licitaciones
sqlLic = '''select a.rbhCode
from DCCPProcurement.dbo.prcRFBHeader a
LEFT JOIN DCCPProcurement.dbo.prcRFBDate c on a.rbhCode = c.rbdRFBCode
WHERE YEAR(c.rbdOpeningDate) > 2019
AND YEAR(c.rbdOpeningDate) < 2021
AND a.rbhOwnerName != 'Dirección de Compras y Contratación  Pública'
AND rbhEnterprise != 6945
AND a.rbhProcessSubType in (1, 2, 3, 23, 24, 25,  30) 
AND a.rbhDocumentStatus in (8,9,10, 7, 15, 16)
AND a.rbhProcessType = 1
AND a.rbhInformation != 1'''

# Descarga de datos de cantidad de ofertas por licitación 
sqlQOfertas = '''SELECT a.rbhCode, (CONVERT(FLOAT,(COUNT(b.bidID)))) AS 'TotalOfertas'
FROM DCCPProcurement.dbo.prcRFBHeader a
LEFT JOIN DCCPProcurement.dbo.prcBIDQuote b ON a.rbhCode = b.bidRFBCode
LEFT JOIN DCCPProcurement.dbo.prcRFBDate d ON a.rbhCode = d.rbdRFBCode
WHERE YEAR(d.rbdOpeningDate) > 2019
AND YEAR(d.rbdOpeningDate) < 2021
AND a.rbhOwnerName != 'Dirección de Compras y Contratación  Pública'
AND rbhEnterprise != 6945
AND a.rbhProcessSubType in (1, 2, 3, 23, 24, 25,  30) 
AND a.rbhDocumentStatus in (8,9,10, 7, 15, 16)
AND a.rbhProcessType = 1
AND a.rbhInformation != 1
AND b.bidDocumentStatus NOT IN (2, 6) --Excluye ofertas Guardadas y Temporales
GROUP BY a.rbhcode'''

licUniverso = pd.read_sql(sqlLic, cnxn)
QOfertas = pd.read_sql(sqlQOfertas, cnxn)


# Cerramos la conexión
cnxn.close()

# unimos los dataframes que tienen los datos del indicador
tempQOfertas = licUniverso.merge(QOfertas, how='left')

# Reemplazamos los valores nulos por ceros
tempQOfertas['oferenteUnico'] = 0
tempQOfertas.loc[tempQOfertas['TotalOfertas'] == 1, 'oferenteUnico'] = 1
tempQOfertas.loc[tempQOfertas['TotalOfertas'] == 0, 'oferenteUnico'] = np.nan

# Eliminamos los campos que no se utilizan
QOfertas = tempQOfertas.drop(['TotalOfertas'], axis=1)

# Carga de datos en MySQL
from sqlalchemy import create_engine
import pymysql

engine = create_engine('mysql+pymysql://server:server@192.168.2.2:3306/nuevos', echo = False)
QOfertas.to_sql(con=engine, name='oferenteUnico', if_exists='replace', index=False)

# Término del "crónometro" y transformaciones a hora, minutos y segundos
tFinal = time.time()
tSegundosGenerico = tFinal - tInicio
tFormateado = str(datetime.timedelta(seconds=tSegundosGenerico))

# Resultados de la primera extracción
print("Terminado, se procesaron "+ str(len(QOfertas)) + " licitaciones, en "+ tFormateado)

Terminado, se procesaron 100819 licitaciones, en 0:00:26.515059
