# Pipeline de generación de clusters usando redflags de Compras
El presente notebook permite descargar datos desde la base de datos de Aquiles, y posteriormente cargados en MySQL desde donde se obtienen los clusters y con los cuales se generarán las predicciones

## ETAPA: Licitación

### Redflag: Bids after the deadline accepted
Bids submitted after the admission deadline still accepted

In [2]:
#Imports necesarios
import pyodbc #odbc para sqlserver
import time #librería necesaria para medir el tiempo de ejecución 
import datetime
import pandas as pd
import numpy as np
from functools import reduce

# Inicio del "cronómetro"
tInicio = time.time()

# Apertura la conexión a SQL SERVER
cnxn = pyodbc.connect('DRIVER={ODBC Driver 17 for SQL Server};SERVER=10.34.71.145;DATABASE=DCCPProcurement;UID=JoseMora;PWD=Chilecompra2018')

# Envío de las querys y lectura de los resultados

# Listado de licitaciones
sqlLic = '''select a.rbhCode
from DCCPProcurement.dbo.prcRFBHeader a
LEFT JOIN DCCPProcurement.dbo.prcRFBDate c on a.rbhCode = c.rbdRFBCode
WHERE YEAR(c.rbdOpeningDate) > 2013
and YEAR(c.rbdOpeningDate) < 2020
AND a.rbhOwnerName != 'Dirección de Compras y Contratación  Pública' 
AND a.rbhProcessSubType in (1, 2, 3, 23, 24, 25,  30) 
AND a.rbhDocumentStatus in (8,9,10, 7, 15, 16)
AND a.rbhProcessType = 1'''

# Descarga de datos de licitaciones con indicador de si las fechas son incumplidas
sqlFechasInc = '''SELECT a.rbhCode, SUM(case when c.rbdTechnicalBidReception < b.bidTechnicalIssueDate then 1 else 0 end) as flag
FROM DCCPProcurement.dbo.prcRFBHeader a
LEFT JOIN DCCPProcurement.dbo.prcBIDQuote b ON a.rbhCode = b.bidRFBCode
LEFT JOIN DCCPProcurement.dbo.prcRFBDate c on a.rbhCode = c.rbdRFBCode
WHERE YEAR(c.rbdOpeningDate) > 2013
and YEAR(c.rbdOpeningDate) < 2020
AND a.rbhOwnerName != 'Dirección de Compras y Contratación  Pública' 
AND a.rbhProcessSubType in (1, 2, 3, 23, 24, 25,  30) 
AND a.rbhDocumentStatus in (8,9,10, 7, 15, 16)
AND a.rbhProcessType = 1
GROUP by a.rbhCode'''

licUniverso = pd.read_sql(sqlLic, cnxn)
fechasInc = pd.read_sql(sqlFechasInc, cnxn)


# Cerramos la conexión
cnxn.close()

# generamos el indicador
fechasInc['indFechaInc'] = 0
fechasInc.loc[fechasInc['flag'] > 0, 'indFechaInc'] = 1

# botamos las columnas innecesarias
fechasInc = fechasInc.drop(['flag'], axis=1)

#unimos los dataframes
fechIncumplidas = licUniverso.merge(fechasInc, how='left')

# Carga de datos en MySQL
from sqlalchemy import create_engine
import pymysql

engine = create_engine('mysql+pymysql://server:server@192.168.2.2:3306/redflags', echo = False)
fechIncumplidas.to_sql(con=engine, name='fechasIncumplidas', if_exists='replace', index=False)

# Término del "crónometro" y transformaciones a hora, minutos y segundos
tFinal = time.time()
tSegundosGenerico = tFinal - tInicio
tFormateado = str(datetime.timedelta(seconds=tSegundosGenerico))

# Resultados de la primera extracción
print("Terminado, se procesaron "+ str(len(fechIncumplidas)) + " licitaciones, en "+ tFormateado)


Terminado, se procesaron 1163108 licitaciones, en 0:01:05.203011


### Redflag: Todas las ofertas son demasiado altas
All bids higher than estimated overall costs

In [4]:
#Imports necesarios
import pyodbc #odbc para sqlserver
import time #librería necesaria para medir el tiempo de ejecución 
import datetime
import pandas as pd
import numpy as np
from functools import reduce

# Inicio del "cronómetro"
tInicio = time.time()

# Apertura la conexión a SQL SERVER
cnxn = pyodbc.connect('DRIVER={ODBC Driver 17 for SQL Server};SERVER=10.34.71.145;DATABASE=DCCPProcurement;UID=JoseMora;PWD=Chilecompra2018')

# Envío de las querys y lectura de los resultados

# Listado de licitaciones
sqlLic = '''select a.rbhCode
from DCCPProcurement.dbo.prcRFBHeader a
LEFT JOIN DCCPProcurement.dbo.prcRFBDate c on a.rbhCode = c.rbdRFBCode
WHERE YEAR(c.rbdOpeningDate) > 2013
and YEAR(c.rbdOpeningDate) < 2020
AND a.rbhOwnerName != 'Dirección de Compras y Contratación  Pública' 
AND a.rbhProcessSubType in (1, 2, 3, 23, 24, 25,  30) 
AND a.rbhDocumentStatus in (8,9,10, 7, 15, 16)
AND a.rbhProcessType = 1'''

# Descarga de datos de licitaciones con contador de  las ofertas que son más altas que el monto disponible 
sqlOfertasAltas = '''SELECT a.rbhCode, COUNT(b.bidID) AS BidCount, SUM(CASE WHEN c.bitUnitNetPrice * c.bitQuantity > a.rbhEstimatedAmount THEN 1 ELSE 0 END) AS HighBidCount
FROM DCCPProcurement.dbo.prcRFBHeader a 
LEFT JOIN DCCPProcurement.dbo.prcBIDQuote b ON a.rbhCode = b.bidRFBCode
LEFT JOIN DCCPProcurement.dbo.prcBIDItem c ON b.bidID = c.bitBID
LEFT JOIN DCCPProcurement.dbo.prcRFBDate d on a.rbhCode = d.rbdRFBCode
WHERE YEAR(d.rbdOpeningDate) > 2013
and YEAR(d.rbdOpeningDate) < 2020
AND a.rbhOwnerName != 'Dirección de Compras y Contratación  Pública' 
AND a.rbhProcessSubType in (1, 2, 3, 23, 24, 25,  30) 
AND a.rbhDocumentStatus in (8,9,10, 7, 15, 16)
AND a.rbhProcessType = 1
AND a.rbhCurrency = c.bitCurrency
GROUP BY a.rbhCode'''

licUniverso = pd.read_sql(sqlLic, cnxn)
ofertasAltas = pd.read_sql(sqlOfertasAltas, cnxn)


# Cerramos la conexión
cnxn.close()

# generamos el indicador
ofertasAltas['indOfertasAltas'] = 0
ofertasAltas.loc[ofertasAltas['HighBidCount'] == ofertasAltas['BidCount'], 'indOfertasAltas'] = 1

# botamos las columnas innecesarias
ofertasAltas = ofertasAltas.drop(['BidCount', 'HighBidCount'], axis=1)

#unimos los dataframes
oferAltas = licUniverso.merge(ofertasAltas, how='left')

# Carga de datos en MySQL
from sqlalchemy import create_engine
import pymysql

engine = create_engine('mysql+pymysql://server:server@192.168.2.2:3306/redflags', echo = False)
oferAltas.to_sql(con=engine, name='ofertasAltas', if_exists='replace', index=False)

# Término del "crónometro" y transformaciones a hora, minutos y segundos
tFinal = time.time()
tSegundosGenerico = tFinal - tInicio
tFormateado = str(datetime.timedelta(seconds=tSegundosGenerico))

# Resultados de la primera extracción
print("Terminado, se procesaron "+ str(len(oferAltas)) + " licitaciones, en "+ tFormateado)


Terminado, se procesaron 1163108 licitaciones, en 0:01:33.269694


### Redflag: Todas las ofertas son demasiado baja
All bids lower than estimated overall costs

In [5]:
#Imports necesarios
import pyodbc #odbc para sqlserver
import time #librería necesaria para medir el tiempo de ejecución 
import datetime
import pandas as pd
import numpy as np
from functools import reduce

# Inicio del "cronómetro"
tInicio = time.time()

# Apertura la conexión a SQL SERVER
cnxn = pyodbc.connect('DRIVER={ODBC Driver 17 for SQL Server};SERVER=10.34.71.145;DATABASE=DCCPProcurement;UID=JoseMora;PWD=Chilecompra2018')

# Envío de las querys y lectura de los resultados

# Listado de licitaciones
sqlLic = '''select a.rbhCode
from DCCPProcurement.dbo.prcRFBHeader a
LEFT JOIN DCCPProcurement.dbo.prcRFBDate c on a.rbhCode = c.rbdRFBCode
WHERE YEAR(c.rbdOpeningDate) > 2013
and YEAR(c.rbdOpeningDate) < 2020
AND a.rbhOwnerName != 'Dirección de Compras y Contratación  Pública' 
AND a.rbhProcessSubType in (1, 2, 3, 23, 24, 25,  30) 
AND a.rbhDocumentStatus in (8,9,10, 7, 15, 16)
AND a.rbhProcessType = 1'''

# Descarga de datos de licitaciones con contador de  las ofertas que son menores que el 10% que el monto disponible 
sqlOfertasBajas = '''SELECT a.rbhCode, COUNT(b.bidID) AS BidCount, SUM(CASE WHEN c.bitUnitNetPrice * c.bitQuantity < a.rbhEstimatedAmount * 0.1 THEN 1 ELSE 0 END) AS LowBidCount
FROM DCCPProcurement.dbo.prcRFBHeader a 
LEFT JOIN DCCPProcurement.dbo.prcBIDQuote b ON a.rbhCode = b.bidRFBCode
LEFT JOIN DCCPProcurement.dbo.prcBIDItem c ON b.bidID = c.bitBID
LEFT JOIN DCCPProcurement.dbo.prcRFBDate d on a.rbhCode = d.rbdRFBCode
WHERE YEAR(d.rbdOpeningDate) > 2013
and YEAR(d.rbdOpeningDate) < 2020
AND a.rbhOwnerName != 'Dirección de Compras y Contratación  Pública' 
AND a.rbhProcessSubType in (1, 2, 3, 23, 24, 25,  30) 
AND a.rbhDocumentStatus in (8,9,10, 7, 15, 16)
AND a.rbhProcessType = 1
and c.bitUnitNetPrice > 1
AND a.rbhCurrency = c.bitCurrency
GROUP BY a.rbhCode'''

licUniverso = pd.read_sql(sqlLic, cnxn)
ofertasBajas = pd.read_sql(sqlOfertasBajas, cnxn)


# Cerramos la conexión
cnxn.close()

# generamos el indicador
ofertasBajas['indOfertasBajas'] = 0
ofertasBajas.loc[ofertasBajas['LowBidCount'] == ofertasBajas['BidCount'], 'indOfertasBajas'] = 1

# botamos las columnas innecesarias
ofertasBajas = ofertasBajas.drop(['BidCount', 'LowBidCount'], axis=1)

#unimos los dataframes
oferBajas = licUniverso.merge(ofertasBajas, how='left')

# Carga de datos en MySQL
from sqlalchemy import create_engine
import pymysql

engine = create_engine('mysql+pymysql://server:server@192.168.2.2:3306/redflags', echo = False)
oferBajas.to_sql(con=engine, name='ofertasBajas', if_exists='replace', index=False)

# Término del "crónometro" y transformaciones a hora, minutos y segundos
tFinal = time.time()
tSegundosGenerico = tFinal - tInicio
tFormateado = str(datetime.timedelta(seconds=tSegundosGenerico))

# Resultados de la primera extracción
print("Terminado, se procesaron "+ str(len(oferBajas)) + " licitaciones, en "+ tFormateado)


Terminado, se procesaron 1163108 licitaciones, en 0:03:04.099268


### Redflag: El organismo comprador responde de una manera concisa y oportuna a los reclamos de los proveedores
El tiempo entre el reclamo y su respuesta sobrepasa un umbral razonable

In [6]:
#Imports necesarios
import pyodbc #odbc para sqlserver
import time #librería necesaria para medir el tiempo de ejecución 
import datetime
import pandas as pd
import numpy as np
from functools import reduce

# Inicio del "cronómetro"
tInicio = time.time()

# Apertura la conexión a SQL SERVER
cnxn = pyodbc.connect('DRIVER={ODBC Driver 17 for SQL Server};SERVER=10.34.71.145;DATABASE=DCCPProcurement;UID=JoseMora;PWD=Chilecompra2018')

# Envío de las querys y lectura de los resultados

# Listado de licitaciones
sqlLic = '''select a.rbhCode
from DCCPProcurement.dbo.prcRFBHeader a
LEFT JOIN DCCPProcurement.dbo.prcRFBDate c on a.rbhCode = c.rbdRFBCode
WHERE YEAR(c.rbdOpeningDate) > 2013
and YEAR(c.rbdOpeningDate) < 2020
AND a.rbhOwnerName != 'Dirección de Compras y Contratación  Pública' 
AND a.rbhProcessSubType in (1, 2, 3, 23, 24, 25,  30) 
AND a.rbhDocumentStatus in (8,9,10, 7, 15, 16)
AND a.rbhProcessType = 1'''

# Descarga de datos de licitaciones con contador de  las ofertas que son menores que el 10% que el monto disponible 
sqlplRespuesta = '''SELECT a.rbhCode, ((COUNT(DISTINCT (CASE WHEN DATEDIFF(HOUR, b.FechaAsignacionReclamoOOPP, c.FechaEnvio) > 336 THEN 1 ELSE 0 END)))-1) AS PlazoLargoRespuesta
FROM DCCPProcurement.dbo.prcRFBHeader a
LEFT JOIN DCCPReclamos.dbo.Reclamo b ON a.rbhExternalCode = b.NumLicOC
LEFT JOIN DCCPReclamos.dbo.GestionInternaOOPP c ON b.idReclamo = c.idReclamo
LEFT JOIN DCCPProcurement.dbo.prcRFBDate d on a.rbhCode = d.rbdRFBCode
WHERE YEAR(d.rbdOpeningDate) > 2013
and YEAR(d.rbdOpeningDate) < 2020
AND a.rbhOwnerName != 'Dirección de Compras y Contratación  Pública' 
AND a.rbhProcessSubType in (1, 2, 3, 23, 24, 25,  30) 
AND a.rbhDocumentStatus in (8,9,10, 7, 15, 16)
AND a.rbhProcessType = 1
AND b.FechaAsignacionReclamoOOPP is not null
GROUP BY a.rbhCode'''

licUniverso = pd.read_sql(sqlLic, cnxn)
plRespuesta = pd.read_sql(sqlplRespuesta, cnxn)


# Cerramos la conexión
cnxn.close()

#unimos los dataframes
plalarRespuesta = licUniverso.merge(plRespuesta, how='left')
plalarRespuesta.loc[plalarRespuesta['PlazoLargoRespuesta'].isnull(), 'PlazoLargoRespuesta'] = 0
# Carga de datos en MySQL
from sqlalchemy import create_engine
import pymysql

engine = create_engine('mysql+pymysql://server:server@192.168.2.2:3306/redflags', echo = False)
plalarRespuesta.to_sql(con=engine, name='plazoLargoRespuesta', if_exists='replace', index=False)

# Término del "crónometro" y transformaciones a hora, minutos y segundos
tFinal = time.time()
tSegundosGenerico = tFinal - tInicio
tFormateado = str(datetime.timedelta(seconds=tSegundosGenerico))

# Resultados de la primera extracción
print("Terminado, se procesaron "+ str(len(plalarRespuesta)) + " licitaciones, en "+ tFormateado)


Terminado, se procesaron 1163108 licitaciones, en 0:00:56.210379


### Redflag: Inicio cierre preguntas fin de semana
Variable que indica si el inicio o cierre del periodo de realización de preguntas se da un fin de semana.

In [8]:
#Imports necesarios
import pyodbc #odbc para sqlserver
import time #librería necesaria para medir el tiempo de ejecución 
import datetime
import pandas as pd
import numpy as np
from functools import reduce

# Inicio del "cronómetro"
tInicio = time.time()

# Apertura la conexión a SQL SERVER
cnxn = pyodbc.connect('DRIVER={ODBC Driver 17 for SQL Server};SERVER=10.34.71.145;DATABASE=DCCPProcurement;UID=JoseMora;PWD=Chilecompra2018')

# Envío de las querys y lectura de los resultados

# Listado de licitaciones
sqlLic = '''select a.rbhCode
from DCCPProcurement.dbo.prcRFBHeader a
LEFT JOIN DCCPProcurement.dbo.prcRFBDate c on a.rbhCode = c.rbdRFBCode
WHERE YEAR(c.rbdOpeningDate) > 2013
and YEAR(c.rbdOpeningDate) < 2020
AND a.rbhOwnerName != 'Dirección de Compras y Contratación  Pública' 
AND a.rbhProcessSubType in (1, 2, 3, 23, 24, 25,  30) 
AND a.rbhDocumentStatus in (8,9,10, 7, 15, 16)
AND a.rbhProcessType = 1'''

# Descarga de datos de licitaciones cuya fecha de cierre de preguntas corresponde a un fin de semana o un día feriado
sqlFindeSemana = '''SELECT rbhCode
, rbhID IDLic
, d.rbdOpeningDate FechaLic
, rbhExternalCode CodLic
, b.rbdQuestionClose FechaCierrePreg
, DATENAME(dw,b.rbdQuestionClose) diadelasemana
, (CASE DATENAME(dw,b.rbdQuestionClose) WHEN 'Saturday' THEN 1 WHEN 'Sunday' THEN 1 ELSE 0 END) FinDeSemana
, (CASE WHEN (CONVERT(varchar(2), DAY(b.rbdQuestionClose))+ '-' + CONVERT(varchar(2), MONTH(b.rbdQuestionClose))+ '-' +RIGHT(CONVERT(varchar(4), YEAR(b.rbdQuestionClose)),2)) IN ('1-1-14', '18-4-14', '19-4-14', '1-5-14', '21-5-14', '7-6-14', '29-6-14', '16-7-14', '15-8-14', '20-8-14', '8-9-14', '18-9-14', '19-9-14', '20-9-14', '2-10-14', '12-10-14', '31-10-14', '1-11-14', '8-12-14', '25-12-14', '1-1-15', '3-4-15', '4-4-15', '1-5-15', '21-5-15', '7-6-15', '29-6-15', '16-7-15', '10-8-15', '15-8-15', '20-8-15', '18-9-15', '19-9-15', '12-10-15', '31-10-15', '1-11-15', '8-12-15', '25-12-15', '1-1-16', '25-3-16', '26-3-16', '1-5-16', '21-5-16', '7-6-16', '19-6-16', '27-6-16', '16-7-16', '10-8-16', '15-8-16', '20-8-16', '8-9-16', '18-9-16', '19-9-16', '20-9-16', '10-10-16', '23-10-16', '31-10-16', '1-11-16', '8-12-16', '25-12-16', '1-1-17', '2-1-17', '14-4-17', '15-4-17', '19-4-17', '1-5-17', '21-5-17', '7-6-17', '26-6-17', '2-7-17', '16-7-17', '10-8-17', '15-8-17', '20-8-17', '18-9-17', '19-9-17', '20-9-17', '21-9-17', '2-10-17', '9-10-17', '27-10-17', '1-11-17', '19-11-17', '8-12-17', '17-12-17', '25-12-17', '1-1-18', '16-1-18', '17-1-18', '18-1-18', '30-3-18', '31-3-18', '1-5-18', '21-5-18', '7-6-18', '2-7-18', '16-7-18', '15-8-18', '20-8-18', '17-9-18', '18-9-18', '19-9-18', '15-10-18', '1-11-18', '2-11-18', '8-12-18', '25-12-18', '1-1-19', '19-4-19', '20-4-19', '1-5-19', '21-5-19', '7-6-19', '29-6-19', '16-7-19', '15-8-19', '20-8-19', '18-9-19', '19-9-19', '20-9-19', '12-10-19', '31-10-19', '1-11-19', '8-12-19', '25-12-19')
THEN 1 ELSE 0 END) Feriado
FROM DCCPProcurement.dbo.prcRFBHeader a
LEFT JOIN DCCPProcurement.dbo.prcRFBDate b ON a.rbhCode = b.rbdRFBCode
LEFT JOIN DCCPProcurement.dbo.prcRFBDate d ON a.rbhCode = d.rbdRFBCode
WHERE YEAR(d.rbdOpeningDate) > 2013
and YEAR(d.rbdOpeningDate) < 2020
AND a.rbhOwnerName != 'Dirección de Compras y Contratación  Pública' 
AND a.rbhProcessSubType in (1, 2, 3, 23, 24, 25,  30) 
AND a.rbhDocumentStatus in (8,9,10, 7, 15, 16)
AND a.rbhProcessType = 1'''

licUniverso = pd.read_sql(sqlLic, cnxn)
findeSemana = pd.read_sql(sqlFindeSemana, cnxn)


# Cerramos la conexión
cnxn.close()

# unimos los dataframes
cierreFinDe = licUniverso.merge(findeSemana, how='left')

# Aplicamos las condiciones para obtener el indicador
cierreFinDe.loc[cierreFinDe['FinDeSemana'].isnull(), 'FinDeSemana'] = 0
cierreFinDe.loc[cierreFinDe['Feriado'].isnull(), 'Feriado'] = 0
cierreFinDe['indFerFinde'] = 0
cierreFinDe.loc[cierreFinDe['FinDeSemana'] == 1, 'indFerFinde'] = 1
cierreFinDe.loc[cierreFinDe['Feriado'] == 1, 'indFerFinde'] = 1

# Eliminamos los campos que no se utilizan
cierreFinDe = cierreFinDe.drop(['IDLic', 'FechaLic', 'CodLic', 'FechaCierrePreg', 'diadelasemana', 'FinDeSemana', 'Feriado'], axis=1)

# Carga de datos en MySQL
from sqlalchemy import create_engine
import pymysql

engine = create_engine('mysql+pymysql://server:server@192.168.2.2:3306/redflags', echo = False)
cierreFinDe.to_sql(con=engine, name='cierreFinDe', if_exists='replace', index=False)

# Término del "crónometro" y transformaciones a hora, minutos y segundos
tFinal = time.time()
tSegundosGenerico = tFinal - tInicio
tFormateado = str(datetime.timedelta(seconds=tSegundosGenerico))

# Resultados de la primera extracción
print("Terminado, se procesaron "+ str(len(cierreFinDe)) + " licitaciones, en "+ tFormateado)



Terminado, se procesaron 1163108 licitaciones, en 0:01:36.624347


### Redflag: Fuera de plazo mínimo de publicación
La licitación no cumple con un estándar mínimo de días de publicación dado el tipo de licitación.

In [9]:
#Imports necesarios
import pyodbc #odbc para sqlserver
import time #librería necesaria para medir el tiempo de ejecución 
import datetime
import pandas as pd
import numpy as np
from functools import reduce

# Inicio del "cronómetro"
tInicio = time.time()

# Apertura la conexión a SQL SERVER
cnxn = pyodbc.connect('DRIVER={ODBC Driver 17 for SQL Server};SERVER=10.34.71.145;DATABASE=DCCPProcurement;UID=JoseMora;PWD=Chilecompra2018')

# Envío de las querys y lectura de los resultados

# Listado de licitaciones
sqlLic = '''select a.rbhCode
from DCCPProcurement.dbo.prcRFBHeader a
LEFT JOIN DCCPProcurement.dbo.prcRFBDate c on a.rbhCode = c.rbdRFBCode
WHERE YEAR(c.rbdOpeningDate) > 2013
and YEAR(c.rbdOpeningDate) < 2020
AND a.rbhOwnerName != 'Dirección de Compras y Contratación  Pública' 
AND a.rbhProcessSubType in (1, 2, 3, 23, 24, 25,  30) 
AND a.rbhDocumentStatus in (8,9,10, 7, 15, 16)
AND a.rbhProcessType = 1'''

# Descarga de datos de licitaciones que cumplen con el mínimo de plazo de publicación
sqlPerMinPub = '''SELECT rbhCode, rbhID, b.rbdOpeningDate, rbhProcessSubType, b.rbdTechnicalBidReception,
DATEDIFF(DAY, b.rbdOpeningDate, b.rbdTechnicalBidReception) AS PlazoPublicacion,
(CASE WHEN a.rbhProcessSubType = 1 AND DATEDIFF(DAY, b.rbdOpeningDate, b.rbdTechnicalBidReception) < 5 THEN 1
         WHEN a.rbhProcessSubType = 2 AND DATEDIFF(DAY, b.rbdOpeningDate, b.rbdTechnicalBidReception) < 10 THEN 1
         WHEN a.rbhProcessSubType = 3 AND DATEDIFF(DAY, b.rbdOpeningDate, b.rbdTechnicalBidReception) < 20 THEN 1
         WHEN a.rbhProcessSubType = 24 AND DATEDIFF(DAY, b.rbdOpeningDate, b.rbdTechnicalBidReception) < 20 THEN 1
         WHEN a.rbhProcessSubType = 25 AND DATEDIFF(DAY, b.rbdOpeningDate, b.rbdTechnicalBidReception) < 30 THEN 1 
         WHEN a.rbhProcessSubType = 23 AND DATEDIFF(DAY, b.rbdOpeningDate, b.rbdTechnicalBidReception) < 10 THEN 1
         ELSE 0 END) AS indPlazoPublicacionIlegal
FROM DCCPProcurement.dbo.prcRFBHeader a
LEFT JOIN DCCPProcurement.dbo.prcRFBDate b ON a.rbhCode = b.rbdRFBCode
WHERE YEAR(b.rbdOpeningDate) > 2013
and YEAR(b.rbdOpeningDate) < 2020
AND a.rbhOwnerName != 'Dirección de Compras y Contratación  Pública' 
AND a.rbhProcessSubType in (1, 2, 3, 23, 24, 25,  30) 
AND a.rbhDocumentStatus in (8,9,10, 7, 15, 16)
AND a.rbhProcessType = 1'''

licUniverso = pd.read_sql(sqlLic, cnxn)
perMinPub = pd.read_sql(sqlPerMinPub, cnxn)


# Cerramos la conexión
cnxn.close()

# unimos los dataframes
perMinPublic = licUniverso.merge(perMinPub, how='left')

# Aplicamos las condiciones para obtener el indicador
perMinPublic.loc[perMinPublic['indPlazoPublicacionIlegal'].isnull(), 'indPlazoPublicacionIlegal'] = 0

# Eliminamos los campos que no se utilizan
perMinPublic = perMinPublic.drop(['rbhID', 'rbdOpeningDate', 'rbhProcessSubType', 'rbdTechnicalBidReception', 'PlazoPublicacion'], axis=1)

# Carga de datos en MySQL
from sqlalchemy import create_engine
import pymysql

engine = create_engine('mysql+pymysql://server:server@192.168.2.2:3306/redflags', echo = False)
perMinPublic.to_sql(con=engine, name='PlazoMinimoPublicacion', if_exists='replace', index=False)

# Término del "crónometro" y transformaciones a hora, minutos y segundos
tFinal = time.time()
tSegundosGenerico = tFinal - tInicio
tFormateado = str(datetime.timedelta(seconds=tSegundosGenerico))

# Resultados de la primera extracción
print("Terminado, se procesaron "+ str(len(perMinPublic)) + " licitaciones, en "+ tFormateado)


Terminado, se procesaron 1163108 licitaciones, en 0:01:22.680047


### Redflag: Number of bids
Number of bidders significantly less than average for similar item or procuring entity

In [10]:
#Imports necesarios
import pyodbc #odbc para sqlserver
import time #librería necesaria para medir el tiempo de ejecución 
import datetime
import pandas as pd
import numpy as np
from functools import reduce

# Inicio del "cronómetro"
tInicio = time.time()

# Apertura la conexión a SQL SERVER
cnxn = pyodbc.connect('DRIVER={ODBC Driver 17 for SQL Server};SERVER=10.34.71.145;DATABASE=DCCPProcurement;UID=JoseMora;PWD=Chilecompra2018')

# Envío de las querys y lectura de los resultados

# Listado de licitaciones
sqlLic = '''select a.rbhCode
from DCCPProcurement.dbo.prcRFBHeader a
LEFT JOIN DCCPProcurement.dbo.prcRFBDate c on a.rbhCode = c.rbdRFBCode
WHERE YEAR(c.rbdOpeningDate) > 2013
and YEAR(c.rbdOpeningDate) < 2020
AND a.rbhOwnerName != 'Dirección de Compras y Contratación  Pública' 
AND a.rbhProcessSubType in (1, 2, 3, 23, 24, 25,  30) 
AND a.rbhDocumentStatus in (8,9,10, 7, 15, 16)
AND a.rbhProcessType = 1'''

# Descarga de datos de promedios de ofertas por institución
sqlPromOfertas = '''SELECT a.rbhOrganization, COUNT(DISTINCT b.bidID)/COUNT(DISTINCT a.rbhCode) as promOfertas
FROM DCCPProcurement.dbo.prcRFBHeader a
LEFT JOIN DCCPProcurement.dbo.prcBIDQuote b ON a.rbhCode = b.bidRFBCode
LEFT JOIN DCCPProcurement.dbo.prcRFBDate d ON a.rbhCode = d.rbdRFBCode
WHERE YEAR(d.rbdOpeningDate) > 2013
and YEAR(d.rbdOpeningDate) < 2020
AND a.rbhOwnerName != 'Dirección de Compras y Contratación  Pública' 
AND a.rbhProcessSubType in (1, 2, 3, 23, 24, 25,  30) 
AND a.rbhDocumentStatus in (8,9,10, 7, 15, 16)
AND a.rbhProcessType = 1 
GROUP BY a.rbhOrganization'''

# Descarga de datos de cantidad de ofertas por licitación
sqlOferXLic = '''SELECT a.rbhCode, a.rbhOrganization, COUNT(DISTINCT b.bidID) AS BidCount
FROM DCCPProcurement.dbo.prcRFBHeader a
LEFT JOIN DCCPProcurement.dbo.prcBIDQuote b ON a.rbhCode = b.bidRFBCode
LEFT JOIN DCCPProcurement.dbo.prcRFBDate d ON a.rbhCode = d.rbdRFBCode
WHERE YEAR(d.rbdOpeningDate) > 2013
and YEAR(d.rbdOpeningDate) < 2020
AND a.rbhOwnerName != 'Dirección de Compras y Contratación  Pública' 
AND a.rbhProcessSubType in (1, 2, 3, 23, 24, 25,  30) 
AND a.rbhDocumentStatus in (8,9,10, 7, 15, 16)
AND a.rbhProcessType = 1 
GROUP BY a.rbhCode, a.rbhOrganization'''

licUniverso = pd.read_sql(sqlLic, cnxn)
promOfertas = pd.read_sql(sqlPromOfertas, cnxn)
oferXLic = pd.read_sql(sqlOferXLic, cnxn)

# Cerramos la conexión
cnxn.close()

# unimos los dataframes
tempPromOfer = licUniverso.merge(oferXLic, how='left')
tempPromOfer = tempPromOfer.merge(promOfertas, how='left')

# Aplicamos las condiciones para obtener el indicador
tempPromOfer['indPromOfertas'] = 0
tempPromOfer.loc[tempPromOfer['BidCount'] < tempPromOfer['promOfertas'] * 0.5, 'indPromOfertas'] = 1

# Eliminamos los campos que no se utilizan
promOfertas = tempPromOfer.drop(['rbhOrganization', 'BidCount', 'promOfertas'], axis=1)

# Carga de datos en MySQL
from sqlalchemy import create_engine
import pymysql

engine = create_engine('mysql+pymysql://server:server@192.168.2.2:3306/redflags', echo = False)
promOfertas.to_sql(con=engine, name='PromedioOfertas', if_exists='replace', index=False)

# Término del "crónometro" y transformaciones a hora, minutos y segundos
tFinal = time.time()
tSegundosGenerico = tFinal - tInicio
tFormateado = str(datetime.timedelta(seconds=tSegundosGenerico))

# Resultados de la primera extracción
print("Terminado, se procesaron "+ str(len(promOfertas)) + " licitaciones, en "+ tFormateado)

Terminado, se procesaron 1163108 licitaciones, en 0:01:37.546519


### Redflag: Porcentaje reclamos por irregularidad sin respuesta
Porcentaje de reclamos por presunta irregularidad del proceso que quedan sin respuesta por parte del comprador.

In [11]:
#Imports necesarios
import pyodbc #odbc para sqlserver
import time #librería necesaria para medir el tiempo de ejecución 
import datetime
import pandas as pd
import numpy as np
from functools import reduce

# Inicio del "cronómetro"
tInicio = time.time()

# Apertura la conexión a SQL SERVER
cnxn = pyodbc.connect('DRIVER={ODBC Driver 17 for SQL Server};SERVER=10.34.71.145;DATABASE=DCCPProcurement;UID=JoseMora;PWD=Chilecompra2018')

# Envío de las querys y lectura de los resultados

# Listado de licitaciones
sqlLic = '''select a.rbhCode
from DCCPProcurement.dbo.prcRFBHeader a
LEFT JOIN DCCPProcurement.dbo.prcRFBDate c on a.rbhCode = c.rbdRFBCode
WHERE YEAR(c.rbdOpeningDate) > 2013
and YEAR(c.rbdOpeningDate) < 2020
AND a.rbhOwnerName != 'Dirección de Compras y Contratación  Pública' 
AND a.rbhProcessSubType in (1, 2, 3, 23, 24, 25,  30) 
AND a.rbhDocumentStatus in (8,9,10, 7, 15, 16)
AND a.rbhProcessType = 1'''

# Descarga de datos de porcentajes de respuesta a los reclamos
sqlPorcRespRecla = '''SELECT a.rbhCode, CASE WHEN CONVERT(FLOAT, COUNT(b.RespuestaOOPP))/CONVERT(FLOAT, COUNT(b.idReclamo))*100 < 50 THEN 1 ELSE 0 END as indPorcResp 
FROM DCCPProcurement.dbo.prcRFBHeader a
LEFT JOIN DCCPReclamos.dbo.Reclamo b ON a.rbhExternalCode = b.NumLicOC
LEFT JOIN DCCPProcurement.dbo.prcRFBDate d ON a.rbhCode = d.rbdRFBCode
WHERE YEAR(d.rbdOpeningDate) > 2013
and YEAR(d.rbdOpeningDate) < 2020
AND b.idMotivoReclamo != 1
AND b.idMotivoReclamo != 18
AND a.rbhOwnerName != 'Dirección de Compras y Contratación  Pública' 
AND a.rbhProcessSubType in (1, 2, 3, 23, 24, 25,  30) 
AND a.rbhDocumentStatus in (8,9,10, 7, 15, 16)
AND a.rbhProcessType = 1 
GROUP BY a.rbhCode, a.rbhExternalCode'''


licUniverso = pd.read_sql(sqlLic, cnxn)
porcRespRecla = pd.read_sql(sqlPorcRespRecla, cnxn)


# Cerramos la conexión
cnxn.close()

# unimos los dataframes
porcRespRec = licUniverso.merge(porcRespRecla, how='left')

# Aplicamos las condiciones para obtener el indicador
porcRespRec.loc[porcRespRec['indPorcResp'].isnull(), 'indPorcResp'] = 0

# Carga de datos en MySQL
from sqlalchemy import create_engine
import pymysql

engine = create_engine('mysql+pymysql://server:server@192.168.2.2:3306/redflags', echo = False)
porcRespRec.to_sql(con=engine, name='PorcRespReclamos', if_exists='replace', index=False)

# Término del "crónometro" y transformaciones a hora, minutos y segundos
tFinal = time.time()
tSegundosGenerico = tFinal - tInicio
tFormateado = str(datetime.timedelta(seconds=tSegundosGenerico))

# Resultados de la primera extracción
print("Terminado, se procesaron "+ str(len(porcRespRec)) + " licitaciones, en "+ tFormateado)

Terminado, se procesaron 1163108 licitaciones, en 0:00:56.671346


### Redflag: Ratio días de publicación preguntas
Ratio que representa la relación entre la cantidad de días para la realización de preguntas, respecto al total de días de publicación de la licitación.

In [12]:
#Imports necesarios
import pyodbc #odbc para sqlserver
import time #librería necesaria para medir el tiempo de ejecución 
import datetime
import pandas as pd
import numpy as np
from functools import reduce

# Inicio del "cronómetro"
tInicio = time.time()

# Apertura la conexión a SQL SERVER
cnxn = pyodbc.connect('DRIVER={ODBC Driver 17 for SQL Server};SERVER=10.34.71.145;DATABASE=DCCPProcurement;UID=JoseMora;PWD=Chilecompra2018')

# Envío de las querys y lectura de los resultados

# Listado de licitaciones
sqlLic = '''select a.rbhCode
from DCCPProcurement.dbo.prcRFBHeader a
LEFT JOIN DCCPProcurement.dbo.prcRFBDate c on a.rbhCode = c.rbdRFBCode
WHERE YEAR(c.rbdOpeningDate) > 2013
and YEAR(c.rbdOpeningDate) < 2020
AND a.rbhOwnerName != 'Dirección de Compras y Contratación  Pública' 
AND a.rbhProcessSubType in (1, 2, 3, 23, 24, 25,  30) 
AND a.rbhDocumentStatus in (8,9,10, 7, 15, 16)
AND a.rbhProcessType = 1'''

# Descarga de datos de porcentajes de dias para preguntas versus el total publicado
sqlPorcPlazoRespuesta = '''SELECT rbhCode, 
(Convert(Float,((DATEDIFF(day, b.rbdQuestionOpening, b.rbdQuestionClose)))))/nullif((CONVERT(FLOAT,((DATEDIFF(day, b.rbdOpeningDate, b.rbdTechnicalBidReception))))),0) *100 as porc,
case WHEN (Convert(Float,((DATEDIFF(day, b.rbdQuestionOpening, b.rbdQuestionClose)))))/nullif((CONVERT(FLOAT,((DATEDIFF(day, b.rbdOpeningDate, b.rbdTechnicalBidReception))))),0) *100 < 10 then 1 else 0 end as indPorcPlazoPreg
FROM DCCPProcurement.dbo.prcRFBHeader a
LEFT JOIN DCCPProcurement.dbo.prcRFBDate b ON a.rbhCode = b.rbdRFBCode
WHERE YEAR(b.rbdOpeningDate) > 2013
and YEAR(b.rbdOpeningDate) < 2020
AND a.rbhOwnerName != 'Dirección de Compras y Contratación  Pública' 
AND a.rbhProcessSubType in (1, 2, 3, 23, 24, 25,  30) 
AND a.rbhDocumentStatus in (8,9,10, 7, 15, 16)
AND a.rbhProcessType = 1 '''


licUniverso = pd.read_sql(sqlLic, cnxn)
porcPlazoRespuesta = pd.read_sql(sqlPorcPlazoRespuesta, cnxn)


# Cerramos la conexión
cnxn.close()

# unimos los dataframes
porcPlaResp = licUniverso.merge(porcPlazoRespuesta, how='left')

# Aplicamos las condiciones para obtener el indicador
porcPlaResp.loc[porcPlaResp['indPorcPlazoPreg'].isnull(), 'indPorcPlazoPreg'] = 0

# Eliminamos los campos que no se utilizan
porcPlaResp = porcPlaResp.drop(['porc'], axis=1)

# Carga de datos en MySQL
from sqlalchemy import create_engine
import pymysql

engine = create_engine('mysql+pymysql://server:server@192.168.2.2:3306/redflags', echo = False)
porcPlaResp.to_sql(con=engine, name='PorcentajePlazoRespuestas', if_exists='replace', index=False)

# Término del "crónometro" y transformaciones a hora, minutos y segundos
tFinal = time.time()
tSegundosGenerico = tFinal - tInicio
tFormateado = str(datetime.timedelta(seconds=tSegundosGenerico))

# Resultados de la primera extracción
print("Terminado, se procesaron "+ str(len(porcPlaResp)) + " licitaciones, en "+ tFormateado)

Terminado, se procesaron 1163108 licitaciones, en 0:01:06.228894


### Redflag: Ratio reclamos irregularidad de ofertas
Ratio que representa la relación entre los reclamos ingresados por presunta irregularidad respecto al total de ofertas recepcionadas.

In [13]:
#Imports necesarios
import pyodbc #odbc para sqlserver
import time #librería necesaria para medir el tiempo de ejecución 
import datetime
import pandas as pd
import numpy as np
from functools import reduce

# Inicio del "cronómetro"
tInicio = time.time()

# Apertura la conexión a SQL SERVER
cnxn = pyodbc.connect('DRIVER={ODBC Driver 17 for SQL Server};SERVER=10.34.71.145;DATABASE=DCCPProcurement;UID=JoseMora;PWD=Chilecompra2018')

# Envío de las querys y lectura de los resultados

# Listado de licitaciones
sqlLic = '''select a.rbhCode
from DCCPProcurement.dbo.prcRFBHeader a
LEFT JOIN DCCPProcurement.dbo.prcRFBDate c on a.rbhCode = c.rbdRFBCode
WHERE YEAR(c.rbdOpeningDate) > 2013
and YEAR(c.rbdOpeningDate) < 2020
AND a.rbhOwnerName != 'Dirección de Compras y Contratación  Pública' 
AND a.rbhProcessSubType in (1, 2, 3, 23, 24, 25,  30) 
AND a.rbhDocumentStatus in (8,9,10, 7, 15, 16)
AND a.rbhProcessType = 1'''

# Descarga de datos de cantidad de ofertas por licitación 
sqlQOfertas = '''SELECT a.rbhCode, (CONVERT(FLOAT,(COUNT(b.bidID)))) AS 'TotalOfertas'
FROM DCCPProcurement.dbo.prcRFBHeader a
LEFT JOIN DCCPProcurement.dbo.prcBIDQuote b ON a.rbhCode = b.bidRFBCode
LEFT JOIN DCCPReclamos.dbo.Reclamo c ON a.rbhExternalCode = c.numLicOC
LEFT JOIN DCCPProcurement.dbo.prcRFBDate d ON a.rbhCode = d.rbdRFBCode
WHERE YEAR(d.rbdOpeningDate) > 2013
and YEAR(d.rbdOpeningDate) < 2020
AND a.rbhOwnerName != 'Dirección de Compras y Contratación  Pública' 
AND a.rbhProcessSubType in (1, 2, 3, 23, 24, 25,  30) 
AND a.rbhDocumentStatus in (8,9,10, 7, 15, 16)
AND a.rbhProcessType = 1 
GROUP BY a.rbhcode'''

# Descarga de datos de cantidad de reclamos por irregularidad
sqlQReclamos = '''SELECT a.rbhCode, (CONVERT(FLOAT,(COUNT(DISTINCT c.idReclamo)))) AS 'ReclamosIrregularidad'
FROM DCCPProcurement.dbo.prcRFBHeader a
LEFT JOIN DCCPProcurement.dbo.prcBIDQuote b ON a.rbhCode = b.bidRFBCode
LEFT JOIN DCCPReclamos.dbo.Reclamo c ON a.rbhExternalCode = c.numLicOC 
LEFT JOIN DCCPProcurement.dbo.prcRFBDate d ON a.rbhCode = d.rbdRFBCode
WHERE YEAR(d.rbdOpeningDate) > 2013
and YEAR(d.rbdOpeningDate) < 2020
AND a.rbhOwnerName != 'Dirección de Compras y Contratación  Pública' 
AND a.rbhProcessSubType in (1, 2, 3, 23, 24, 25,  30) 
AND a.rbhDocumentStatus in (8,9,10, 7, 15, 16)
AND c.idMotivoReclamo != 1
AND c.idMotivoReclamo != 18
AND a.rbhProcessType = 1
GROUP BY a.rbhcode'''

licUniverso = pd.read_sql(sqlLic, cnxn)
QOfertas = pd.read_sql(sqlQOfertas, cnxn)
QReclamos = pd.read_sql(sqlQReclamos, cnxn)


# Cerramos la conexión
cnxn.close()

# unimos los dataframes que tienen los datos del indicador
tempRatRecl = QOfertas.merge(QReclamos, how='left')
tempRatRecl2 = licUniverso.merge(tempRatRecl, how='left')

# Reemplazamos los valores nulos por ceros
tempRatRecl2.loc[tempRatRecl2['ReclamosIrregularidad'].isnull(), 'ReclamosIrregularidad'] = 0
tempRatRecl2.loc[tempRatRecl2['TotalOfertas']== 0, 'TotalOfertas'] = 1

# Calculamos el indicador
tempRatRecl2['indRatioReclamos'] = tempRatRecl2['ReclamosIrregularidad']/tempRatRecl2['TotalOfertas']
tempRatRecl2.loc[tempRatRecl2['indRatioReclamos'] < 0.6, 'indRatioReclamos'] = 0
tempRatRecl2.loc[tempRatRecl2['indRatioReclamos'] >= 0.6, 'indRatioReclamos'] = 1


# Eliminamos los campos que no se utilizan
ratRecl = tempRatRecl2.drop(['TotalOfertas', 'ReclamosIrregularidad'], axis=1)

# Carga de datos en MySQL
from sqlalchemy import create_engine
import pymysql

engine = create_engine('mysql+pymysql://server:server@192.168.2.2:3306/redflags', echo = False)
ratRecl.to_sql(con=engine, name='RatioReclamosOfertas', if_exists='replace', index=False)

# Término del "crónometro" y transformaciones a hora, minutos y segundos
tFinal = time.time()
tSegundosGenerico = tFinal - tInicio
tFormateado = str(datetime.timedelta(seconds=tSegundosGenerico))

# Resultados de la primera extracción
print("Terminado, se procesaron "+ str(len(ratRecl)) + " licitaciones, en "+ tFormateado)


Terminado, se procesaron 1163108 licitaciones, en 0:01:10.645906


### Redflag: Ratio reclamos pago ofertas
Ratio que representa la relación entre los reclamos ingresados por problemas de pago, respecto al total de ofertas recepcionadas.

In [14]:
#Imports necesarios
import pyodbc #odbc para sqlserver
import time #librería necesaria para medir el tiempo de ejecución 
import datetime
import pandas as pd
import numpy as np
from functools import reduce

# Inicio del "cronómetro"
tInicio = time.time()

# Apertura la conexión a SQL SERVER
cnxn = pyodbc.connect('DRIVER={ODBC Driver 17 for SQL Server};SERVER=10.34.71.145;DATABASE=DCCPProcurement;UID=JoseMora;PWD=Chilecompra2018')

# Envío de las querys y lectura de los resultados

# Listado de licitaciones
sqlLic = '''select a.rbhCode
from DCCPProcurement.dbo.prcRFBHeader a
LEFT JOIN DCCPProcurement.dbo.prcRFBDate c on a.rbhCode = c.rbdRFBCode
WHERE YEAR(c.rbdOpeningDate) > 2013
and YEAR(c.rbdOpeningDate) < 2020
AND a.rbhOwnerName != 'Dirección de Compras y Contratación  Pública' 
AND a.rbhProcessSubType in (1, 2, 3, 23, 24, 25,  30) 
AND a.rbhDocumentStatus in (8,9,10, 7, 15, 16)
AND a.rbhProcessType = 1'''

# Descarga de datos de cantidad de ofertas por licitación 
sqlQOfertas = '''SELECT a.rbhCode, (CONVERT(FLOAT,(COUNT(b.bidID)))) AS 'TotalOfertas'
FROM DCCPProcurement.dbo.prcRFBHeader a
LEFT JOIN DCCPProcurement.dbo.prcBIDQuote b ON a.rbhCode = b.bidRFBCode
LEFT JOIN DCCPReclamos.dbo.Reclamo c ON a.rbhExternalCode = c.numLicOC
LEFT JOIN DCCPProcurement.dbo.prcRFBDate d ON a.rbhCode = d.rbdRFBCode
WHERE YEAR(d.rbdOpeningDate) > 2013
and YEAR(d.rbdOpeningDate) < 2020
AND a.rbhOwnerName != 'Dirección de Compras y Contratación  Pública' 
AND a.rbhProcessSubType in (1, 2, 3, 23, 24, 25,  30) 
AND a.rbhDocumentStatus in (8,9,10, 7, 15, 16)
AND a.rbhProcessType = 1 
GROUP BY a.rbhcode'''

# Descarga de datos de cantidad de reclamos por pagos
sqlQReclamos = '''SELECT a.rbhCode, (CONVERT(FLOAT,(COUNT(DISTINCT c.idReclamo)))) AS 'ReclamosPago'
FROM DCCPProcurement.dbo.prcRFBHeader a
LEFT JOIN DCCPProcurement.dbo.prcBIDQuote b ON a.rbhCode = b.bidRFBCode
LEFT JOIN DCCPReclamos.dbo.Reclamo c ON a.rbhExternalCode = c.numLicOC 
LEFT JOIN DCCPProcurement.dbo.prcRFBDate d ON a.rbhCode = d.rbdRFBCode
WHERE YEAR(d.rbdOpeningDate) > 2013
and YEAR(d.rbdOpeningDate) < 2020
AND a.rbhOwnerName != 'Dirección de Compras y Contratación  Pública' 
AND a.rbhProcessSubType in (1, 2, 3, 23, 24, 25,  30) 
AND a.rbhDocumentStatus in (8,9,10, 7, 15, 16)
AND c.idMotivoReclamo = 1
AND c.idMotivoReclamo = 18
AND a.rbhProcessType = 1
GROUP BY a.rbhcode'''

licUniverso = pd.read_sql(sqlLic, cnxn)
QOfertas = pd.read_sql(sqlQOfertas, cnxn)
QReclamos = pd.read_sql(sqlQReclamos, cnxn)


# Cerramos la conexión
cnxn.close()

# unimos los dataframes que tienen los datos del indicador
tempRatRecl = QOfertas.merge(QReclamos, how='left')
tempRatRecl2 = licUniverso.merge(tempRatRecl, how='left')

# Reemplazamos los valores nulos por ceros
tempRatRecl2.loc[tempRatRecl2['ReclamosPago'].isnull(), 'ReclamosPago'] = 0
tempRatRecl2.loc[tempRatRecl2['TotalOfertas']== 0, 'TotalOfertas'] = 1

# Calculamos el indicador
tempRatRecl2['indRatioReclamosPagos'] = tempRatRecl2['ReclamosPago']/tempRatRecl2['TotalOfertas']
tempRatRecl2.loc[tempRatRecl2['indRatioReclamosPagos'] < 0.6, 'indRatioReclamosPagos'] = 0
tempRatRecl2.loc[tempRatRecl2['indRatioReclamosPagos'] >= 0.6, 'indRatioReclamosPagos'] = 1

# Eliminamos los campos que no se utilizan
ratRecl = tempRatRecl2.drop(['TotalOfertas', 'ReclamosPago'], axis=1)

# Carga de datos en MySQL
from sqlalchemy import create_engine
import pymysql

engine = create_engine('mysql+pymysql://server:server@192.168.2.2:3306/redflags', echo = False)
ratRecl.to_sql(con=engine, name='RatioReclamosPagosOfertas', if_exists='replace', index=False)

# Término del "crónometro" y transformaciones a hora, minutos y segundos
tFinal = time.time()
tSegundosGenerico = tFinal - tInicio
tFormateado = str(datetime.timedelta(seconds=tSegundosGenerico))

# Resultados de la primera extracción
print("Terminado, se procesaron "+ str(len(ratRecl)) + " licitaciones, en "+ tFormateado)


Terminado, se procesaron 1163108 licitaciones, en 0:01:08.638098


### Redflag: Single bid received
Tender featured a single bidder only

In [15]:
import pyodbc #odbc para sqlserver
import time #librería necesaria para medir el tiempo de ejecución 
import datetime
import pandas as pd
import numpy as np
from functools import reduce

# Inicio del "cronómetro"
tInicio = time.time()

# Apertura la conexión a SQL SERVER
cnxn = pyodbc.connect('DRIVER={ODBC Driver 17 for SQL Server};SERVER=10.34.71.145;DATABASE=DCCPProcurement;UID=JoseMora;PWD=Chilecompra2018')

# Envío de las querys y lectura de los resultados

# Listado de licitaciones
sqlLic = '''select a.rbhCode
from DCCPProcurement.dbo.prcRFBHeader a
LEFT JOIN DCCPProcurement.dbo.prcRFBDate c on a.rbhCode = c.rbdRFBCode
WHERE YEAR(c.rbdOpeningDate) > 2013
and YEAR(c.rbdOpeningDate) < 2020
AND a.rbhOwnerName != 'Dirección de Compras y Contratación  Pública' 
AND a.rbhProcessSubType in (1, 2, 3, 23, 24, 25,  30) 
AND a.rbhDocumentStatus in (8,9,10, 7, 15, 16)
AND a.rbhProcessType = 1'''

# Descarga de datos de cantidad de ofertas por licitación 
sqlQOfertas = '''SELECT a.rbhCode, (CONVERT(FLOAT,(COUNT(b.bidID)))) AS 'TotalOfertas'
FROM DCCPProcurement.dbo.prcRFBHeader a
LEFT JOIN DCCPProcurement.dbo.prcBIDQuote b ON a.rbhCode = b.bidRFBCode
LEFT JOIN DCCPReclamos.dbo.Reclamo c ON a.rbhExternalCode = c.numLicOC
LEFT JOIN DCCPProcurement.dbo.prcRFBDate d ON a.rbhCode = d.rbdRFBCode
WHERE YEAR(d.rbdOpeningDate) > 2013
and YEAR(d.rbdOpeningDate) < 2020
AND a.rbhOwnerName != 'Dirección de Compras y Contratación  Pública' 
AND a.rbhProcessSubType in (1, 2, 3, 23, 24, 25,  30) 
AND a.rbhDocumentStatus in (8,9,10, 7, 15, 16)
AND a.rbhProcessType = 1 
GROUP BY a.rbhcode'''

licUniverso = pd.read_sql(sqlLic, cnxn)
QOfertas = pd.read_sql(sqlQOfertas, cnxn)


# Cerramos la conexión
cnxn.close()

# unimos los dataframes que tienen los datos del indicador
tempQOfertas = licUniverso.merge(QOfertas, how='left')

# Reemplazamos los valores nulos por ceros
tempQOfertas['indQOfertas'] = 0
tempQOfertas.loc[tempQOfertas['TotalOfertas'] < 2, 'indQOfertas'] = 1

# Eliminamos los campos que no se utilizan
QOfertas = tempQOfertas.drop(['TotalOfertas'], axis=1)

# Carga de datos en MySQL
from sqlalchemy import create_engine
import pymysql

engine = create_engine('mysql+pymysql://server:server@192.168.2.2:3306/redflags', echo = False)
QOfertas.to_sql(con=engine, name='OfertasUnicas', if_exists='replace', index=False)

# Término del "crónometro" y transformaciones a hora, minutos y segundos
tFinal = time.time()
tSegundosGenerico = tFinal - tInicio
tFormateado = str(datetime.timedelta(seconds=tSegundosGenerico))

# Resultados de la primera extracción
print("Terminado, se procesaron "+ str(len(QOfertas)) + " licitaciones, en "+ tFormateado)

Terminado, se procesaron 1163108 licitaciones, en 0:01:05.669879


### Redflag: Tasa de respuesta
Tasa de respuesta a preguntas realizadas por los proveedores a través del foro.

In [None]:
"--Both tables merged in Spoon. Only 16 licitaciones have data available in the 'Foro de Preguntas'. For each of these, a response rate is calculated. For all other licitaciones, the TasaRespuesta campo is left null. 
SELECT a.rbhCode, (CONVERT(FLOAT,(COUNT(c.prgBidID)))) AS 'TotalPreguntas'
FROM DCCPProcurement.dbo.prcRFBHeader a
LEFT JOIN DCCPProcurement.dbo.prcBIDQuote b
ON a.rbhCode = b.bidRFBCode 
LEFT JOIN DCCPProcurement.dbo.prcForoPreguntaCS c
ON b.bidID = c.prgBidID 
LEFT JOIN DCCPProcurement.dbo.prcForoRespuestaCS d
ON d.rpsIDPregunta = c.prgID
WHERE YEAR (a.rbhCreationDate) >= 2014
AND a.rbhProcessType = 1
GROUP BY a.rbhCode

SELECT a.rbhCode, (CONVERT(FLOAT,(COUNT(c.prgBidID)))) AS 'PreguntasConRespuestas'
FROM DCCPProcurement.dbo.prcRFBHeader a
LEFT JOIN DCCPProcurement.dbo.prcBIDQuote b
ON a.rbhCode = b.bidRFBCode 
LEFT JOIN DCCPProcurement.dbo.prcForoPreguntaCS c
ON b.bidID = c.prgBidID 
LEFT JOIN DCCPProcurement.dbo.prcForoRespuestaCS d
ON d.rpsIDPregunta = c.prgID
WHERE YEAR (a.rbhCreationDate) >= 2014
AND a.rbhProcessType = 1
AND d.rpsRespuesta IS NOT NULL
GROUP BY a.rbhCode"