# Pipeline de generación de clusters usando redflags de Compras
El presente notebook permite descargar datos desde la base de datos de Aquiles, y posteriormente cargados en MySQL desde donde se obtienen los clusters y con los cuales se generarán las predicciones

## ETAPA: Elaboración

In [48]:
import pandas as pd
anio_inf = 2021
anio_sup = 2023
df_keys = pd.read_csv('secret.csv') 

### Redflag: Requisito de boleta de garantía irrazonable
El porcentaje solicitado en la garantía sobrepasa los límites razonables. Porcentajes muy altos pueden significar una barrera de entrada, así como un bajísimo porcentaje podría indicar lo contrario, asimismo cuando no hay requisitos, también podría ser riesgoso

In [49]:
#Imports necesarios
import pyodbc #odbc para sqlserver
import time #librería necesaria para medir el tiempo de ejecución 
import datetime
import pandas as pd
import numpy as np
from functools import reduce
import os

user = os.environ['chcprocuser']
passw = os.environ['chcprocpass']
server = os.environ['chcprocserver']
db = os.environ['chcprocdb']

# Inicio del "cronómetro"
tInicio = time.time()

# Apertura la conexión a SQL SERVER
cnxn = pyodbc.connect('DRIVER={ODBC Driver 17 for SQL Server};SERVER='+server+';DATABASE='+db+';UID='+user+';PWD='+passw)

# Envío de las querys y lectura de los resultados

# Listado de licitaciones
sqlLic = f'''select a.rbhCode
from DCCPProcurement.dbo.prcRFBHeader a
LEFT JOIN DCCPProcurement.dbo.prcRFBDate c on a.rbhCode = c.rbdRFBCode
WHERE YEAR(c.rbdOpeningDate) > {anio_inf}
AND YEAR(c.rbdOpeningDate) < {anio_sup}
AND a.rbhOwnerName != 'Dirección de Compras y Contratación  Pública'
AND rbhEnterprise != 6945
AND a.rbhProcessSubType in (3, 23, 24, 25,  30) -- se excluyen las L1 por no ser requisito
AND a.rbhDocumentStatus in (8,9,10, 7, 15, 16)
AND a.rbhProcessType = 1
AND a.rbhInformation != 1'''

# primero la seriedad de oferta
sqlSO = f'''SELECT a.rbhCode,  
CASE b.rgaAmountType 
WHEN '1' THEN b.rgaAmount
WHEN '0' THEN (Case when a.rbhEstimatedAwardAmount=0 then null else b.rgaAmount/a.rbhEstimatedAwardAmount*100 end)
ELSE 0
END as porctSerOfer
FROM DCCPProcurement.dbo.prcRFBHeader a
LEFT JOIN DCCPProcurement.dbo.prcRFBGuarantee b ON a.rbhCode = b.rgaRFBCode
LEFT JOIN DCCPProcurement.dbo.prcRFBDate c on a.rbhCode = c.rbdRFBCode
WHERE YEAR(c.rbdOpeningDate) > {anio_inf}
AND YEAR(c.rbdOpeningDate) < {anio_sup}
AND a.rbhOwnerName != 'Dirección de Compras y Contratación  Pública'
AND rbhEnterprise != 6945
AND a.rbhProcessSubType in (23, 24, 25,  30) -- se excluyen las L1 por no ser requisito
AND a.rbhDocumentStatus in (8,9,10, 7, 15, 16)
AND a.rbhProcessType = 1
AND b.rgaGuaranteeType = 1
AND b.rgaIsBasis = 1
AND a.rbhInformation != 1
ORDER by b.rgaAmount '''

# luego la de fiel cumplimiento
sqlFC = f'''SELECT a.rbhCode,  
CASE b.rgaAmountType 
WHEN '1' THEN b.rgaAmount
WHEN '0' THEN (Case when a.rbhEstimatedAwardAmount=0 then null else b.rgaAmount/a.rbhEstimatedAwardAmount*100 end)
ELSE 0
END as porctFC
FROM DCCPProcurement.dbo.prcRFBHeader a
LEFT JOIN DCCPProcurement.dbo.prcRFBGuarantee b ON a.rbhCode = b.rgaRFBCode
LEFT JOIN DCCPProcurement.dbo.prcRFBDate c on a.rbhCode = c.rbdRFBCode
WHERE YEAR(c.rbdOpeningDate) > {anio_inf}
AND YEAR(c.rbdOpeningDate) < {anio_sup}
AND a.rbhOwnerName != 'Dirección de Compras y Contratación  Pública' 
AND rbhEnterprise != 6945
AND a.rbhProcessSubType in (3, 23, 24, 25,  30) -- se excluyen las L1 por no ser requisito
AND a.rbhDocumentStatus in (8,9,10, 7, 15, 16)
AND a.rbhProcessType = 1
AND b.rgaGuaranteeType = 2
AND b.rgaIsBasis = 1
AND a.rbhInformation != 1
ORDER by b.rgaAmount'''

# otras garantías
sqlOtros = f'''SELECT a.rbhCode,   
CASE b.rgaAmountType 
WHEN '1' THEN b.rgaAmount
WHEN '0' THEN (Case when a.rbhEstimatedAwardAmount=0 then null else b.rgaAmount/a.rbhEstimatedAwardAmount*100 end)
ELSE 0
END as porctOtros
FROM DCCPProcurement.dbo.prcRFBHeader a
LEFT JOIN DCCPProcurement.dbo.prcRFBGuarantee b ON a.rbhCode = b.rgaRFBCode
LEFT JOIN DCCPProcurement.dbo.prcRFBDate c on a.rbhCode = c.rbdRFBCode
WHERE YEAR(c.rbdOpeningDate) > {anio_inf}
AND YEAR(c.rbdOpeningDate) < {anio_sup}
AND a.rbhOwnerName != 'Dirección de Compras y Contratación  Pública' 
AND rbhEnterprise != 6945
AND a.rbhProcessSubType in (3, 23, 24, 25,  30) -- se excluyen las L1 por no ser requisito
AND a.rbhDocumentStatus in (8,9,10, 7, 15, 16)
AND a.rbhProcessType = 1
AND b.rgaGuaranteeType not in (1,2)
AND b.rgaIsBasis = 1
AND a.rbhInformation != 1
ORDER by b.rgaAmount'''

licUniverso = pd.read_sql(sqlLic,cnxn)
garSO = pd.read_sql(sqlSO,cnxn)
garFC = pd.read_sql(sqlFC,cnxn)
garOtros = pd.read_sql(sqlOtros,cnxn)

# Cerramos la conexión
cnxn.close()

#unimos los dataframes
garantias = licUniverso.merge(garSO, how='left')
garantias = garantias.merge(garFC, how='left')
garantias = garantias.merge(garOtros, how='left')

# Calculamos el redflag y dejamos el dataframe en garantias2
garantias2 = garantias.copy()

# condiciones para definir un redflag, finalmente se definió un límite de 
conditions = [
    (pd.isnull(garantias2['porctSerOfer']) & pd.isnull(garantias2['porctFC']) & pd.isnull(garantias2['porctOtros'])),
    ((garantias2['porctSerOfer']>5) | (garantias2['porctFC']>30) | (garantias2['porctOtros']>10)) & (pd.notna(garantias2['porctSerOfer']) & pd.notna(garantias2['porctFC']) & pd.notna(garantias2['porctOtros'])),
    ((garantias2['porctSerOfer']<0.00001) | (garantias2['porctFC']<0.05) | (garantias2['porctOtros']<0.00001)) & (pd.notna(garantias2['porctSerOfer']) & pd.notna(garantias2['porctFC']) & pd.notna(garantias2['porctOtros']))]
choices = [1,1,1]

# aplicamos el filtro mediante un select
garantias2['requisitoGarantía'] = np.select(conditions, choices, default=0)

# botamos las columnas innecesarias
garantias2 = garantias2.drop_duplicates()
garantias2 = garantias2.groupby(['rbhCode'], as_index = False).sum()
garantias2['requisitoGarantía'] = garantias2['requisitoGarantía'].apply(lambda x: 1 if x > 0  else 0)

garantías2 = licUniverso.merge(garantias2, how = 'left')

# Carga de datos en MySQL
from sqlalchemy import create_engine
import pymysql

engine = create_engine('mysql+pymysql://server:server@192.168.2.2:3306/nuevos', echo = False)
garantias2.to_sql(con=engine, name='requisitoGarantía', if_exists='replace', index=False)

# Término del "crónometro" y transformaciones a hora, minutos y segundos
tFinal = time.time()
tSegundosGenerico = tFinal - tInicio
tFormateado = str(datetime.timedelta(seconds=tSegundosGenerico))

# Resultados de la primera extracción
print("Terminado, se procesaron "+ str(len(garantias2.index)) + " licitaciones, en "+ tFormateado)



Terminado, se procesaron 6348 licitaciones, en 0:00:06.108188


### Redflag: Posibilidad de renovación de contrato
This red flag indicator is based on information on the renewability of contracts and signals situations as risky when the number of possible renewals may be considered high (3 or more), or result in a contract of a longer term (longer than 4 years). 

In [50]:
#Imports necesarios
import pyodbc #odbc para sqlserver
import time #librería necesaria para medir el tiempo de ejecución 
import datetime
import pandas as pd
import numpy as np
from functools import reduce

# Inicio del "cronómetro"
tInicio = time.time()

# Apertura la conexión a SQL SERVER
cnxn = pyodbc.connect('DRIVER={ODBC Driver 17 for SQL Server};SERVER='+server+';DATABASE='+db+';UID='+user+';PWD='+passw)

# Envío de las querys y lectura de los resultados

# Listado de licitaciones
sqlLic = f'''select a.rbhCode
from DCCPProcurement.dbo.prcRFBHeader a
LEFT JOIN DCCPProcurement.dbo.prcRFBDate c on a.rbhCode = c.rbdRFBCode
WHERE YEAR(c.rbdOpeningDate) > {anio_inf}
AND YEAR(c.rbdOpeningDate) < {anio_sup}
AND a.rbhOwnerName != 'Dirección de Compras y Contratación  Pública' 
AND rbhEnterprise != 6945
AND a.rbhProcessSubType in (1, 2, 3, 23, 24, 25,  30) 
AND a.rbhDocumentStatus in (8,9,10, 7, 15, 16)
AND a.rbhProcessType = 1
AND a.rbhInformation != 1'''

# query para obtener indicador de si el contrato es renovable
sqlRenova = f'''SELECT a.rbhCode, CASE WHEN a.rbhOptionContratoRenovable is null THEN 0 ELSE a.rbhOptionContratoRenovable END as renovacionContrato
from DCCPProcurement.dbo.prcRFBHeader a
LEFT JOIN DCCPProcurement.dbo.prcRFBDate c on a.rbhCode = c.rbdRFBCode
WHERE YEAR(c.rbdOpeningDate) > {anio_inf}
AND YEAR(c.rbdOpeningDate) < {anio_sup}
AND a.rbhOwnerName != 'Dirección de Compras y Contratación  Pública'
AND rbhEnterprise != 6945
AND a.rbhProcessSubType in (1, 2, 3, 23, 24, 25,  30) 
AND a.rbhDocumentStatus in (8,9,10, 7, 15, 16)
AND a.rbhProcessType = 1
AND a.rbhInformation != 1'''

licUniverso = pd.read_sql(sqlLic,cnxn)
renovaCont = pd.read_sql(sqlRenova,cnxn)

# Cerramos la conexión
cnxn.close()

#unimos los dataframes
renCont = licUniverso.merge(renovaCont, how='left')

# Carga de datos en MySQL
from sqlalchemy import create_engine
import pymysql

engine = create_engine('mysql+pymysql://server:server@192.168.2.2:3306/nuevos', echo = False)
renCont.to_sql(con=engine, name='renovacionContrato', if_exists='replace', index=False)

# Término del "crónometro" y transformaciones a hora, minutos y segundos
tFinal = time.time()
tSegundosGenerico = tFinal - tInicio
tFormateado = str(datetime.timedelta(seconds=tSegundosGenerico))

# Resultados de la primera extracción
print("Terminado, se procesaron "+ str(len(renCont.index)) + " licitaciones, en "+ tFormateado)



Terminado, se procesaron 42060 licitaciones, en 0:00:17.107149


### Redflag: Los requisitos de experiencia sobrepasan un umbral razonable
Criterios de evaluación son muy pocos, se define como pocos 2 o menosEl criterio experiencia no es garantía de la calidad de un bien o servicio y puede servir como una barrera de entrada para las empresas que buscan expandir sus oportunidades participando del abastecimiento del Estado  

In [51]:
#Imports necesarios
import pyodbc #odbc para sqlserver
import time #librería necesaria para medir el tiempo de ejecución 
import datetime
import pandas as pd
import numpy as np
from functools import reduce

# Inicio del "cronómetro"
tInicio = time.time()

# Apertura la conexión a SQL SERVER
cnxn = pyodbc.connect('DRIVER={ODBC Driver 17 for SQL Server};SERVER='+server+';DATABASE='+db+';UID='+user+';PWD='+passw)

# Envío de las querys y lectura de los resultados

# Listado de licitaciones
sqlLic = f'''select a.rbhCode
from DCCPProcurement.dbo.prcRFBHeader a
LEFT JOIN DCCPProcurement.dbo.prcRFBDate c on a.rbhCode = c.rbdRFBCode
WHERE YEAR(c.rbdOpeningDate) > {anio_inf}
AND YEAR(c.rbdOpeningDate) < {anio_sup}
AND a.rbhOwnerName != 'Dirección de Compras y Contratación  Pública'
AND rbhEnterprise != 6945
AND a.rbhProcessSubType in (1, 2, 3, 23, 24, 25,  30) 
AND a.rbhDocumentStatus in (8,9,10, 7, 15, 16)
AND a.rbhProcessType = 1
AND a.rbhInformation != 1'''

# query para obtener indicador de si el contrato es renovable
sqlExp = f'''SELECT * FROM 
(
SELECT  a.rbhCode
, CASE WHEN a.rbhCode IN (SELECT  a.rbhCode
FROM DCCPProcurement.dbo.prcRFBHeader a
LEFT JOIN DCCPProcurement.dbo.prcRFBAwardCriteria b ON a.rbhCode = b.rbaRFBCode
LEFT JOIN DCCPProcurement.dbo.prcRFBDate c ON a.rbhCode = c.rbdRFBCode
WHERE YEAR(c.rbdOpeningDate) > {anio_inf}
AND YEAR(c.rbdOpeningDate) < {anio_sup}
AND (b.rbaIsChecked = 1)
AND a.rbhOwnerName != 'Dirección de Compras y Contratación  Pública' 
AND a.rbhProcessSubType IN (1, 2, 3, 23, 24, 25,  30) 
AND a.rbhDocumentStatus in (8,9,10, 7, 15, 16)
AND a.rbhProcessType = 1
AND LOWER(b.rbaName) LIKE '%experiencia%'
AND (LOWER(b.rbaComment) LIKE '%20 años%'
OR LOWER(b.rbaComment) LIKE '%6 años%'
OR LOWER(b.rbaComment) LIKE '%7 años%'
OR LOWER(b.rbaComment) LIKE '%8 años%'
OR LOWER(b.rbaComment) LIKE '%9 años%'
OR LOWER(b.rbaComment) LIKE '%10 años%')) THEN 1 ELSE 0 END AS requisitoExperiencia
FROM DCCPProcurement.dbo.prcRFBHeader a
LEFT JOIN DCCPProcurement.dbo.prcRFBDate c on a.rbhCode = c.rbdRFBCode
WHERE YEAR(c.rbdOpeningDate) > {anio_inf}
and YEAR(c.rbdOpeningDate) < {anio_sup}
AND a.rbhOwnerName != 'Dirección de Compras y Contratación  Pública'
AND rbhEnterprise != 6945
AND a.rbhProcessSubType in (1, 2, 3, 23, 24, 25,  30) 
AND a.rbhDocumentStatus in (8,9,10, 7, 15, 16)
AND a.rbhProcessType = 1
AND a.rbhInformation != 1
) as t1
LEFT JOIN (
SELECT a.rbhCode as id, max(
CASE 
WHEN LOWER(b.rbaComment) LIKE '%6 años%' THEN 6
WHEN LOWER(b.rbaComment) LIKE '%7 años%' THEN 7
WHEN LOWER(b.rbaComment) LIKE '%8 años%' THEN 8
WHEN LOWER(b.rbaComment) LIKE '%9 años%' THEN 9
WHEN LOWER(b.rbaComment) LIKE '%10 años%' THEN 10
WHEN LOWER(b.rbaComment) LIKE '%20 años%' THEN 20  
ELSE 0 
END) AS desde
FROM DCCPProcurement.dbo.prcRFBHeader a
LEFT JOIN DCCPProcurement.dbo.prcRFBAwardCriteria b ON a.rbhCode = b.rbaRFBCode
LEFT JOIN DCCPProcurement.dbo.prcRFBDate c ON a.rbhCode = c.rbdRFBCode
WHERE YEAR(c.rbdOpeningDate) > {anio_inf}
AND YEAR(c.rbdOpeningDate) < {anio_sup}
AND a.rbhOwnerName != 'Dirección de Compras y Contratación  Pública' 
AND a.rbhProcessSubType in (1, 2, 3, 23, 24, 25,  30) 
AND a.rbhDocumentStatus in (8,9,10, 7, 15, 16)
AND a.rbhProcessType = 1
AND a.rbhInformation != 1
GROUP BY a.rbhCode
) t2 ON t1.rbhCode = t2.id'''

licUniverso = pd.read_sql(sqlLic,cnxn)
experiencia = pd.read_sql(sqlExp,cnxn)

# Cerramos la conexión
cnxn.close()

#unimos los dataframes
expExcesiva = licUniverso.merge(experiencia, how='left')

# Carga de datos en MySQL
from sqlalchemy import create_engine
import pymysql

engine = create_engine('mysql+pymysql://server:server@192.168.2.2:3306/nuevos', echo = False)
expExcesiva.to_sql(con=engine, name='requisitoExperiencia', if_exists='replace', index=False)

# Término del "crónometro" y transformaciones a hora, minutos y segundos
tFinal = time.time()
tSegundosGenerico = tFinal - tInicio
tFormateado = str(datetime.timedelta(seconds=tSegundosGenerico))

# Resultados de la primera extracción
print("Terminado, se procesaron "+ str(len(expExcesiva)) + " licitaciones, en "+ tFormateado)



Terminado, se procesaron 42060 licitaciones, en 0:00:19.206224


### Redflag: Procurement with amounts close to threshold
A "pre-threshold procedure" has been announced or a "report on concluded agreement" has been published with amounts close to threshold amounts: UAH 190,000 to 200,000 and UAH 1.49 million to 1.5 million for regular procuring entities, and UAH 990,000 to 1 million and 4.9 million to 5 million for "certain areas of activity."

In [54]:
#Imports necesarios

import time #librería necesaria para medir el tiempo de ejecución 
import datetime
import pandas as pd
import numpy as np
from functools import reduce
import urllib.request
import json

# Inicio del "cronómetro"
tInicio = time.time()

def monedas(apikey, moneda, valor, anio):
    df = pd.read_json(f'https://api.sbif.cl/api-sbifv3/recursos_api/{moneda}/{anio}?apikey={apikey}&formato=json')
    df = pd.json_normalize(df[valor])
    df = df.rename(columns={'Fecha': 'Fecha', 'Valor': valor})
    return df

currencies = ['uf', 'dolar', 'euro', 'utm', 'ipc']
values = ['UFs', 'Dolares', 'Euros', 'UTMs', 'IPCs']
anios = [anio_inf - 1, anio_inf, anio_inf + 1]
apikey = df_keys['value'][4].replace(' ', '')

for j in range(len(anios)):
    for i in range(5):
        df = monedas(apikey, currencies[i], values[i], anios[j])
        if i == 0:
            df_monedas = df
        else:
            df_monedas = df_monedas.merge(df, how='left', left_on='Fecha', right_on='Fecha')
    if j == 0:
        df_monedas_ext = df_monedas
    else:
        df_monedas_ext = df_monedas_ext.append(df_monedas)

df_monedas = df_monedas_ext
df_monedas['UFs'] = df_monedas['UFs'].str.replace('.','').str.replace(',','.').astype('float')
df_monedas['Dolares'] = df_monedas['Dolares'].str.replace('.','').str.replace(',','.').astype('float')
df_monedas['Euros'] = df_monedas['Euros'].str.replace('.','').str.replace(',','.').astype('float')
df_monedas['UTMs'] = df_monedas['UTMs'].str.replace('.','').str.replace(',','.').astype('float')
df_monedas['IPCs'] = df_monedas['IPCs'].str.replace('.','').str.replace(',','.').astype('float')

df_monedas['mes'] = df_monedas['Fecha'].str.split('-', expand=True)[1]
df_monedas['año'] = df_monedas['Fecha'].str.split('-', expand=True)[0]

df_ipc = df_monedas.groupby(['año', 'mes'])['IPCs'].mean().reset_index().fillna(0)
df_ipc['acum'] = df_ipc.sort_values(by=['año', 'mes'], ascending=False)['IPCs'].cumsum()
df_ipc['IPC'] = df_ipc['acum']/100 + 1

for i in range(len(df_ipc)):
    df_monedas.loc[df_monedas['mes'] == df_ipc['mes'][i], 'IPC_factor'] = df_ipc['IPC'][i]

df_utm = df_monedas.groupby(['año', 'mes'])['UTMs'].mean().reset_index()
for i in range(len(df_utm)):
    df_monedas.loc[df_monedas['mes'] == df_utm['mes'][i], 'UTMCompleta'] = df_utm['UTMs'][i]

def fill_moneda(df, moneda):
    promedio = df[moneda].mean()
    df[moneda].fillna(value=promedio, inplace=True)
    return df[moneda]

fill_l = ['Dolares', 'Euros']

for i in range(len(fill_l)):
    df_monedas[fill_l[i]] = fill_moneda(df_monedas, fill_l[i])

df_monedas.drop(columns=['UTMs', 'mes', 'año', 'IPCs'], inplace=True)
df_monedas['Fecha'] = pd.to_datetime(df_monedas['Fecha'])

df_monedas['Año-Mes'] = df_monedas['Fecha'].dt.strftime('%Y-%m')
df_monedas = df_monedas.groupby(['Año-Mes']).mean().reset_index()

df_monedas.rename(columns={'Año-Mes':'Fecha', 'Dolares': 'Dolar', 'Euros': 'Euro', 'UFs': 'CLF', 'UTMCompleta': 'UTM', 'IPC_factor': 'factorIPC'}, inplace=True)

# Cargamos estos valores en la tabla UTM de MySQL
# Carga de datos en MySQL
from sqlalchemy import create_engine
import pymysql

engine = create_engine('mysql+pymysql://server:server@192.168.2.2:3306/nuevos', echo = False)
df_monedas.to_sql(con=engine, name='Monedas', if_exists='replace', index=False)


  df_monedas_ext = df_monedas_ext.append(df_monedas)
  df_monedas_ext = df_monedas_ext.append(df_monedas)
  df_monedas['UFs'] = df_monedas['UFs'].str.replace('.','').str.replace(',','.').astype('float')
  df_monedas['Dolares'] = df_monedas['Dolares'].str.replace('.','').str.replace(',','.').astype('float')
  df_monedas['Euros'] = df_monedas['Euros'].str.replace('.','').str.replace(',','.').astype('float')
  df_monedas['UTMs'] = df_monedas['UTMs'].str.replace('.','').str.replace(',','.').astype('float')
  df_monedas['IPCs'] = df_monedas['IPCs'].str.replace('.','').str.replace(',','.').astype('float')


30

In [55]:
server2 = df_keys['value'][2].replace(' ','')
db2 = df_keys['value'][3].replace(' ','')
user2 = df_keys['value'][0].replace(' ','')
pass2 = df_keys['value'][1].replace(' ','')

In [56]:
# Ahora trabajamos sobre los datos de las licitaciones para ver si el monto estimado está cerca de los umbrales de control (5000 UTM)
# Apertura la conexión a Conexiones


cnxn = pyodbc.connect('DRIVER={ODBC Driver 17 for SQL Server};SERVER='+server+';DATABASE='+db+';UID='+user+';PWD='+passw)
cnxn2 = pyodbc.connect('DRIVER={ODBC Driver 17 for SQL Server};SERVER='+server2+';DATABASE='+db2+';UID='+user2+';PWD='+pass2)
mycnxn = mysql.connector.connect(host="192.168.2.2", user="server",  passwd="server")


# Envío de las querys y lectura de los resultados
# Listado de licitaciones
sqlLic = f'''select a.rbhCode
from DCCPProcurement.dbo.prcRFBHeader a
LEFT JOIN DCCPProcurement.dbo.prcRFBDate c on a.rbhCode = c.rbdRFBCode
WHERE YEAR(c.rbdOpeningDate) > {anio_inf}
AND YEAR(c.rbdOpeningDate) < {anio_sup}
AND a.rbhOwnerName != 'Dirección de Compras y Contratación  Pública' 
AND rbhEnterprise != 6945
AND a.rbhProcessSubType in (1, 2, 3, 23, 24, 25,  30) 
AND a.rbhDocumentStatus in (8,9,10, 7, 15, 16)
AND a.rbhProcessType = 1
AND a.rbhInformation != 1'''

# query para obtener indicador de cercanía a umbral de control
sqltempLimites = f'''SELECT a.rbhCode, a.rbhOrganization , a.rbhEstimatedAmount, a.rbhCurrency, CAST(YEAR(c.rbdOpeningDate) as varchar) + '-' + CASE WHEN MONTH(c.rbdOpeningDate)<10 THEN '0' + cast(MONTH(c.rbdOpeningDate) as varchar) ELSE cast(MONTH(c.rbdOpeningDate) as varchar) END as Fecha 
, CASE WHEN YEAR(c.rbdOpeningDate) > 2018 THEN 0 ELSE 1 END as pre2019
FROM DCCPProcurement.dbo.prcRFBHeader a
LEFT JOIN DCCPProcurement.dbo.prcRFBDate c on a.rbhCode = c.rbdRFBCode
WHERE YEAR(c.rbdOpeningDate) > {anio_inf}
AND YEAR(c.rbdOpeningDate) < {anio_sup}
AND a.rbhOwnerName != 'Dirección de Compras y Contratación  Pública' 
AND rbhEnterprise != 6945
AND a.rbhProcessSubType in (1, 2, 3, 23, 24, 25,  30) 
AND a.rbhDocumentStatus in (8,9,10, 7, 15, 16)
AND a.rbhProcessType = 1
AND a.rbhInformation != 1'''

sqlMonedas = '''
SELECT *
FROM nuevos.Monedas;
'''

sqlRegiones = '''
select dc.orgCode , dl.IDRegion 
FROM DM_Transaccional.dbo.DimComprador dc 
left JOIN DM_Transaccional.dbo.DimLocalidad dl ON dc.IDLocalidadUnidaddeCompra = dl.IDLocalidad ;
'''

licUniverso = pd.read_sql(sqlLic,cnxn)
tempLimites = pd.read_sql(sqltempLimites,cnxn)
monedasTemp = pd.read_sql(sqlMonedas,mycnxn)
regiones = pd.read_sql(sqlRegiones,cnxn2)

#unimos los dataframes
tempLimites = tempLimites.merge(monedasTemp, how='left')

# Cerramos la conexión
cnxn.close()
mycnxn.close()
cnxn2.close()
#unimos los dataframes
tempLimites = tempLimites.merge(monedasTemp, how='left')
tempLimites = tempLimites.merge(regiones, how='left', left_on='rbhOrganization', right_on='orgCode' )

#calculamos los valores en UTM
tempLimites['valorEnUTM'] = 0
tempLimites.loc[tempLimites['rbhCurrency'] == 'UTM', 'valorEnUTM'] = round(tempLimites['rbhEstimatedAmount']).fillna(0).astype(int)
tempLimites.loc[tempLimites['rbhCurrency'] == 'CLP', 'valorEnUTM'] = round(tempLimites['rbhEstimatedAmount'] / tempLimites['UTM']).fillna(0).astype(int)
tempLimites.loc[tempLimites['rbhCurrency'] == 'CLF', 'valorEnUTM'] = round(tempLimites['rbhEstimatedAmount'] * tempLimites['CLF'] / tempLimites['UTM']).fillna(0).astype(int)
tempLimites.loc[tempLimites['rbhCurrency'] == 'USD', 'valorEnUTM'] = round(tempLimites['rbhEstimatedAmount'] * tempLimites['Dolar'] / tempLimites['UTM']).fillna(0).astype(int)
tempLimites.loc[tempLimites['rbhCurrency'] == 'EUR', 'valorEnUTM'] = round(tempLimites['rbhEstimatedAmount'] * tempLimites['Euro'] / tempLimites['UTM']).fillna(0).astype(int)

# Generamos las condiciones para establecer el valor del indicador
conditions = [
    (tempLimites['pre2019'] == 1) & (tempLimites['valorEnUTM'] > 4900) & (tempLimites['valorEnUTM'] < 5001),
    (tempLimites['pre2019'] == 0) & (tempLimites['valorEnUTM'] > 14900) & (tempLimites['valorEnUTM'] < 15001) & (tempLimites['IDRegion'] == 13),
    (tempLimites['pre2019'] == 0) & (tempLimites['valorEnUTM'] > 9900) & (tempLimites['valorEnUTM'] < 10001) & (tempLimites['IDRegion'] == 8),
    (tempLimites['pre2019'] == 0) & (tempLimites['valorEnUTM'] > 7900) & (tempLimites['valorEnUTM'] < 8001) & (tempLimites['IDRegion'] != 13) & (tempLimites['IDRegion'] != 8)]
choices = [1, 1, 1, 1]

tempLimites['montoCercanoUmbral'] = np.select(conditions, choices, default=0)
   
tempLimites.loc[tempLimites['rbhEstimatedAmount'].isnull() , 'valorEnUTM'] = np.nan
tempLimites.loc[tempLimites['rbhEstimatedAmount'].isnull() , 'montoCercanoUmbral'] = np.nan

# botamos las columnas innecesarias y fusión con licitaciones totales
tempLimites = tempLimites.drop(['rbhEstimatedAmount', 'rbhCurrency', 'Fecha', 'pre2019', 'Dolar', 'CLF', 'Euro', 'UTM', 'rbhOrganization', 'orgCode', 'IDRegion'], axis=1)
limites = licUniverso.merge(tempLimites, how='left')

# Cargamos estos valores en la tabla indValorrUTM
# Carga de datos en MySQL
engine = create_engine('mysql+pymysql://server:server@192.168.2.2:3306/nuevos', echo = False)
limites.to_sql(con=engine, name='montoCercanoUmbral', if_exists='replace', index=False)

# Término del "crónometro" y transformaciones a hora, minutos y segundos
tFinal = time.time()
tSegundosGenerico = tFinal - tInicio
tFormateado = str(datetime.timedelta(seconds=tSegundosGenerico))

# Resultados de la primera extracción
# Resultados de la primera extracción
print("Terminado, se procesaron "+ str(len(limites)) + " licitaciones, en "+ tFormateado)



Terminado, se procesaron 42060 licitaciones, en 0:00:23.894226


### LICITACIONES

In [57]:
#Imports necesarios
import pyodbc #odbc para sqlserver
import time #librería necesaria para medir el tiempo de ejecución 
import datetime
import pandas as pd
import numpy as np
from functools import reduce
import os


user = os.environ['chcprocuser']
passw = os.environ['chcprocpass']
server = os.environ['chcprocserver']
db = os.environ['chcprocdb']

# Inicio del "cronómetro"
tInicio = time.time()

# Apertura la conexión a SQL SERVER
cnxn = pyodbc.connect('DRIVER={ODBC Driver 17 for SQL Server};SERVER='+server+';DATABASE='+db+';UID='+user+';PWD='+passw)

# Envío de las querys y lectura de los resultados

# Listado de licitaciones
sqlLic = f'''SELECT a.rbhCode , a.rbhExternalCode , c.rbdOpeningDate, a.rbhOrganization, a.rbhTotalAward, a.rbhName, d.rstPublicName 
FROM DCCPProcurement.dbo.prcRFBHeader a
LEFT JOIN DCCPProcurement.dbo.prcRFBDate c ON a.rbhCode = c.rbdRFBCode
LEFT JOIN DCCPProcurement.dbo.prcRFBStatus d ON a.rbhDocumentStatus = d.rstCode 
WHERE YEAR(c.rbdOpeningDate) > {anio_inf}
AND YEAR(c.rbdOpeningDate) < {anio_sup}
AND a.rbhOwnerName != 'Dirección de Compras y Contratación  Pública'
AND rbhEnterprise != 6945
AND a.rbhProcessSubType IN (1, 2, 3, 23, 24, 25,  30) 
AND a.rbhDocumentStatus in (8,9,10, 7, 15, 16)
AND a.rbhProcessType = 1
AND a.rbhInformation != 1'''

licUniverso = pd.read_sql(sqlLic,cnxn)


# Cerramos la conexión
cnxn.close()

# Carga de datos en MySQL
from sqlalchemy import create_engine
import pymysql

engine = create_engine('mysql+pymysql://server:server@192.168.2.2:3306/nuevos', echo = False)
licUniverso.to_sql(con=engine, name='LICSERV', if_exists='replace', index=False)

# Término del "crónometro" y transformaciones a hora, minutos y segundos
tFinal = time.time()
tSegundosGenerico = tFinal - tInicio
tFormateado = str(datetime.timedelta(seconds=tSegundosGenerico))

# Resultados de la primera extracción
print("Terminado, se procesaron "+ str(len(licUniverso.index)) + " licitaciones, en "+ tFormateado)



Terminado, se procesaron 42060 licitaciones, en 0:00:15.829145


: 