# Indicadores de Espacio Público

In [8]:
#Imports necesarios
import pyodbc #odbc para sqlserver
import time #librería necesaria para medir el tiempo de ejecución 
import datetime
import pandas as pd
import numpy as np
from functools import reduce
import os

user = os.environ['chcprocuser']
passw = os.environ['chcprocpass']
server = os.environ['chcprocserver']
db = os.environ['chcprocdb']


anio_inf = 2021
anio_sup = 2023

### 1 Porcentaje de licitaciones públicas y privadas con un único oferente

In [9]:

# Inicio del "cronómetro"
tInicioT = time.time()
tInicio = time.time()

# Apertura la conexión a SQL SERVER
cnxn = pyodbc.connect('DRIVER={ODBC Driver 17 for SQL Server};SERVER='+server+';DATABASE='+db+';UID='+user+';PWD='+passw)

# Envío de las querys y lectura de los resultados

# Listado de licitaciones
sqllicOfertas = f'''SELECT rbhEnterprise, rbhCode, rbhOwnerCity,rbhExternalCode, year(FEC.rbdOpeningDate) AS 'Year_Publicacion', count(DISTINCT bidOrganization) AS 'N_Ofertas' 
FROM DCCPProcurement.dbo.prcRFBHeader AS LC
LEFT JOIN [DCCPProcurement].[dbo].[prcBIDQuote] AS OFE ON rbhCode=bidRFBCode
INNER JOIN DCCPProcurement.dbo.prcRFBDate AS FEC ON LC.rbhCode = FEC.rbdRFBCode
WHERE LC.rbhEnterprise <> ''
AND YEAR(FEC.rbdOpeningDate) >= {anio_inf-1}
AND YEAR(FEC.rbdOpeningDate) < {anio_sup}
AND lower(LC.rbhOwnerName) != 'dirección de compras y contratación  pública' 
AND LC.rbhProcessSubType IN (1, 2, 3, 4,5,6,7,8,9,10,13,26,27,29, 23, 24, 25,  30) 
AND LC.rbhDocumentStatus in (8,9,10)
AND LC.rbhProcessType in( 1,2)
AND [bidIsAwarded] is not null
AND rbhEnterprise != 6945 
GROUP BY rbhEnterprise, rbhCode, rbhExternalCode, year(FEC.rbdOpeningDate),rbhOwnerCity
ORDER BY rbhEnterprise'''

licOfertasT = pd.read_sql(sqllicOfertas,cnxn)

#problema con municipio de parral, el departamento de suld aparece como una entidad aparte
licOfertasT.loc[licOfertasT['rbhEnterprise'] == '7299', 'rbhEnterprise'] = '94459'

# Cerramos la conexión
cnxn.close()

licOfertas = licOfertasT[licOfertasT['Year_Publicacion'] > (anio_inf - 1)]

#procesamos el dataframe para obtener el porcentaje, agregando por año e institución
totalLic = licOfertas.groupby(['rbhEnterprise', 'Year_Publicacion'])['rbhCode'].count().reset_index()

unicoLic = licOfertas[licOfertas['N_Ofertas'] == 1]
unicoLic = unicoLic.groupby(['rbhEnterprise', 'Year_Publicacion'])['rbhCode'].count().reset_index()

agregado = totalLic.merge(unicoLic, how='left', left_on=['rbhEnterprise', 'Year_Publicacion'], right_on=['rbhEnterprise', 'Year_Publicacion'])
agregado['rbhCode_y'] = agregado['rbhCode_y'].fillna(0)
agregado['porc'] = round(agregado['rbhCode_y']/agregado['rbhCode_x'] * 100,1)
agregado = agregado.rename(columns={'rbhCode_x':'N_Total_Licitaciones', 'rbhCode_y':'N_Licitaciones_1_Oferente'})


agregado.rename(columns={'porc':'Indicador1'}, inplace=True)

# Carga de datos en MySQL
from sqlalchemy import create_engine
import pymysql

engine = create_engine('mysql+pymysql://server:server@192.168.2.2:3306/espaciopublico', echo = False)
agregado.to_sql(con=engine, name='indicador1', if_exists='replace', index=False)
agregado.to_sql(con=engine, name='indicador1', if_exists='replace', index=False)

# Término del "crónometro" y transformaciones a hora, minutos y segundos
tFinal = time.time()
tSegundosGenerico = tFinal - tInicio
tFormateado = str(datetime.timedelta(seconds=tSegundosGenerico))

# Resultados de la primera extracción
print("Terminado, se procesaron "+ str(len(agregado.index)/2) + " instituciones, en "+ tFormateado)



Terminado, se procesaron 855.5 instituciones, en 0:00:40.909548


### 2 Promedio de participantes por procedimiento 

In [10]:
# Inicio del "cronómetro"
tInicio = time.time()

#procesamos el dataframe para obtener el porcentaje, agregando por año e institución

promedioOfertas = licOfertasT.groupby(['rbhEnterprise', 'Year_Publicacion'])['N_Ofertas'].mean().reset_index()
promedioOfertas['N_Ofertas'] = round(promedioOfertas['N_Ofertas'])
promedioOfertas = promedioOfertas.rename(columns={'N_Ofertas':'Promedio_Ofertas'})
promedioOfertas.rename(columns={'Promedio_Ofertas':'Indicador2'}, inplace=True)

# Carga de datos en MySQL
from sqlalchemy import create_engine
import pymysql

engine = create_engine('mysql+pymysql://server:server@192.168.2.2:3306/espaciopublico', echo = False)
promedioOfertas.to_sql(con=engine, name='indicador2', if_exists='replace', index=False)

# Término del "crónometro" y transformaciones a hora, minutos y segundos
tFinal = time.time()
tSegundosGenerico = tFinal - tInicio
tFormateado = str(datetime.timedelta(seconds=tSegundosGenerico))

# Resultados de la primera extracción
print("Terminado, se procesaron "+ str(len(promedioOfertas.index)/2) + " instituciones, en "+ tFormateado)

Terminado, se procesaron 1288.5 instituciones, en 0:00:00.258005


### 3 Cambio en el promedio de participantes por procedimiento

In [11]:
# Inicio del "cronómetro"
tInicio = time.time()

#procesamos el dataframe para obtener el porcentaje, agregando por año e institución

promedioOfertas = licOfertasT.groupby(['rbhEnterprise', 'Year_Publicacion'])['N_Ofertas'].mean().reset_index()
promedioOfertas['N_Ofertas'] = round(promedioOfertas['N_Ofertas'])
promedioOfertas['N_Ofertas'] = promedioOfertas.groupby(['rbhEnterprise'])['N_Ofertas'].diff()

promedioOfertas = promedioOfertas.rename(columns={'N_Ofertas':'PromedioOferentes'})
promedioOfertas = promedioOfertas[promedioOfertas['Year_Publicacion'] > (anio_inf - 1)]
promedioOfertas.rename(columns={'PromedioOferentes':'Indicador3'}, inplace=True)

# Carga de datos en MySQL
from sqlalchemy import create_engine
import pymysql

engine = create_engine('mysql+pymysql://server:server@192.168.2.2:3306/espaciopublico', echo = False)
promedioOfertas.to_sql(con=engine, name='indicador3', if_exists='replace', index=False)

# Término del "crónometro" y transformaciones a hora, minutos y segundos
tFinal = time.time()
tSegundosGenerico = tFinal - tInicio
tFormateado = str(datetime.timedelta(seconds=tSegundosGenerico))

# Resultados de la primera extracción
print("Terminado, se procesaron "+ str(len(promedioOfertas.index)/2) + " instituciones, en "+ tFormateado)

Terminado, se procesaron 855.5 instituciones, en 0:00:00.506073


### 4 Número de empresas ganadoras diferentes entre todos los contratos

In [13]:
# Apertura la conexión a SQL SERVER
cnxn = pyodbc.connect('DRIVER={ODBC Driver 17 for SQL Server};SERVER='+server+';DATABASE='+db+';UID='+user+';PWD='+passw)

# Envío de las querys y lectura de los resultados

# Listado de ocs
sqldf = f'''
SELECT a.porid
,a.porCode
,a.porCreationDate
,a.porSendDate
,a.porJustifyType
,gor.orgEnterprise as porBuyerEnterprise
,porSellerEnterprise
,porSourceDocumentNumber
,item.poiCurrency
,item.poiTotalAmount
,eroc.exrValue 'cambioOC'
,erit.exrValue 'cambioItem'
,a.porIsIntegrated
FROM DCCPProcurement.dbo.prcPOHeader a 
INNER JOIN DCCPProcurement.dbo.prcPOItem item ON a.porID = item.poiOrder
LEFT JOIN DCCPPlatform.dbo.gblExchangeRate eroc ON a.porCurrency=eroc.exrCurrency AND (a.porSendDate BETWEEN eroc.exrDateFrom AND eroc.exrDateTo)
LEFT JOIN DCCPPlatform.dbo.gblExchangeRate erit ON item.poiCurrency=erit.exrCurrency AND (a.porSendDate BETWEEN erit.exrDateFrom AND erit.exrDateTo)
LEFT JOIN DCCPPlatform.dbo.gblOrganization gor on a.porBuyerOrganization = gor.orgID 
WHERE year(a.porSendDate) in ({anio_inf}, {anio_sup - 1})
and a.porBuyerOrganization not in ('1027','1616','1883','1921','2382','3233','3234','3235','5817','5891','6180','511671','512839','527838','601918','609685','657359','673771','684136','747832','748523','748723','749182','749218','749219','749221','869591','897086','897087','897088','897089','897095','897096','897097','897101','980445','1060323','1077636','1083838','1122317','1131977','1164441')
AND porBuyerStatus NOT IN (1,2,3,8,9,10,11)
'''

df = pd.read_sql(sqldf,cnxn)
df.loc[df['porBuyerEnterprise'] == '7299', 'porBuyerEnterprise'] = '94459'

# Cerramos la conexión
cnxn.close()



In [14]:
# TIPO DE CONTRATACION
df['Tipodeproceso'] = 'Trato Directo'
df.loc[df['porJustifyType'] == 703, 'Tipodeproceso'] = 'Convenio Marco'
df.loc[df['porJustifyType'] == 702, 'Tipodeproceso'] = 'Licitacion Privada'
df.loc[df['porJustifyType'] == 701, 'Tipodeproceso'] = 'Licitacion Publica'
df.loc[df['porJustifyType'] == 1301, 'Tipodeproceso'] = '.'
df.loc[df['porJustifyType'] == 1401, 'Tipodeproceso'] = '.'
df.loc[df['porIsIntegrated'] == 3, 'Tipodeproceso'] = 'Compra Ágil'
df.loc[df['porSourceDocumentNumber'].isna(), 'porSourceDocumentNumber'] = 0

In [15]:
# MONTOS: (ITEM)
df['MontototalenCLP'] = 10000000000.0
df.loc[df['poiCurrency'] != 'CLP', 'MontototalenCLP'] = df['poiTotalAmount'] * df['cambioItem']
df.loc[df['poiCurrency'] == 'CLP', 'MontototalenCLP'] = df['poiTotalAmount']
df['year'] = pd.DatetimeIndex(df['porSendDate']).year
df['MontototalenCLP'] = round(df['MontototalenCLP'])

#### dfN_Empresas_Ganadoras

empresas ganadoras distintas

In [16]:
dfN_Empresas_Ganadoras = df[['porSellerEnterprise', 'porBuyerEnterprise', 'year']]
dfN_Empresas_Ganadoras = dfN_Empresas_Ganadoras.drop_duplicates()
dfN_Empresas_Ganadoras = dfN_Empresas_Ganadoras.groupby(['porBuyerEnterprise', 'year'])['porSellerEnterprise'].count().reset_index()

#### dfNyMonto_Contratos_TC

In [17]:
dfNyMonto_Contratos_TC = df.copy()
dfNyMonto_Contratos_TC.loc[dfNyMonto_Contratos_TC['porSourceDocumentNumber'] == 0, 'porSourceDocumentNumber'] = dfNyMonto_Contratos_TC['porid']
dfNyMonto_Contratos_TC.loc[dfNyMonto_Contratos_TC['porSourceDocumentNumber'].isna(), 'porSourceDocumentNumber'] = dfNyMonto_Contratos_TC['porid']
dfNyMonto_Contratos_TC = dfNyMonto_Contratos_TC.groupby(['porBuyerEnterprise', 'Tipodeproceso', 'porSourceDocumentNumber', 'porSellerEnterprise', 'year']).agg({'MontototalenCLP':'sum'}).reset_index()

#### indicador 4

In [18]:
indicador4 = dfNyMonto_Contratos_TC.groupby(['porBuyerEnterprise', 'year']).agg({'porSourceDocumentNumber':pd.Series.nunique}).reset_index()
indicador4 = dfN_Empresas_Ganadoras.merge(indicador4, how='left', left_on=['porBuyerEnterprise', 'year'], right_on=['porBuyerEnterprise', 'year'])
indicador4['Ratio_Ganadores_Contratos'] = indicador4['porSellerEnterprise'] * 100 / indicador4['porSourceDocumentNumber']
indicador4.rename(columns={'Ratio_Ganadores_Contratos':'Indicador4'}, inplace=True)

# Carga de datos en MySQL
from sqlalchemy import create_engine
import pymysql

engine = create_engine('mysql+pymysql://server:server@192.168.2.2:3306/espaciopublico', echo = False)
indicador4.to_sql(con=engine, name='indicador4', if_exists='replace', index=False)

# Término del "crónometro" y transformaciones a hora, minutos y segundos
tFinal = time.time()
tSegundosGenerico = tFinal - tInicio
tFormateado = str(datetime.timedelta(seconds=tSegundosGenerico))

# Resultados de la primera extracción
print("Terminado, se procesaron "+ str(len(indicador4.index)/2) + " instituciones, en "+ tFormateado)

Terminado, se procesaron 910.0 instituciones, en 0:26:08.238652


### 5 Porcentaje de procedimientos que utilizaron adjudicación directa o licitación privada 

In [19]:
# Inicio del "cronómetro"
tInicio = time.time()


indicador5 = dfNyMonto_Contratos_TC.groupby(['porBuyerEnterprise', 'year', 'Tipodeproceso']).agg({'porSourceDocumentNumber':pd.Series.nunique}).reset_index()
indicador5['CantDirecta'] = 0
indicador5.loc[indicador5['Tipodeproceso'].isin(['Licitacion Privada', 'Trato Directo']), 'CantDirecta'] = indicador5['porSourceDocumentNumber']
indicador5 = indicador5.groupby(['porBuyerEnterprise', 'year'])['porSourceDocumentNumber', 'CantDirecta'].sum().reset_index()
indicador5['PorcProcDirecto'] = indicador5['CantDirecta'] / indicador5['porSourceDocumentNumber'] * 100
indicador5.rename(columns={'PorcProcDirecto':'Indicador5'}, inplace=True)

# Carga de datos en MySQL
from sqlalchemy import create_engine
import pymysql

engine = create_engine('mysql+pymysql://server:server@192.168.2.2:3306/espaciopublico', echo = False)
indicador5.to_sql(con=engine, name='indicador5', if_exists='replace', index=False)

# Término del "crónometro" y transformaciones a hora, minutos y segundos
tFinal = time.time()
tSegundosGenerico = tFinal - tInicio
tFormateado = str(datetime.timedelta(seconds=tSegundosGenerico))

# Resultados de la primera extracción
print("Terminado, se procesaron "+ str(len(indicador5.index)/2) + " instituciones, en "+ tFormateado)

Terminado, se procesaron 910.0 instituciones, en 0:00:03.843006


  indicador5 = indicador5.groupby(['porBuyerEnterprise', 'year'])['porSourceDocumentNumber', 'CantDirecta'].sum().reset_index()


### 6 Porcentaje del monto adjudicado por adjudicación directa o licitación privada 

In [20]:
# Inicio del "cronómetro"
tInicio = time.time()

indicador6 = dfNyMonto_Contratos_TC.groupby(['porBuyerEnterprise', 'year', 'Tipodeproceso']).agg({'MontototalenCLP': 'sum'}).reset_index()
indicador6['MontoDirecto'] = 0
indicador6.loc[indicador6['Tipodeproceso'].isin(['Licitacion Privada', 'Trato Directo']), 'MontoDirecto'] = indicador6['MontototalenCLP']
indicador6 = indicador6.groupby(['porBuyerEnterprise', 'year'])['MontototalenCLP', 'MontoDirecto'].sum().reset_index()
indicador6['PorcMontoDirecto'] = indicador6['MontoDirecto'] / indicador6['MontototalenCLP'] * 100
indicador6.rename(columns={'PorcMontoDirecto':'Indicador6'}, inplace=True)

# Carga de datos en MySQL
from sqlalchemy import create_engine
import pymysql

engine = create_engine('mysql+pymysql://server:server@192.168.2.2:3306/espaciopublico', echo = False)
indicador6.to_sql(con=engine, name='indicador6', if_exists='replace', index=False)

# Término del "crónometro" y transformaciones a hora, minutos y segundos
tFinal = time.time()
tSegundosGenerico = tFinal - tInicio    
tFormateado = str(datetime.timedelta(seconds=tSegundosGenerico))

# Resultados de la primera extracción
print("Terminado, se procesaron "+ str(len(indicador6.index)/2) + " instituciones, en "+ tFormateado)

Terminado, se procesaron 910.0 instituciones, en 0:00:01.051060


  indicador6 = indicador6.groupby(['porBuyerEnterprise', 'year'])['MontototalenCLP', 'MontoDirecto'].sum().reset_index()


### 8 IHH por número de contratos

In [21]:
# Inicio del "cronómetro"
tInicio = time.time()

indicador8 = dfNyMonto_Contratos_TC.groupby(['porBuyerEnterprise','porSellerEnterprise', 'year']).agg({'MontototalenCLP':'sum', 'porSourceDocumentNumber':pd.Series.nunique}).reset_index()
indicador8 = indicador8.rename(columns={'MontototalenCLP':'Monto', 'porSourceDocumentNumber':'Cantidad'})
ind8A = indicador8.groupby(by=['porBuyerEnterprise', 'year'])['Cantidad'].sum().reset_index()
ind8B = pd.merge(indicador8, ind8A, how='left', left_on=['porBuyerEnterprise', 'year'], right_on=['porBuyerEnterprise', 'year'])
ind8B['indHHC'] = pow(round(ind8B['Cantidad_x'] / ind8B['Cantidad_y']*100, 6), 2)
ind8F = ind8B.groupby(by=['porBuyerEnterprise', 'year'])['indHHC'].sum().reset_index()
ind8F.sort_values('indHHC')
ind8F.rename(columns={'indHHC':'Indicador8'}, inplace=True)

# Carga de datos en MySQL
from sqlalchemy import create_engine
import pymysql

engine = create_engine('mysql+pymysql://server:server@192.168.2.2:3306/espaciopublico', echo = False)
ind8F.to_sql(con=engine, name='indicador8', if_exists='replace', index=False)

# Término del "crónometro" y transformaciones a hora, minutos y segundos
tFinal = time.time()
tSegundosGenerico = tFinal - tInicio
tFormateado = str(datetime.timedelta(seconds=tSegundosGenerico))

# Resultados de la primera extracción
print("Terminado, se procesaron "+ str(len(ind8F.index)/2) + " instituciones, en "+ tFormateado)

Terminado, se procesaron 910.0 instituciones, en 0:02:05.087108


### 9 IHH por monto

In [22]:
# Inicio del "cronómetro"
tInicio = time.time()

indicador9 = dfNyMonto_Contratos_TC.groupby(['porBuyerEnterprise','porSellerEnterprise', 'year']).agg({'MontototalenCLP':'sum', 'porSourceDocumentNumber':pd.Series.nunique}).reset_index()
indicador9 = indicador9.rename(columns={'MontototalenCLP':'Monto', 'porSourceDocumentNumber':'Cantidad'})
ind9A = indicador9.groupby(by=['porBuyerEnterprise', 'year'])['Monto'].sum().reset_index()
ind9B = pd.merge(indicador9, ind9A, how='left', left_on=['porBuyerEnterprise', 'year'], right_on=['porBuyerEnterprise', 'year'])
ind9B['indHHM'] = pow(round(ind9B['Monto_x'] / ind9B['Monto_y']*100, 6), 2)
ind9F = ind9B.groupby(by=['porBuyerEnterprise', 'year'])['indHHM'].sum().reset_index()
ind9F.rename(columns={'indHHM':'Indicador9'}, inplace=True)

# Carga de datos en MySQL
from sqlalchemy import create_engine
import pymysql

engine = create_engine('mysql+pymysql://server:server@192.168.2.2:3306/espaciopublico', echo = False)
ind9F.to_sql(con=engine, name='indicador9', if_exists='replace', index=False)

# Término del "crónometro" y transformaciones a hora, minutos y segundos
tFinal = time.time()
tSegundosGenerico = tFinal - tInicio
tFormateado = str(datetime.timedelta(seconds=tSegundosGenerico))

# Resultados de la primera extracción
print("Terminado, se procesaron "+ str(len(ind9F.index)/2) + " instituciones, en "+ tFormateado)

Terminado, se procesaron 910.0 instituciones, en 0:02:05.454218


### 10 ID por número de contratos 

In [23]:
# Inicio del "cronómetro"
tInicio = time.time()

indicador10 = indicador9.copy()
ind10A = pd.merge(indicador10, ind8B, how='left', left_on=['porBuyerEnterprise', 'year', 'porSellerEnterprise'], right_on=['porBuyerEnterprise', 'year', 'porSellerEnterprise'])
ind10B = pd.merge(ind10A, ind8F, how='left', left_on=['porBuyerEnterprise', 'year'], right_on=['porBuyerEnterprise', 'year'])
ind10B['ID_Cantidad'] = pow((ind10B['indHHC']/ind10B['Indicador8']), 2) * 100
ind10F = ind10B.groupby(by=['porBuyerEnterprise', 'year'])['ID_Cantidad'].mean().reset_index()
ind10F.rename(columns={'ID_Cantidad':'Indicador10'}, inplace=True)

# Carga de datos en MySQL
from sqlalchemy import create_engine
import pymysql

engine = create_engine('mysql+pymysql://server:server@192.168.2.2:3306/espaciopublico', echo = False)
ind10F.to_sql(con=engine, name='indicador10', if_exists='replace', index=False)

# Término del "crónometro" y transformaciones a hora, minutos y segundos
tFinal = time.time()
tSegundosGenerico = tFinal - tInicio
tFormateado = str(datetime.timedelta(seconds=tSegundosGenerico))

# Resultados de la primera extracción
print("Terminado, se procesaron "+ str(len(ind10F.index)/2) + " instituciones, en "+ tFormateado)

Terminado, se procesaron 910.0 instituciones, en 0:00:01.981190


### 11 ID por monto

In [24]:
# Inicio del "cronómetro"
tInicio = time.time()

ind11 = indicador9.copy()
ind11A = pd.merge(ind11, ind9B, how='left', left_on=['porBuyerEnterprise', 'year', 'porSellerEnterprise'], right_on=['porBuyerEnterprise', 'year', 'porSellerEnterprise'])
ind11B = pd.merge(ind11A, ind9F, how='left', left_on=['porBuyerEnterprise', 'year'], right_on=['porBuyerEnterprise', 'year'])
ind11B['ID_Monto'] = pow((ind11B['indHHM']/ind11B['Indicador9']), 2) * 100
ind11F = ind11B.groupby(by=['porBuyerEnterprise', 'year'])['ID_Monto'].mean().reset_index()
ind11F.rename(columns={'ID_Monto':'Indicador11'}, inplace=True)

# Carga de datos en MySQL
from sqlalchemy import create_engine
import pymysql

engine = create_engine('mysql+pymysql://server:server@192.168.2.2:3306/espaciopublico', echo = False)
ind11F.to_sql(con=engine, name='indicador11', if_exists='replace', index=False)

# Término del "crónometro" y transformaciones a hora, minutos y segundos
tFinal = time.time()
tSegundosGenerico = tFinal - tInicio
tFormateado = str(datetime.timedelta(seconds=tSegundosGenerico))

# Resultados de la primera extracción
print("Terminado, se procesaron "+ str(len(ind11F.index)/2) + " instituciones, en "+ tFormateado)

Terminado, se procesaron 910.0 instituciones, en 0:00:01.980135


### 12 Índice de participación

In [25]:
# Inicio del "cronómetro"
tInicio = time.time()

# Apertura la conexión a SQL SERVER
cnxn = pyodbc.connect('DRIVER={ODBC Driver 17 for SQL Server};SERVER='+server+';DATABASE='+db+';UID='+user+';PWD='+passw)

# Envío de las querys y lectura de los resultados

# Listado de ocs
sqlOrganismo_Proveedor_Ofertas = f'''
SELECT rbhEnterprise,year(FEC.rbdOpeningDate) AS 'Year_Publicacion', bidOrganization, count(DISTINCT rbhCode) AS 'N_Ofertas_Proveedor' 
FROM DCCPProcurement.dbo.prcRFBHeader AS LC
INNER JOIN [DCCPProcurement].[dbo].[prcBIDQuote] AS OFE ON rbhCode=bidRFBCode
INNER JOIN DCCPProcurement.dbo.prcRFBDate AS FEC ON LC.rbhCode = FEC.rbdRFBCode
WHERE [rbhEnterprise]<>''
AND YEAR(FEC.rbdOpeningDate) >= {anio_inf}
AND YEAR(FEC.rbdOpeningDate) < {anio_sup}
AND lower(LC.rbhOwnerName) != 'dirección de compras y contratación  pública' 
AND rbhEnterprise != 6945 
AND LC.rbhProcessSubType IN (1, 2, 3, 4,5,6,7,8,9,10,13,26,27,29, 23, 24, 25,  30) 
AND LC.rbhDocumentStatus in (8,9,10)
AND LC.rbhProcessType in( 1,2)
AND [bidIsAwarded] is not null
GROUP BY rbhEnterprise, bidOrganization,year(FEC.rbdOpeningDate)
ORDER BY rbhEnterprise, count(DISTINCT rbhCode)
'''

OPOfertas = pd.read_sql(sqlOrganismo_Proveedor_Ofertas,cnxn)
OPOfertas.loc[OPOfertas['rbhEnterprise'] == '7299', 'rbhEnterprise'] = '94459'

# Cerramos la conexión
cnxn.close()

#Calculamos los porcentajes
ind12A = OPOfertas.groupby(['rbhEnterprise','Year_Publicacion'])['N_Ofertas_Proveedor'].max().reset_index()
ind12B = OPOfertas.groupby(['rbhEnterprise','Year_Publicacion'])['N_Ofertas_Proveedor'].sum().reset_index()
ind12C = ind12A.merge(ind12B, how = 'inner', left_on = ['Year_Publicacion', 'rbhEnterprise'], right_on = ['Year_Publicacion', 'rbhEnterprise'])
ind12C = ind12C.rename(columns={'N_Ofertas_Proveedor_x':'Max_Ofertas','N_Ofertas_Proveedor_y':'Total_Ofertas'})
ind12C['porc'] = round(ind12C['Max_Ofertas']/ ind12C['Total_Ofertas']*100, 3)
ind12C.rename(columns={'porc':'Indicador12'}, inplace=True)

# Carga de datos en MySQL
from sqlalchemy import create_engine
import pymysql

engine = create_engine('mysql+pymysql://server:server@192.168.2.2:3306/espaciopublico', echo = False)
ind12C.to_sql(con=engine, name='indicador12', if_exists='replace', index=False)

# Término del "crónometro" y transformaciones a hora, minutos y segundos
tFinal = time.time()
tSegundosGenerico = tFinal - tInicio
tFormateado = str(datetime.timedelta(seconds=tSegundosGenerico))

# Resultados de la primera extracción
print("Terminado, se procesaron "+ str(len(ind12C.index)/2) + " instituciones, en "+ tFormateado)



Terminado, se procesaron 855.5 instituciones, en 0:00:18.198160


### 13 Número de participantes distintos entre todos los procedimientos

In [26]:
# Inicio del "cronómetro"
tInicio = time.time()

# Apertura la conexión a SQL SERVER
cnxn = pyodbc.connect('DRIVER={ODBC Driver 17 for SQL Server};SERVER='+server+';DATABASE='+db+';UID='+user+';PWD='+passw)

# Envío de las querys y lectura de los resultados

# Listado de ocs
sqlindicador13 = f'''
SELECT rbhEnterprise,year(FEC.rbdOpeningDate) AS 'Year_Publicacion', count(DISTINCT bidOrganization) participantes_distintos, count(DISTINCT rbhCode) AS 'Cantidad de licitaciones' 
FROM DCCPProcurement.dbo.prcRFBHeader AS LC
INNER JOIN [DCCPProcurement].[dbo].[prcBIDQuote] AS OFE ON rbhCode=bidRFBCode
INNER JOIN DCCPProcurement.dbo.prcRFBDate AS FEC ON LC.rbhCode = FEC.rbdRFBCode
WHERE [rbhEnterprise]<>''
AND YEAR(FEC.rbdOpeningDate) >= {anio_inf}
AND YEAR(FEC.rbdOpeningDate) < {anio_sup}
AND lower(LC.rbhOwnerName) != 'dirección de compras y contratación  pública' 
AND rbhEnterprise != 6945 
AND LC.rbhProcessSubType IN (1, 2, 3, 4,5,6,7,8,9,10,13,26,27,29, 23, 24, 25,  30) 
AND LC.rbhDocumentStatus in (8,9,10)
AND LC.rbhProcessType in( 1,2)
AND [bidIsAwarded] is not null
GROUP BY rbhEnterprise,year(FEC.rbdOpeningDate)
ORDER BY rbhEnterprise, count(DISTINCT rbhCode)
'''

indicador13 = pd.read_sql(sqlindicador13,cnxn)
indicador13.loc[indicador13['rbhEnterprise'] == '7299', 'rbhEnterprise'] = '94459'

# Cerramos la conexión
cnxn.close()

indicador13['N_Participantes'] = indicador13['participantes_distintos'] / indicador13['Cantidad de licitaciones']
indicador13.rename(columns={'N_Participantes':'Indicador13'}, inplace=True)

# Carga de datos en MySQL
from sqlalchemy import create_engine
import pymysql

engine = create_engine('mysql+pymysql://server:server@192.168.2.2:3306/espaciopublico', echo = False)
indicador13.to_sql(con=engine, name='indicador13', if_exists='replace', index=False)

# Término del "crónometro" y transformaciones a hora, minutos y segundos
tFinal = time.time()
tSegundosGenerico = tFinal - tInicio
tFormateado = str(datetime.timedelta(seconds=tSegundosGenerico))

# Resultados de la primera extracción
print("Terminado, se procesaron "+ str(len(indicador13.index)/2) + " instituciones, en "+ tFormateado)



Terminado, se procesaron 856.5 instituciones, en 0:00:09.962989


### 14 Índice de concentración de las 4 empresas con más procedimientos ganados

In [27]:
# Inicio del "cronómetro"
tInicio = time.time()

ind14 = indicador9.copy()
ind14A = ind14.groupby(by=['porBuyerEnterprise', 'year'])['Cantidad'].sum().reset_index()
ind14B = ind14.merge(ind14A, how='left', left_on=['porBuyerEnterprise', 'year'], right_on=['porBuyerEnterprise', 'year'])
ind14B['Part'] = ind14B['Cantidad_x'] / ind14B['Cantidad_y'] * 100
ind142019 = ind14B[ind14B['year'] == anio_inf]
ind142020 = ind14B[ind14B['year'] == (anio_sup - 1)]
ind142019['Rank'] = ind142019.groupby('porBuyerEnterprise')['Part'].rank(ascending=False, method='first')
ind142020['Rank'] = ind142020.groupby('porBuyerEnterprise')['Part'].rank(ascending=False, method='first')
ind14B['Rank'] = ind14B.groupby('porBuyerEnterprise')['Part'].rank(ascending=False, method='first')
ind142019C = ind142019[ind142019['Rank']<=4]
ind142020C = ind142020[ind142020['Rank']<=4]
ind14C = pd.concat([ind142019C,ind142020C])
ind14F = ind14C.groupby(by=['porBuyerEnterprise', 'year'])['Part'].sum().reset_index()
ind14F.rename(columns={'Part':'Indicador14'}, inplace=True)

# Carga de datos en MySQL
from sqlalchemy import create_engine
import pymysql

engine = create_engine('mysql+pymysql://server:server@192.168.2.2:3306/espaciopublico', echo = False)
ind14F.to_sql(con=engine, name='indicador14', if_exists='replace', index=False)

# Término del "crónometro" y transformaciones a hora, minutos y segundos
tFinal = time.time()
tSegundosGenerico = tFinal - tInicio
tFormateado = str(datetime.timedelta(seconds=tSegundosGenerico))

# Resultados de la primera extracción
print("Terminado, se procesaron "+ str(len(ind14F.index)/2) + " instituciones, en "+ tFormateado)

A value is trying to be set on a copy of a slice from a DataFrame.
Try using .loc[row_indexer,col_indexer] = value instead

See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html#returning-a-view-versus-a-copy
  ind142019['Rank'] = ind142019.groupby('porBuyerEnterprise')['Part'].rank(ascending=False, method='first')
A value is trying to be set on a copy of a slice from a DataFrame.
Try using .loc[row_indexer,col_indexer] = value instead

See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html#returning-a-view-versus-a-copy
  ind142020['Rank'] = ind142020.groupby('porBuyerEnterprise')['Part'].rank(ascending=False, method='first')


Terminado, se procesaron 910.0 instituciones, en 0:00:01.485015


### 15 Índice de concentración de las 4 empresas con más monto adjudicado 

In [28]:
# Inicio del "cronómetro"
tInicio = time.time()

ind15 = indicador9.copy()
ind15A = ind15.groupby(by=['porBuyerEnterprise', 'year'])['Monto'].sum().reset_index()
ind15B = ind15.merge(ind15A, how='left', left_on=['porBuyerEnterprise', 'year'], right_on=['porBuyerEnterprise', 'year'])
ind15B['Part'] = ind15B['Monto_x'] / ind15B['Monto_y'] * 100
ind152019 = ind15B[ind15B['year'] == anio_inf]
ind152020 = ind15B[ind15B['year'] == (anio_sup - 1)]
ind152019['Rank'] = ind152019.groupby('porBuyerEnterprise')['Part'].rank(ascending=False, method='first')
ind152020['Rank'] = ind152020.groupby('porBuyerEnterprise')['Part'].rank(ascending=False, method='first')
ind152019C = ind152019[ind152019['Rank']<=4]
ind152020C = ind152020[ind152020['Rank']<=4]
ind15C = pd.concat([ind152019C,ind152020C])
ind15F = ind15C.groupby(by=['porBuyerEnterprise', 'year'])['Part'].sum().reset_index()
ind15F.rename(columns={'Part':'Indicador15'}, inplace=True)

# Carga de datos en MySQL
from sqlalchemy import create_engine
import pymysql

engine = create_engine('mysql+pymysql://server:server@192.168.2.2:3306/espaciopublico', echo = False)
ind15F.to_sql(con=engine, name='indicador15', if_exists='replace', index=False)

# Término del "crónometro" y transformaciones a hora, minutos y segundos
tFinal = time.time()
tSegundosGenerico = tFinal - tInicio
tFormateado = str(datetime.timedelta(seconds=tSegundosGenerico))

# Resultados de la primera extracción
print("Terminado, se procesaron "+ str(len(ind15F.index)/2) + " instituciones, en "+ tFormateado)

A value is trying to be set on a copy of a slice from a DataFrame.
Try using .loc[row_indexer,col_indexer] = value instead

See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html#returning-a-view-versus-a-copy
  ind152019['Rank'] = ind152019.groupby('porBuyerEnterprise')['Part'].rank(ascending=False, method='first')
A value is trying to be set on a copy of a slice from a DataFrame.
Try using .loc[row_indexer,col_indexer] = value instead

See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html#returning-a-view-versus-a-copy
  ind152020['Rank'] = ind152020.groupby('porBuyerEnterprise')['Part'].rank(ascending=False, method='first')


Terminado, se procesaron 910.0 instituciones, en 0:00:01.365155


### 16 Ratio de participación y adjudicación en licitaciones públicas y privadas 

In [29]:
# Inicio del "cronómetro"
tInicio = time.time()

# Apertura la conexión a SQL SERVER
cnxn = pyodbc.connect('DRIVER={ODBC Driver 17 for SQL Server};SERVER='+server+';DATABASE='+db+';UID='+user+';PWD='+passw)

# Envío de las querys y lectura de los resultados

# Listado de ocs
sqlOrganismo_Proveedor_Ganadores = f'''
SELECT rbhEnterprise, year(FEC.rbdOpeningDate) AS 'Year_Publicacion', count(DISTINCT bidOrganization) AS 'N_Ganadores_Proveedor' 
FROM DCCPProcurement.dbo.prcRFBHeader AS LC
INNER JOIN [DCCPProcurement].[dbo].[prcBIDQuote] AS OFE ON rbhCode=bidRFBCode
INNER JOIN DCCPProcurement.dbo.prcRFBDate AS FEC ON LC.rbhCode = FEC.rbdRFBCode
WHERE [rbhEnterprise]<>''
AND YEAR(FEC.rbdOpeningDate) >= {anio_inf}
AND YEAR(FEC.rbdOpeningDate) < {anio_sup}
AND lower(LC.rbhOwnerName) != 'dirección de compras y contratación  pública' 
AND rbhEnterprise != 6945 
AND LC.rbhProcessSubType IN (1, 2, 3, 4,5,6,7,8,9,10,13,26,27,29, 23, 24, 25,  30) 
AND LC.rbhDocumentStatus in (8,9,10)
AND LC.rbhProcessType in( 1,2)
AND [bidIsAwarded]=1
GROUP BY rbhEnterprise,year(FEC.rbdOpeningDate)
ORDER BY rbhEnterprise
'''

sqlOrganismo_Proveedor_distintos = f'''
SELECT rbhEnterprise, year(FEC.rbdOpeningDate) AS 'Year_Publicacion', count(DISTINCT bidOrganization) AS 'N_Participantes' 
FROM DCCPProcurement.dbo.prcRFBHeader AS LC
INNER JOIN [DCCPProcurement].[dbo].[prcBIDQuote] AS OFE ON rbhCode=bidRFBCode
INNER JOIN DCCPProcurement.dbo.prcRFBDate AS FEC ON LC.rbhCode = FEC.rbdRFBCode
WHERE [rbhEnterprise]<>''
AND YEAR(FEC.rbdOpeningDate) >= {anio_inf}
AND YEAR(FEC.rbdOpeningDate) < {anio_sup}
AND lower(LC.rbhOwnerName) != 'dirección de compras y contratación  pública' 
AND rbhEnterprise != 6945 
AND LC.rbhProcessSubType IN (1, 2, 3, 4,5,6,7,8,9,10,13,26,27,29, 23, 24, 25,  30) 
AND LC.rbhDocumentStatus in (8,9,10)
AND LC.rbhProcessType in(1,2)
AND [bidIsAwarded] is not null
GROUP BY rbhEnterprise,year(FEC.rbdOpeningDate)
ORDER BY rbhEnterprise
'''

OPGanadores = pd.read_sql(sqlOrganismo_Proveedor_Ganadores,cnxn)
OPGanadores.loc[OPGanadores['rbhEnterprise'] == '7299', 'rbhEnterprise'] = '94459'

OPdistintos = pd.read_sql(sqlOrganismo_Proveedor_distintos,cnxn)
OPdistintos.loc[OPdistintos['rbhEnterprise'] == '7299', 'rbhEnterprise'] = '94459'

# Cerramos la conexión
cnxn.close()


indicador16 = OPdistintos.merge(OPGanadores, how='left', left_on=['rbhEnterprise', 'Year_Publicacion'], right_on=['rbhEnterprise', 'Year_Publicacion'])
indicador16['porc'] = round(indicador16['N_Participantes'] / indicador16['N_Ganadores_Proveedor'], 2)
indicador16.rename(columns={'porc':'Indicador16'}, inplace=True)

# Carga de datos en MySQL
from sqlalchemy import create_engine
import pymysql

engine = create_engine('mysql+pymysql://server:server@192.168.2.2:3306/espaciopublico', echo = False)
indicador16.to_sql(con=engine, name='indicador16', if_exists='replace', index=False)

# Término del "crónometro" y transformaciones a hora, minutos y segundos
tFinal = time.time()
tSegundosGenerico = tFinal - tInicio
tFormateado = str(datetime.timedelta(seconds=tSegundosGenerico))

# Resultados de la primera extracción
print("Terminado, se procesaron "+ str(len(indicador16.index)/2) + " instituciones, en "+ tFormateado)



Terminado, se procesaron 858.5 instituciones, en 0:00:20.906141


### 17 Porcentaje de licitaciones públicas y privadas sin ningún documento obligatorio publicado

In [30]:
# Inicio del "cronómetro"
tInicio = time.time()

# Apertura la conexión a SQL SERVER
cnxn = pyodbc.connect('DRIVER={ODBC Driver 17 for SQL Server};SERVER='+server+';DATABASE='+db+';UID='+user+';PWD='+passw)

# Envío de las querys y lectura de los resultados

# Listado de ocs
sqlindicador17_1 = f'''
SELECT DISTINCT rbhEnterprise, rbhCode, rbhExternalCode, year(FEC.rbdOpeningDate) AS 'Year_Publicacion',
COUNT(DISTINCT CASE WHEN AT.[atcIsActive]=1 AND ((lower(AT.atcSourceFileName) LIKE '%bases%') or (lower(AT.atcDescription) LIKE '%bases%') or (AT.actDocumentType = -3 and AT.atcDocumentSubType = 1) or (AT.actDocumentType = -3 and AT.atcDocumentSubType = 2) or (AT.actDocumentType = -3 and AT.atcDocumentSubType = 3)) then 1 ELSE NULL END) 'bases_licitacion',
COUNT(DISTINCT CASE WHEN AT.[atcIsActive]=1 AND (((lower(AT.atcSourceFileName) LIKE '%selecci%') OR (lower(AT.atcDescription) LIKE '%selecci%')) OR ((lower(AT.atcSourceFileName) LIKE '%evaluaci%') OR (lower(AT.atcDescription) LIKE '%evaluaci%')) OR (((lower(AT.atcSourceFileName) LIKE '%acta%') and (lower(AT.atcSourceFileName) LIKE '%eval%')) or ((lower(AT.atcSourceFileName) LIKE '%acta%') and (lower(AT.atcSourceFileName) LIKE '%eval%'))) OR (((lower(AT.atcSourceFileName) LIKE '%cuadro%') and (lower(atcSourceFileName) LIKE '%eval%')) or ((lower(atcSourceFileName) LIKE '%cuadro%') and (lower(atcSourceFileName) LIKE '%eval%'))) OR (((lower(atcSourceFileName) LIKE '%cuadro%') and (lower(atcSourceFileName) LIKE '%comp%')) or ((lower(atcSourceFileName) LIKE '%cuadro%') and (lower(atcSourceFileName) LIKE '%comp%')))  or (AT.actDocumentType = -3 and AT.atcDocumentSubType = 17) or (AT.actDocumentType = -6 and AT.atcDocumentSubType = 3)) then 1 ELSE NULL END) 'acta_evaluacion',
COUNT(DISTINCT CASE WHEN AT.[atcIsActive]=1 AND (((lower(AT.atcSourceFileName) LIKE '%resol%') OR (lower(AT.atcDescription) LIKE '%resol%')) OR ((lower(AT.atcSourceFileName) LIKE '%adjudica%') OR (lower(AT.atcDescription) LIKE '%adjudica%')) OR (((lower(AT.atcSourceFileName) LIKE '%res%') and (lower(AT.atcSourceFileName) LIKE '%adj%')) or ((lower(AT.atcSourceFileName) LIKE '%res%') and (lower(AT.atcSourceFileName) LIKE '%adj%'))) OR (((lower(AT.atcSourceFileName) LIKE '%decre%') and (lower(atcSourceFileName) LIKE '%adj%')) or ((lower(atcSourceFileName) LIKE '%decre%') and (lower(atcSourceFileName) LIKE '%adj%'))) or (AT.actDocumentType = -6 and AT.atcDocumentSubType = 2) or (AT.actDocumentType = -3 and AT.atcDocumentSubType = 6)) then 1 ELSE NULL END) 'resolucion_adjudicacion'
FROM DCCPProcurement.dbo.prcRFBHeader AS LC
INNER JOIN [DCCPProcurement].[dbo].[prcBIDQuote] AS OFE ON rbhCode=bidRFBCode
INNER JOIN DCCPProcurement.dbo.prcRFBDate AS FEC ON LC.rbhCode = FEC.rbdRFBCode
LEFT JOIN DCCPPlatform.dbo.gblAttachment AS AT ON LC.rbhCode = AT.actDocumentNumber
WHERE [rbhEnterprise]<>''
AND YEAR(FEC.rbdOpeningDate) >= {anio_inf}
AND YEAR(FEC.rbdOpeningDate) < {anio_sup}
AND lower(LC.rbhOwnerName) != 'dirección de compras y contratación  pública' 
AND rbhEnterprise != 6945 
AND LC.rbhProcessSubType IN (1, 2, 3, 4,5,6,7,8,9,10,13,26,27,29, 23, 24, 25,  30) 
AND LC.rbhDocumentStatus in (8,9,10)
AND LC.rbhProcessType in( 1,2)
AND bidDocumentStatus IN (3, 4, 5)
GROUP BY LC.rbhEnterprise, LC.rbhCode,year(FEC.rbdOpeningDate), rbhExternalCode
ORDER BY LC.rbhEnterprise, rbhCode
'''

indicador17_1 = pd.read_sql(sqlindicador17_1,cnxn)
indicador17_1.loc[indicador17_1['rbhEnterprise'] == '7299', 'rbhEnterprise'] = '94459'


sqlindicador17_2 = f'''
SELECT DISTINCT rbhEnterprise, rbhCode, rbhExternalCode, year(FEC.rbdOpeningDate) AS 'Year_Publicacion',
COUNT(DISTINCT CASE WHEN AT.[atcIsActive]=1 AND ((lower(AT.atcSourceFileName) LIKE '%contrato%') or (lower(AT.atcDescription) LIKE '%contrato%') or (AT.actDocumentType = -3 and AT.atcDocumentSubType = 10)) then 1 ELSE NULL END) 'contrato'
FROM DCCPProcurement.dbo.prcRFBHeader AS LC
INNER JOIN [DCCPProcurement].[dbo].[prcBIDQuote] AS OFE ON rbhCode=bidRFBCode
INNER JOIN DCCPProcurement.dbo.prcRFBDate AS FEC ON LC.rbhCode = FEC.rbdRFBCode
LEFT JOIN DCCPPlatform.dbo.gblAttachment AS AT ON LC.rbhCode = AT.actDocumentNumber
WHERE [rbhEnterprise]<>''
AND YEAR(FEC.rbdOpeningDate) >= {anio_inf}
AND YEAR(FEC.rbdOpeningDate) < {anio_sup}
AND lower(LC.rbhOwnerName) != 'dirección de compras y contratación  pública' 
AND rbhEnterprise != 6945 
AND LC.rbhProcessSubType IN (2, 3, 4,5,6,7,8,9,10,13,26,27,29, 23, 24, 25,  30) 
AND LC.rbhDocumentStatus in (8,9,10)
AND LC.rbhProcessType in( 1,2)
AND bidDocumentStatus IN (3, 4, 5)
GROUP BY LC.rbhEnterprise, LC.rbhCode,year(FEC.rbdOpeningDate), rbhExternalCode
ORDER BY LC.rbhEnterprise, rbhCode
'''
indicador17_2 = pd.read_sql(sqlindicador17_2,cnxn)
indicador17_2.loc[indicador17_2['rbhEnterprise'] == '7299', 'rbhEnterprise'] = '94459'

# Cerramos la conexión
cnxn.close()

indicador17A = indicador17_1.merge(indicador17_2, how='left', left_on=['rbhEnterprise', 'rbhCode','Year_Publicacion', 'rbhExternalCode'], right_on=['rbhEnterprise', 'rbhCode','Year_Publicacion', 'rbhExternalCode'])
indicador17A['contrato'] = indicador17A['contrato'].fillna(0)

indicador17A['alguno'] = indicador17A['bases_licitacion'] + indicador17A['contrato'] + indicador17A['acta_evaluacion'] + indicador17A['resolucion_adjudicacion']
indicador17A['ninguno'] = 0
indicador17A.loc[indicador17A['alguno']==0, 'ninguno'] = 1
indicador17B = indicador17A.groupby(['rbhEnterprise', 'Year_Publicacion'])['ninguno'].sum().reset_index()
indicador17C = indicador17A.groupby(['rbhEnterprise', 'Year_Publicacion'])['rbhCode'].count().reset_index()
indicador17F = indicador17C.merge(indicador17B, how='left', left_on=['rbhEnterprise', 'Year_Publicacion'], right_on=['rbhEnterprise', 'Year_Publicacion'])
indicador17F['Porc_Sin_Doc'] = round(indicador17F['ninguno'] / indicador17F['rbhCode'] * 100, 2)
indicador17F.rename(columns={'Porc_Sin_Doc':'Indicador17'}, inplace=True)

# Carga de datos en MySQL
from sqlalchemy import create_engine
import pymysql

engine = create_engine('mysql+pymysql://server:server@192.168.2.2:3306/espaciopublico', echo = False)
indicador17F.to_sql(con=engine, name='indicador17', if_exists='replace', index=False)

# Término del "crónometro" y transformaciones a hora, minutos y segundos
tFinal = time.time()
tSegundosGenerico = tFinal - tInicio
tFormateado = str(datetime.timedelta(seconds=tSegundosGenerico))

# Resultados de la primera extracción
print("Terminado, se procesaron "+ str(len(indicador17F.index)/2) + " instituciones, en "+ tFormateado)



Terminado, se procesaron 855.5 instituciones, en 0:05:37.296016


### 18 Promedio del porcentaje de incumplimiento en la publicación de documentos obligatorios 

In [31]:
# Inicio del "cronómetro"
tInicio = time.time()

indicador18 = indicador17A.copy()
indicador18['Incumplimiento'] = 100 - ((indicador17A['alguno'] / 4) * 100)
indicador18F = indicador18.groupby(['rbhEnterprise', 'Year_Publicacion'])['Incumplimiento'].mean().reset_index()
indicador18F.rename(columns={'Incumplimiento':'Indicador18'}, inplace=True)

# Carga de datos en MySQL
from sqlalchemy import create_engine
import pymysql

engine = create_engine('mysql+pymysql://server:server@192.168.2.2:3306/espaciopublico', echo = False)
indicador18F.to_sql(con=engine, name='indicador18', if_exists='replace', index=False)

# Término del "crónometro" y transformaciones a hora, minutos y segundos
tFinal = time.time()
tSegundosGenerico = tFinal - tInicio
tFormateado = str(datetime.timedelta(seconds=tSegundosGenerico))

# Resultados de la primera extracción
print("Terminado, se procesaron "+ str(len(indicador18F.index)/2) + " instituciones, en "+ tFormateado)

Terminado, se procesaron 855.5 instituciones, en 0:00:00.230032


### 19 Porcentaje de licitaciones públicas y privadas con varias adjudicaciones 

In [32]:
# Inicio del "cronómetro"
tInicio = time.time()

# Apertura la conexión a SQL SERVER
cnxn = pyodbc.connect('DRIVER={ODBC Driver 17 for SQL Server};SERVER='+server+';DATABASE='+db+';UID='+user+';PWD='+passw)

# Envío de las querys y lectura de los resultados

# Listado de ocs
sqlindicador19A = f'''
SELECT rbhEnterprise, rbhCode, rbhExternalCode,year(FEC.rbdOpeningDate) AS 'Year_Publicacion', count(DISTINCT bidOrganization) AS 'N_Ganadores_Proveedor' 
FROM DCCPProcurement.dbo.prcRFBHeader AS LC
INNER JOIN [DCCPProcurement].[dbo].[prcBIDQuote] AS OFE ON rbhCode=bidRFBCode
INNER JOIN DCCPProcurement.dbo.prcRFBDate AS FEC ON LC.rbhCode = FEC.rbdRFBCode
WHERE [rbhEnterprise]<>''
AND YEAR(FEC.rbdOpeningDate) >= {anio_inf}
AND YEAR(FEC.rbdOpeningDate) < {anio_sup}
AND lower(LC.rbhOwnerName) != 'dirección de compras y contratación  pública' 
AND rbhEnterprise != 6945 
AND LC.rbhProcessSubType IN (1, 2, 3, 4,5,6,7,8,9,10,13,26,27,29, 23, 24, 25,  30) 
AND LC.rbhDocumentStatus in (8,9,10)
AND LC.rbhProcessType in( 1,2)
AND [bidIsAwarded]=1
GROUP BY rbhEnterprise,year(FEC.rbdOpeningDate), rbhCode, rbhExternalCode
ORDER BY count(DISTINCT bidOrganization) desc
'''

indicador19A = pd.read_sql(sqlindicador19A,cnxn)
indicador19A.loc[indicador19A['rbhEnterprise'] == '7299', 'rbhEnterprise'] = '94459'

sqlindicador19B = f'''
SELECT rbhEnterprise, rbhCode, rbhExternalCode,year(FEC.rbdOpeningDate) AS 'Year_Publicacion'
FROM DCCPProcurement.dbo.prcRFBHeader AS LC
INNER JOIN DCCPProcurement.dbo.prcRFBDate AS FEC ON LC.rbhCode = FEC.rbdRFBCode
WHERE [rbhEnterprise]<>''
AND YEAR(FEC.rbdOpeningDate) >= {anio_inf}
AND YEAR(FEC.rbdOpeningDate) < {anio_sup}
AND lower(LC.rbhOwnerName) != 'dirección de compras y contratación  pública' 
AND rbhEnterprise != 6945 
AND LC.rbhProcessSubType IN (1, 2, 3, 4,5,6,7,8,9,10,13,26,27,29, 23, 24, 25,  30) 
AND LC.rbhDocumentStatus in (8,9,10)
AND LC.rbhProcessType in (1,2)
'''

indicador19B = pd.read_sql(sqlindicador19B,cnxn)
indicador19B.loc[indicador19B['rbhEnterprise'] == '7299', 'rbhEnterprise'] = '94459'

sqlindicador19G = f'''
SELECT rbhEnterprise, rbhCode, rbhExternalCode,year(FEC.rbdOpeningDate) AS 'Year_Publicacion'
FROM DCCPProcurement.dbo.prcRFBHeader AS LC
INNER JOIN DCCPProcurement.dbo.prcRFBDate AS FEC ON LC.rbhCode = FEC.rbdRFBCode
WHERE [rbhEnterprise]<>''
AND YEAR(FEC.rbdOpeningDate) >= {anio_inf}
AND YEAR(FEC.rbdOpeningDate) < {anio_sup}
AND lower(LC.rbhOwnerName) != 'dirección de compras y contratación  pública' 
AND rbhEnterprise != 6945 
AND LC.rbhProcessSubType IN (2, 3, 4,5,6,7,8,9,10,13,26,27,29, 23, 24, 25,  30) 
AND LC.rbhDocumentStatus in (8,9,10)
AND LC.rbhProcessType in (1,2)
'''

indicador19G = pd.read_sql(sqlindicador19G,cnxn)
indicador19G.loc[indicador19G['rbhEnterprise'] == '7299', 'rbhEnterprise'] = '94459'

# Cerramos la conexión
cnxn.close()

indicador19A = indicador19A[indicador19A['N_Ganadores_Proveedor'] > 1]
indicador19C = indicador19A.groupby(['rbhEnterprise', 'Year_Publicacion'])['rbhCode'].count().reset_index()
indicador19D = indicador19B.groupby(['rbhEnterprise', 'Year_Publicacion'])['rbhCode'].count().reset_index()
indicador19F = indicador19D.merge(indicador19C, how='left', left_on=['rbhEnterprise', 'Year_Publicacion'], right_on=['rbhEnterprise', 'Year_Publicacion'])
indicador19F = indicador19F.rename(columns={'rbhCode_x':'N_Total_Licitaciones','rbhCode_y':'N_Licitaciones_Varios_Ganadores'})
indicador19F['porc'] = round(indicador19F['N_Licitaciones_Varios_Ganadores'] / indicador19F['N_Total_Licitaciones'] * 100,2)
indicador19F.rename(columns={'porc':'Indicador19'}, inplace=True)

# Carga de datos en MySQL
from sqlalchemy import create_engine
import pymysql

engine = create_engine('mysql+pymysql://server:server@192.168.2.2:3306/espaciopublico', echo = False)
indicador19F.to_sql(con=engine, name='indicador19', if_exists='replace', index=False)

# Término del "crónometro" y transformaciones a hora, minutos y segundos
tFinal = time.time()
tSegundosGenerico = tFinal - tInicio
tFormateado = str(datetime.timedelta(seconds=tSegundosGenerico))

# Resultados de la primera extracción
print("Terminado, se procesaron "+ str(len(indicador19F.index)/2) + " instituciones, en "+ tFormateado)



Terminado, se procesaron 855.5 instituciones, en 0:00:35.432111


### 20 Porcentaje de las licitaciones mayores o iguales a 100 UTM y menores a 1.000 UTM cuyo plazo de oferta fue acelerado

In [33]:
# Inicio del "cronómetro"
tInicio = time.time()

# Apertura la conexión a SQL SERVER
cnxn = pyodbc.connect('DRIVER={ODBC Driver 17 for SQL Server};SERVER='+server+';DATABASE='+db+';UID='+user+';PWD='+passw)

# Envío de las querys y lectura de los resultados

# Listado de ocs
sqlindicador20 = f'''
SELECT DISTINCT rbhEnterprise, rbhCode, rbhExternalCode, rbhProcessSubType, rpsAbbreviationCode, FEC.rbdOpeningDate,FEC.rbdTechnicalBidReception, year(FEC.rbdOpeningDate) AS 'Year_Publicacion', DATEDIFF(DAY,FEC.rbdOpeningDate,FEC.rbdTechnicalBidReception) 'dias'
FROM DCCPProcurement.dbo.prcRFBHeader AS LC
INNER JOIN [DCCPProcurement].[dbo].[prcBIDQuote] AS OFE ON LC.rbhCode = OFE.bidRFBCode
INNER JOIN DCCPProcurement.dbo.prcRFBDate AS FEC ON LC.rbhCode = FEC.rbdRFBCode 
LEFT JOIN [DCCPProcurement].[dbo].[prcRFBProcessSubType] ON rbhProcessSubType=rpsCode
WHERE [rbhEnterprise]<>''
AND YEAR(FEC.rbdOpeningDate) >= {anio_inf}
AND YEAR(FEC.rbdOpeningDate) < {anio_sup}
AND lower(LC.rbhOwnerName) != 'dirección de compras y contratación  pública' 
AND rbhEnterprise != 6945 
AND LC.rbhProcessSubType IN (1, 2, 3, 4,5,6,7,8,9,10,13,26,27,29, 23, 24, 25,  30) 
AND LC.rbhDocumentStatus in (8,9,10)
AND LC.rbhProcessType in( 1,2)
AND bidDocumentStatus IN (3, 4, 5)
'''

indicador20A = pd.read_sql(sqlindicador20,cnxn)
indicador20A.loc[indicador20A['rbhEnterprise'] == '7299', 'rbhEnterprise'] = '94459'

# Cerramos la conexión
cnxn.close()

indicador20B = indicador20A[indicador20A['rpsAbbreviationCode'].isin(['LE','CO'])]
indicador20C = indicador20B[(indicador20B['dias']<10) & (indicador20B['dias']>=5)]
indicador20D = indicador20B.groupby(['rbhEnterprise', 'Year_Publicacion'])['rbhCode'].count().reset_index()
indicador20E = indicador20C.groupby(['rbhEnterprise', 'Year_Publicacion'])['rbhCode'].count().reset_index()
indicador20F = indicador20D.merge(indicador20E, how='left', left_on=['rbhEnterprise', 'Year_Publicacion'], right_on=['rbhEnterprise', 'Year_Publicacion'])
indicador20F = indicador20F.rename(columns={'rbhCode_x':'N_Licitaciones','rbhCode_y':'N_Licitaciones_Menos5'})
indicador20F['Porc_Lic_Acel_10'] = round(indicador20F['N_Licitaciones_Menos5'] / indicador20F['N_Licitaciones'] * 100, 2)
indicador20F.rename(columns={'Porc_Lic_Acel_10':'Indicador20'}, inplace=True)

# Carga de datos en MySQL
from sqlalchemy import create_engine
import pymysql

engine = create_engine('mysql+pymysql://server:server@192.168.2.2:3306/espaciopublico', echo = False)
indicador20F.to_sql(con=engine, name='indicador20', if_exists='replace', index=False)

# Término del "crónometro" y transformaciones a hora, minutos y segundos
tFinal = time.time()
tSegundosGenerico = tFinal - tInicio
tFormateado = str(datetime.timedelta(seconds=tSegundosGenerico))

# Resultados de la primera extracción
print("Terminado, se procesaron "+ str(len(indicador20F.index)/2) + " instituciones, en "+ tFormateado)



Terminado, se procesaron 822.0 instituciones, en 0:00:18.533108


### 21 Porcentaje de las licitaciones mayores o iguales a 1.000 UTM y menores a 5.000 UTM cuyo plazo de oferta fue acelerado 

In [34]:
# Inicio del "cronómetro"
tInicio = time.time()

indicador21B = indicador20A[indicador20A['rpsAbbreviationCode'].isin(['LP','LQ', 'B2', 'H2'])]
indicador21C = indicador21B[(indicador21B['dias']<20) & (indicador21B['dias']>=10)]
indicador21D = indicador21B.groupby(['rbhEnterprise', 'Year_Publicacion'])['rbhCode'].count().reset_index()
indicador21E = indicador21C.groupby(['rbhEnterprise', 'Year_Publicacion'])['rbhCode'].count().reset_index()
indicador21F = indicador21D.merge(indicador21E, how='left', left_on=['rbhEnterprise', 'Year_Publicacion'], right_on=['rbhEnterprise', 'Year_Publicacion'])
indicador21F = indicador21F.rename(columns={'rbhCode_x':'N_Licitaciones','rbhCode_y':'N_Licitaciones_Menos20'})
indicador21F['Porc_MenosPlazo_20'] = round(indicador21F['N_Licitaciones_Menos20'] / indicador21F['N_Licitaciones'] * 100, 2)
indicador21F = indicador21F.fillna(0)
indicador21F.rename(columns={'Porc_MenosPlazo_20':'Indicador21'}, inplace=True)

# Carga de datos en MySQL
from sqlalchemy import create_engine
import pymysql

engine = create_engine('mysql+pymysql://server:server@192.168.2.2:3306/espaciopublico', echo = False)
indicador21F.to_sql(con=engine, name='indicador21', if_exists='replace', index=False)

# Término del "crónometro" y transformaciones a hora, minutos y segundos
tFinal = time.time()
tSegundosGenerico = tFinal - tInicio
tFormateado = str(datetime.timedelta(seconds=tSegundosGenerico))

# Resultados de la primera extracción
print("Terminado, se procesaron "+ str(len(indicador21F.index)/2) + " instituciones, en "+ tFormateado)

Terminado, se procesaron 683.0 instituciones, en 0:00:00.219096


### 22 Porcentaje de licitaciones sin bases de licitación

In [35]:
# Inicio del "cronómetro"
tInicio = time.time()

indicador22A = indicador17A[indicador17A['bases_licitacion'] == 0]
indicador22B = indicador19B.groupby(['rbhEnterprise', 'Year_Publicacion'])['rbhCode'].count().reset_index()
indicador22C = indicador22A.groupby(['rbhEnterprise', 'Year_Publicacion'])['rbhCode'].count().reset_index()
indicador22F = indicador22B.merge(indicador22C, how='left', left_on=['rbhEnterprise', 'Year_Publicacion'], right_on=['rbhEnterprise', 'Year_Publicacion'])
indicador22F = indicador22F.rename(columns={'rbhCode_x':'licitaciones','rbhCode_y':'sinbases'})
indicador22F['Porc_Publica_Bases'] = round(indicador22F['sinbases'] / indicador22F['licitaciones'] * 100 ,2)
indicador22F = indicador22F.fillna(0)
indicador22F.rename(columns={'Porc_Publica_Bases':'Indicador22'}, inplace=True)

# Carga de datos en MySQL

engine = create_engine('mysql+pymysql://server:server@192.168.2.2:3306/espaciopublico', echo = False)
indicador22F.to_sql(con=engine, name='indicador22', if_exists='replace', index=False)

# Término del "crónometro" y transformaciones a hora, minutos y segundos
tFinal = time.time()
tSegundosGenerico = tFinal - tInicio
tFormateado = str(datetime.timedelta(seconds=tSegundosGenerico))

# Resultados de la primera extracción
print("Terminado, se procesaron "+ str(len(indicador22F.index)/2) + " instituciones, en "+ tFormateado)

Terminado, se procesaron 855.5 instituciones, en 0:00:00.245937


### 23 Porcentaje de licitaciones sin respuesta a todas las preguntas del foro

In [36]:
# Inicio del "cronómetro"
tInicio = time.time()

# Apertura la conexión a SQL SERVER
cnxn = pyodbc.connect('DRIVER={ODBC Driver 17 for SQL Server};SERVER='+server+';DATABASE='+db+';UID='+user+';PWD='+passw)

# Envío de las querys y lectura de los resultados

# Listado de ocs
sqlindicador23 = f'''
SELECT DISTINCT rbhEnterprise, rbhCode, rbhExternalCode, year(FEC.rbdOpeningDate) AS 'Year_Publicacion', 
CASE WHEN ([biqID] IS NULL AND A.[Id] IS NULL) THEN 'Sin Preguntas'
ELSE 'Con Preguntas' END AS 'Preguntas',
[biqID],
CASE WHEN ([biqText] IS NOT NULL OR [biqText]<>'') AND ([rswText] IS NULL OR [rswText]='') THEN 1
ELSE 0 END AS 'No_Responde_Preguntas',
A.[Id] AS 'ID_Pregunta',
CASE WHEN (A.TextoForo IS NOT NULL OR cast(A.TextoForo as nvarchar(max))<>'') AND (B.TextoForo IS NULL OR cast(B.TextoForo as nvarchar(max))='') THEN 1
ELSE 0 END AS 'No_Responde_Preguntas_2',
[biqText] AS [biqText], [rswText] AS [rswText],  --DISTINCT en la organization es por si se hizo más de una oferta. Por ejemplo: 2712-91-LE12.
cast(A.TextoForo as nvarchar(max)) AS TextoForo_PRO, cast(B.TextoForo as nvarchar(max)) AS TextoForo_COM
FROM DCCPProcurement.dbo.prcRFBHeader AS LC
INNER JOIN [DCCPProcurement].[dbo].[prcBIDQuote] AS OFE ON rbhCode=bidRFBCode
INNER JOIN DCCPProcurement.dbo.prcRFBDate AS FEC ON LC.rbhCode = FEC.rbdRFBCode
LEFT JOIN [DCCPProcurement].[dbo].[prcBIDQuestion] AS PRE ON LC.rbhCode = [biqRFBCode]
LEFT JOIN [DCCPProcurement].[dbo].[prcRFBAnswer] AS RES ON [biqRFBCode]=[rswRFBCode] AND [biqID]=[rswbiqID]
LEFT JOIN [DCCPForo].[dbo].[ForoLicitacionProveedor] AS A ON LC.rbhCode = A.[LicitacionId]
LEFT JOIN [DCCPForo].[dbo].[ForoLicitacionComprador] AS B ON A.[Id]=B.[ForoLicitacionProveedorId]
WHERE [rbhEnterprise]<>''
AND YEAR(FEC.rbdOpeningDate) >= {anio_inf}
AND YEAR(FEC.rbdOpeningDate) < {anio_sup}
AND lower(LC.rbhOwnerName) != 'dirección de compras y contratación  pública' 
AND rbhEnterprise != 6945 
AND LC.rbhProcessSubType IN (1, 2, 3, 4,5,6,7,8,9,10,13,26,27,29, 23, 24, 25,  30) 
AND LC.rbhDocumentStatus in (8,9,10)
AND LC.rbhProcessType in( 1,2)
AND bidDocumentStatus IN (3, 4, 5) 
'''

indicador23A = pd.read_sql(sqlindicador23,cnxn)
indicador23A.loc[indicador23A['rbhEnterprise'] == '7299', 'rbhEnterprise'] = '94459'

# Cerramos la conexión
cnxn.close()

indicador23A = indicador23A[indicador23A['Preguntas'] == 'Con Preguntas']
indicador23A['Noresponde'] = indicador23A['No_Responde_Preguntas'] + indicador23A['No_Responde_Preguntas_2']
indicador23B = indicador23A.groupby(['rbhEnterprise','rbhCode','Year_Publicacion'])['Noresponde'].sum().reset_index()
indicador23C = indicador23B[indicador23B['Noresponde'] == 1]
indicador23D = indicador23C.groupby(['rbhEnterprise','Year_Publicacion'])['rbhCode'].count().reset_index()
indicador23E = indicador19B.groupby(['rbhEnterprise', 'Year_Publicacion'])['rbhCode'].count().reset_index()
indicador23F = indicador23E.merge(indicador23D, how='left', left_on=['rbhEnterprise', 'Year_Publicacion'], right_on=['rbhEnterprise', 'Year_Publicacion'])
indicador23F = indicador23F.rename(columns={'rbhCode_x':'Total_lic','rbhCode_y':'Sin_Respuesta'})
indicador23F['Porc_Sin_Respuesta'] = round(indicador23F['Sin_Respuesta'] / indicador23F['Total_lic'] * 100, 2)
indicador23F = indicador23F.fillna(0)
indicador23F.rename(columns={'Porc_Sin_Respuesta':'Indicador23'}, inplace=True)

# Carga de datos en MySQL
engine = create_engine('mysql+pymysql://server:server@192.168.2.2:3306/espaciopublico', echo = False)
indicador23F.to_sql(con=engine, name='indicador23', if_exists='replace', index=False)

# Término del "crónometro" y transformaciones a hora, minutos y segundos
tFinal = time.time()
tSegundosGenerico = tFinal - tInicio
tFormateado = str(datetime.timedelta(seconds=tSegundosGenerico))

# Resultados de la primera extracción
print("Terminado, se procesaron "+ str(len(indicador23F.index)/2) + " instituciones, en "+ tFormateado)



Terminado, se procesaron 855.5 instituciones, en 0:07:35.538171


### 24 Porcentaje de procedimientos sin acta de evaluación 

In [37]:
# Inicio del "cronómetro"
tInicio = time.time()

indicador24A = indicador17A.groupby(['rbhEnterprise', 'Year_Publicacion'])['acta_evaluacion'].sum().reset_index()
indicador24B = indicador19B.groupby(['rbhEnterprise', 'Year_Publicacion'])['rbhCode'].count().reset_index()
indicador24F = indicador24B.merge(indicador24A, how='left', left_on=['rbhEnterprise', 'Year_Publicacion'], right_on=['rbhEnterprise', 'Year_Publicacion'])
indicador24F['Porc_Publica_Acta_Evaluacion'] = round((1 - (indicador24F['acta_evaluacion'] / indicador24F['rbhCode']))* 100, 2)
indicador24F.rename(columns={'Porc_Publica_Acta_Evaluacion':'Indicador24'}, inplace=True)

# Carga de datos en MySQL
engine = create_engine('mysql+pymysql://server:server@192.168.2.2:3306/espaciopublico', echo = False)
indicador24F.to_sql(con=engine, name='indicador24', if_exists='replace', index=False)

# Término del "crónometro" y transformaciones a hora, minutos y segundos
tFinal = time.time()
tSegundosGenerico = tFinal - tInicio
tFormateado = str(datetime.timedelta(seconds=tSegundosGenerico))

# Resultados de la primera extracción
print("Terminado, se procesaron "+ str(len(indicador24F.index)/2) + " instituciones, en "+ tFormateado)

Terminado, se procesaron 855.5 instituciones, en 0:00:00.261063


### 25 Porcentaje de procedimientos sin resolución de adjudicación

In [38]:
# Inicio del "cronómetro"
tInicio = time.time()

indicador25A = indicador17A.groupby(['rbhEnterprise', 'Year_Publicacion'])['resolucion_adjudicacion'].sum().reset_index()
indicador25B = indicador19B.groupby(['rbhEnterprise', 'Year_Publicacion'])['rbhCode'].count().reset_index()
indicador25F = indicador25B.merge(indicador25A, how='left', left_on=['rbhEnterprise', 'Year_Publicacion'], right_on=['rbhEnterprise', 'Year_Publicacion'])
indicador25F['Porc_Publica_Resolucion_Adjudicacion'] = round((1 - (indicador25F['resolucion_adjudicacion'] / indicador25F['rbhCode']))* 100, 2)
indicador25F.rename(columns={'Porc_Publica_Resolucion_Adjudicacion':'Indicador25'}, inplace=True)

# Carga de datos en MySQL
engine = create_engine('mysql+pymysql://server:server@192.168.2.2:3306/espaciopublico', echo = False)
indicador25F.to_sql(con=engine, name='indicador25', if_exists='replace', index=False)

# Término del "crónometro" y transformaciones a hora, minutos y segundos
tFinal = time.time()
tSegundosGenerico = tFinal - tInicio
tFormateado = str(datetime.timedelta(seconds=tSegundosGenerico))

# Resultados de la primera extracción
print("Terminado, se procesaron "+ str(len(indicador25F.index)/2) + " instituciones, en "+ tFormateado)

Terminado, se procesaron 855.5 instituciones, en 0:00:00.263929


### 26 Porcentaje de procedimientos sin contrato

In [39]:
# Inicio del "cronómetro"
tInicio = time.time()

filter = indicador19G['rbhCode']

indicador26T = indicador17A.merge(filter, how='inner', left_on=['rbhCode'], right_on=['rbhCode'])
indicador26A = indicador26T.groupby(['rbhEnterprise', 'Year_Publicacion'])['contrato'].sum().reset_index()
indicador26B = indicador19G.groupby(['rbhEnterprise', 'Year_Publicacion'])['rbhCode'].count().reset_index()
indicador26F = indicador26B.merge(indicador26A, how='left', left_on=['rbhEnterprise', 'Year_Publicacion'], right_on=['rbhEnterprise', 'Year_Publicacion'])
indicador26F['PORC_SIN_CONTRATO'] = round((1 - (indicador26F['contrato'] / indicador26F['rbhCode']))* 100, 2)
indicador26F.rename(columns={'PORC_SIN_CONTRATO':'Indicador26'}, inplace=True)

# Carga de datos en MySQL
engine = create_engine('mysql+pymysql://server:server@192.168.2.2:3306/espaciopublico', echo = False)
indicador26F.to_sql(con=engine, name='indicador26', if_exists='replace', index=False)

# Término del "crónometro" y transformaciones a hora, minutos y segundos
tFinal = time.time()
tSegundosGenerico = tFinal - tInicio
tFormateado = str(datetime.timedelta(seconds=tSegundosGenerico))

# Resultados de la primera extracción
print("Terminado, se procesaron "+ str(len(indicador26F.index)/2) + " instituciones, en "+ tFormateado)

Terminado, se procesaron 839.0 instituciones, en 0:00:00.307138


### 27 Cambio en el porcentaje de contratos publicados por procedimiento

In [40]:
# Inicio del "cronómetro"
tInicio = time.time()

# Apertura la conexión a SQL SERVER
cnxn = pyodbc.connect('DRIVER={ODBC Driver 17 for SQL Server};SERVER='+server+';DATABASE='+db+';UID='+user+';PWD='+passw)

# Envío de las querys y lectura de los resultados

# Listado de ocs
sqlindicador27A = f'''
SELECT DISTINCT rbhEnterprise, rbhCode,  rbhExternalCode,year(FEC.rbdOpeningDate) AS 'Year_Publicacion',
COUNT(DISTINCT CASE WHEN AT.[atcIsActive]=1 AND ((lower(AT.atcSourceFileName) LIKE '%contrato%') or (lower(AT.atcDescription) LIKE '%contrato%') or (AT.actDocumentType = -3 and AT.atcDocumentSubType = 10)) then 1 ELSE NULL END) 'contrato'
FROM DCCPProcurement.dbo.prcRFBHeader AS LC
INNER JOIN [DCCPProcurement].[dbo].[prcBIDQuote] AS OFE ON rbhCode=bidRFBCode
INNER JOIN DCCPProcurement.dbo.prcRFBDate AS FEC ON LC.rbhCode = FEC.rbdRFBCode
LEFT JOIN DCCPPlatform.dbo.gblAttachment AS AT ON LC.rbhCode = AT.actDocumentNumber
WHERE [rbhEnterprise]<>''
AND YEAR(FEC.rbdOpeningDate) >= {anio_inf -1}
AND YEAR(FEC.rbdOpeningDate) < {anio_sup}
AND lower(LC.rbhOwnerName) != 'dirección de compras y contratación  pública' 
AND LC.rbhProcessSubType IN (2, 3, 4,5,6,7,8,9,10,13,26,27,29, 23, 24, 25,  30) 
AND LC.rbhDocumentStatus in (8,9,10)
AND LC.rbhProcessType in( 1,2)
AND bidDocumentStatus IN (3, 4, 5)
AND rbhEnterprise != 6945
GROUP BY LC.rbhEnterprise, LC.rbhCode,year(FEC.rbdOpeningDate), rbhExternalCode 
ORDER BY LC.rbhEnterprise, rbhCode
'''

indicador27A = pd.read_sql(sqlindicador27A,cnxn)
indicador27A.loc[indicador27A['rbhEnterprise'] == '7299', 'rbhEnterprise'] = '94459'

sqlindicador27B = f'''
SELECT rbhEnterprise, rbhCode, rbhExternalCode,year(FEC.rbdOpeningDate) AS 'Year_Publicacion'
FROM DCCPProcurement.dbo.prcRFBHeader AS LC
INNER JOIN DCCPProcurement.dbo.prcRFBDate AS FEC ON LC.rbhCode = FEC.rbdRFBCode
WHERE [rbhEnterprise]<>''
AND YEAR(FEC.rbdOpeningDate) >= {anio_inf -1}
AND YEAR(FEC.rbdOpeningDate) < {anio_sup}
AND lower(LC.rbhOwnerName) != 'dirección de compras y contratación  pública'
and rbhProcessSubType != 1
AND rbhEnterprise != 6945 
AND LC.rbhProcessSubType IN (2, 3, 4,5,6,7,8,9,10,13,26,27,29, 23, 24, 25,  30) 
AND LC.rbhDocumentStatus in (8,9,10)
AND LC.rbhProcessType in (1,2)
'''

indicador27B = pd.read_sql(sqlindicador27B,cnxn)
indicador27B.loc[indicador27B['rbhEnterprise'] == '7299', 'rbhEnterprise'] = '94459'

# Cerramos la conexión
cnxn.close()

indicador27C = indicador27A.groupby(['rbhEnterprise', 'Year_Publicacion'])['contrato'].sum().reset_index()
indicador27D = indicador27B.groupby(['rbhEnterprise', 'Year_Publicacion'])['rbhCode'].count().reset_index()
indicador27F = indicador27D.merge(indicador27C, how='inner', left_on=['rbhEnterprise', 'Year_Publicacion'], right_on=['rbhEnterprise', 'Year_Publicacion'])
indicador27F['PORC_SIN_CONTRATO'] = round((1 - (indicador27F['contrato'] / indicador27F['rbhCode']))* 100, 2)
indicador27F['PorcentajeSinContrato'] = indicador27F['PORC_SIN_CONTRATO'].diff()
indicador27F.rename(columns={'PorcentajeSinContrato':'Indicador27'}, inplace=True)

# Carga de datos en MySQL
engine = create_engine('mysql+pymysql://server:server@192.168.2.2:3306/espaciopublico', echo = False)
indicador27F.to_sql(con=engine, name='indicador27', if_exists='replace', index=False)

# Término del "crónometro" y transformaciones a hora, minutos y segundos
tFinal = time.time()
tSegundosGenerico = tFinal - tInicio
tFormateado = str(datetime.timedelta(seconds=tSegundosGenerico))

# Resultados de la primera extracción
print("Terminado, se procesaron "+ str(len(indicador27F.index)/2) + " instituciones, en "+ tFormateado)



Terminado, se procesaron 1260.5 instituciones, en 0:00:42.206286


### 28 Porcentaje de licitaciones que no cumplen con la normativa de publicación

In [41]:
# Inicio del "cronómetro"
tInicio = time.time()

indicador28 = indicador17A.copy()
indicador28['normativa'] = indicador28['bases_licitacion'] + indicador28['acta_evaluacion'] + indicador28['resolucion_adjudicacion']
indicador28.loc[indicador28['normativa'] == 3, 'cumple'] = 1
indicador28['cumple'] = indicador28['cumple'].fillna(0)

indicador28A = indicador28.groupby(['rbhEnterprise', 'Year_Publicacion'])['cumple'].sum().reset_index()
indicador28B = indicador19B.groupby(['rbhEnterprise', 'Year_Publicacion'])['rbhCode'].count().reset_index()
indicador28F = indicador28B.merge(indicador28A, how='left', left_on=['rbhEnterprise', 'Year_Publicacion'], right_on=['rbhEnterprise', 'Year_Publicacion'])
indicador28F['Perc_Dummy_Norm'] = round((1-(indicador28F['cumple'] / indicador28F['rbhCode']))* 100, 2)
indicador28F.rename(columns={'Perc_Dummy_Norm':'Indicador28'}, inplace=True)

# Carga de datos en MySQL
engine = create_engine('mysql+pymysql://server:server@192.168.2.2:3306/espaciopublico', echo = False)
indicador28F.to_sql(con=engine, name='indicador28', if_exists='replace', index=False)

# Término del "crónometro" y transformaciones a hora, minutos y segundos
tFinal = time.time()
tSegundosGenerico = tFinal - tInicio
tFormateado = str(datetime.timedelta(seconds=tSegundosGenerico))

# Resultados de la primera extracción
print("Terminado, se procesaron "+ str(len(indicador28F.index)/2) + " instituciones, en "+ tFormateado)

Terminado, se procesaron 855.5 instituciones, en 0:00:00.290144


### 29 Porcentaje de las licitaciones menores a 100 UTM cuyo plazo de oferta fue menor al plazo mínimo establecido por la ley de compras públicas 

In [42]:
# Inicio del "cronómetro"
tInicio = time.time()

indicador29B = indicador20A[indicador20A['rpsAbbreviationCode'].isin(['L1','E2'])]
indicador29C = indicador29B[(indicador29B['dias']<5)]
indicador29D = indicador29B.groupby(['rbhEnterprise', 'Year_Publicacion'])['rbhCode'].count().reset_index()
indicador29E = indicador29C.groupby(['rbhEnterprise', 'Year_Publicacion'])['rbhCode'].count().reset_index()
indicador29F = indicador29D.merge(indicador29E, how='left', left_on=['rbhEnterprise', 'Year_Publicacion'], right_on=['rbhEnterprise', 'Year_Publicacion'])
indicador29F = indicador29F.rename(columns={'rbhCode_x':'N_Licitaciones','rbhCode_y':'N_Licitaciones_MenosPlazo'})
indicador29F['Porc_MenosPlazo_5'] = round(indicador29F['N_Licitaciones_MenosPlazo'] / indicador29F['N_Licitaciones'] * 100, 2)
indicador29F = indicador29F.fillna(0)
indicador29F.rename(columns={'Porc_MenosPlazo_5':'Indicador29'}, inplace=True)

# Carga de datos en MySQL
engine = create_engine('mysql+pymysql://server:server@192.168.2.2:3306/espaciopublico', echo = False)
indicador29F.to_sql(con=engine, name='indicador29', if_exists='replace', index=False)

# Término del "crónometro" y transformaciones a hora, minutos y segundos
tFinal = time.time()
tSegundosGenerico = tFinal - tInicio
tFormateado = str(datetime.timedelta(seconds=tSegundosGenerico))

# Resultados de la primera extracción
print("Terminado, se procesaron "+ str(len(indicador29F.index)/2) + " instituciones, en "+ tFormateado)

Terminado, se procesaron 617.0 instituciones, en 0:00:00.203092


### 30 Porcentaje de las licitaciones mayores o iguales a 100 UTM y menores a 1.000 UTM cuyo plazo de oferta fue menor al plazo mínimo establecido por la ley de compras públicas

In [43]:
# Inicio del "cronómetro"
tInicio = time.time()

indicador30B = indicador20A[indicador20A['rpsAbbreviationCode'].isin(['LE','CO'])]
indicador30C = indicador30B[(indicador30B['dias']<10)]
indicador30D = indicador30B.groupby(['rbhEnterprise', 'Year_Publicacion'])['rbhCode'].count().reset_index()
indicador30E = indicador30C.groupby(['rbhEnterprise', 'Year_Publicacion'])['rbhCode'].count().reset_index()
indicador30F = indicador30D.merge(indicador30E, how='left', left_on=['rbhEnterprise', 'Year_Publicacion'], right_on=['rbhEnterprise', 'Year_Publicacion'])
indicador30F = indicador30F.rename(columns={'rbhCode_x':'N_Licitaciones','rbhCode_y':'N_Licitaciones_MenosPlazo'})
indicador30F['Porc_MenosPlazo_10'] = round(indicador30F['N_Licitaciones_MenosPlazo'] / indicador30F['N_Licitaciones'] * 100, 2)
indicador30F = indicador30F.fillna(0)
indicador30F.rename(columns={'Porc_MenosPlazo_10':'Indicador30'}, inplace=True)


# Carga de datos en MySQL
engine = create_engine('mysql+pymysql://server:server@192.168.2.2:3306/espaciopublico', echo = False)
indicador30F.to_sql(con=engine, name='indicador30', if_exists='replace', index=False)

# Término del "crónometro" y transformaciones a hora, minutos y segundos
tFinal = time.time()
tSegundosGenerico = tFinal - tInicio
tFormateado = str(datetime.timedelta(seconds=tSegundosGenerico))

# Resultados de la primera extracción
print("Terminado, se procesaron "+ str(len(indicador30F.index)/2) + " instituciones, en "+ tFormateado)

Terminado, se procesaron 822.0 instituciones, en 0:00:00.247013


### 31 Porcentaje de las licitaciones mayores o iguales a 1.000 UTM y menores a 5.000 UTM cuyo plazo de oferta fue menor al plazo mínimo establecido por la ley de compras públicas

In [44]:
# Inicio del "cronómetro"
tInicio = time.time()

indicador31B = indicador20A[indicador20A['rpsAbbreviationCode'].isin(['LP','LQ', 'B2', 'H2'])]
indicador31C = indicador31B[(indicador31B['dias']<20)]
indicador31D = indicador31B.groupby(['rbhEnterprise', 'Year_Publicacion'])['rbhCode'].count().reset_index()
indicador31E = indicador31C.groupby(['rbhEnterprise', 'Year_Publicacion'])['rbhCode'].count().reset_index()
indicador31F = indicador31D.merge(indicador31E, how='left', left_on=['rbhEnterprise', 'Year_Publicacion'], right_on=['rbhEnterprise', 'Year_Publicacion'])
indicador31F = indicador31F.rename(columns={'rbhCode_x':'N_Licitaciones','rbhCode_y':'N_Licitaciones_MenosPlazo'})
indicador31F['Porc_MenosPlazo_20'] = round(indicador31F['N_Licitaciones_MenosPlazo'] / indicador31F['N_Licitaciones'] * 100, 2)
indicador31F = indicador31F.fillna(0)
indicador31F.rename(columns={'Porc_MenosPlazo_20':'Indicador31'}, inplace=True)

# Carga de datos en MySQL
engine = create_engine('mysql+pymysql://server:server@192.168.2.2:3306/espaciopublico', echo = False)
indicador31F.to_sql(con=engine, name='indicador31', if_exists='replace', index=False)

# Término del "crónometro" y transformaciones a hora, minutos y segundos
tFinal = time.time()
tSegundosGenerico = tFinal - tInicio
tFormateado = str(datetime.timedelta(seconds=tSegundosGenerico))

# Resultados de la primera extracción
print("Terminado, se procesaron "+ str(len(indicador31F.index)/2) + " instituciones, en "+ tFormateado)

Terminado, se procesaron 683.0 instituciones, en 0:00:00.216003


### 32 Porcentaje de las licitaciones mayores o iguales a 5.000 UTM cuyo plazo de oferta fue menor al plazo mínimo establecido por la ley de compras públicas

In [45]:
# Inicio del "cronómetro"
tInicio = time.time()

indicador32B = indicador20A[indicador20A['rpsAbbreviationCode'].isin(['LR', 'I2'])]
indicador32C = indicador32B[(indicador32B['dias']<20)]
indicador32D = indicador32B.groupby(['rbhEnterprise', 'Year_Publicacion'])['rbhCode'].count().reset_index()
indicador32E = indicador32C.groupby(['rbhEnterprise', 'Year_Publicacion'])['rbhCode'].count().reset_index()
indicador32F = indicador32D.merge(indicador32E, how='left', left_on=['rbhEnterprise', 'Year_Publicacion'], right_on=['rbhEnterprise', 'Year_Publicacion'])
indicador32F = indicador32F.rename(columns={'rbhCode_x':'N_Licitaciones','rbhCode_y':'N_Licitaciones_MenosPlazo'})
indicador32F['Porc_MenosPlazo_30'] = round(indicador32F['N_Licitaciones_MenosPlazo'] / indicador32F['N_Licitaciones'] * 100, 2)
indicador32F = indicador32F.fillna(0)
indicador32F.rename(columns={'Porc_MenosPlazo_30':'Indicador32'}, inplace=True)

# Carga de datos en MySQL
engine = create_engine('mysql+pymysql://server:server@192.168.2.2:3306/espaciopublico', echo = False)
indicador32F.to_sql(con=engine, name='indicador32', if_exists='replace', index=False)

# Término del "crónometro" y transformaciones a hora, minutos y segundos
tFinal = time.time()
tSegundosGenerico = tFinal - tInicio
tFormateado = str(datetime.timedelta(seconds=tSegundosGenerico))

# Resultados de la primera extracción
print("Terminado, se procesaron "+ str(len(indicador32F.index)/2) + " instituciones, en "+ tFormateado)

Terminado, se procesaron 364.0 instituciones, en 0:00:00.148998


## Archivos para calcular indicadores

In [46]:
# importamos las librerias necesarias
import vertica_python
import os

userV = os.environ['vertuser']
passwV = os.environ['vertpass']
serverV = os.environ['verthost']
dbV = os.environ['vertdb']
portV = os.environ['vertport']

hostV = serverV
portV = portV
userV = userV
passV = passwV
dbV = dbV

# información de conexión a vertica
conn_info = {'host': hostV,
             'port': portV,
             'user': userV,
             'password': passV,
             'database': dbV,
             # default throw error on invalid UTF-8 results
             'unicode_error': 'strict',
             # SSL is disabled by default
             'ssl': False,
             # using server-side prepared statements is disabled by default
             'use_prepared_statements': False}

# conexión simple con cierre manual
cnxn = vertica_python.connect(**conn_info)
# sql y consulta
sql_servicios = '''SELECT cs.orgID , cm.id_Comp_Matriz , Replace(cm.Matriz_Comprador, '"', '') Servicio ,trim(m.Ministerio) Ministerio, cs.Municipios
from bimensual.comp_suc cs 
left join bimensual.comp_mat cm ON cs.id_matriz  = cm.id_Comp_Matriz 
left JOIN bimensual.Ministerios m ON cs.orgID = m.orgID '''

servicios = pd.read_sql(sql_servicios, cnxn)

redServ = servicios[['id_Comp_Matriz', 'Servicio' ]].drop_duplicates()
redServ['id_Comp_Matriz'] = redServ['id_Comp_Matriz'].astype('int')



In [47]:
#indicador 1
export1 = licOfertas.copy()
export1['rbhEnterprise'] = export1['rbhEnterprise'].astype('int')
export1 = export1.merge(redServ, how='left', left_on='rbhEnterprise', right_on='id_Comp_Matriz')
export1 = export1[['rbhEnterprise', 'rbhCode', 'rbhExternalCode', 'Year_Publicacion', 'N_Ofertas', 'Servicio']]
export1.to_csv('./datasets/Servicios-indicador1.csv')

In [48]:
#indicador 2
export2 = export1.copy()
export2.to_csv('./datasets/Servicios-indicador2.csv')


In [49]:
#indicador 3
export3 = licOfertasT.copy()
export3['rbhEnterprise'] = export3['rbhEnterprise'].astype('int')
export3 = export3.merge(redServ, how='left', left_on='rbhEnterprise', right_on='id_Comp_Matriz')
export3 = export3[['rbhEnterprise', 'rbhCode', 'rbhExternalCode', 'Year_Publicacion', 'N_Ofertas', 'Servicio']]
export3.to_csv('./datasets/Servicios-indicador3.csv')

In [50]:
#indicador 4
# sql y consulta
sql_proveedores = '''SELECT pm.id_Prov_Matriz, trim(replace(pm.Matriz_Prov, '"', '')) Proveedor
from bimensual.prov_mat pm'''

proveedores = pd.read_sql(sql_proveedores, cnxn)

export4 = dfNyMonto_Contratos_TC.copy()
export4['porSellerEnterprise'] = export4['porSellerEnterprise'].astype('int')
export4['porBuyerEnterprise'] = export4['porBuyerEnterprise'].astype('int')
export4 = export4.merge(proveedores, how= 'left',left_on='porSellerEnterprise', right_on='id_Prov_Matriz')
export4 = export4.merge(redServ, how= 'left',left_on='porBuyerEnterprise', right_on='id_Comp_Matriz')
export4 = export4.rename(columns={'porSourceDocumentNumber': 'idDocumentoCompra(Licitacion/OC)'})
export4 = export4[['porBuyerEnterprise', 'Servicio', 'porSellerEnterprise', 'Proveedor', 'Tipodeproceso', 'year', 'idDocumentoCompra(Licitacion/OC)', 'MontototalenCLP']]
export4['Servicio'] = export4['Servicio'].str.title()
export4['Proveedor'] = export4['Proveedor'].str.title()
export4.to_csv('./datasets/Servicios-indicador4.csv')



In [51]:
#indicador 5
export5 = export4.copy()
export5.to_csv('./datasets/Servicios-indicador5.csv')

In [52]:
#indicador 6
export6 = export4.copy()
export6.to_csv('./datasets/Servicios-indicador6.csv')

In [53]:
#indicador 7
export7 = export4.copy()
export7.to_csv('./datasets/Servicios-indicador7.csv')

In [54]:
#indicador 8
export8 = export4.copy()
export8.to_csv('./datasets/Servicios-indicador8.csv')

In [55]:
# indicador 9
export9 = export4.copy()
export9.to_csv('./datasets/Servicios-indicador9.csv')

In [56]:
# indicador 10
export10 = export4.copy()
export10.to_csv('./datasets/Servicios-indicador10.csv')

In [57]:
# indicador 11
sql_proveedoresO = '''SELECT orgID , trim(REPLACE(Nombre, '"', '')) Proveedor
FROM bimensual.prov_suc ps'''
provSuc = pd.read_sql(sql_proveedoresO, cnxn)

export11 = OPOfertas.copy()
export11['bidOrganization'] = export11['bidOrganization'].astype('int')
export11['rbhEnterprise'] = export11['rbhEnterprise'].astype('int')
export11 = export11.merge(provSuc, how='left', left_on='bidOrganization', right_on='orgID')
export11['Proveedor'] = export11['Proveedor'].str.title()
export11 = export11.merge(redServ, how= 'left',left_on='rbhEnterprise', right_on='id_Comp_Matriz')
export11['Servicio'] = export11['Servicio'].str.title()
export11 = export11[['rbhEnterprise', 'Servicio', 'bidOrganization', 'Proveedor', 'Year_Publicacion', 'N_Ofertas_Proveedor']]
export11.to_csv('./datasets/Servicios-indicador11.csv')



In [58]:
cnxnS = pyodbc.connect('DRIVER={ODBC Driver 17 for SQL Server};SERVER='+server+';DATABASE='+db+';UID='+user+';PWD='+passw)

In [59]:
# indicador 12
cnxnS = pyodbc.connect('DRIVER={ODBC Driver 17 for SQL Server};SERVER='+server+';DATABASE='+db+';UID='+user+';PWD='+passw)

sqlindicador13export = '''
SELECT rbhEnterprise,year(FEC.rbdOpeningDate) AS 'Year_Publicacion', bidOrganization, rbhCode, rbhExternalCode
FROM DCCPProcurement.dbo.prcRFBHeader AS LC
INNER JOIN [DCCPProcurement].[dbo].[prcBIDQuote] AS OFE ON rbhCode=bidRFBCode
INNER JOIN DCCPProcurement.dbo.prcRFBDate AS FEC ON LC.rbhCode = FEC.rbdRFBCode
WHERE [rbhEnterprise]<>''
AND YEAR(FEC.rbdOpeningDate) >= 2021
AND YEAR(FEC.rbdOpeningDate) < 2023
AND lower(LC.rbhOwnerName) != 'dirección de compras y contratación  pública' 
AND rbhEnterprise != 6945 
AND LC.rbhProcessSubType IN (1, 2, 3, 4,5,6,7,8,9,10,13,26,27,29, 23, 24, 25,  30) 
AND LC.rbhDocumentStatus in (8,9,10)
AND LC.rbhProcessType in( 1,2)
AND bidDocumentStatus IN (3, 4, 5)
AND [bidIsAwarded] is not null
'''

export12E = pd.read_sql(sqlindicador13export, cnxnS)

export12E['bidOrganization'] = export12E['bidOrganization'].astype('int')
export12E['rbhEnterprise'] = export12E['rbhEnterprise'].astype('int')
export12E = export12E.merge(provSuc, how='left', left_on='bidOrganization', right_on='orgID')
export12E['Proveedor'] = export12E['Proveedor'].str.title()
export12E = export12E.merge(redServ, how= 'left',left_on='rbhEnterprise', right_on='id_Comp_Matriz')
export12E['Servicio'] = export12E['Servicio'].str.title()
export12E = export12E[['rbhEnterprise', 'Servicio', 'bidOrganization', 'Proveedor', 'Year_Publicacion', 'rbhCode', 'rbhExternalCode']]
export12E.to_csv('./datasets/Servicios-indicador12.csv')



In [60]:
#indicador 13
export13 = export4.copy()
export13.to_csv('./datasets/Servicios-indicador13.csv')

In [61]:
#indicador 14
export14 = export4.copy()
export14.to_csv('./datasets/Servicios-indicador14.csv')

In [62]:
#indicador 15
sqlind15 = '''
SELECT rbhEnterprise, year(FEC.rbdOpeningDate) AS 'Year_Publicacion',bidOrganization, bidIsAwarded, rbhExternalCode
FROM DCCPProcurement.dbo.prcRFBHeader AS LC
INNER JOIN [DCCPProcurement].[dbo].[prcBIDQuote] AS OFE ON rbhCode=bidRFBCode
INNER JOIN DCCPProcurement.dbo.prcRFBDate AS FEC ON LC.rbhCode = FEC.rbdRFBCode
WHERE [rbhEnterprise]<>''
AND YEAR(FEC.rbdOpeningDate) >= 2021
AND YEAR(FEC.rbdOpeningDate) < 2023
AND lower(LC.rbhOwnerName) != 'dirección de compras y contratación  pública' 
AND rbhEnterprise != 6945 
AND LC.rbhProcessSubType IN (1, 2, 3, 4,5,6,7,8,9,10,13,26,27,29, 23, 24, 25,  30) 
AND LC.rbhDocumentStatus in (8,9,10)
AND LC.rbhProcessType in( 1,2)
AND bidDocumentStatus IN (3, 4, 5)
AND [bidIsAwarded] is not null
'''

indicador15 = pd.read_sql(sqlind15,cnxnS)

indicador15['bidOrganization'] = indicador15['bidOrganization'].astype('int')
indicador15['rbhEnterprise'] = indicador15['rbhEnterprise'].astype('int')
indicador15 = indicador15.merge(provSuc, how='left', left_on='bidOrganization', right_on='orgID')
indicador15['Proveedor'] = indicador15['Proveedor'].str.title()
indicador15 = indicador15.merge(redServ, how= 'left',left_on='rbhEnterprise', right_on='id_Comp_Matriz')
indicador15['Servicio'] = indicador15['Servicio'].str.title()
indicador15 = indicador15[['rbhEnterprise', 'Servicio', 'bidOrganization', 'Proveedor', 'Year_Publicacion', 'bidIsAwarded', 'rbhExternalCode']]
indicador15.to_csv('./datasets/Servicios-indicador15.csv')



In [63]:
#indicador 16
export16 = indicador17A.copy()
export16['rbhEnterprise'] = export16['rbhEnterprise'].astype('int')
export16 = export16.merge(redServ, how= 'left',left_on='rbhEnterprise', right_on='id_Comp_Matriz')
export16['Servicio'] = export16['Servicio'].str.title()
export16 = export16[['rbhEnterprise', 'Servicio', 'rbhCode', 'rbhExternalCode', 'Year_Publicacion', 'bases_licitacion', 'acta_evaluacion', 'resolucion_adjudicacion', 'contrato']]
export16.to_csv('./datasets/Servicios-indicador16.csv')

In [64]:
#indicador 17
export17 = export16.copy()
export17.to_csv('./datasets/Servicios-indicador17.csv')

In [65]:
#indicador 18
export18 = indicador15.copy()
export18.to_csv('./datasets/Servicios-indicador18.csv')

In [66]:
#indicador 19
export19 = indicador20A.copy()
export19.to_csv('./datasets/Servicios-indicador19.csv')

In [67]:
#indicador 20
export20 = indicador20A.copy()
export20.to_csv('./datasets/Servicios-indicador20.csv')

In [68]:
#indicador 21
export21 = export16.copy()
export21.to_csv('./datasets/Servicios-indicador21.csv')

In [69]:
#indicador 22
export22 = indicador23A.copy()
export22.to_csv('./datasets/Servicios-indicador22.csv')

In [70]:
#indicador 23
export23 = export16.copy()
export23.to_csv('./datasets/Servicios-indicador23.csv')

In [71]:
#indicador 24
export24 = export16.copy()
export24.to_csv('./datasets/Servicios-indicador24.csv')

In [72]:
#indicador 25
export25 = export16.copy()
export25.to_csv('./datasets/Servicios-indicador25.csv')

In [73]:
#indicador 27
export26 = indicador27A.copy()
export26['rbhEnterprise'] = export26['rbhEnterprise'].astype('int')
export26 = export26.merge(redServ, how= 'left',left_on='rbhEnterprise', right_on='id_Comp_Matriz')
export26['Servicio'] = export26['Servicio'].str.title()
export26 = export26[['rbhEnterprise', 'Servicio', 'rbhCode', 'rbhExternalCode', 'Year_Publicacion','contrato']]
export26.to_csv('./datasets/Servicios-indicador26.csv')

In [74]:
#indicador 27
export27 = export16.copy()
export27.to_csv('./datasets/Servicios-indicador27.csv')

In [75]:
#indicador 28
export28 = indicador20A.copy()
export28.to_csv('./datasets/Servicios-indicador28.csv')

In [76]:
#indicador 29
export29 = indicador20A.copy()
export29.to_csv('./datasets/Servicios-indicador29.csv')

In [77]:
#indicador 30
export30 = indicador20A.copy()
export30.to_csv('./datasets/Servicios-indicador30.csv')

In [78]:
#indicador 31
export31 = indicador20A.copy()
export31.to_csv('./datasets/Servicios-indicador31.csv')

In [79]:
# Término del "crónometro" y transformaciones a hora, minutos y segundos
tFinalT = time.time()
tSegundosGenerico = tFinalT - tInicioT
tFormateado = str(datetime.timedelta(seconds=tSegundosGenerico))

# Resultados de la primera extracción
print("El proceso duró "+ tFormateado)

El proceso duró 0:55:15.097644


In [80]:
cnxnS.close()