# Bot Licitaciones

El objetivo es desarrollar un bot que publique de una manera sencilla la información de las licitaciones del Estado. Para eso:

- [X] Entramos a comprar.gob.ar
- [X] Listamos las últimas licitaciones
- [X] Ingresamos a los detalles de cada una
- [X] Si hay cuadro comparativo, ingresamos para buscar el monto
- [ ] Ordenamos los datos
- [ ] Damos formato a la información
- [ ] Publicamos en Twitter

In [7]:
import os
import re
import pandas as pd
from time import sleep
from selenium.webdriver import Chrome
from selenium.webdriver.chrome.options import Options
from IPython.display import HTML, display

In [8]:
def init_chrome():
    """Funcion para iniciar Chrome"""
    
    chrome_options = Options()
    
    useragent = (
        "Mozilla/5.0 (X11; Linux x86_64) AppleWebKit/537.36 (KHTML, like "
        "Gecko) Chrome/73.0.3683.103 Safari/537.36"
    )
    
    # En windows C:\Users\<username>\AppData\Local\Google\Chrome\User Data\Default
    datadir = r'C:\Users\Matias\AppData\Local\Google\Chrome\User Data\Default'
    chrome_options.add_argument(f"user-data-dir={datadir}") if datadir else None
    chrome_options.add_argument(f"user-agent={useragent}") if useragent else None
    chrome_options.add_argument("start-maximized")
    # chrome_options.add_argument("--headless")
    chrome_options.add_experimental_option('useAutomationExtension', False)
    chrome_options.add_argument('disable-blink-features=AutomationControlled')
        
    driver = Chrome(
        executable_path=os.path.join(os.getcwd(), 'chromedriver.exe'),
        options=chrome_options,
        desired_capabilities=chrome_options.to_capabilities(),
    )
    return driver

In [9]:
def extract_data(th=0.5, verbose=True):
    """Para extraer tablas del HTML"""
    global driver
    dfs = pd.read_html(driver.page_source)
    data = []
    for df in dfs:
        if (df.isnull().sum().sum() / df.size > th):
            del df
            continue

        if verbose: display(HTML(df.to_html()))
        data.append(df.to_dict('list'))
    return data

In [243]:
def extract_panels():
    """Para las tablas en el otro formato"""
    tables = driver.find_elements_by_xpath('//div[contains(@class, "panel")]')

    tablas = []
    for t in tables:
        try:
            title = t.find_element_by_xpath('.//h4').text
        except:
            title=None
        # iteramos tabla
        datos_tabla = []
        for r in t.find_elements_by_xpath('.//div[contains(@class, "row")]'):
            cols = r.find_elements_by_xpath('.//div[contains(@class, "col")]')
            row = {}
            for c in cols:
                try:
                    dato = c.find_element_by_xpath('.//span').text
                except:
                    dato=None
                    continue
                try:
                    label = c.find_element_by_xpath('.//label').text
                except:
                    label = title # mm

                row[label]=dato        

            try:
                del row['']
            except:
                pass
            if len(row) > 0:
                datos_tabla.append(row)

        if len(datos_tabla)>0:
            tablas.append(datos_tabla)
    return tablas

In [244]:
url = 'https://comprar.gob.ar/'
pausa = 3

In [249]:
driver = init_chrome()
driver.get(url)
sleep(pausa)

# xpath cheatsheet https://devhints.io/xpath
driver.find_element_by_xpath('//*[contains(text(), "Ver todos")]').click()

# primera tabla con las 
df = pd.read_html(driver.page_source)[0]
df = df.drop([c for c in df.columns if 'Unnamed' in c], axis=1).iloc[:-2, :]
display(HTML(df.to_html()))
print('--'*50)

Unnamed: 0,Número de Proceso,Nombre descriptivo de Proceso,Tipo de Proceso,Fecha de Apertura,Estado,Unidad Ejecutora,Servicio Administrativo Financiero
0,46/18-0391-CDI21,SEGUNDA REPARACIÓN DE MOVILIDADES VARIAS,Contratación Directa,26/05/2021 07:00 Hrs.,Publicado,46/18 - 18° Chaco - DNV,604 - Dirección Nacional de Vialidad
1,38/35-0442-LPR21,"Servicio de revisión, recorrido, recarga de matafuegos de la ESNP Y ESBU",Licitación Privada,26/05/2021 08:00 Hrs.,Publicado,38/35 - Escuela Nacional de Pesca - Armada Argentina,379 - Estado Mayor General de la Armada
2,46/22-0380-CDI21,PROVISIÓN E INSTALACIÓN DE TORRE DE ANTENA DE 42 M CON BALIZADO Y PARARRAYOS,Contratación Directa,26/05/2021 08:00 Hrs.,Publicado,46/22 - 22° Formosa - DNV,604 - Dirección Nacional de Vialidad
3,40/22-0130-LPR21,MANTENIMIENTO Y REPARACIÓN DE TECHO,Licitación Privada,26/05/2021 08:00 Hrs.,Publicado,40/022 - UOC DIL,381 - Estado Mayor General de La Fuerza Aérea
4,14/3-0274-CDI21,"INSUMOS ELECTRICIDAD,FERRETERIA Y HERRAMIENTAS PARA TALLERES",Contratación Directa,26/05/2021 08:00 Hrs.,Publicado,14/3 - Centro Atómico Bariloche - CNEA,105 - Comisión Nacional de Energía Atómica
5,84/20-0735-LPR21,ADQUISICIÓN DE SERVICIO DE MANTENIMIENTO Y REPARACIÓN PARA PEUGEOT PARTNER,Licitación Privada,26/05/2021 08:00 Hrs.,Publicado,84/20 - Comando Brigada Mecanizada IX,374 - Estado Mayor General del Ejercito
6,74/26-0149-LPR21,ADQUISICIÓN DE PINTURAS Y LIJAS,Licitación Privada,26/05/2021 08:00 Hrs.,Publicado,74/26 - Parque Nacional Mburucuya,107 - Administración de Parques Nacionales
7,38/22-0111-LPU21,Adquisición de ferretería e insumos de electricidad para el Apostadero San Fernando.,Licitación Pública,26/05/2021 08:00 Hrs.,Publicado,38/22 - Secretaria General de la Armada,379 - Estado Mayor General de la Armada
8,84/34-0080-CDI21,ADQUISICION DE ARTICULOS DE PROTOCOLO Y CEREMONIAL -,Contratación Directa,26/05/2021 08:00 Hrs.,Publicado,84/34 - Regimiento de Granaderos a Caballo,374 - Estado Mayor General del Ejercito
9,84/34-0706-LPR21,ADQUISICION DE ART DE FERRETERIA PARA EL 2DO TRIM 2021,Licitación Privada,26/05/2021 08:00 Hrs.,Publicado,84/34 - Regimiento de Granaderos a Caballo,374 - Estado Mayor General del Ejercito


----------------------------------------------------------------------------------------------------


In [250]:
data = []
# para cada licitacion
for n in range(10):
    data_licitacion = []
    # seleccionamos licitacion
    elem = driver.find_elements_by_xpath('//tr/td[1]/a')[n]
    # inicializamos "base" con el id
    licitacion_id = elem.text
    elem.click()
    sleep(pausa)
    
    # vemos solo las tablas de la primera
    data_licitacion.extend(extract_data(verbose=True if n == 0 else False))    
    data_licitacion.extend(extract_panels())
    
    # dice monto?
    if 'Ofertas al proceso de compra' in driver.page_source:
        driver.find_element_by_xpath("//*[contains(text(), 'cuadro comparativo')]").click()
        data_licitacion.extend(extract_data(verbose=True if n == 0 else False))
        data_licitacion.extend(extract_panels())
        driver.back()
        
    posibles_tablas = [e.text for e in driver.find_elements_by_xpath('//h4') if len(e.text) > 0]
    data.append(data_licitacion)

    driver.back()
    sleep(pausa)
    print('--'*50)
    break

Unnamed: 0,Número solicitud de contratación,Estado,Unidad Ejecutora,Rubro,Tipo de urgencia,Fecha creación
0,46/18-672-SCO21,Autorizada en Proceso,46/18 - 18° Chaco - DNV,MANT. REPARACION Y LIMPIEZA,Normal,23/04/2021


Unnamed: 0,Número renglón,Objeto del gasto,Código del ítem,Descripción,Cantidad,Acciones
0,1,3.3.2,3.3.2-5266.21,"MANT. Y REP. DE VEHICULOS; DESCRIPCION: MANT. Y REP. DE VEHICULOS, CRITERIO SOCIAL: SIN","1,00 SERVICIO",
1,2,3.3.2,3.3.2-5266.21,"MANT. Y REP. DE VEHICULOS; DESCRIPCION: MANT. Y REP. DE VEHICULOS, CRITERIO SOCIAL: SIN","1,00 SERVICIO",
2,3,3.3.2,3.3.2-5266.21,"MANT. Y REP. DE VEHICULOS; DESCRIPCION: MANT. Y REP. DE VEHICULOS, CRITERIO SOCIAL: SIN","1,00 SERVICIO",
3,4,3.3.2,3.3.2-5266.21,"MANT. Y REP. DE VEHICULOS; DESCRIPCION: MANT. Y REP. DE VEHICULOS, CRITERIO SOCIAL: SIN","1,00 SERVICIO",
4,5,3.3.2,3.3.2-5266.21,"MANT. Y REP. DE VEHICULOS; DESCRIPCION: MANT. Y REP. DE VEHICULOS, CRITERIO SOCIAL: SIN","1,00 SERVICIO",
5,6,3.3.2,3.3.2-5266.21,"MANT. Y REP. DE VEHICULOS; DESCRIPCION: MANT. Y REP. DE VEHICULOS, CRITERIO SOCIAL: SIN","1,00 SERVICIO",


Unnamed: 0,Pliego de Bases y Condiciones Generales,Disposición aprobatoria,Fecha creación
0,IF-2019-98574914-APN-DNCBYS#JGM,DI-2016-01714551-APN-ONC#MM,05/11/2019


Unnamed: 0,Nº de requisito,Descripción,Tipo de documento
0,1,SEGÚN PLIEGO,


Unnamed: 0,Nº de requisito,Descripción,Tipo de documento
0,1,SEGÚN ESPECIFICACIONES TÉCNICAS,


Unnamed: 0,Nº de requisito,Descripción,Tipo de documento
0,1,"S/PLIEGO: ANEXO II: DECLARACIÓN JURADA DE OFERTA NACIONAL, DECLARACIÓN JURADA DE CUMPLIMIENTO DEL REGIMEN DE INTEGRACIÓN DE DISCAPACITADOS, INFORME DE BALANZA COMERCIAL, DECLARACIÓN JURADA DE INTERESES - DECRETO 202/2017 - PERSONA HUMANA O DECLARACIÓN JURADA DE INTERESES - DECRETO 202/2017 - PERSONA JURÍDICA SEGÚN CORRESPONDA.",Requiere adjuntar documentación electrónica
1,2,"EN EL MARCO DEL DECRETO N° 1.023 DEL 2001, SUS MODIFICATORIOS Y COMPLEMENTARIOS, EL DECRETO N° 1.030 DEL 2016 Y LA RESOLUCIÓN GENERAL N° 4164 del 2017 SE REQUIERE NO POSEER DEUDA LÍQUIDA Y EXIGIBLE O PREVISIONAL ANTE AFIP",
2,3,"Cuando el oferente sea una persona Jurídica, deberá indefectiblemente adjuntar en su oferta el Estatuto Societario Actualizado y el Poder del Firmante (Art. 25 del Pliego de Bases y Condiciones Particulares)",Requiere adjuntar documentación electrónica
3,4,"EL PROVEEDOR NO DEBE PRESENTAR SANCIONES LABORALES EN EL REPSAL CON EL OBJETO DE DAR CUMPLIMIENTO AL EL ART 13° DE LA LEY 26.940/2014, ART 28° INC. F DEL DECRETO 1023/01 Y ART 15° DEL PLIEGO DE COND. PARTICULARES",


Unnamed: 0,Documento,Número GDE,Número especial,Fecha vinculación,Opciones
0,Clausulas Particulares,PLIEG-2021-39047828-APN-DCHA#DNV,,04/05/2021,


Unnamed: 0,Nº penalidad,Descripción
0,1,SEGÚN ART 29° DEL DECRETO 1023/01 Y TITULO V DEL DECRETO 1030/16


Unnamed: 0,Nombre del Anexo,Tipo,Descripción,Acciones
0,IF-2021-34628592-APN-DCHA%DNV-EETT.pdf,Técnico,ANEXO DE ESPECIFICACIONES TÉCNICAS,


Unnamed: 0,Documento,Número GDE,Número especial,Fecha vinculación,Opciones
0,Autorización pliego,DI-2021-42725356-APN-DCHA#DNV,DI-2021-84-DCHA#DNV,14/05/2021,
1,Autorización llamado,DI-2021-42725356-APN-DCHA#DNV,DI-2021-84-DCHA#DNV,14/05/2021,


----------------------------------------------------------------------------------------------------


In [251]:
data

[[{'Número solicitud de contratación': ['46/18-672-SCO21'],
   'Estado': ['Autorizada en Proceso'],
   'Unidad Ejecutora': ['46/18 - 18° Chaco - DNV'],
   'Rubro': ['MANT. REPARACION Y LIMPIEZA'],
   'Tipo de urgencia': ['Normal'],
   'Fecha creación': ['23/04/2021']},
  {'Número renglón': [1, 2, 3, 4, 5, 6],
   'Objeto del gasto': ['3.3.2', '3.3.2', '3.3.2', '3.3.2', '3.3.2', '3.3.2'],
   'Código del ítem': ['3.3.2-5266.21',
    '3.3.2-5266.21',
    '3.3.2-5266.21',
    '3.3.2-5266.21',
    '3.3.2-5266.21',
    '3.3.2-5266.21'],
   'Descripción': ['MANT. Y REP. DE VEHICULOS; DESCRIPCION: MANT. Y REP. DE VEHICULOS, CRITERIO SOCIAL: SIN',
    'MANT. Y REP. DE VEHICULOS; DESCRIPCION: MANT. Y REP. DE VEHICULOS, CRITERIO SOCIAL: SIN',
    'MANT. Y REP. DE VEHICULOS; DESCRIPCION: MANT. Y REP. DE VEHICULOS, CRITERIO SOCIAL: SIN',
    'MANT. Y REP. DE VEHICULOS; DESCRIPCION: MANT. Y REP. DE VEHICULOS, CRITERIO SOCIAL: SIN',
    'MANT. Y REP. DE VEHICULOS; DESCRIPCION: MANT. Y REP. DE VEHICULO

# Notas

- Ver clasificadas como COVID  
- Objeto  
- Organismos  
- Estandarizar la información en una estructura (obj, monto, a quien...) 
- Humanizarlo (NLG, y personaje): emojis? personalidad, marca, identidad digital
- Check moneda == peso


- https://www.buenosairescompras.gob.ar/