In [7]:
import requests
from requests.adapters import HTTPAdapter
from requests.packages.urllib3.util.ssl_ import create_urllib3_context
import urllib3
from bs4 import BeautifulSoup
import pandas as pd
import datetime as dt
import os
import argparse
import re
import sys

In [8]:
REINTENTOS = 20
TIMEOUT = 30
BASE_URL = "https://www.sicoes.gob.bo/portal"
SICOES_CIPHERS = "AES256-SHA"

In [9]:
def iniciarSesion(conexion: requests.sessions.Session, headers: dict, data: dict):
    """Una consulta para comenzar o reiniciar el intercambio con SICOES"""
    respuesta = conexion.get(
        BASE_URL + "/contrataciones/busqueda/convocatorias.php?tipo=convNacional",
        headers=headers,
        timeout=TIMEOUT,
        verify=False,
    )
    return mantenerSesion(data, respuesta)


def mantenerSesion(data: dict, response: requests.models.Response):
    """Actualiza los parámetros que mantienen una sesión"""
    parametros_sesion = ["B903A6B7", "varSesionCli"]

    html = BeautifulSoup(response.text, "html.parser")

    for parametro in parametros_sesion:
        valor = html.select(f"input[name={parametro}]")
        if len(valor) > 0:
            data[parametro] = valor[0]["value"]

    return data

In [10]:
def iniciarDescarga():
    """
    Pasos antes de descargar datos de convocatorias:
    - Crea una conexión para reutilizar en cada consulta.
    - Define un estado inicial para headers y datos de consulta.
    - Define el día de consulta desde el argumento --dia o , por defecto, el día de ayer.
    Retorna estos valores para futuras consultas y procesos.
    """

    class adaptadorSicoes(HTTPAdapter):
        """
        Un adaptador para realizar consultas con el cipher anticuado que utiliza SICOES.
        """

        def __init__(self, *args, **kwargs):
            self.ssl_context = create_urllib3_context(ciphers=SICOES_CIPHERS)
            self.ssl_context.check_hostname = False
            super().__init__(*args, **kwargs)

        def _add_ssl_context(self, *args, **kwargs):
            kwargs["ssl_context"] = self.ssl_context
            return super().init_poolmanager(*args, **kwargs)

        init_poolmanager = _add_ssl_context
        proxy_manager_for = _add_ssl_context

    def dataInicial():
        """
        Valores iniciales para datos de consulta.
        """

        return {
            "entidad": "",
            "codigoDpto": "",
            "cuce1": "",
            "cuce2": "",
            "cuce3": "",
            "cuce4": "",
            "cuce5": "",
            "cuce6": "",
            "objetoContrato": "",
            "codigoModalidad": "",
            "r1": "",
            "codigoContrato": "",
            "nroContrato": "",
            "codigoNormativa": "",
            "montoDesde": "",
            "montoHasta": "",
            "publicacionDesde": "",
            "publicacionHasta": "",
            "presentacionPropuestasDesde": "",
            "presentacionPropuestasHasta": "",
            "desiertaDesde": "",
            "desiertaHasta": "",
            "subasta": "",
            "personaContDespliegue": "on",
            "nomtoGarDespliegue": "option2",
            "costoPlieDespliegue": "option3",
            "arpcDespliegue": "option3",
            "fechaReunionDespliegue": "option1",
            "fechaAdjudicacionDespliegue": "option2",
            "dptoDespliegue": "option3",
            "normativaDespliegue": "option3",
            "tipo": "Avanzada",
            "operacion": "convNacional",
            "autocorrector": "",
            "nroRegistros": "10",
            "draw": "1",
            "start": "0",
            "length": "10",
            "captcha": "",
        }

    def headersIniciales():
        """Valores iniciales para headers de consulta."""
        return {
            "User-Agent": "Mozilla/5.0 (X11; Linux x86_64) AppleWebKit/537.36 (KHTML, like Gecko)",
            "Referer": "https://www.sicoes.gob.bo/portal/index.php",
        }

    def diaConsulta(data):
        """
        Define el día de consulta desde el argumento --dia o, por defecto, el día de ayer.
        """

        parametros_fecha = ["publicacionDesde", "publicacionHasta"]

        # parser = argparse.ArgumentParser()
        # parser.add_argument(
        #     "--dia", required=False, type=str, help="Fecha de Publicación"
        # )
        # args = parser.parse_args()

        # if args.dia:
        #     dia = dt.datetime.strptime(args.dia, "%Y-%m-%d")
        # else:
        dia = dt.datetime.now() - dt.timedelta(days=1)

        for parametro in parametros_fecha:
            data[parametro] = dia.strftime("%d/%m/%Y")

        print(f"Convocatorias para el {dia.strftime("%Y-%m-%d")}")

        return dia, data

    # Utiliza el adaptador de SICOES en todas las consultas de red
    # y deshabilita advertencias para hacer consultas no cifradas.
    conexion = requests.Session()
    conexion.mount("http://", adaptadorSicoes(max_retries=REINTENTOS))
    conexion.mount("https://", adaptadorSicoes(max_retries=REINTENTOS))
    urllib3.disable_warnings()

    # Inicializa headers y datos de consulta.
    headers = headersIniciales()
    data = dataInicial()

    # Inicializa la sesión en SICOES.
    data = iniciarSesion(conexion, headers, data)

    # Define el día de consulta.
    dia, data = diaConsulta(data)

    # Retorna estos valores para futuras consultas y procesos.
    return conexion, headers, data, dia

In [14]:
conexion, headers, data, dia = iniciarDescarga()

usage: ipykernel_launcher.py [-h] [--dia DIA]
ipykernel_launcher.py: error: unrecognized arguments: -f /home/m/.local/share/jupyter/runtime/kernel-59331a05-4780-4b77-9608-8571115dff50.json


SystemExit: 2

  warn("To exit: use 'exit', 'quit', or Ctrl-D.", stacklevel=1)


In [15]:
%tb

SystemExit: 2