In [2]:
import requests
import pandas as pd
import tqdm
from dotenv import load_dotenv
import os

In [3]:
load_dotenv(dotenv_path='credentials.env')

api_key = os.getenv("API_KEY")
username = os.getenv("USER")

In [23]:
url = f'https://api-constancias-de-inscripcion.mrbot.com.ar/crear_usuario/?mail={username}'

In [3]:
res = requests.post(url)
res.json()

In [6]:
creditos_hist = pd.read_parquet('./input/creditos_hist.parquet')

In [7]:
identificaciones = creditos_hist['identificacion'].unique()
tramos = [identificaciones[i:i + 250] for i in range(0, len(identificaciones), 250)]

In [5]:
url = f'https://api-constancias-de-inscripcion.mrbot.com.ar/consulta_constancia_masiva/?usuario={username}&api_key={api_key}'

In [25]:
headers = {
    "accept": "application/json",
    "Content-Type": "application/json"
}

In [26]:
def resultados_constancias(response_json):
    datos = []
    for res in response_json['resultado']:
        datos_generales = res.get('datosGenerales') if res.get('datosGenerales') else None
        domicilio_fiscal = datos_generales.get('domicilioFiscal') if datos_generales else None
        codigo_postal = domicilio_fiscal.get('codPostal') if domicilio_fiscal else None
        provincia = domicilio_fiscal.get('descripcionProvincia') if domicilio_fiscal else None
        direccion = domicilio_fiscal.get('direccion') if domicilio_fiscal else None
        localidad = domicilio_fiscal.get('localidad') if domicilio_fiscal else None
        tipo_domicilio = domicilio_fiscal.get('tipoDomicilio') if domicilio_fiscal else None
        sucesion = datos_generales.get('esSucesion') if datos_generales else None
        estado_clave = datos_generales.get('estadoClave') if datos_generales else None
        cuit = datos_generales.get('idPersona') if datos_generales else None
        mes_cierre = datos_generales.get('mesCierre') if datos_generales else None
        razon_social = datos_generales.get('razonSocial') if datos_generales else None
        tipo_persona = datos_generales.get('tipoPersona') if datos_generales else None
        datos_monotributo = res.get('datosMonotributo') if res.get('datosMonotributo') else None
        datos_regimen = res.get('datosRegimenGeneral') if res.get('datosRegimenGeneral') else None
        datos_actividad = datos_regimen.get('actividad', []) if datos_regimen else None
        impuestos = datos_regimen.get('impuesto', []) if datos_regimen else None
        regimenes = datos_regimen.get('regimen', []) if datos_regimen else None
        
        fila = {
			'codPostal': codigo_postal,
			'cuit': cuit,
			'tipoPersona': tipo_persona,
			'provincia': provincia,
			'direccion': direccion,
			'localidad': localidad,
			'tipoDomicilio': tipo_domicilio,
			'esSucesion': sucesion,
			'estadoClave': estado_clave,
			'mesCierre': mes_cierre,
			'razonSocial': razon_social,
			'datosMonotributo': datos_monotributo,
		}
        if impuestos:
            for impuesto in impuestos:
                imp_descripcion = impuesto.get('descripcionImpuesto')
                if imp_descripcion:
                    fila[imp_descripcion] = True
        
        if regimenes:
            for regimen in regimenes:
                reg_descripcion = regimen.get('descripcionRegimen')
                tipo_regimen = regimen.get('tipoRegimen')
                if reg_descripcion:
                    fila[reg_descripcion] = tipo_regimen if tipo_regimen else True
        
        if datos_actividad:
            for act in datos_actividad:
                actividad = act.get('descripcionActividad') if act.get('descripcionActividad') else None
                id_act = act.get('idActividad') if act.get('idActividad') else None
                fila_actividad = fila.copy() 
                fila_actividad['actividad'] = actividad
                fila_actividad['idActividad'] = id_act
                datos.append(fila_actividad)
    return datos

In [19]:
todos_los_datos = []
session = requests.Session()

for tramo in tqdm.tqdm(tramos[13:]):
    payload = {
        "cuits": [str(cuit) for cuit in tramo]
    }
    response = session.post(url, json=payload, headers=headers)
    if response.status_code == 200:
        datos = resultados_constancias(response.json())
        todos_los_datos.extend(datos)
    elif response.status_code == 422:
        print("Error de validación para el tramo.")
        print("Detalles:", response.json())
    else:
        print(f"Error inesperado para el tramo. Código de estado: {response.status_code}")
        print("Detalles:", response.text)

  0%|          | 0/1298 [00:00<?, ?it/s]

In [15]:
datos = pd.DataFrame(todos_los_datos)

In [16]:
datos.to_parquet('./input/constancia_inscripcion.parquet', compression= 'gzip')