## Pipeline de Machine Learning

In [1]:
import sys

sys.path.append("../src")

In [2]:
import pickle

import numpy as np
import pandas as pd

Pyarrow will become a required dependency of pandas in the next major release of pandas (pandas 3.0),
(to allow more performant data types, such as the Arrow string type, and better interoperability with other libraries)
but was not found to be installed on your system.
If this would cause problems for you,
please provide us feedback at https://github.com/pandas-dev/pandas/issues/54466
        
  import pandas as pd


## Carregamento do Modelo

O carregamento do modelo é feito utilizando o pickle. A partir dos dados carregados, defino a função `predict`.

In [3]:
class Predictor:
    def __init__(self, model_file: str) -> None:
        with open(model_file, "rb") as f:
            model_data = pickle.load(f)
        self.model = model_data["model"]
        self.threshold = model_data["threshold"]
        self.input_features = model_data["input_features"]

    def predict(self, input_data: dict) -> dict:
        keys = set(input_data.keys())
        missing_keys = set(self.input_features) - keys
        if missing_keys:
            msg = "As seguintes chaves estão faltando na entrada: "
            msg += ", ".join(missing_keys)
            raise KeyError(msg)

        x = pd.DataFrame([input_data])
        y_pred_proba = self.model.predict_proba(x[self.input_features])[0, 1]
        return {
            "default": int(y_pred_proba > self.threshold),
        }

In [4]:
pred = Predictor("../model.pickle")

## Exemplos

Exemplos de utilização do preditor.

In [5]:
# Retirado do dataset original, índice 43431, default=0

pred.predict(
    {
        "default_3months": 0,
        "ioi_36months": 31.0625,
        "ioi_3months": 30.0,
        "valor_por_vencer": 20258.45,
        "valor_vencido": 0.0,
        "valor_quitado": 134339.27,
        "quant_protestos": 0,
        "valor_protestos": 0.0,
        "quant_acao_judicial": 0,
        "acao_judicial_valor": 0.0,
        "dividas_vencidas_valor": 0.0,
        "dividas_vencidas_qtd": 0,
        "falencia_concordata_qtd": 0,
        "tipo_sociedade": "sociedade empresaria limitada",
        "opcao_tributaria": "simples nacional",
        "atividade_principal": "com de equipamentos de informatica",
        "forma_pagamento": np.nan,
        "valor_total_pedido": 3157.4304819200124,
        "month": 7,
        "year": 2018,
    }
)

{'default': 0}

In [6]:
# Retirado do dataset original, índice 102904, default=1

pred.predict(
    {
        "default_3months": 0,
        "ioi_36months": 11.581651455484923,
        "ioi_3months": 18.0115805861392,
        "valor_por_vencer": 0.0,
        "valor_vencido": 0.0,
        "valor_quitado": 0.0,
        "quant_protestos": 0,
        "valor_protestos": 0.0,
        "quant_acao_judicial": 0,
        "acao_judicial_valor": 0.0,
        "dividas_vencidas_valor": 0.0,
        "dividas_vencidas_qtd": 0,
        "falencia_concordata_qtd": 0,
        "tipo_sociedade": "sociedade empresaria limitada",
        "opcao_tributaria": "simples nacional",
        "atividade_principal": "servicos de telefonia fixa",
        "forma_pagamento": "30/60/90/120/150/180/210/240/270/300",
        "valor_total_pedido": 22955.870059379937,
        "month": 4,
        "year": 2018,
    }
)

{'default': 1}