In [1]:
import pandas as pd
import numpy as np
from datetime import datetime
from pydantic import BaseModel
from typing import Dict, List, Optional

#### Explicação

In [2]:
class User(BaseModel):
    id: int
    name: str = 'John Doe'
    signup_ts: Optional[datetime] = None
    friends: List[int] = []

In [3]:
external_data = {
    'id': 123,
    #'signup_ts': '2019-06-01 12:22',
    'friends': [1, '2', b'3'],
}

user = User(**external_data)

#### Como aplicar

In [4]:
dados = pd.read_table("../datasets/Potencial_Novos_Clientes.txt",
                      sep="\t",
                      header=0)
dados.head()

Unnamed: 0,COD_CARTAO,IDADE_CLIENTE,RENDA_MENSAL_CLIENTE,BEHAVIOUR_SCORE_CLIENTE,QTD_TRANSACOES_3M,QTD_ITENS_3M,VALOR_GASTO_3M,TICKET_MEDIO_3M,FLAG_ELETRONICOS_3M,SATISFACAO_ULTIMA_COMPRA,VALOR_GASTO_PROX_12M
0,212394,22,1500,52,2,4,802,401.0,0,01_Muito_Satisfeito,226
1,279177,29,1800,94,5,5,1384,276.8,1,03_Neutro,2786
2,291430,36,1500,89,5,6,1610,322.0,1,Nao_Respondeu,3737
3,176612,43,1500,48,3,4,836,278.67,0,01_Muito_Satisfeito,1162
4,223092,28,12090,89,4,5,1318,329.5,0,Nao_Respondeu,2699


In [5]:
# Variáveis explicativas quantitativas (deixar vazio [] caso não haja nenhuma)
lista_X_quanti = ['IDADE_CLIENTE',
                  'RENDA_MENSAL_CLIENTE',
                  'BEHAVIOUR_SCORE_CLIENTE',
                  'QTD_TRANSACOES_3M',
                  'QTD_ITENS_3M',
                  'VALOR_GASTO_3M',
                  'TICKET_MEDIO_3M']

# Variáveis explicativas qualitativas (deixar vazio [] caso não haja nenhuma)
lista_X_quali = ['FLAG_ELETRONICOS_3M',
                 'SATISFACAO_ULTIMA_COMPRA']

In [6]:
X = dados[lista_X_quanti + lista_X_quali]
#X['FLAG_ELETRONICOS_3M'] = X['FLAG_ELETRONICOS_3M'].to_string()

In [7]:
class TrainDataSchema(BaseModel):
    """
    Data Input schema
    """
    IDADE_CLIENTE: int
    RENDA_MENSAL_CLIENTE: float
    BEHAVIOUR_SCORE_CLIENTE: float
    QTD_TRANSACOES_3M: float
    QTD_ITENS_3M: float
    VALOR_GASTO_3M: float
    TICKET_MEDIO_3M: float
    FLAG_ELETRONICOS_3M: int
    SATISFACAO_ULTIMA_COMPRA: str

In [8]:
class MultipleDataSchema(BaseModel):
    inputs: List[TrainDataSchema]

In [9]:
MultipleDataSchema(
    inputs=X.replace({np.nan: None}).to_dict(orient="records")
)

MultipleDataSchema(inputs=[TrainDataSchema(IDADE_CLIENTE=22, RENDA_MENSAL_CLIENTE=1500.0, BEHAVIOUR_SCORE_CLIENTE=52.0, QTD_TRANSACOES_3M=2.0, QTD_ITENS_3M=4.0, VALOR_GASTO_3M=802.0, TICKET_MEDIO_3M=401.0, FLAG_ELETRONICOS_3M=0, SATISFACAO_ULTIMA_COMPRA='01_Muito_Satisfeito'), TrainDataSchema(IDADE_CLIENTE=29, RENDA_MENSAL_CLIENTE=1800.0, BEHAVIOUR_SCORE_CLIENTE=94.0, QTD_TRANSACOES_3M=5.0, QTD_ITENS_3M=5.0, VALOR_GASTO_3M=1384.0, TICKET_MEDIO_3M=276.8, FLAG_ELETRONICOS_3M=1, SATISFACAO_ULTIMA_COMPRA='03_Neutro'), TrainDataSchema(IDADE_CLIENTE=36, RENDA_MENSAL_CLIENTE=1500.0, BEHAVIOUR_SCORE_CLIENTE=89.0, QTD_TRANSACOES_3M=5.0, QTD_ITENS_3M=6.0, VALOR_GASTO_3M=1610.0, TICKET_MEDIO_3M=322.0, FLAG_ELETRONICOS_3M=1, SATISFACAO_ULTIMA_COMPRA='Nao_Respondeu'), TrainDataSchema(IDADE_CLIENTE=43, RENDA_MENSAL_CLIENTE=1500.0, BEHAVIOUR_SCORE_CLIENTE=48.0, QTD_TRANSACOES_3M=3.0, QTD_ITENS_3M=4.0, VALOR_GASTO_3M=836.0, TICKET_MEDIO_3M=278.67, FLAG_ELETRONICOS_3M=0, SATISFACAO_ULTIMA_COMPRA='01_Mu