# Implementando uma máquina de estados

### Exercício 1

Vamos implementar uma máquina de estados como no diagrama abaixo. Este exercício é importante para a fixação de alguns conceitos da linguagem **Python** que serão necessários para o correto aproveitamento das demais atividades do curso.

![title](https://www.thiengo.com.br/img/post/normal/f8vu2jt9hh2fcendvulf6qb7t2528cd4c8ac16a31e05ff7bb569678aa3.png)

In [None]:
class MaquinaEstados():

    def __init__(self, refrigerantes=0):
        self.refrigerantes = refrigerantes
    
    def sem_moeda(self, moeda=False):
        if moeda:
            if self.refrigerantes <= 0:
                self.sem_refrigerante()
            else:
                print('Inseriu Moeda')
                self.com_moeda()
        else:
            print('Nenhuma Moeda')

    def com_moeda(self):
        print('Despejar!')
        self.venda()
    
    def venda(self):
        print('Venda realizada')
        self.refrigerantes -= 1
        if self.refrigerantes > 0:
            self.sem_moeda()
        else:
            self.sem_refrigerante()
    
    def sem_refrigerante(self):
        print('Sem refrigerante')
        
    def inicio(self, moeda=False):
        self.sem_moeda(moeda)

In [None]:
maq = MaquinaEstados(3)

In [None]:
maq.inicio(True)

## Rotina tratamento de dados

In [2]:
'perdizes'.upper()

'PERDIZES'

Temos que pensar que da mesma maneira que trabalhamos uma base para o desenvolvimento de qualquer tipo de modelo, também precisamos trabalhar os dados em que este modelo será responsável por responder.

Não há motivos em ter todo o trabalho de desenvolvimento de inteligência aplicada a tomada de decisão, se o trabalho não for utilizado em um ambiente produtivo.

Existem muitas formas de servir um modelo baseado em IA, uma delas é através de um serviço web. Este é padrão que vamos estudar hoje.

Imagine que nosso modelo, após o período de treinamento, é disponibilizado em um servidor web. Este servidor aguarda receber um pedido de processamento de informação.

Este pedido é realizado através de um método POST, onde um json com os dados de entrada é esperado pelo serviço na estrutura descrita abaixo:

```js
{
    "unidade" : "PERDIZES",
    "dt_agendamento" : "Dia Normal",
    "mes" : "Dezembro",
    "dia_da_semana" : "Terça",
    "periodo_do_dia" : "Manha",
    "fonte_pagadora" : "Convenio",
    "sexo" : "Masculino",
    "exame" : "Teste Ergometrico",
    "area" : "METODOS GRAFICOS",
    "idade" : "47",
    "bairro" : "TAMBORE",
    "cidade" : "SANTANA DE PARNAIBA",
    "estado" : "SP"
}
```

O cliente espera que o serviço responda a previsão do modelo com os dados fornecidos, essa resposta será enviada da mesma maneira seguindo a estrutura abaixo:

```js
{
    "model_response" : 0
}
```

Se o cliente souber como interpretar a resposta, temos então uma arquitetura de request e response definidos.

É importante que no momento do treinamento deste modelo, nós tenhamos o cuidado de pensar em como vamos disponibilizar essas informações e também como vamos processar os dados que recebemos.

O objetivo desta atividade é demonstrar alguns cuidados que devemos ter com o preparo da base pensando nesses pontos.

#### Lendo um arquivo Excel

Para modelar o problema recebemos da área de negócios um arquivo em excel com os dados de agendamento de exames.

In [3]:
import pandas as pd

In [6]:
data = pd.read_excel('https://github.com/pgiaeinstein/otmz-mlp/raw/master/saida_aula.xlsx')
data.head(15)

Unnamed: 0,Unidade,Data Agendameto,Mês,Dia da Semana,Período do dia,Fonte Pagadora,Sexo,Exame,Área,Idade,Bairro,Cidade,Estado,Status
0,MORUMBI,Dia Normal,Outubro,Terça,Manha,Particular,Feminino,Ud Estudo Urodinam Completo,URODINAMICA,94,CENTRO,SAO ROQUE,SP,Veio
1,MORUMBI,Dia Normal,Maio,Terça,Tarde,Convenio,Masculino,Teste Ergometrico,METODOS GRAFICOS,72,HIGIENOPOLIS,SAO PAULO,SP,Veio
2,BRASIL,Dia Normal,Marco,Quarta,Manha,Convenio,Masculino,Ecocardiografia Doppler,ECOCARDIOGRAFIA,29,VILA DA SAUDE,SAO PAULO,SP,Veio
3,ALPHAVILLE,Dia Normal,Outubro,Segunda,Tarde,Convenio,Masculino,Ecocardiografia Doppler,ECOCARDIOGRAFIA,59,VILA MORUMBI,SAO PAULO,SP,Veio
4,BRASIL,Dia Normal,Julho,Quinta,Manha,Convenio,Masculino,Teste Ergometrico,METODOS GRAFICOS,40,COLINAS DA ANHANGUERA,SANTANA DE PARNAIBA,SP,Veio
5,MORUMBI,Dia Normal,Marco,Sexta,Manha,Convenio,Masculino,Ecocardiografia Doppler,ECOCARDIOGRAFIA,40,MORADA DOS PINHEIROS (ALDEIA DA SERRA),SANTANA DE PARNAIBA,SP,Veio
6,MORUMBI,Dia Normal,Julho,Quarta,Manha,Convenio,Masculino,Ecocardiografia Doppler,ECOCARDIOGRAFIA,52,JARDIM INDAIA,EMBU,SP,Veio
7,MORUMBI,Dia Normal,Julho,Quinta,Tarde,Particular,Masculino,Ecocardiografia Doppler,ECOCARDIOGRAFIA,63,VILA ANDRADE,SAO PAULO,SP,Nao veio
8,MORUMBI,Dia Normal,Janeiro,Quarta,Manha,Particular,Masculino,Eletroneuromiografia dois membros,ECOCARDIOGRAFIA,54,VILA ROMANA,SAO PAULO,SP,Nao veio
9,MORUMBI,Dia Normal,Julho,Quarta,Manha,Funcionario,Masculino,Eletrocardiograma,METODOS GRAFICOS,43,VILA PROGREDIOR,SAO PAULO,SP,Veio


Note que o nome das colunas é diferente do padrão de estrutura que adotamos acima, vamos corrigir isso para não cometer nenhum erro no futuro:

In [8]:
data.columns

Index(['Unidade', 'Data Agendameto', 'Mês', 'Dia da Semana', 'Período do dia',
       'Fonte Pagadora', 'Sexo', 'Exame', 'Área', 'Idade', 'Bairro', 'Cidade',
       'Estado', 'Status'],
      dtype='object')

In [10]:
data.Data_Agendamento

Index(['unidade', 'dt_agendamento', 'mes', 'dia_da_semana', 'periodo_do_dia',
       'fonte_pagadora', 'sexo', 'exame', 'area', 'idade', 'bairro', 'cidade',
       'estado', 'status'],
      dtype='object')

In [9]:
colunas = ['unidade', 'dt_agendamento', 'mes', 'dia_da_semana', 'periodo_do_dia', 'fonte_pagadora', 'sexo', 'exame', 'area', 'idade', 'bairro', 'cidade', 'estado', 'status']

data.columns = colunas

In [11]:
data.head()

Unnamed: 0,unidade,dt_agendamento,mes,dia_da_semana,periodo_do_dia,fonte_pagadora,sexo,exame,area,idade,bairro,cidade,estado,status
0,MORUMBI,Dia Normal,Outubro,Terça,Manha,Particular,Feminino,Ud Estudo Urodinam Completo,URODINAMICA,94,CENTRO,SAO ROQUE,SP,Veio
1,MORUMBI,Dia Normal,Maio,Terça,Tarde,Convenio,Masculino,Teste Ergometrico,METODOS GRAFICOS,72,HIGIENOPOLIS,SAO PAULO,SP,Veio
2,BRASIL,Dia Normal,Marco,Quarta,Manha,Convenio,Masculino,Ecocardiografia Doppler,ECOCARDIOGRAFIA,29,VILA DA SAUDE,SAO PAULO,SP,Veio
3,ALPHAVILLE,Dia Normal,Outubro,Segunda,Tarde,Convenio,Masculino,Ecocardiografia Doppler,ECOCARDIOGRAFIA,59,VILA MORUMBI,SAO PAULO,SP,Veio
4,BRASIL,Dia Normal,Julho,Quinta,Manha,Convenio,Masculino,Teste Ergometrico,METODOS GRAFICOS,40,COLINAS DA ANHANGUERA,SANTANA DE PARNAIBA,SP,Veio


Para padronizar os dados, vamos modificar o conteúdo das colunas para que todas as letras sejam minúsculas e vamos também remover qualquer acento das palavras.

Repare que em uma das colunas temos valores numéricos, podemos ter um resumo do nosso dataset utilizando o comando abaixo:

In [12]:
data.info()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 2500 entries, 0 to 2499
Data columns (total 14 columns):
unidade           2500 non-null object
dt_agendamento    2500 non-null object
mes               2500 non-null object
dia_da_semana     2500 non-null object
periodo_do_dia    2500 non-null object
fonte_pagadora    2500 non-null object
sexo              2500 non-null object
exame             2500 non-null object
area              2500 non-null object
idade             2500 non-null int64
bairro            2500 non-null object
cidade            2500 non-null object
estado            2500 non-null object
status            2500 non-null object
dtypes: int64(1), object(13)
memory usage: 273.6+ KB


Repare que todos os valores textuais em nossa base tem o tipo `object`. Já a coluna *idade* possui tipo `int64`.

Essa coluna não será modificada, temos que descobrir uma forma de identificar o tipo de cada coluna individualmente, isso pode ser feito como demonstrado abaixo:

In [15]:
data.idade.dtype

dtype('int64')

In [17]:
data.columns

Index(['unidade', 'dt_agendamento', 'mes', 'dia_da_semana', 'periodo_do_dia',
       'fonte_pagadora', 'sexo', 'exame', 'area', 'idade', 'bairro', 'cidade',
       'estado', 'status'],
      dtype='object')

In [16]:
for coluna in data.columns:
    print(f'Coluna "{coluna}" tem tipo "{data[coluna].dtype}"')

Coluna "unidade" tem tipo "object"
Coluna "dt_agendamento" tem tipo "object"
Coluna "mes" tem tipo "object"
Coluna "dia_da_semana" tem tipo "object"
Coluna "periodo_do_dia" tem tipo "object"
Coluna "fonte_pagadora" tem tipo "object"
Coluna "sexo" tem tipo "object"
Coluna "exame" tem tipo "object"
Coluna "area" tem tipo "object"
Coluna "idade" tem tipo "int64"
Coluna "bairro" tem tipo "object"
Coluna "cidade" tem tipo "object"
Coluna "estado" tem tipo "object"
Coluna "status" tem tipo "object"


Agora que temos como diferenciar os tipos por colunas, podemos padronizar a informação.

Para remover os acentos das palavras utilizaremos uma biblioteca do python chamada `unidecode`. 

In [22]:
data.unidade

0          MORUMBI
1          MORUMBI
2           BRASIL
3       ALPHAVILLE
4           BRASIL
           ...    
2495       MORUMBI
2496       MORUMBI
2497       MORUMBI
2498      PERDIZES
2499       MORUMBI
Name: unidade, Length: 2500, dtype: object

In [18]:
# !pip install unidecode
from unidecode import unidecode

In [21]:
unidecode('âãéàüç')

'aaeauc'

In [23]:
for coluna in data.columns:
    if data[coluna].dtype == 'object':
        data[coluna] = data[coluna].str.lower()
        data[coluna] = data[coluna].apply(unidecode)

In [25]:
data.head(10)

Unnamed: 0,unidade,dt_agendamento,mes,dia_da_semana,periodo_do_dia,fonte_pagadora,sexo,exame,area,idade,bairro,cidade,estado,status
0,morumbi,dia normal,outubro,terca,manha,particular,feminino,ud estudo urodinam completo,urodinamica,94,centro,sao roque,sp,veio
1,morumbi,dia normal,maio,terca,tarde,convenio,masculino,teste ergometrico,metodos graficos,72,higienopolis,sao paulo,sp,veio
2,brasil,dia normal,marco,quarta,manha,convenio,masculino,ecocardiografia doppler,ecocardiografia,29,vila da saude,sao paulo,sp,veio
3,alphaville,dia normal,outubro,segunda,tarde,convenio,masculino,ecocardiografia doppler,ecocardiografia,59,vila morumbi,sao paulo,sp,veio
4,brasil,dia normal,julho,quinta,manha,convenio,masculino,teste ergometrico,metodos graficos,40,colinas da anhanguera,santana de parnaiba,sp,veio
5,morumbi,dia normal,marco,sexta,manha,convenio,masculino,ecocardiografia doppler,ecocardiografia,40,morada dos pinheiros (aldeia da serra),santana de parnaiba,sp,veio
6,morumbi,dia normal,julho,quarta,manha,convenio,masculino,ecocardiografia doppler,ecocardiografia,52,jardim indaia,embu,sp,veio
7,morumbi,dia normal,julho,quinta,tarde,particular,masculino,ecocardiografia doppler,ecocardiografia,63,vila andrade,sao paulo,sp,nao veio
8,morumbi,dia normal,janeiro,quarta,manha,particular,masculino,eletroneuromiografia dois membros,ecocardiografia,54,vila romana,sao paulo,sp,nao veio
9,morumbi,dia normal,julho,quarta,manha,funcionario,masculino,eletrocardiograma,metodos graficos,43,vila progredior,sao paulo,sp,veio


Temos agora que criar uma forma de representar essa informação para que seja possível de um algoritmo interpretar. Como temos um problema dito binário, ou seja, há duas possibilidades de resposta:

0. nao veio
1. veio

Vamos modificar a coluna `status` para respeitar este novo formato.

In [31]:
status_dict.get('batata', 'None')

'None'

In [26]:
status_dict = {
    'veio' : 1,
    'nao veio' : 0
}

data['status'] = data['status'].map(status_dict)

In [27]:
data.head(10)

Unnamed: 0,unidade,dt_agendamento,mes,dia_da_semana,periodo_do_dia,fonte_pagadora,sexo,exame,area,idade,bairro,cidade,estado,status
0,morumbi,dia normal,outubro,terca,manha,particular,feminino,ud estudo urodinam completo,urodinamica,94,centro,sao roque,sp,1
1,morumbi,dia normal,maio,terca,tarde,convenio,masculino,teste ergometrico,metodos graficos,72,higienopolis,sao paulo,sp,1
2,brasil,dia normal,marco,quarta,manha,convenio,masculino,ecocardiografia doppler,ecocardiografia,29,vila da saude,sao paulo,sp,1
3,alphaville,dia normal,outubro,segunda,tarde,convenio,masculino,ecocardiografia doppler,ecocardiografia,59,vila morumbi,sao paulo,sp,1
4,brasil,dia normal,julho,quinta,manha,convenio,masculino,teste ergometrico,metodos graficos,40,colinas da anhanguera,santana de parnaiba,sp,1
5,morumbi,dia normal,marco,sexta,manha,convenio,masculino,ecocardiografia doppler,ecocardiografia,40,morada dos pinheiros (aldeia da serra),santana de parnaiba,sp,1
6,morumbi,dia normal,julho,quarta,manha,convenio,masculino,ecocardiografia doppler,ecocardiografia,52,jardim indaia,embu,sp,1
7,morumbi,dia normal,julho,quinta,tarde,particular,masculino,ecocardiografia doppler,ecocardiografia,63,vila andrade,sao paulo,sp,0
8,morumbi,dia normal,janeiro,quarta,manha,particular,masculino,eletroneuromiografia dois membros,ecocardiografia,54,vila romana,sao paulo,sp,0
9,morumbi,dia normal,julho,quarta,manha,funcionario,masculino,eletrocardiograma,metodos graficos,43,vila progredior,sao paulo,sp,1


Reparem que a ordem pouco importa, o que fizemos foi criar um dicionário que vai servir como nosso tradutor de informação. Vamos fazer a mesma coisa para todas as colunas.

Nada nos impede de criar esses dicionários na mão como no exemplo acima, porém, quando temos um número muito grande de classes, este trabalho pode ser complexo e podemos gerar algum erro.

A biblioteca ScikitLearn têm algumas classes prontas para realizar este tipo de processamento. Iremos utilizar uma dessas classes para nos auxiliar nesta tarefa.

Agora que temos os conteúdos padronizados, o ideal é separar o que temos como dados de `input` (features) e `output` (meta ou target).

In [32]:
lista = data.columns

In [46]:
lista[:-2]

Index(['unidade', 'dt_agendamento', 'mes', 'dia_da_semana', 'periodo_do_dia',
       'fonte_pagadora', 'sexo', 'exame', 'area', 'idade', 'bairro', 'cidade'],
      dtype='object')

In [47]:
features = data.iloc[:, :-1]
meta     = data.iloc[:, 13]

In [48]:
features.head(10)

Unnamed: 0,unidade,dt_agendamento,mes,dia_da_semana,periodo_do_dia,fonte_pagadora,sexo,exame,area,idade,bairro,cidade,estado
0,morumbi,dia normal,outubro,terca,manha,particular,feminino,ud estudo urodinam completo,urodinamica,94,centro,sao roque,sp
1,morumbi,dia normal,maio,terca,tarde,convenio,masculino,teste ergometrico,metodos graficos,72,higienopolis,sao paulo,sp
2,brasil,dia normal,marco,quarta,manha,convenio,masculino,ecocardiografia doppler,ecocardiografia,29,vila da saude,sao paulo,sp
3,alphaville,dia normal,outubro,segunda,tarde,convenio,masculino,ecocardiografia doppler,ecocardiografia,59,vila morumbi,sao paulo,sp
4,brasil,dia normal,julho,quinta,manha,convenio,masculino,teste ergometrico,metodos graficos,40,colinas da anhanguera,santana de parnaiba,sp
5,morumbi,dia normal,marco,sexta,manha,convenio,masculino,ecocardiografia doppler,ecocardiografia,40,morada dos pinheiros (aldeia da serra),santana de parnaiba,sp
6,morumbi,dia normal,julho,quarta,manha,convenio,masculino,ecocardiografia doppler,ecocardiografia,52,jardim indaia,embu,sp
7,morumbi,dia normal,julho,quinta,tarde,particular,masculino,ecocardiografia doppler,ecocardiografia,63,vila andrade,sao paulo,sp
8,morumbi,dia normal,janeiro,quarta,manha,particular,masculino,eletroneuromiografia dois membros,ecocardiografia,54,vila romana,sao paulo,sp
9,morumbi,dia normal,julho,quarta,manha,funcionario,masculino,eletrocardiograma,metodos graficos,43,vila progredior,sao paulo,sp


In [49]:
meta.head(10)

0    1
1    1
2    1
3    1
4    1
5    1
6    1
7    0
8    0
9    1
Name: status, dtype: int64

Agora que temos o dataset devidamente separado, podemos criar nossos dicionários. Como dito acima, utilizaremos a classe [LabelEncoder](https://scikit-learn.org/stable/modules/generated/sklearn.preprocessing.LabelEncoder.html) para a tarefa:

In [50]:
cols   = features.dtypes==object

In [51]:
cols

unidade            True
dt_agendamento     True
mes                True
dia_da_semana      True
periodo_do_dia     True
fonte_pagadora     True
sexo               True
exame              True
area               True
idade             False
bairro             True
cidade             True
estado             True
dtype: bool

In [56]:
labels = features.columns[cols].tolist()

In [57]:
labels

['unidade',
 'dt_agendamento',
 'mes',
 'dia_da_semana',
 'periodo_do_dia',
 'fonte_pagadora',
 'sexo',
 'exame',
 'area',
 'bairro',
 'cidade',
 'estado']

In [None]:
lista = []
lista_2 = list()

In [58]:
dic = {}
dic_2 = dict()

In [61]:
dic['idade'] = 3

In [62]:
dic

{'idade': 3}

In [55]:
['palavra', 10, True, 0.55, {'ano' : 2019, 'dia' : 5}]

['palavra', 10, True, 0.55, {'ano': 2019, 'dia': 5}]

In [63]:
from sklearn.preprocessing import LabelEncoder

cols   = features.dtypes==object
labels = features.columns[cols].tolist()

dicionarios = dict()

for label in labels:
    le = LabelEncoder()
    le.fit(features[label])
    le_name_mapping = dict(zip(le.classes_, le.transform(le.classes_)))
    dicionarios[label] = le_name_mapping

O resultado da operação é um grande dicionário de dicionários, veja abaixo:

In [64]:
dicionarios

{'unidade': {'alphaville': 0, 'brasil': 1, 'morumbi': 2, 'perdizes': 3},
 'dt_agendamento': {'dia normal': 0, 'feriado': 1, 'final de semana': 2},
 'mes': {'abril': 0,
  'agosto': 1,
  'dezembro': 2,
  'fevereiro': 3,
  'janeiro': 4,
  'julho': 5,
  'junho': 6,
  'maio': 7,
  'marco': 8,
  'novembro': 9,
  'outubro': 10,
  'setembro': 11},
 'dia_da_semana': {'domingo': 0,
  'quarta': 1,
  'quinta': 2,
  'sabado': 3,
  'segunda': 4,
  'sexta': 5,
  'terca': 6},
 'periodo_do_dia': {'manha': 0, 'noite': 1, 'tarde': 2},
 'fonte_pagadora': {'convenio': 0, 'funcionario': 1, 'particular': 2},
 'sexo': {'feminino': 0, 'masculino': 1},
 'exame': {'dipiridamol com medicina nuclear': 0,
  'doppler transcraniano': 1,
  'doppler transcraniano com microbolhas': 2,
  'doppler transcraniano monitorizacao embolos e pesquisa comunicacao': 3,
  'doppler transcraniano monitorizacao manobras posturais': 4,
  'doppler transcraniano pesquisa insuficiencia vertebrobasilar ': 5,
  'doppler transcraniano reserv

O problema é que nossos índices iniciam em 0, por padrão, vamos utilizar o 0 em caso de dado não identificado. Para cada chave iremos somar o valor de 1, assim resolvemos esse problema do 0.

In [None]:
for label in labels:
    dict_tmp = dicionarios[label]

    for key, value in dict_tmp.items():
        dict_tmp[key] = value + 1

In [None]:
dicionarios

Precisamos agora de uma maneira de salvar esses dicionários para uso posterior. Imagine que vamos traduzir informação nova para classificação, não necessariamente temos que treinar o modelo toda vez que uma nova informação é disponibilizada.

Poderíamos salvar esses dicionários em arquivos json para facilitar a interoperabilidade entre sistemas, mas vamos salvar em objetos Python através da biblioteca `pickle`. Veja o exemplo:

In [None]:
import pickle

In [None]:
unidade_dict = dicionarios['unidade']

In [None]:
unidade_dict

In [None]:
pickle.dump(unidade_dict ,open('unidade_dict.pk', 'wb'))

Através do método `dump` podemos salvar o dicionário para uso posterior. Para carregar novamente este dicionário, utilizamos o método `load`:

In [None]:
load_unidade_dict = pickle.load(open('unidade_dict.pk', 'rb'))

In [None]:
unidade_dict

In [None]:
load_unidade_dict

Podemos automatizar a criação destes arquivos da seguinte forma:

In [None]:
for label in labels:
    dict_tmp = dicionarios[label]
    pickle.dump(dict_tmp ,open(f'__dict_{label}.pk', 'wb'))

O que fizemos foi criar um arquivo por dicionário seguindo o padrão "**dict_nome_da_coluna.pk**".

Podemos também modificar todo o conteúdo do nosso dataset seguindo esse padrão representativo numérico que criamos:

In [None]:
for label in labels:
    features[label] = features[label].map(dicionarios[label])

In [None]:
features.head()

## Problema

Crie uma classe para automatizar a tradução dos dados novos que você receberá neste projeto. Utilize dos arquivos gerados para criar uma forma de automatizar o processo.

Para testar sua classe, utilize a estrutura abaixo:

```js
{
    "unidade" : "PERDIZES",
    "dt_agendamento" : "Dia Normal",
    "mes" : "Dezembro",
    "dia_da_semana" : "Terça",
    "periodo_do_dia" : "Manha",
    "fonte_pagadora" : "Convenio",
    "sexo" : "Masculino",
    "exame" : "Teste Ergometrico",
    "area" : "METODOS GRAFICOS",
    "idade" : "47",
    "bairro" : "TAMBORE",
    "cidade" : "SANTANA DE PARNAIBA",
    "estado" : "SP"
}
```

O resultado deverá ser um array dos valores inteiros relativos as classes criadas no exemplo acima. A ordem dos valores deve respeitar a mesma ordem do dicionário dados.

> Dica:
> Tente rodar o seguinte comando: `dados.get('unidade', None)` verifique o valor obtido como output

In [None]:
!wget https://github.com/pgiaeinstein/otmz-mlp/raw/master/dict_data/dict_area.pk
!wget https://github.com/pgiaeinstein/otmz-mlp/raw/master/dict_data/dict_bairro.pk
!wget https://github.com/pgiaeinstein/otmz-mlp/raw/master/dict_data/dict_cidade.pk
!wget https://github.com/pgiaeinstein/otmz-mlp/raw/master/dict_data/dict_dia_da_semana.pk
!wget https://github.com/pgiaeinstein/otmz-mlp/raw/master/dict_data/dict_dt_agendamento.pk
!wget https://github.com/pgiaeinstein/otmz-mlp/raw/master/dict_data/dict_estado.pk
!wget https://github.com/pgiaeinstein/otmz-mlp/raw/master/dict_data/dict_exame.pk
!wget https://github.com/pgiaeinstein/otmz-mlp/raw/master/dict_data/dict_fonte_pagadora.pk
!wget https://github.com/pgiaeinstein/otmz-mlp/raw/master/dict_data/dict_mes.pk
!wget https://github.com/pgiaeinstein/otmz-mlp/raw/master/dict_data/dict_periodo_do_dia.pk
!wget https://github.com/pgiaeinstein/otmz-mlp/raw/master/dict_data/dict_sexo.pk
!wget https://github.com/pgiaeinstein/otmz-mlp/raw/master/dict_data/dict_unidade.pk

In [None]:
dados = {
    "unidade" : "PERDIZES",
    "dt_agendamento" : "Dia Normal",
    "mes" : "Dezembro",
    "dia_da_semana" : "Terça",
    "periodo_do_dia" : "Manha",
    "fonte_pagadora" : "Convenio",
    "sexo" : "Masculino",
    "exame" : "Teste Ergometrico",
    "area" : "METODOS GRAFICOS",
    "idade" : "47",
    "bairro" : "TAMBORE",
    "cidade" : "SANTANA DE PARNAIBA",
    "estado" : "SP"
}