<h1>ETL para a criação e carga inicial do Banco Siconv</h1>
<h2>1. Inicialmente, devemos baixar os dados do Siconv na Plataforma +Brasil</h2>
<p><a href="http://plataformamaisbrasil.gov.br/download-de-dados">Plataforma +Brasil - Dados Siconv</a></p>
<p>Descompactar os dados em um diretório escolhido</p>
<h2>2. Executar o script de criação do banco e tabelas</h2>
<p><code> mysql -u root -p < create_siconv.sql </code></p>
<h2>3. Executar as células para substituir os ponto e vírgula e inserção dos dados</h2>
<p>
<code>
    SubsPontoVirgula()
    tipos
    
    popular dados [insertion_order]
    convenio
    demais tabelas
</code>
   </p>
<h2>4. Executar o script de geracao das tabelas intermediarias</h2>
<p> <code> mysql -u root -p < convenio_proposta_emenda_consorcio.sql </code> </p>
<h2>5. Executar o script de geracao da tabela de features</h2>
<p><code>
GeraFeatures()    
</code>
</p>

In [1]:
import pandas as pd
import sqlalchemy
from sqlalchemy import create_engine
import datetime
import numpy
import re
import numpy as np
import os

In [2]:
### executa arquivo sql
### lido linha a linha e executado
### a engine passada não possui banco sdelecionado
def ExecutaSql(arq_sql, engine):
    engine.connect()
    f = open(arq_sql, 'r', encoding='utf-8')
    for linha in f:
        engine.execute(linha)

In [3]:
### abre os dados em csv do siconv, substituindo
### alguns campos que possuem ";" no meio dos dados
### gerou alguns erros qd foi inserir no banco, que tive q consertar na mão
def SubsPontoVirgula(diretorio, arquivos):
    for arq in arquivos:
        print(arq)
        with open(diretorio+'//siconv_'+arq+'.csv', encoding='utf-8') as arq_csv:
            data = arq_csv.read()
            data = re.sub("[ ]+\;", " -", data)
            data = re.sub("\;[ ]+", "- ", data)
        with open(diretorio+'//siconv_'+arq+'.csv', 'w', encoding='utf-8') as arq_csv:
            arq_csv.write(data)

In [4]:
## quando é criado o banco siconv, já são criadas algumas views e tabelas
## a tabela TBL_CONVENIO_PROPOSTA_EMENDA_CONSORCIO é a tabela final a ser utilizada
## apenas os cálculos das datas devem ser realizados no python

## em alguns casos, a data de fim_orig está anterior à data de inicio do convenio.
## no calcula, está dando negativo, descartar?
## verificar casos de perc q constam como NaN, será que tem nulos em algum dos valores?

## para a geracao da tabela 'features'
def GeraFeatures():
    
    #cria conexao no banco
    engine = create_engine("mysql+pymysql://root:Siconv!@localhost/siconv", pool_pre_ping=True,  connect_args = {'use_unicode':True, 'charset':'utf8mb4'})
    
    #le tabela final gerada, passando as colunas a serem interpretadas como data
    datas = {'DIA_INIC_VIGENC_CONV': '%d/%m/%Y',
         'DIA_FIM_VIGENC_CONV': '%d/%m/%Y',
         'DIA_FIM_VIGENC_ORIGINAL_CONV': '%d/%m/%Y'
        }
    
    tbl_features = pd.read_sql_table('tbl_convenio_proposta_emenda_consorcio', con=engine, schema='siconv', parse_dates=datas)
    
    #substitui NaN por 0
    nan_idx = np.isnan(tbl_features.loc[:,'QTD_TA'])
    tbl_features.loc[nan_idx, 'QTD_TA'] = 0

    nan_idx = np.isnan(tbl_features.loc[:,'QTD_PRORROGA'])
    tbl_features.loc[nan_idx, 'QTD_PRORROGA'] = 0

    nan_idx = np.isnan(tbl_features.loc[:,'QTDE_CONVENIOS'])
    tbl_features.loc[nan_idx, 'QTDE_CONVENIOS'] = 0

    nan_idx = np.isnan(tbl_features.loc[:,'MES'])
    tbl_features.loc[nan_idx, 'MES'] = 0

    nan_idx = np.isnan(tbl_features.loc[:,'VL_GLOBAL_CONV'])
    tbl_features.loc[nan_idx, 'VL_GLOBAL_CONV'] = 0

    nan_idx = np.isnan(tbl_features.loc[:,'VL_REPASSE_CONV'])
    tbl_features.loc[nan_idx, 'VL_REPASSE_CONV'] = 0

    nan_idx = np.isnan(tbl_features.loc[:,'VL_CONTRAPARTIDA_CONV'])
    tbl_features.loc[nan_idx, 'VL_CONTRAPARTIDA_CONV'] = 0

    nan_idx = np.isnan(tbl_features.loc[:,'VL_DESEMBOLSADO_CONV'])
    tbl_features.loc[nan_idx, 'VL_DESEMBOLSADO_CONV'] = 0

    #gera os percentuais de valores
    tbl_features.loc[:, 'PERC_REPASSE'] = tbl_features.loc[:,'VL_REPASSE_CONV']/tbl_features.loc[:,'VL_GLOBAL_CONV']
    tbl_features.loc[:,'PERC_CONTRA'] = tbl_features.loc[:,'VL_CONTRAPARTIDA_CONV']/tbl_features.loc[:,'VL_GLOBAL_CONV']
    tbl_features.loc[:,'PERC_DESEMBOLSADO'] = tbl_features.loc[:,'VL_DESEMBOLSADO_CONV']/tbl_features.loc[:,'VL_GLOBAL_CONV']

    #gera as diferencas entre fim-inic (original e com prorrogacao)
    tbl_features.loc[:,'DIF_ORIG'] = (tbl_features.loc[:,'DIA_FIM_VIGENC_ORIGINAL_CONV'] - tbl_features.loc[:,'DIA_INIC_VIGENC_CONV']).dt.days
    tbl_features.loc[:,'DIF_PRORROG'] = (tbl_features.loc[:,'DIA_FIM_VIGENC_CONV'] - tbl_features.loc[:,'DIA_INIC_VIGENC_CONV']).dt.days

    tipos = {
        'index': sqlalchemy.types.INT,
        'NR_CONVENIO': sqlalchemy.types.CHAR(length=20),
        'ID_PROPOSTA':sqlalchemy.types.CHAR(length=20),
        'SIT_CONVENIO':sqlalchemy.types.CHAR(length=255),
        'QTD_TA':sqlalchemy.types.INT,
        'QTD_PRORROGA':sqlalchemy.types.INT ,
        'MES':sqlalchemy.types.INT ,
        'QTDE_CONVENIOS':sqlalchemy.types.INT ,
        'VL_GLOBAL_CONV':sqlalchemy.types.FLOAT,
        'VL_REPASSE_CONV':sqlalchemy.types.FLOAT ,
        'VL_CONTRAPARTIDA_CONV': sqlalchemy.types.FLOAT,
        'VL_DESEMBOLSADO_CONV':sqlalchemy.types.FLOAT ,
        'UF_PROPONENTE':sqlalchemy.types.CHAR(length=10),
        'COD_MUNIC_IBGE':sqlalchemy.types.CHAR(length=255),
        'COD_ORGAO_SUP':sqlalchemy.types.CHAR(length=255),
        'COD_ORGAO':sqlalchemy.types.CHAR(length=255),
        'MODALIDADE':sqlalchemy.types.CHAR(length=255),
        'IDENTIF_PROPONENTE':sqlalchemy.types.CHAR(length=255),
        'SITUACAO_CONTA':sqlalchemy.types.CHAR(length=255),
        'SITUACAO_PROJETO_BASICO':sqlalchemy.types.CHAR(length=255),
        'TARGET':sqlalchemy.types.INT ,
        'EMENDAS':sqlalchemy.types.INT ,
        'CNPJS_CONSORCIOS':sqlalchemy.types.INT ,
        'PERC_REPASSE':sqlalchemy.types.FLOAT ,
        'PERC_CONTRA':sqlalchemy.types.FLOAT ,
        'PERC_DESEMBOLSADO':sqlalchemy.types.FLOAT ,
        'DIF_ORIG':sqlalchemy.types.INT ,
        'DIF_PRORROG':sqlalchemy.types.INT
    }
    
    #joga fora as colunas "dias", pois já temos as diferencas
    tbl = tbl_features.drop(columns=['DIA_FIM_VIGENC_ORIGINAL_CONV', 'DIA_FIM_VIGENC_CONV', 'DIA_INIC_VIGENC_CONV'])
    tbl.to_sql('features', con=engine, if_exists='replace', dtype = tipos)

In [8]:
#tive q alterar o tipo de password root para mysql_native_password, 
#use mysql
#alter user 'root'@localhost identified with mysql_native_password by 'Siconv!'
#ALTER USER 'root'@'localhost' IDENTIFIED WITH mysql_native_password BY 'Siconv!';
insertion_order = ['programa','proponentes','proposta', 'convenio', 'desembolso','empenho','meta_crono_fisico','pagamento','consorcios',
                   'desbloqueio_cr','emenda','etapa_crono_fisico','ingresso_contrapartida','obtv_convenente','plano_aplicacao_detalhado',
                   'prorroga_oficio','termo_aditivo','empenho_desembolso','historico_situacao','programa_proposta']
#inicialmente, a engine não tem uma base associada
engine = create_engine("mysql+pymysql://root:Siconv!@localhost", pool_pre_ping=True,  connect_args = {'use_unicode':True, 'charset':'utf8mb4'})

In [None]:
### diretorio onde estao os arquivos csv
### lista de arquivos na ordem em q devem ser inseridos, sem extensao de arquivo
SubsPontoVirgula('/home/guilhon/Downloads/siconv', insertion_order)

In [109]:
## para poder ler o csv e criar corretamente os dataframes
## cada campo tem um tipo definido
tipos = {}
tipos['programa'] = {'ID_PROGRAMA': 'object','COD_ORGAO_SUP_PROGRAMA': 'object','DESC_ORGAO_SUP_PROGRAMA': 'object','COD_PROGRAMA': 'object','NOME_PROGRAMA': 'object','SIT_PROGRAMA': 'object','DATA_DISPONIBILIZACAO': 'object','ANO_DISPONIBILIZACAO': 'object','DT_PROG_INI_RECEB_PROP': 'object','DT_PROG_FIM_RECEB_PROP': 'object','DT_PROG_INI_EMENDA_PAR': 'object','DT_PROG_FIM_EMENDA_PAR': 'object','DT_PROG_INI_BENEF_ESP': 'object','DT_PROG_FIM_BENEF_ESP': 'object','MODALIDADE_PROGRAMA': 'object','NATUREZA_JURIDICA_PROGRAMA': 'object','UF_PROGRAMA': 'object','ACAO_ORCAMENTARIA': 'object'}
tipos['proponentes'] = {'IDENTIF_PROPONENTE':'object', 'NM_PROPONENTE': 'object', 'MUNICIPIO_PROPONENTE': 'object', 'UF_PROPONENTE': 'object', 'ENDERECO_PROPONENTE': 'object', 'BAIRRO_PROPONENTE': 'object', 'CEP_PROPONENTE': 'object', 'EMAIL_PROPONENTE': 'object', 'TELEFONE_PROPONENTE': 'object', 'FAX_PROPONENTE': 'object'}
tipos['proposta'] = {'ID_PROPOSTA': sqlalchemy.types.CHAR(length=20),'UF_PROPONENTE': sqlalchemy.types.CHAR(length=10),'MUNIC_PROPONENTE': sqlalchemy.types.CHAR(length=255),'COD_MUNIC_IBGE': sqlalchemy.types.CHAR(length=255),'COD_ORGAO_SUP': sqlalchemy.types.CHAR(length=255),'DESC_ORGAO_SUP': sqlalchemy.types.TEXT,'NATUREZA_JURIDICA': sqlalchemy.types.CHAR(length=255),'NR_PROPOSTA': sqlalchemy.types.CHAR(length=255),'DIA_PROP': sqlalchemy.types.CHAR(length=10),'MES_PROP': sqlalchemy.types.CHAR(length=10),'ANO_PROP': sqlalchemy.types.CHAR(length=10),'DIA_PROPOSTA': sqlalchemy.types.CHAR(length=20),'COD_ORGAO': sqlalchemy.types.CHAR(length=255),'DESC_ORGAO': sqlalchemy.types.TEXT ,'MODALIDADE': sqlalchemy.types.CHAR(length=255),'IDENTIF_PROPONENTE': sqlalchemy.types.CHAR(length=255),'NM_PROPONENTE': sqlalchemy.types.CHAR(length=255),'CEP_PROPONENTE': sqlalchemy.types.CHAR(length=10),'ENDERECO_PROPONENTE': sqlalchemy.types.TEXT,'BAIRRO_PROPONENTE': sqlalchemy.types.CHAR(length=255),'NM_BANCO': sqlalchemy.types.CHAR(length=255),'SITUACAO_CONTA': sqlalchemy.types.CHAR(length=255),'SITUACAO_PROJETO_BASICO': sqlalchemy.types.CHAR(length=255),'SIT_PROPOSTA': sqlalchemy.types.CHAR(length=255),'DIA_INIC_VIGENCIA_PROPOSTA': sqlalchemy.types.CHAR(length=20),'DIA_FIM_VIGENCIA_PROPOSTA': sqlalchemy.types.CHAR(length=20),'OBJETO_PROPOSTA': sqlalchemy.types.TEXT, 'ITEM_INVESTIMENTO': sqlalchemy.types.CHAR(length=255), 'ENVIADA_MANDATARIA': sqlalchemy.types.CHAR(length=255),'VL_GLOBAL_PROP': sqlalchemy.types.FLOAT,'VL_REPASSE_PROP':sqlalchemy.types.FLOAT,'VL_CONTRAPARTIDA_PROP':sqlalchemy.types.FLOAT}
tipos['convenio'] = {'NR_CONVENIO': sqlalchemy.types.CHAR(length=20),'ID_PROPOSTA': sqlalchemy.types.CHAR(length=20),'DIA': sqlalchemy.types.CHAR(length=10),'MES': sqlalchemy.types.INT,'ANO': sqlalchemy.types.CHAR(length=10),'DIA_ASSIN_CONV': sqlalchemy.types.CHAR(length=20),'SIT_CONVENIO': sqlalchemy.types.CHAR(length=255),'SUBSITUACAO_CONV': sqlalchemy.types.CHAR(length=255),'SITUACAO_PUBLICACAO': sqlalchemy.types.CHAR(length=255),'INSTRUMENTO_ATIVO': sqlalchemy.types.CHAR(length=10),'IND_OPERA_OBTV': sqlalchemy.types.CHAR(length=10),'NR_PROCESSO': sqlalchemy.types.CHAR(length=255),'UG_EMITENTE': sqlalchemy.types.CHAR(length=255),'DIA_PUBL_CONV': sqlalchemy.types.CHAR(length=20),'DIA_INIC_VIGENC_CONV': sqlalchemy.types.CHAR(length=20),'DIA_FIM_VIGENC_CONV': sqlalchemy.types.CHAR(length=20),'DIA_FIM_VIGENC_ORIGINAL_CONV': sqlalchemy.types.CHAR(length=20),'DIAS_PREST_CONTAS': sqlalchemy.types.CHAR(length=10),'DIA_LIMITE_PREST_CONTAS': sqlalchemy.types.CHAR(length=20),'DATA_SUSPENSIVA': sqlalchemy.types.CHAR(length=20), 'DATA_RETIRADA_SUSPENSIVA':sqlalchemy.types.CHAR(length=20), 'DIAS_CLAUSULA_SUSPENSIVA': sqlalchemy.types.FLOAT, 'SITUACAO_CONTRATACAO': sqlalchemy.types.CHAR(length=255),'IND_ASSINADO': sqlalchemy.types.CHAR(length=10),'MOTIVO_SUSPENSAO': sqlalchemy.types.TEXT,'IND_FOTO': sqlalchemy.types.CHAR(length=10),'QTDE_CONVENIOS': sqlalchemy.types.INT,'QTD_TA': sqlalchemy.types.INT,'QTD_PRORROGA': sqlalchemy.types.INT,'VL_GLOBAL_CONV': sqlalchemy.types.FLOAT,'VL_REPASSE_CONV': sqlalchemy.types.FLOAT,'VL_CONTRAPARTIDA_CONV': sqlalchemy.types.FLOAT,'VL_EMPENHADO_CONV': sqlalchemy.types.FLOAT,'VL_DESEMBOLSADO_CONV': sqlalchemy.types.FLOAT,'VL_SALDO_REMAN_TESOURO': sqlalchemy.types.FLOAT,'VL_SALDO_REMAN_CONVENENTE': sqlalchemy.types.FLOAT,'VL_RENDIMENTO_APLICACAO': sqlalchemy.types.FLOAT,'VL_INGRESSO_CONTRAPARTIDA': sqlalchemy.types.FLOAT,'VL_SALDO_CONTA': sqlalchemy.types.FLOAT,'VALOR_GLOBAL_ORIGINAL_CONV': sqlalchemy.types.FLOAT}
tipos['desembolso'] = {'ID_DESEMBOLSO': 'object','NR_CONVENIO': 'object','DT_ULT_DESEMBOLSO': 'object','QTD_DIAS_SEM_DESEMBOLSO': 'object','DATA_DESEMBOLSO': 'object','ANO_DESEMBOLSO': 'object','MES_DESEMBOLSO': 'object','NR_SIAFI': 'object','VL_DESEMBOLSADO': np.float64}
tipos['empenho'] = {'ID_EMPENHO': 'object','NR_CONVENIO': 'object','NR_EMPENHO': 'object','TIPO_NOTA': 'object','DESC_TIPO_NOTA': 'object','DATA_EMISSAO': 'object','COD_SITUACAO_EMPENHO': 'object','DESC_SITUACAO_EMPENHO': 'object','VALOR_EMPENHO': np.float64}
tipos['meta_crono_fisico'] = {'ID_META': 'object','NR_CONVENIO': 'object','COD_PROGRAMA': 'object','NOME_PROGRAMA': 'object','NR_META': 'object','TIPO_META': 'object','DESC_META': 'object','DATA_INICIO_META': 'object','DATA_FIM_META': 'object','UF_META': 'object','MUNICIPIO_META': 'object','ENDERECO_META': 'object','CEP_META': 'object','QTD_META': 'object','UND_FORNECIMENTO_META': 'object','VL_META': np.float64}
tipos['pagamento'] = {'NR_MOV_FIN': 'object','NR_CONVENIO': 'object','IDENTIF_FORNECEDOR': 'object','NOME_FORNECEDOR': 'object','TP_MOV_FINANCEIRA': 'object','DATA_PAG': 'object','NR_DL': 'object','DESC_DL': 'object','VL_PAGO': np.float64}
tipos['consorcios'] = {'ID_PROPOSTA': sqlalchemy.types.CHAR(length=20),'CNPJ_CONSORCIO': sqlalchemy.types.CHAR(length=255),'NOME_CONSORCIO': sqlalchemy.types.TEXT,'CODIGO_CNAE_PRIMARIO': sqlalchemy.types.CHAR(length=20),'DESC_CNAE_PRIMARIO': sqlalchemy.types.TEXT,'CODIGO_CNAE_SECUNDARIO': sqlalchemy.types.CHAR(length=20),'DESC_CNAE_SECUNDARIO': sqlalchemy.types.TEXT,'CNPJ_PARTICIPANTE': sqlalchemy.types.CHAR(length=255),'NOME_PARTICIPANTE': sqlalchemy.types.TEXT}
tipos['desbloqueio_cr'] = {'NR_CONVENIO': 'object','NR_OB': 'object','DATA_CADASTRO': 'object','DATA_ENVIO': 'object','TIPO_RECURSO_DESBLOQUEIO': 'object','VL_TOTAL_DESBLOQUEIO': np.float64,'VL_DESBLOQUEADO': np.float64,'VL_BLOQUEADO': np.float64}
tipos['emenda'] = {'ID_PROPOSTA': sqlalchemy.types.CHAR(length=20),'QUALIF_PROPONENTE': sqlalchemy.types.TEXT,'COD_PROGRAMA_EMENDA': sqlalchemy.types.CHAR(length=20),'NR_EMENDA': sqlalchemy.types.CHAR(length=20),'NOME_PARLAMENTAR': sqlalchemy.types.TEXT,'BENEFICIARIO_EMENDA': sqlalchemy.types.CHAR(length=255),'IND_IMPOSITIVO': sqlalchemy.types.CHAR(length=10),'TIPO_PARLAMENTAR': sqlalchemy.types.CHAR(length=255),'VALOR_REPASSE_PROPOSTA_EMENDA': sqlalchemy.types.FLOAT,'VALOR_REPASSE_EMENDA': sqlalchemy.types.FLOAT}
tipos['etapa_crono_fisico'] = {'ID_META': 'object','ID_ETAPA': 'object','NR_ETAPA': 'object','DESC_ETAPA': 'object','DATA_INICIO_ETAPA': 'object','DATA_FIM_ETAPA': 'object','UF_ETAPA': 'object','MUNICIPIO_ETAPA': 'object','ENDERECO_ETAPA': 'object','CEP_ETAPA': 'object','QTD_ETAPA': 'object','UND_FORNECIMENTO_ETAPA': 'object','VL_ETAPA': np.float64}
tipos['ingresso_contrapartida'] = {'NR_CONVENIO': 'object','DT_INGRESSO_CONTRAPARTIDA': 'object','VL_INGRESSO_CONTRAPARTIDA': np.float64}
tipos['obtv_convenente'] = {'NR_MOV_FIN': 'object','IDENTIF_FAVORECIDO_OBTV_CONV': 'object','NM_FAVORECIDO_OBTV_CONV': 'object','TP_AQUISICAO': 'object','VL_PAGO_OBTV_CONV': np.float64}
tipos['plano_aplicacao_detalhado'] = {'ID_PROPOSTA': 'object','SIGLA': 'object','MUNICIPIO': 'object','NATUREZA_AQUISICAO': 'object','DESCRICAO_ITEM': 'object','CEP_ITEM': 'object','ENDERECO_ITEM': 'object','TIPO_DESPESA_ITEM': 'object','NATUREZA_DESPESA': 'object','SIT_ITEM': 'object','COD_NATUREZA_DESPESA': 'object','QTD_ITEM': 'object','VALOR_UNITARIO_ITEM': np.float64,'VALOR_TOTAL_ITEM': np.float64}
tipos['prorroga_oficio'] = {'NR_CONVENIO': 'object','NR_PRORROGA': 'object','DT_INICIO_PRORROGA': 'object','DT_FIM_PRORROGA': 'object','DIAS_PRORROGA': 'object','DT_ASSINATURA_PRORROGA': 'object','SIT_PRORROGA': 'object'}
tipos['termo_aditivo'] = {'NR_CONVENIO': 'object','NUMERO_TA': 'object','TIPO_TA': 'object','VL_GLOBAL_TA': np.float64,'VL_REPASSE_TA': np.float64,'VL_CONTRAPARTIDA_TA': np.float64,'DT_ASSINATURA_TA': 'object','DT_INICIO_TA': 'object','DT_FIM_TA': 'object','JUSTIFICATIVA_TA': 'object'}
tipos['empenho_desembolso'] = {'ID_DESEMBOLSO': 'object','ID_EMPENHO': 'object','VALOR_GRUPO': np.float64}
tipos['historico_situacao'] = {'ID_PROPOSTA': 'object','NR_CONVENIO': 'object','DIA_HISTORICO_SIT': 'object','HISTORICO_SIT': 'object','DIAS_HISTORICO_SIT': 'object','COD_HISTORICO_SIT': 'object'}
tipos['programa_proposta'] = {'ID_PROGRAMA': 'object', 'ID_PROPOSTA': 'object'}

In [110]:
## a tabela convenio é tratada de forma separada pois ha erros ao carregar dados de convenios cancelados, e outros
## status que não nos interessam
tabela = 'convenio'

result = pd.read_csv('/home/guilhon/Downloads/siconv/siconv_'+tabela+'.csv', delimiter=';', sep=';', encoding='utf-8', decimal=',')

df = result[result['SIT_CONVENIO'] == 'Prestação de Contas Aprovada']
df = df.append(result[result['SIT_CONVENIO'] == 'Prestação de Contas Aprovada com Ressalvas'])
df = df.append(result[result['SIT_CONVENIO'] == 'Inadimplente'])
df = df.append(result[result['SIT_CONVENIO'] == 'Prestação de Contas Rejeitada'])
df = df.append(result[result['SIT_CONVENIO'] == 'Convênio Rescindido'])
df.to_sql(tabela, con=engine, schema='siconv', if_exists='append', index=False, dtype = tipos[tabela])

In [None]:
### pra cada arquivo csv, na ordem "insertion_order"
### lê e insere os dados no banco
### mesmo apos o SubsPontoVirgula, sobraram alguns erros q foram corrigidos na mao
insertion_order = ['proposta','consorcios','emenda']

for tabela in insertion_order:
    print(tabela)
    result = pd.read_csv('/home/guilhon/Downloads/siconv/siconv_'+tabela+'.csv', delimiter=';', sep=';', encoding='utf-8', decimal=',')
    result.to_sql(tabela, con=engine, schema='siconv', if_exists='append', index=False, dtype = tipos[tabela])

In [6]:
GeraFeatures()

In [9]:
tbl_features = pd.read_sql_table('features', con=engine, schema='siconv')

In [12]:
tbl_features.to_csv('/home/guilhon/Mestrado/dissertação/features.csv', index = False, header=True, sep=';', encoding='utf-8', decimal=',')