# <font color='red'>1.0 IMPORT</font>

In [None]:
# ENVIRONMENT

# !pip install mysql-connector-python
# !pip install pymysql
# !pip install sqlalchemy

import pandas as pd
from datetime import datetime
import mysql.connector
import numpy as np
from sqlalchemy import create_engine

# pd.options.display.max_rows = 2000
# pd.options.display.width = 120
# pd.options.display.max_colwidth = 100

ETL_VERSAO = 'etl_v1.0'

# <font color='red'>2.0 EXTRACT</font>

In [None]:
def LeFontes(strAut):

    print('Iniciando leitura de dados nativos...', end='')
    
    sql_form = (
    "SELECT * "
    "FROM form"
    )
    sql_tasks = (
    "SELECT `Protocolo`, `Entidade`, `Serviço`, `Usuário`, `Grupo`, `Data e Hora de conclusão`, "
    "`Data e Hora de criação`, `Ação`, `Encaminhado para`, `Processo encerrado`, `Processo cancelado`, "
    "`Motivo de cancelamento`, `Status externo`, `Categoria`, `Grupo responsável`, `Prazo (em segundos)` "
    "FROM tasks"
    )
    sql_sla = (
    "SELECT * "
    "FROM sla"
    )
    sql_rating = (
    "SELECT * "
    "FROM rating"
    )
    
    try:
        connection = mysql.connector.connect(host     = strAut['My_host'], 
                                             database = strAut['My_db'], 
                                             user     = strAut['My_user'], 
                                             password = strAut['My_pw'])

        df_int_tasks =   pd.read_sql(sql_tasks,  con=connection)
        df_int_sla =     pd.read_sql(sql_sla,    con=connection)
        df_int_form =    pd.read_sql(sql_form,   con=connection)
        df_int_rating =  pd.read_sql(sql_rating, con=connection)
        
        print('OK')

    except mysql.connector.Error as error:
        print("Failed to read record from MySQL table {}".format(error))

    finally:
        if (connection.is_connected()):
            connection.close()
            print(f'tasks:{df_int_tasks.shape[0]} registros lidos em {df_int_tasks.shape[1]} colunas')
            print(f'sla: {df_int_sla.shape[0]} registros lidos em {df_int_sla.shape[1]} colunas')
            print(f'form: {df_int_form.shape[0]} registros lidos em {df_int_form.shape[1]} colunas')
            print(f'rating: {df_int_rating.shape[0]} registros lidos em {df_int_rating.shape[1]} colunas')
            print("MySQL connection is closed")
            
    return df_int_tasks, df_int_sla, df_int_form, df_int_rating

# <font color='red'>3.0 TRANSFORM</font>

## <font color='blue'>trata os datasets</font>

### <font color='black'>trata o dataset sla</font>

In [None]:
def trSLA(df):
    
    print('df_sla - iniciando transformação... ', end='')
    
    MINUTOS_PARA_DIAS = 1440 # quantidade de minutos em um dia

    # preenche com null as colunas que contém 'null' como tipo string
    df.loc[(df['limiteMinimo'] == 'null'), 'limiteMinimo'] = np.nan
    df.loc[(df['limiteMaximo'] == 'null'), 'limiteMaximo'] = np.nan

    # transforma o tipo de coluna para float
    df['limiteMinimo'] = df['limiteMinimo'].astype(float)
    df['limiteMaximo'] = df['limiteMaximo'].astype(float)

    # transforma a unidade de medida de minuto para dias
    df['limiteMinimo'] = df['limiteMinimo'] / MINUTOS_PARA_DIAS
    df['limiteMaximo'] = df['limiteMaximo'] / MINUTOS_PARA_DIAS

    # preenche com valores extremos os limites máximos e limites mínimos
    df.loc[(df['limiteMinimo'].isna()), 'limiteMinimo'] = -9999999.9
    df.loc[(df['limiteMaximo'].isna()), 'limiteMaximo'] = 9999999.9

    # cria mais uma coluna de status para pivotar limite mínimo e limite máxio
    df['status2'] = df['status']
    df.rename(columns={'status': 'StatusLmin', 'status2': 'StatusLmax'}, inplace = True)
    
    # faz pivot da coluna StatusLmin
    idx = ['entityCode', 'service', 'StatusLmax', 'limiteMaximo']
    df = df.pivot(columns = 'StatusLmin', values = 'limiteMinimo', index=idx).reset_index()
    df.columns.name = None
    dic_renome = {'Dentro do prazo' : 'Dentro do Prazo LMin', 
                  'Fora do prazo' : 'Fora do Prazo LMin',
                  'Perto do prazo' : 'Perto do Prazo LMin'}
    df.rename(columns=dic_renome, inplace = True)

    # faz pivot da coluna StatusLmax
    idx = ['entityCode', 'service', 'Dentro do Prazo LMin', 'Fora do Prazo LMin', 'Perto do Prazo LMin']
    df = df.pivot(columns = 'StatusLmax', values = 'limiteMaximo', index=idx).reset_index()
    df.columns.name = None
    dic_renome = {'Dentro do prazo' : 'Dentro do Prazo LMax', 
                  'Fora do prazo' : 'Fora do Prazo LMax',
                  'Perto do prazo' : 'Perto do Prazo LMax'}
    df.rename(columns=dic_renome, inplace = True)

    # agrupa por entidade e serviço
    df = df.groupby('service').sum().reset_index()

    print('%d linhas OK.' %df.shape[0])
    
    return df

### <font color='black'>trata o dataset form</font>

In [None]:
def trForm(df):
    
    print('df_form - iniciando transformação... ', end='')

    df.columns = ['atributo', 'nome', 'valor', 'protocolo', 'servico', 'tipo', 'campo_relacionado']
    df['atributo'] = df['atributo'].str.lower()
    
    print('%d linhas OK.' %df.shape[0])

    return df

### <font color='black'>trata o dataset rating</font>

In [None]:
def trRating(df):

    print('df_rating - iniciando transformação... ', end='')

    # renomeia as colunas
    cols = ['Solicitacao', 'NotaAvaliacao', 'MotivoAvaliacao', 'DataHoraAvaliacao']
    df.columns = cols

    # separa e formata as colunas de datas e horas 
    df['DataAvaliacao'] = pd.to_datetime(df['DataHoraAvaliacao']).dt.date
    df['HoraAvaliacao'] = pd.to_datetime(df['DataHoraAvaliacao']).dt.time

    # deleta a coluna que contém data e hora
    df.drop(['DataHoraAvaliacao'], axis=1, inplace=True)

    # preenche colunas de linhas vazias
    df.loc[df['MotivoAvaliacao'] == '', 'MotivoAvaliacao'] = '<motivo vazio>'
    
    print('%d linhas OK.' %df.shape[0])
    
    return df

### <font color='black'>trata o dataset tasks</font>

In [None]:
def trTasks(df):

    print('df_tasks - iniciando transformação... ', end='')

    SEM_STATUS = '<sem status inicial>'
    
    # renomeia as colunas
    lst_colunas_tasks = ['Protocolo', 'Entidade', 'Servico', 'Usuarios','Grupo', 'DataHora_Conclusao',
                          'DataHora_Criacao', 'Acao', 'EncaminhadoPara', 'ProcessoEncerrado', 'ProcessoCancelado',
                          'MotivoCancelamento', 'StatusExterno', 'Categoria', 'GrupoResponsavel','Prazo']
    df.columns = lst_colunas_tasks
    
    # coloca dataset em ordem para acertar o status externo
    lst = ['Entidade', 'Protocolo', 'DataHora_Criacao']
    df = df.sort_values(by=lst).reset_index()

    # rotina para preencher status externo vazio
    # pega sempre o anterior e se o primeiro status estiver vazio coloca "sem status inicial"
    if df.loc[0, 'StatusExterno'] == '':
        df.loc[0, 'StatusExterno'] = SEM_STATUS
    for i in range(1, df.shape[0]):
        if df.loc[i, 'StatusExterno'] == '':    
            if df.loc[i, 'Protocolo'] == df.loc[i - 1, 'Protocolo']:
                df.loc[i, 'StatusExterno'] = df.loc[i - 1, 'StatusExterno']
            else:
                df.loc[i, 'StatusExterno'] = SEM_STATUS
    
    print('%d linhas OK.' %df.shape[0])

    return df

## <font color='blue'>monta tabelas dimensões</font>

### DIM acoes

In [None]:
def Mt_dim_Acoes(df):

    print('dim_Acoes - iniciando montagem... ', end='')

    # trasnforma a coluna Acao em uma coluna do tipo "category'
    df['tmpAcao'] = df['Acao'].astype('category')

    # cria uma nova coluna que será a coluna chave primária da dimensão Ação
    df['FK_dim_Acoes'] = df['tmpAcao'].cat.codes.astype('int64') + 1

    # tira a duplicidade
    dfx = df.loc[:, ['FK_dim_Acoes', 'Acao']].drop_duplicates()
    dfx.rename(columns={'FK_dim_Acao': 'PK_dim_Acao'}, inplace = True)
    
    # preenche colunas com linhas vazias
    dfx.loc[dfx['Acao'] == '', ['Acao']] = '<sem ação determinada>'
    
    # exclui a coluna Acoes de df_tasks que será a futura tabela fato
    df.drop(['Acao', 'tmpAcao'], axis=1, inplace=True)
    
    print('%d linhas OK.' %dfx.shape[0])

    return dfx

### DIM categoria servicos

In [None]:
def Mt_dim_CategoriaServico(df):

    print('dim_Categoria - iniciando montagem... ', end='')

    # trasnforma a coluna Categoria em uma coluna do tipo "category'
    df['tmpCategoria'] = df['Categoria'].astype('category')

    # cria uma nova coluna que será a coluna chave primária da dimensão CategoriasServicos
    df['FK_dim_CategoriasServicos'] = df['tmpCategoria'].cat.codes.astype('int64') + 1

    # tira a duplicidade
    dfx = df.loc[:, ['FK_dim_CategoriasServicos', 'Categoria']].drop_duplicates()
    dfx.rename(columns={'FK_dim_CategoriasServicos': 'PK_dim_CategoriasServicos'}, inplace = True)

    # preenche colunas com linhas vazias
    dfx.loc[dfx['Categoria'] == '', ['Categoria']] = '<categoria indefinida>'
    
    # exclui a coluna Categoria de df_tasks que será a futura tabela fato
    df.drop(['Categoria', 'tmpCategoria'], axis=1, inplace=True)
    
    print('%d linhas OK.' %dfx.shape[0])

    return dfx

### DIM encaminhamento

In [None]:
def Mt_dim_Encaminhamento(df):

    print('dim_Encaminhamento - iniciando montagem... ', end='')

    # trasnforma a coluna EncaminhadoPara em uma coluna do tipo "category'
    df['tmpEncaminhadoPara'] = df['EncaminhadoPara'].astype('category')

    # cria uma nova coluna que será a coluna chave primária da dimensão Encaminhamento
    df['FK_dim_Encaminhamento'] = df['tmpEncaminhadoPara'].cat.codes.astype('int64') + 1

    # tira a duplicidade
    dfx = df.loc[:, ['FK_dim_Encaminhamento', 'EncaminhadoPara']].drop_duplicates()
    dfx.rename(columns={'FK_dim_Encaminhamento': 'PK_dim_Encaminhamento'}, inplace = True)

    # preenche colunas com linhas vazias
    dfx.loc[dfx['EncaminhadoPara'] == '', ['EncaminhadoPara']] = '<sem encaminhamento>'

    # exclui a coluna Entidade de df_tasks que será a futura tabela fato
    df.drop(['EncaminhadoPara', 'tmpEncaminhadoPara'], axis=1, inplace=True)

    print('%d linhas OK.' %dfx.shape[0])

    return dfx

### DIM entidade

In [None]:
def Mt_dim_Entidade(df):

    print('dim_Entidade - iniciando montagem... ', end='')

    # trasnforma a coluna Entidade em uma coluna do tipo "category'
    df['tmpEntidade'] = df['Entidade'].astype('category')

    # cria uma nova coluna que será a coluna chave primária da dimensão Entidades
    df['FK_dim_Entidades'] = df['tmpEntidade'].cat.codes.astype('int64') + 1

    # tira a duplicidade
    dfx = df.loc[:, ['FK_dim_Entidades', 'Entidade']].drop_duplicates()
    dfx['Entidade'] = dfx['Entidade'].str.upper()
    dfx.rename(columns={'FK_dim_Entidades': 'PK_dim_Entidades'}, inplace = True)

    # exclui a coluna Entidade de df_tasks que será a futura tabela fato
    df.drop(['Entidade', 'tmpEntidade'], axis=1, inplace=True)

    print('%d linhas OK.' %dfx.shape[0])

    return dfx

### DIM grupo responsavel

In [None]:
def Mt_dim_GrupoResponsavel(df):

    print('dim_GrupoResponsavel - iniciando montagem... ', end='')

    # trasnforma a coluna GrupoResponsavel em uma coluna do tipo "category'
    df['tmpGrupoResponsavel'] = df['GrupoResponsavel'].astype('category')

    # cria uma nova coluna que será a coluna chave primária da dimensão GrupoResponsavel
    df['FK_dim_GrupoResponsavel'] = df['tmpGrupoResponsavel'].cat.codes.astype('int64') + 1

    # tira a duplicidade
    dfx = df.loc[:, ['FK_dim_GrupoResponsavel', 'GrupoResponsavel']].drop_duplicates()
    dfx.rename(columns={'FK_dim_GrupoResponsavel': 'PK_dim_GrupoResponsavel'}, inplace = True)

    # preenche colunas com linhas vazias
    dfx.loc[dfx['GrupoResponsavel'] == '', ['GrupoResponsavel']] = '<grupo responsável não definido>'

    # exclui a coluna GrupoResponsavel de df_tasks que será a futura tabela fato
    df.drop(['GrupoResponsavel', 'tmpGrupoResponsavel'], axis=1, inplace=True)
    
    print('%d linhas OK.' %dfx.shape[0])
    
    return dfx

### DIM grupo usuarios

In [None]:
def Mt_dim_GruposUsuarios(df):

    print('dim_GruposUsuarios - iniciando montagem... ', end='')

    # trasnforma a coluna Grupo em uma coluna do tipo "category'
    df['tmpGrupo'] = df['Grupo'].astype('category')

    # cria uma nova coluna que será a coluna chave primária da dimensão Grupo
    df['FK_dim_GruposUsuarios'] = df['tmpGrupo'].cat.codes.astype('int64') + 1

    # tira a duplicidade
    dfx = df.loc[:, ['FK_dim_GruposUsuarios', 'Grupo']].drop_duplicates()
    dfx.rename(columns={'FK_dim_GruposUsuarios': 'PK_dim_GruposUsuarios'}, inplace = True)

    # preenche colunas com linhas vazias
    dfx.loc[dfx['Grupo'] == '', ['Grupo']] = '<grupo usuário não definido>'

    # exclui a coluna Grupo de df_tasks que será a futura tabela fato
    df.drop(['Grupo', 'tmpGrupo'], axis=1, inplace=True)
    
    print('%d linhas OK.' %dfx.shape[0])
    
    return dfx

### DIM motivos cancelamento

In [None]:
def Mt_MotivosCanc(df):

    print('dim_MotivosCanc - iniciando montagem... ', end='')

    # trasnforma a coluna MotivoCancelamento em uma coluna do tipo "category'
    df['tmpMotivoCancelamento'] = df['MotivoCancelamento'].astype('category')

    # cria uma nova coluna que será a coluna chave primária da dimensão MotivoCanc
    df['FK_dim_MotivosCanc'] = df['tmpMotivoCancelamento'].cat.codes.astype('int64') + 1

    # tira a duplicidade
    dfx = df.loc[:, ['FK_dim_MotivosCanc', 'MotivoCancelamento']].drop_duplicates()
    dfx.rename(columns={'FK_dim_MotivosCanc': 'PK_dim_MotivosCanc'}, inplace = True)


    # preenche colunas com linhas vazias
    dfx.loc[dfx['MotivoCancelamento'] == '', ['MotivoCancelamento']] = '<sem motivo de cancelamento>'

    # exclui a coluna MotivoCancelamento de df_tasks que será a futura tabela fato
    df.drop(['MotivoCancelamento', 'tmpMotivoCancelamento'], axis=1, inplace=True)

    print('%d linhas OK.' %dfx.shape[0])
    
    return dfx

### DIM servico

In [None]:
def Mt_Servico(df, dff_sla):

    print('dim_Servico - iniciando montagem... ', end='')

    # trasnforma a coluna Servico em uma coluna do tipo "category'
    df['tmpServico'] = df['Servico'].astype('category')

    # cria uma nova coluna que será a coluna chave primária da dimensão Servico
    df['FK_dim_Servicos'] = df['tmpServico'].cat.codes.astype('int64') + 1

    # tira a duplicidade
    dfx = df.loc[:, ['FK_dim_Servicos', 'Servico']].drop_duplicates()

    # exclui a coluna Servico de df_tasks que será a futura tabela fato
    df.drop(['Servico', 'tmpServico'], axis=1, inplace=True)

    # defive os nomes das colunas de SLA
    cols = {'FK_dim_Servicos': 'PK_dim_Servicos',
            'Dentro do Prazo LMin': 'sla_VD_Lmin',
            'Perto do Prazo LMin': 'sla_AM_Lmin',
            'Fora do Prazo LMin': 'sla_VM_Lmin',
            'Dentro do Prazo LMax': 'sla_VD_Lmax',
            'Perto do Prazo LMax': 'sla_AM_LMax',
            'Fora do Prazo LMax': 'sla_VM_LMax',
           }
    # faz um merge da dimensão dim_Servicos com a tabela de SLAs
    dfx = dfx.merge(dff_sla, left_on='Servico', right_on='service', how='left')
    dfx = dfx.drop('service', axis=1)
    dfx.rename(columns=cols, inplace = True)
    
    print('%d linhas OK.' %dfx.shape[0])
    
    return dfx

### DIM status externo

In [None]:
def Mt_StatusExt(df):

    print('dim_StatusExt - iniciando montagem... ', end='')

    # trasnforma a coluna StatusExterno em uma coluna do tipo "category'
    df['tmpStatusExterno'] = df['StatusExterno'].astype('category')

    # cria uma nova coluna que será a coluna chave primária da dimensão Grupo
    df['FK_dim_StatusExt'] = df['tmpStatusExterno'].cat.codes.astype('int64') + 1

    # tira a duplicidade
    dfx = df.loc[:, ['FK_dim_StatusExt', 'StatusExterno']].drop_duplicates()
    dfx.rename(columns={'FK_dim_StatusExt': 'PK_dim_StatusExt'}, inplace = True)

    # exclui a coluna Grupo de df_tasks que será a futura tabela fato
    df.drop(['StatusExterno', 'tmpStatusExterno'], axis=1, inplace=True)

    # preenche colunas com linhas vazias
    dfx.loc[dfx['StatusExterno'] == '', ['StatusExterno']] = '<sem status>'

    print('%d linhas OK.' %dfx.shape[0])
    
    return dfx

### DIM usuario

In [None]:
def Mt_Usuarios(df):

    print('dim_Usuario - iniciando montagem... ', end='')

    # trasnforma a coluna Usuario em uma coluna do tipo "category'
    df['tmpUsuario'] = df['Usuarios'].astype('category')

    # cria uma nova coluna que será a coluna chave primária da dimensão Usuario
    df['FK_dim_Usuarios'] = df['tmpUsuario'].cat.codes.astype('int64') + 1

    # tira a duplicidade
    dfx = df.loc[:, ['FK_dim_Usuarios', 'Usuarios']].drop_duplicates()
    col_ren = {'FK_dim_Usuarios': 'PK_dim_Usuarios', 'Usuarios': 'Usuario'}
    dfx.rename(columns=col_ren, inplace = True)

    # exclui a coluna Usuario de df_tasks que será a futura tabela fato
    df.drop(['Usuarios', 'tmpUsuario'], axis=1, inplace=True)

    # preenche colunas com linhas vazias
    dfx.loc[dfx['Usuario'] == '', ['Usuario']] = '<usuário indefinido>'

    print('%d linhas OK.' %dfx.shape[0])
    
    return dfx

### DIM situacao

In [None]:
def Mt_Situacao():

    print('dim_Situacao - iniciando montagem... ', end='')

    dfx = pd.DataFrame({'PK_dim_Situacao': [1, 2, 3],
                        'Situacao':        ['em Andamento', 'Encerrada', 'Cancelada']}
                        )
    print('%d linhas OK.' %dfx.shape[0])

    return dfx


### DIM SLA

In [None]:
def Mt_SLA():

    print('dim_SLA - iniciando montagem... ', end='')

    dfx = pd.DataFrame({'PK_dim_SLA': [1, 2, 3],
                        'DescSLA':    ['dentro do prazo', 'perto do prazo', 'fora do prazo'],
                        'Cor':        ['verde','amarelo' ,'vermelho']}
                    )
    print('%d linhas OK.' %dfx.shape[0])

    return dfx

### DIM endereco

In [None]:
def Mt_Endereco(dfe):

    print('dim_Endereco - iniciando montagem... ', end='')

    dc = ['state', 'city', 'neighborhood', 'zipcode', 'street']
    df = dfe.loc[dfe['atributo'].isin(dc), ['atributo','valor', 'protocolo']].copy()
# ===================================================    
    # faz pivot da coluna atributo
    df = df.pivot(columns='atributo', values='valor', index='protocolo').reset_index()
    df.columns.name = None

    # renomeia colunas
    dic_renome = {'protocolo': 'Solicitacao', 
                  'zipcode': 'CEP', 
                  'street': 'Endereco', 
                  'neighborhood': 'Bairro', 
                  'city': 'Cidade', 
                  'state': 'UF'}
    df.rename(columns=dic_renome, inplace = True)
    
    # substitui a coluna Endereco por branco quando '-' ou null
    df.loc[(df['Endereco'] == '-') | (df['Endereco'].isnull()), ['Endereco']] = ''
    df.loc[(df['Bairro'] == '-') | (df['Bairro'].isnull()), ['Bairro']] = ''

    # cria a coluna Endereco Completo
    df['EnderecoCompleto'] = df['Cidade'] + ', ' + df['UF'] + ', Brasil' 

# ===================================================    

    dict_uf = {'AC': 'Acre', 'AL': 'Alagoas', 'AP': 'Amapá', 'AM': 'Amazonas', 'BA': 'Bahia',
               'CE': 'Ceará', 'ES': 'Espírito Santo', 'GO': 'Goiás', 'MA': 'Maranhão', 'MT': 'Mato Grosso',
               'MS': 'Mato Grosso do Sul', 'MG': 'Minas Gerais', 'PA': 'Pará', 'PB': 'Paraíba',
               'PR': 'Paraná', 'PE': 'Pernambuco', 'PI': 'Piauí', 'RJ': 'Rio de Janeiro',
               'RN': 'Rio Grande do Norte', 'RS': 'Rio Grande do Sul', 'RO': 'Rondônia', 'RR': 'Roraima',
               'SC': 'Santa Catarina', 'SP': 'São Paulo', 'SE': 'Sergipe', 'TO': 'Tocantins', 'DF': 'Distrito Federal',
               '<nd>': '<sem UF>'
    }

    # acrescenta o nome do estado ao dataframe
    dfx = df.copy()
    dfx['NomeUF'] = dfx['UF'].apply(lambda x: dict_uf.get(x, None))
    dfx.rename(columns={'Solicitacao': 'PK_dim_Endereco'}, inplace = True)

    # preenche colunas com linhas vazias
    dfx.loc[dfx['CEP'].isna(), ['CEP']] = ''

    print('%d linhas OK.' %dfx.shape[0])

    return dfx

### FAT tasks

In [None]:
# função retorna a situação da solicitação de acordo com as coilunas cancelado e encerrado
def RetSit(Enc, Canc):
    rt = 0
    if Canc == 1:
        rt = 3
    elif Enc == 1:
        rt = 2
    else:
        rt = 1
    return rt

In [None]:
def Mt_Tasks(df, dfr):

    print('fat_Tasks - iniciando montagem... ', end='')

    dfx = df.copy()
    
    # faz um merge com o dataset de ratings
    dfx = df.merge(dfr, left_on='Protocolo', right_on='Solicitacao', how='left')
    dfx.drop(['Solicitacao'], axis=1, inplace=True)

    # define o código de situação da solicitação
    df_aux = dfx[['Protocolo', 'ProcessoEncerrado', 'ProcessoCancelado']].drop_duplicates()

    # substui valores de colunas
    troca = {'false': 0, 'true': 1}
    df_aux['ProcessoEncerrado'] = df_aux['ProcessoEncerrado'].map(troca)
    df_aux['ProcessoCancelado'] = df_aux['ProcessoCancelado'].map(troca)

    # agrega as ações para um registro por protocolo
    df_aux = df_aux.groupby('Protocolo').agg({'ProcessoEncerrado': 'max', 'ProcessoCancelado': 'max'}).reset_index()

    # retorna a situção da solicitação: 1-em andamento, 2-encerrado, 3-cancelado
    df_aux['Situacao'] = df_aux.apply(lambda x: RetSit(x['ProcessoEncerrado'], x['ProcessoCancelado']), axis=1)
    df_aux.drop(['ProcessoEncerrado', 'ProcessoCancelado'], axis=1, inplace=True)

    # faz merge com o dataset de situação da solicitação
    dfx = dfx.merge(df_aux, left_on='Protocolo', right_on='Protocolo', how='left')
    dfx.drop(['ProcessoEncerrado', 'ProcessoCancelado'], axis=1, inplace=True)

    # coloca -1 para as solicitações que não possuem avaliação
    dfx.loc[dfx['NotaAvaliacao'].isna(), 'NotaAvaliacao'] = -1
    dfx['NotaAvaliacao'] = dfx['NotaAvaliacao'].astype('int32')

    # renomeia as colunas
    col_ren = {'Protocolo': 'FK_dim_Solicitacoes', 'Situacao': 'FK_dim_Situacao'}
    dfx.rename(columns=col_ren, inplace = True)

    # trata a coluna Prazo
    dfx['Prazo'] == ''
    dfx.loc[dfx['Prazo'] == '', 'Prazo'] = '0'
    dfx['Prazo'] = dfx['Prazo'].astype('int64')

    dfx['DataCriacao'] = pd.to_datetime(dfx['DataHora_Criacao']).dt.date
    dfx['HoraCriacao'] = pd.to_datetime(dfx['DataHora_Criacao']).dt.time

    dfx['DataConclusao'] = pd.to_datetime(dfx['DataHora_Conclusao']).dt.date
    dfx['HoraConclusao'] = pd.to_datetime(dfx['DataHora_Conclusao']).dt.time

    dfx.drop(['DataHora_Criacao', 'DataHora_Conclusao'], axis=1, inplace=True)

    cols_ordem = ['FK_dim_Solicitacoes', 'Prazo', 'DataCriacao', 'HoraCriacao', 
                  'DataConclusao', 'HoraConclusao', 
                  'NotaAvaliacao', 'MotivoAvaliacao', 
                  'DataAvaliacao', 'HoraAvaliacao', 
                  'FK_dim_Entidades', 'FK_dim_Servicos', 'FK_dim_Usuarios', 'FK_dim_GruposUsuarios', 
                  'FK_dim_Acoes', 'FK_dim_StatusExt', 'FK_dim_CategoriasServicos', 'FK_dim_GrupoResponsavel', 
                  'FK_dim_MotivosCanc', 'FK_dim_Encaminhamento', 'FK_dim_Situacao'
                ]
    dfx = dfx[cols_ordem]

    print('%d linhas OK.' %dfx.shape[0])

    return dfx


### <font color='green'>META BI - Constantes</font>

In [None]:
# tabela de decisão de combinação Dimensões e Métricas
mtx =  [('STRING_DIM',  'INTEGER_MET', 'N', 'N', 'S', 'S'),
        ('STRING_DIM',  'DOUBLE_MET',  'N', 'N', 'S', 'S'),
        ('STRING_DIM',  'NULL_MET',    'S', 'S', 'N', 'N'),

        ('BOOLEAN_DIM', 'INTEGER_MET', 'S', 'N', 'N', 'N'),
        ('BOOLEAN_DIM', 'DOUBLE_MET',  'S', 'N', 'N', 'N'),
        ('BOOLEAN_DIM', 'NULL_MET',    'S', 'N', 'N', 'N'),

        ('INTEGER_DIM', 'INTEGER_MET', 'S', 'S', 'S', 'S'),
        ('INTEGER_DIM', 'DOUBLE_MET',  'N', 'N', 'N', 'N'),
        ('INTEGER_DIM', 'NULL_MET',    'S', 'S', 'N', 'N'),

        ('DOUBLE_MET',  'INTEGER_MET', 'N', 'N', 'N', 'N'),
        ('DOUBLE_MET',  'DOUBLE_MET',  'N', 'N', 'S', 'S'),
        ('DOUBLE_MET',  'NULL_MET',    'N', 'N', 'N', 'N'),

        ('ID_DIM',      'INTEGER_MET', 'N', 'N', 'S', 'S'),
        ('ID_DIM',      'DOUBLE_MET',  'N', 'N', 'S', 'S'),
        ('ID_DIM',      'NULL_MET',    'S', 'S', 'N', 'N')
        ]
# colunas da tabela de decisão de combinação Dimensões e Métricas
cols_mtx = ['t_dim', 't_met', 'Count', 'Distinct Count', 'Sum', 'Average']

### <font color='green'>META BI - Tabelas Auxiliares</font>

In [None]:
def GeraCodDimMet(d, m):
    d_dim = {'STRING_DIM': 10, 'BOOLEAN_DIM': 20, 'INTEGER_DIM' :30, 'DOUBLE_DIM': 40, 'ID_DIM': 50}
    d_met = {'INTEGER_MET': 1, 'DOUBLE_MET': 2, 'NULL_MET': 3}

    v_dim = d_dim[d] if d in d_dim else 0
    v_met = d_met[m] if m in d_met else 0
    
    return v_dim + v_met

In [None]:
def Enumerico(s, tipo):
    try:
        v = np.float64(s) if tipo == 'DOUBLE' else np.int64(s)
    except:
        return False
    
    return True

In [None]:
def Z_aux_entidade(df):
    # recebe df=tasks

    print('Z_aux_entidade - iniciando montagem... ', end='')

    df_ret = df[['Protocolo', 'Entidade']].drop_duplicates()
    df_ret.columns = ['protocolo', 'entidade']
    
    print('%d linhas OK.' %df_ret.shape[0])

    return df_ret

In [None]:
def Z_aux_BASE(df, df2):
    # recebe df=form, df2=df_aux_entidade

    print('Z_aux_BASE - iniciando montagem... ', end='')

    df_ret = df.copy()
    
    # transforma as strings atributo e campo relacionado em lower case
    df_ret[['atributo', 'campo_relacionado']] = df_ret[['atributo', 'campo_relacionado']].apply(lambda x: x.str.lower())

    # faz um merge da dimensão df_aux_BASE com a df_auxentidade para adicionar a coluna entidade
    # se não existir o protocolo na tasks não considera a linha -- isso é um erro de integridade da base de dados
    df_ret = df_ret.merge(df2, on='protocolo')    
    
    # cria 3 novas colunas vazias
    df_ret['MET_atributo'] = np.nan
    df_ret['MET_valor']    = np.nan
    df_ret['MET_tipo']     = np.nan

    # cria uma coluna como PK
    df_ret['PK'] = df_ret['entidade'] + '_' + df_ret['servico'] + '_' + \
                        df_ret['atributo'] + '_' + df_ret['protocolo']

    # cria uma coluna com o tipo de registro
    df_ret['TIPO_REG'] = 'BASE'
    
    print('%d linhas OK.' %df_ret.shape[0])
    
    return df_ret
    

In [None]:
# traramento do tipo INTEGER ou DOUBLE
def Z_aux_MET(df):
    # recebe df=df_aux_BASE

    print('Z_aux_MET e Z_aux_MET_Err - iniciando montagem... ', end='')

    # dataset de métricas - usa somente tipo "INTEGER" ou "DOUBLE"
    cols = ['atributo', 'nome', 'valor', 'protocolo', 'servico', 'tipo', 'campo_relacionado', 'entidade']
    df_ret = df.loc[(df['tipo'] == 'INTEGER') | (df['tipo'] == 'DOUBLE'), cols].copy()

    # os valores estão com formato: ponto para separador de milhar e vírgula para fração
    # tira os pontos separador de milhar e substitui vírgula por ponto
    df_ret['valor'] = df_ret['valor'].apply(lambda x: x.replace('.', '').replace(',', '.'))

    # alimenta uma coluna indicadora que mostra se o valor corresponde ou não ao tipo
    df_ret['numerico'] = df_ret.apply(lambda x: Enumerico(x['valor'], x['tipo']), axis=1)

    # cria um dataset de linhas cuja o valor não corresponde ao tipo
    df_ret_Err = df_ret[df_ret['numerico'] == False].drop('numerico', axis=1)

    # cria um dataset de linhas de métricas
    df_ret = df_ret[~df_ret['numerico'] == False].drop('numerico', axis=1)

    # identifica que esse é um dataset de métricas
    df_ret['TIPO_REG'] = 'MET'

    # exclui linhas que não seja uma métrica explícita
    df_ret = df_ret[~(df_ret['campo_relacionado'] == 'null')]

    # cria a coluna FK para relacionar com o dataset BASE
    df_ret['FK'] = df_ret['entidade'] + '_' + df_ret['servico'] + '_' + \
                   df_ret['campo_relacionado'] + '_' + df_ret['protocolo']

    # troca o nome de algumas colunas
    dc = {'atributo': 'MET_atributo', 'campo_relacionado': 'atributo', 'valor': 'MET_valor', 'tipo': 'MET_tipo'}
    df_ret.rename(columns=dc, inplace = True)

    # faz um merge com o dataset BASE 
    df_ret = df_ret.merge(df[['PK', 'valor', 'tipo']], left_on='FK', right_on='PK')
    df_ret.drop(['PK', 'FK'], axis=1, inplace=True)
    
    print('%d e %d linhas OK.' %(df_ret.shape[0], df_ret_Err.shape[0]))

    return df_ret, df_ret_Err
    

In [None]:
def Z_aux_DIM(df, df_m):
# recebe df=df_aux_BASE, df_m=df_aux_MET

    print('Z_aux_DIM - iniciando montagem... ', end='')

    # escolee as colunas que farão a cancatenação de dataframes
    cols = ['atributo', 'nome', 'valor', 'protocolo', 'servico', 'tipo', 
            'entidade', 'MET_atributo', 'MET_valor', 'MET_tipo', 'TIPO_REG']
    df_ret = df[cols].copy()
    df_ret = pd.concat([df_ret, df_m])
    
    print('%d linhas OK.' %df_ret.shape[0])

    return df_ret

In [None]:
def Z_aux_decisao():

    print('Z_aux_decisao - iniciando montagem... ', end='')

    df_ret = pd.DataFrame(mtx, columns=cols_mtx)
    df_ret['Cod_Decisao'] = df_ret.apply(lambda x: GeraCodDimMet(x['t_dim'], x['t_met']), axis=1)
    
    print('%d linhas OK.' %df_ret.shape[0])
    
    return df_ret

In [None]:
def Z_aux_DataSolicitacao(df):
    # recebe df=tasks

    print('Z_aux_DataSolicitacao - iniciando montagem... ', end='')

    df_tmp = df[['Protocolo', 'DataHora_Criacao']].copy()
    # cria uma coluna só de datas
    df_tmp['data_criacao'] = pd.to_datetime(df_tmp['DataHora_Criacao']).dt.date

    # pega a menor data de cada número de protocolo
    df_ret = df_tmp[['Protocolo', 'data_criacao']].groupby('Protocolo').agg('min').reset_index()
    df_ret.columns = ['protocolo', 'data_criacao']
    
    print('%d linhas OK.' %df_ret.shape[0])

    return df_ret


In [None]:
def Z_aux_pto(df):
    # recebe df=df_aux_dec

    print('Z_aux_pto - iniciando montagem... ', end='')

    # faz uma cópia da tabela de decisão com as colunas necessárias
    cols = ['Cod_Decisao'] + cols_mtx[2:]
    df_ret = df[cols].copy()

    # faz o unpivot
    df_ret = pd.melt(df_ret, id_vars=['Cod_Decisao'], 
                     value_vars=['Count', 'Distinct Count', 'Sum', 'Average'],
                     var_name='Atributo')
    df_ret = df_ret[df_ret['value'] == 'S'].drop('value', axis=1)

    # trasnforma a coluna Atributo em uma coluna do tipo "category'
    df_ret['Atributo'] = df_ret['Atributo'].astype('category')

    # cria uma nova coluna que será a coluna chave primária da dimensão Operação
    df_ret['FK_ZN_dim_OPERACAO'] = df_ret['Atributo'].cat.codes.astype('int64') + 1
    
    print('%d linhas OK.' %df_ret.shape[0])

    return df_ret

### <font color='green'>META BI - Tabelas Dim, Fat e Pto</font>

In [None]:
def Z_pto_Decisao_Operacao(df):
    # recebe df=df_Z_aux_pto

    print('Z_pto_decisao_operacao - iniciando montagem... ', end='')

    df_ret = df.copy()
    
    # cria a tabela df_pto_decisao_operacao necessária ao modelo dimensional
    df_ret = df_ret[['Cod_Decisao', 'FK_ZN_dim_OPERACAO']]
    df_ret.columns = ['FK_dim_DECISAO', 'FK_ZN_dim_OPERACAO']
    
    print('%d linhas OK.' %df_ret.shape[0])

    return df_ret


In [None]:
def Z_dim_DIM(df):
    # recebe df=df_aux_DIM

    print('Z_dim_DIM - iniciando montagem... ', end='')

    df_ret = df.copy()

    df_ret = df_ret[['atributo', 'nome']].drop_duplicates().reset_index(drop=True).reset_index()
    df_ret.columns = ['PK_Z_dim_DIM', 'dimensao', 'nome']
    df_ret['PK_Z_dim_DIM'] += 1
    
    print('%d linhas OK.' %df_ret.shape[0])

    return df_ret


In [None]:
def Z_dim_SERVICO(df):    
    # recebe df=df_aux_DIM

    print('Z_dim_SERVICO - iniciando montagem... ', end='')

    df_ret = df.copy()

    df_ret = df_ret['servico'].drop_duplicates().reset_index(drop=True).reset_index()
    df_ret.columns = ['PK_Z_dim_SERVICO', 'servico']
    df_ret['PK_Z_dim_SERVICO'] += 1
    
    print('%d linhas OK.' %df_ret.shape[0])

    return df_ret


In [None]:
def Z_dim_MET(df):    
    # recebe df=df_aux_DIM

    print('Z_dim_MET - iniciando montagem... ', end='')

    df_ret = df.copy()

    df_ret = df_ret.loc[~df_ret['MET_atributo'].isna(), 'MET_atributo'].drop_duplicates()
    df_ret = df_ret.reset_index(drop=True).reset_index()
    df_ret.columns = ['PK_Z_dim_MET', 'metrica']
    df_ret['PK_Z_dim_MET'] += 1

    print('%d linhas OK.' %df_ret.shape[0])

    return df_ret


In [None]:
def Z_dim_OPERACAO(df):    
    # recebe df=df_aux_pto

    print('Z_dim_OPERACAO - iniciando montagem... ', end='')

    df_ret = df.copy()

    df_ret = df_ret[['FK_ZN_dim_OPERACAO', 'Atributo']].drop_duplicates()
    df_ret.columns = ['PK_Z_dim_OPERACAO', 'operacao']

    print('%d linhas OK.' %df_ret.shape[0])

    return df_ret


In [None]:
def Z_dim_DECISAO(df):    
    # recebe df=df_aux_dec

    print('Z_dim_DECISAO - iniciando montagem... ', end='')

    df_ret = df.copy()

    df_ret = df_ret[['Cod_Decisao', 't_dim', 't_met']].copy().rename(columns={'Cod_Decisao': 'PK_Z_dim_DECISAO'})

    print('%d linhas OK.' %df_ret.shape[0])

    return df_ret


In [None]:
def Z_fat_META(df, df_dim, df_ser, df_met, df_dts):    
    # recebe df=df_Z_dim_DIM, df_ser=df_Z_dim_SERVICO, df_met= df_Z_dim_MET, df_dts=df_Z_aux_DataSolicitacao

    print('Z_fat_META - iniciando montagem... ', end='')

    # copia o df auxiliar
    df_ret = df.copy()

    # faz merge com dim_DIM
    df_ret = df_ret.merge(df_dim, 
                          how='left', 
                          left_on=['atributo', 'nome'], 
                          right_on=['dimensao', 'nome']).drop(['atributo', 'nome', 'dimensao'], axis=1)
    # faz merge com dim_SERVICO
    df_ret = df_ret.merge(df_ser, 
                          how='left', 
                          left_on='servico', 
                          right_on='servico').drop('servico', axis=1)
    # faz merge com dim_MET
    df_ret = df_ret.merge(df_met, 
                          how='left', 
                          left_on='MET_atributo', 
                          right_on='metrica').drop(['MET_atributo', 'metrica'], axis=1)
    # faz merge com Z_aux_DataSolicitacao
    df_ret = df_ret.merge(df_dts, 
                          how='left', 
                          on='protocolo') #.drop(['MET_atributo', 'metrica'], axis=1)

    # cria a coluna indicadora de NULL_MET
    df_ret['reg_nativo'] = df_ret['MET_tipo'].apply(lambda x: 1 if pd.isna(x) else 0)

    # passa as colunas de tipo para a string indicadora de NULL
    df_ret.loc[df_ret['MET_tipo'].isna(), 'MET_tipo'] = 'NULL_MET'
    df_ret.loc[df_ret['tipo'].isna(), 'tipo'] = 'NULL_DIM'


    # substitui valores da coluna tipo
    subs_dim = {'STRING':'STRING_DIM', 
                'INTEGER': 'INTEGER_DIM', 
                'BOOLEAN':'BOOLEAN_DIM', 
                'DOUBLE': 'DOUBLE_DIM',
                'ID':'ID_DIM'}
    subs_met = {'INTEGER': 'INTEGER_MET', 
                'DOUBLE': 'DOUBLE_MET'}

    df_ret['tipo'].replace(subs_dim, inplace=True)
    df_ret['MET_tipo'].replace(subs_met, inplace=True)

    # acha o código para a tabela de decisão da dupla de tipos como FK para a PK de "df_aux_dec"
    df_ret['FK_Z_dim_DECISAO'] = df_ret.apply(lambda x: GeraCodDimMet(x['tipo'], x['MET_tipo']), axis=1)

    # exclui colunas já usadas
    df_ret.drop(['tipo', 'MET_tipo'], axis=1, inplace=True)

    # acerta os nomes das colunas
    dc = {'PK_Z_dim_DIM': 'FK_Z_dim_DIM', 
          'PK_Z_dim_SERVICO': 'FK_Z_dim_SERVICO', 
          'PK_Z_dim_MET': 'FK_Z_dim_MET', 
          'data_criacao': 'FK_Z_Data_Criacao'}
    df_ret.rename(columns=dc, inplace = True)

    # acerta os tipos das colunas
    df_ret['FK_Z_dim_MET'] = df_ret['FK_Z_dim_MET'].astype('Int64')
    df_ret['MET_valor'] = df_ret['MET_valor'].astype('float64')
    df_ret['FK_Z_Data_Criacao'] = df_ret['FK_Z_Data_Criacao'].apply(pd.to_datetime)

    print('%d linhas OK.' %df_ret.shape[0])

    return df_ret


# <font color='red'>4.0 LOAD</font>

In [None]:
def Load_BD(strAut):

    # import the module
    # create sqlalchemy engine

    print('LoadBD - carregando tabelas no BD... ', end='')

    SQLengine = create_engine("mysql+pymysql://{user}:{pw}@{host}/{db}"
                           .format(user = strAut['My_user'],
                                   pw   = strAut['My_pw'],
                                   host = strAut['My_host'],
                                   db   = strAut['My_db']),
                                   pool_recycle=3600)
    dbConn = SQLengine.connect()

    try:
        df_dim_Acao.to_sql(               'dim_acoes',               
                                           con=dbConn, if_exists='replace', 
                                           index=False, chunksize = 1000)    
        df_dim_Categoria.to_sql(          'dim_categorias_servicos', 
                                           con=dbConn, if_exists='replace', 
                                           index=False, chunksize = 1000)
        df_dim_Encaminhamento.to_sql(     'dim_encaminhamento',      
                                           con=dbConn, if_exists='replace', 
                                           index=False, chunksize = 1000)
        df_dim_Entidade.to_sql(           'dim_entidades',           
                                           con=dbConn, if_exists='replace', 
                                           index=False, chunksize = 1000)
        df_dim_GrupoResponsavel.to_sql(   'dim_grupo_responsavel',   
                                           con=dbConn, if_exists='replace', 
                                           index=False, chunksize = 1000)
        df_dim_Grupo.to_sql(              'dim_grupos_usuarios',     
                                           con=dbConn, if_exists='replace', 
                                           index=False, chunksize = 1000)
        df_dim_MotivoCanc.to_sql(         'dim_motivos_canc',        
                                           con=dbConn, if_exists='replace', 
                                           index=False, chunksize = 1000)
        df_dim_Servicos.to_sql(           'dim_servicos',            
                                           con=dbConn, if_exists='replace', 
                                           index=False, chunksize = 1000)
        df_dim_StatusExt.to_sql(          'dim_status_ext',          
                                           con=dbConn, if_exists='replace', 
                                           index=False, chunksize = 1000)
        df_dim_Usuarios.to_sql(           'dim_usuarios',            
                                           con=dbConn, if_exists='replace', 
                                           index=False, chunksize = 1000)
        df_dim_Situacao.to_sql(           'dim_situacao',            
                                           con=dbConn, if_exists='replace', 
                                           index=False, chunksize = 1000)
        df_dim_SLA.to_sql(                'dim_sla',                 
                                           con=dbConn, if_exists='replace', 
                                           index=False, chunksize = 1000)
        df_dim_Endereco.to_sql(           'dim_endereco',            
                                           con=dbConn, if_exists='replace', 
                                           index=False, chunksize = 1000)

        df_fat_tasks.to_sql(              'fat_tasks',               
                                           con=dbConn, if_exists='replace', 
                                           index=False, chunksize = 1000)

        df_Z_pto_decisao_operacao.to_sql( 'z_pto_decisao_operacao',  
                                           con=dbConn, if_exists='replace', 
                                           index=False, chunksize = 1000)
        df_Z_dim_DIM.to_sql(              'z_dim_dim',  
                                           con=dbConn, if_exists='replace', 
                                           index=False, chunksize = 1000)
        df_Z_dim_SERVICO.to_sql(          'z_dim_servico',  
                                           con=dbConn, if_exists='replace', 
                                           index=False, chunksize = 1000)
        df_Z_dim_MET.to_sql(              'z_dim_met',  
                                           con=dbConn, if_exists='replace', 
                                           index=False, chunksize = 1000)
        df_Z_dim_OPERACAO.to_sql(         'z_dim_operacao',  
                                           con=dbConn, if_exists='replace', 
                                           index=False, chunksize = 1000)
        df_Z_dim_DECISAO.to_sql(          'z_dim_decisao',  
                                           con=dbConn, if_exists='replace', 
                                           index=False, chunksize = 1000)
        df_Z_fat_META.to_sql(             'z_fat_meta',  
                                           con=dbConn, if_exists='replace', 
                                           index=False, chunksize = 1000)
        df_ts.to_sql(                     'ctl_carga',  
                                           con=dbConn, if_exists='append', 
                                           index=False, chunksize = 1000)

        print('OK')
        
    except ValueError as vx:
        print('ERROR -', vx)

    except Exception as ex: 
        print('EXCEPTION -', ex)

    else:
        print('Tabelas criadas com sucesso');  

    finally:
        dbConn.close()

# <font color='red'>0.0 MAIN</font>

In [None]:
# monta as strings de conexão
def StrConn(sit):
    in_oper   = {'My_host': 'localhost', 'My_db': 'bd_fontes',       'My_user': 'gd', 'My_pw': 'Alpar@123'}
    out_oper  = {'My_host': 'localhost', 'My_db': 'bd_dw',           'My_user': 'gd', 'My_pw': 'Alpar@123'}
    in_teste  = {'My_host': 'localhost', 'My_db': 'bd_teste_fontes', 'My_user': 'gd', 'My_pw': 'Alpar@123'}
    out_teste = {'My_host': 'localhost', 'My_db': 'bd_teste_dw',     'My_user': 'gd', 'My_pw': 'Alpar@123'}
    
    # se True é teste
    if sit:
        rt_in = in_teste
        rt_out = out_teste
    else:
        rt_in = in_oper
        rt_out = out_oper

    return rt_in, rt_out

In [None]:
def gd_timestamp():
    lst = {'DataHora': [datetime.today()], 'Versao': [ETL_VERSAO]}
    df = pd.DataFrame(lst)
    
    return df

In [None]:
x = False
    
print('Iniciando ETL {0}'.format('TESTE' if x else 'OPERAÇÃO'))

In [None]:
if __name__ == '__main__':
    
    etl_teste = False
    
    print('Iniciando ETL {0}'.format('TESTE' if etl_teste else 'OPERAÇÃO'))

    # EXTRACT
    AUTENTIC_IN, AUTENTIC_OUT = StrConn(etl_teste)
    df_tasks, df_sla, df_form, df_rating = LeFontes(AUTENTIC_IN)
    
    # TRANSFORM
    # trata os datasets
    df_sla    = trSLA(df_sla)
    df_form   = trForm(df_form)
    df_rating = trRating(df_rating)
    df_tasks  = trTasks(df_tasks)
    
    dft = df_tasks.copy()
    dff = df_form.copy()
    
    # monta as tabelas dimensão
    df_dim_Acao              = Mt_dim_Acoes(df_tasks)
    df_dim_Categoria         = Mt_dim_CategoriaServico(df_tasks)
    df_dim_Encaminhamento    = Mt_dim_Encaminhamento(df_tasks)
    df_dim_Entidade          = Mt_dim_Entidade(df_tasks)
    df_dim_GrupoResponsavel  = Mt_dim_GrupoResponsavel(df_tasks)
    df_dim_Grupo             = Mt_dim_GruposUsuarios(df_tasks)
    df_dim_MotivoCanc        = Mt_MotivosCanc(df_tasks)
    df_dim_Servicos          = Mt_Servico(df_tasks, df_sla)
    df_dim_StatusExt         = Mt_StatusExt(df_tasks)
    df_dim_Usuarios          = Mt_Usuarios(df_tasks)
    df_dim_Situacao          = Mt_Situacao()
    df_dim_SLA               = Mt_SLA()
    df_dim_Endereco          = Mt_Endereco(df_form)
    
    # monta a tabela fato
    df_fat_tasks             = Mt_Tasks(df_tasks, df_rating)
    
    # monta as tabelas auxiliares do META BI
    df_Z_aux_entidade              = Z_aux_entidade(dft)
    df_Z_aux_BASE                  = Z_aux_BASE(dff, df_Z_aux_entidade)
    df_Z_aux_MET, df_Z_aux_MET_Err = Z_aux_MET(df_Z_aux_BASE)
    df_Z_aux_DIM                   = Z_aux_DIM(df_Z_aux_BASE, df_Z_aux_MET)
    df_Z_aux_decisao               = Z_aux_decisao()
    df_Z_aux_DataSolicitacao       = Z_aux_DataSolicitacao(dft)
    df_Z_aux_pto                   = Z_aux_pto(df_Z_aux_decisao)
    
    # monta as tabelas dimensão do META BI
    df_Z_pto_decisao_operacao      = Z_pto_Decisao_Operacao(df_Z_aux_pto)
    df_Z_dim_DIM                   = Z_dim_DIM(df_Z_aux_DIM)
    df_Z_dim_SERVICO               = Z_dim_SERVICO(df_Z_aux_DIM)
    df_Z_dim_MET                   = Z_dim_MET(df_Z_aux_DIM)
    df_Z_dim_OPERACAO              = Z_dim_OPERACAO(df_Z_aux_pto)
    df_Z_dim_DECISAO               = Z_dim_DECISAO(df_Z_aux_decisao)

    # monta as tabelas dimensão do META BI
    df_Z_fat_META                  = Z_fat_META(df_Z_aux_DIM,
                                                df_Z_dim_DIM, 
                                                df_Z_dim_SERVICO, 
                                                df_Z_dim_MET, 
                                                df_Z_aux_DataSolicitacao)
    
    # monta data e hora e versão da atualização
    df_ts = gd_timestamp()

    # LOAD
    ret = Load_BD(AUTENTIC_OUT)
    