# Imports

In [40]:
import pandas as pd
from datetime import datetime
from pathlib import Path
import sqlite3 as sql

# Variáveis

In [41]:
# Variável que determina a data da carga de uma tabela.
dtCarga = datetime.today().strftime('%d/%m/%Y %H:%M')

# Variável com o diretório local onde serão salvos os bancos de dados SQLite.
endereco = Path('G:\\Meu Drive\\Projetos - Data Engineer\\Databases\\')

# Definindo o local de criação dos bancos.
BDODS = endereco / "ibgeSTG.db"                  #ODS = Operational Data Store
BDDW = endereco / "ibgeDW.db"                    #DW = Data Warehouse

# Conectando nos bancos de dados.
connODS = sql.connect(BDODS)
connDW = sql.connect(BDDW)

# Definindo a manipulação de dados via SQL.
SQL_ODS = connODS.cursor()
SQL_DW = connDW.cursor()

# Criação dos bancos de dados

In [42]:
# Criando os bancos de dados ODS e DW.

if endereco.exists():
    if (BDODS.exists() and BDDW.exists()):
        print('Bancos de dados já existem!')
    else:
        BDODS.touch()
        BDDW.touch()
        print('Bancos de dados criados!')
else:
    print('Endereço não existe! Favor, verificar!')

Bancos de dados já existem!


# Criação das tabelas na Stage Area

In [43]:
# Definindo a query de criação da tabela st_dp.

qry_st_dp = '''
    CREATE TABLE IF NOT EXISTS st_dp (
    
    cod_dp INTEGER,
    nm_dp VARCHAR (100),
    endereco VARCHAR (255),
    dtCarga DATETIME
    )
'''

# Executando a query para criação da tabela.
SQL_ODS.execute(qry_st_dp)

# Definindo a query de criação do index.
qry_idx_stdp = "CREATE INDEX IF NOT EXISTS idx_st_dp ON st_dp (cod_dp)"

# Executando a query para criação do index.
SQL_ODS.execute(qry_idx_stdp)

connODS.commit()

In [44]:
# Definindo a query de criação da tabela st_resp_dp.

qry_st_resp_dp = '''
    CREATE TABLE IF NOT EXISTS st_resp_dp (
    
    cod_dp INTEGER,
    nm_responsavel VARCHAR (100),
    dtCarga DATETIME
    )
'''

# Executando a query para criação da tabela.
SQL_ODS.execute(qry_st_resp_dp)

# Definindo a query de criação do index.
qry_idx_strespdp = "CREATE INDEX IF NOT EXISTS idx_st_resp_dp ON st_resp_dp (cod_dp)"

# Executando a query para criação do index.
SQL_ODS.execute(qry_idx_strespdp)

connODS.commit()

In [45]:
# Definindo a query de criação da tabela st_bpm.

qry_st_bpm = '''
    CREATE TABLE IF NOT EXISTS st_bpm (
    
    cod_bpm INTEGER,
    nm_bpm VARCHAR (10),
    endereco VARCHAR (255),
    dtCarga DATETIME
    )
'''

# Executando a query para criação da tabela.
SQL_ODS.execute(qry_st_bpm)

# Definindo a query de criação do index.
query_idx_stbpm = "CREATE INDEX IF NOT EXISTS idx_st_bpm ON st_bpm (cod_bpm)"

# Executando a query para criação do index.
SQL_ODS.execute(query_idx_stbpm)

connODS.commit()

In [46]:
# Definindo a query de criação da tabela st_area_bpm.

qry_st_area_bpm = '''
    CREATE TABLE IF NOT EXISTS st_area_bpm (
    
    cod_bpm INTEGER,
    area_bpm REAL (5,2),
    dtCarga DATETIME
    )
'''

# Executando a query para criação da tabela.
SQL_ODS.execute(qry_st_area_bpm)

# Definindo a query de criação do index na tabela.
qry_idx_stareabpm = "CREATE INDEX IF NOT EXISTS idx_st_area_bpm ON tbLogAreaBPM (cod_bpm)"

# Executando a query para criação do index.
SQL_ODS.execute(qry_idx_stareabpm)

connODS.commit()

In [47]:
# Definindo a query de criação da tabela st_municipio.

qry_st_municipio = '''
    CREATE TABLE IF NOT EXISTS st_municipio (
    
    cod_municipio INTEGER,
    nm_municipio VARCHAR (255),
    dtCarga DATETIME
    )
'''

# Executando a query para criação da tabela.
SQL_ODS.execute(qry_st_municipio)

# Definindo a query de criação do index na tabela.
qry_idx_stmunicipio = "CREATE INDEX IF NOT EXISTS idx_st_municipio ON st_municipio (cod_municipio)"

# Executando a query para criação do index.
SQL_ODS.execute(qry_idx_stmunicipio)

connODS.commit()

In [48]:
# Definindo a query de criação da tabela st_ocorrencias.

qry_st_ocorrencias = '''
    CREATE TABLE IF NOT EXISTS st_ocorrencias (
    
    cod_dp INTEGER,
    cod_bpm INTEGER,
    ano INTEGER,
    mes INTEGER,
    ano_mes VARCHAR (10),
    regiao INTEGER,
    cod_municipio INTEGER,
    ocorrencia VARCHAR (255),
    quantidade INTEGER,
    dtCarga DATETIME
    )
    
'''
# Executando a query para criação da tabela.
SQL_ODS.execute(qry_st_ocorrencias)

# Definindo a query de criação do index na tabela.
qry_idx_stocorrencias = "CREATE INDEX IF NOT EXISTS idx_st_ocorrencias ON st_ocorrencias (cod_dp, cod_bpm, ano_mes, cod_municipio)"

# Executando a query para criação do index.
SQL_ODS.execute(qry_idx_stocorrencias)

connODS.commit()

# Criação das tabelas Dimensão no Data Warehouse

In [49]:
# Definindo a query de criação da tabela dim_dp.

qry_dim_dp = '''
    CREATE TABLE IF NOT EXISTS dim_dp (
    
    sk_dp INTEGER PRIMARY KEY AUTOINCREMENT,
    cod_dp INTEGER,
    nm_dp VARCHAR (100),
    endereco VARCHAR (255),
    nm_responsavel VARCHAR (100)
    )
'''

# Executando a query para criação da tabela.
SQL_DW.execute(qry_dim_dp)

# Definindo a query de criação do index na tabela.
qry_idx_dimdp = "CREATE INDEX IF NOT EXISTS idx_dim_dp ON dim_dp (sk_dp)"

# Executando a query para criação do index.
SQL_DW.execute(qry_idx_dimdp)

connDW.commit()

In [50]:
# Definindo a query de criação da tabela dim_bpm.

qry_dim_bpm = '''
    CREATE TABLE IF NOT EXISTS dim_bpm (
    
    sk_bpm INTEGER PRIMARY KEY AUTOINCREMENT,
    cod_bpm INTEGER,
    nm_bpm VARCHAR (10),
    endereco VARCHAR (255),
    area_bpm REAL (5,2)
    )
'''

# Executando a query para criação da tabela.
SQL_DW.execute(qry_dim_bpm)

# Definindo a query de criação do index na tabela.
qry_idx_dimbpm = "CREATE INDEX IF NOT EXISTS idx_dim_bpm ON dim_bpm (sk_dp)"

# Executando a query para criação do index.
SQL_DW.execute(qry_idx_dimdp)

connDW.commit()

In [51]:
# Definindo a query de criação da tabela dim_municipio.

qry_dim_municipio = '''
    CREATE TABLE IF NOT EXISTS dim_municipio (
    
    sk_municipio INTEGER PRIMARY KEY AUTOINCREMENT,
    cod_municipio INTEGER,
    nm_municipio VARCHAR (255)
    )
'''

# Executando a query para criação da tabela.
SQL_DW.execute(qry_dim_municipio)

# Definindo a query de criação do index na tabela.
qry_idx_dimmunicipio = "CREATE INDEX IF NOT EXISTS idx_dim_municipio ON dim_municipio (sk_municipio)"

# Executando a query para criação do index.
SQL_DW.execute(qry_idx_dimmunicipio)

connDW.commit()

In [52]:
# Definindo a query de criação da tabela dim_tempo.

qry_dim_tempo = '''
    CREATE TABLE IF NOT EXISTS dim_tempo (
    
    sk_tempo INTEGER PRIMARY KEY,
    data DATETIME,
    dia INTEGER,
    mes INTEGER,
    ano INTEGER,
    trimestre VARCHAR (2),
    semestre VARCHAR (2)
    )
'''

# Executando a query para criação da tabela.
SQL_DW.execute(qry_dim_tempo)

# Definindo a query de criação do index na tabela.
qry_idx_dimtempo = "CREATE INDEX IF NOT EXISTS idx_dim_tempo ON dim_tempo (sk_tempo)"

# Executando a query para criação do index.
SQL_DW.execute(qry_idx_dimtempo)

connDW.commit()

# Criação da tabela Fato no Data Warehouse

O comando "ON UPDATE NO ACTION ON DELETE NO ACTION" é uma cláusula de restrição de chave estrangeira que é adicionada às definições das chaves estrangeiras (FKs).
Essa cláusula indica que, se houver uma tentativa de atualização ou exclusão de uma linha na tabela de origem (tabela referenciada pela chave estrangeira), nenhuma ação deve ser tomada em relação às linhas correspondentes na tabela "fato".

Em outras palavras, a cláusula "NO ACTION" impede que a atualização ou exclusão de uma linha na tabela referenciada pela chave estrangeira afete as linhas correspondentes na tabela "fato_ocorrencia". 

Essa cláusula é uma opção comum para garantir a integridade referencial em modelos de dados dimensionais, onde a maioria dos dados históricos não deve ser alterada.

In [53]:
# Definindo a query de criação da tabela fato_boletim_ocorrencias.

qry_fato_ocorrencias = '''
    CREATE TABLE IF NOT EXISTS fato_boletim_ocorrencias (
    
    sk_dp INTEGER REFERENCES dim_dp(sk_dp) ON UPDATE NO ACTION ON DELETE NO ACTION,
    sk_bpm INTEGER REFERENCES dim_bpm(sk_bpm) ON UPDATE NO ACTION ON DELETE NO ACTION,
    sk_municipio INTEGER REFERENCES dim_municipio(sk_municipio) ON UPDATE NO ACTION ON DELETE NO ACTION,
    sk_tempo INTEGER REFERENCES dim_tempo(sk_tempo) ON UPDATE NO ACTION ON DELETE NO ACTION,
    ocorrencia VARCHAR (255), --Dimensão degenerada.
    quantidade INTEGER
    )
'''

# Executando a query para criação da tabela.
SQL_DW.execute(qry_fato_ocorrencias)

# Definindo a query de criação do index na tabela dTempo.
query_idx_fatoocorrencias = "CREATE INDEX IF NOT EXISTS idx_fato_ocorrencias ON fato_boletim_ocorrencias (sk_dp, sk_bpm, sk_municipio, sk_tempo)"

# Executando a query para criação do index.
SQL_DW.execute(query_idx_fatoocorrencias)

connDW.commit()

# Fechando as conexões

In [54]:
# Fechando as conexões com ODS e DW.

connODS.close()
connDW.close()