In [None]:
import sqlite3
import pandas as pd
import numpy as np

#Selecionar arquivo CSV na janela do Windows que servirá como base de dados
import tkinter as tk
from tkinter import filedialog
root = tk.Tk()
root.withdraw()
caminho_arquivo = filedialog.askopenfilename(filetypes=[("CSV Files", "*.csv")])

#Configurar pandas para mostrar exibir todas as colunas
pd.set_option('display.max_columns', None)

In [None]:
#Ler arquivo CSV usando codificação válida, pulando linhas quebradas e definindo ";" como separador
df = pd.read_csv(caminho_arquivo, encoding='ISO-8859-1', on_bad_lines='skip', sep=';')

In [None]:
#Selecionar registros de pessoas que morreram
dfFato = df[df['DataObito'].notna()].copy(deep=True)

#Selecionar apenas mortes por covid
dfFato = dfFato[dfFato['Evolucao'] == 'Óbito pelo COVID-19']

#Liberar memória do dataframe original do csv
del df

#Resetar índice do dataframe dfFato
dfFato = dfFato.reset_index(drop=True)

#Inserir coluna ID no dataframe fato
dfFato.insert(0, 'ID', dfFato.index)

In [None]:
########### Cria tabela fato "tabela_fato" no SQLite carregando a partir do dataframe ###########

# Criar a conexão com o banco de dados
conn = sqlite3.connect('bancodedados.db')

# Carregar o dataframe para o banco de dados como uma tabela fato
dfFato.to_sql('tabela_fato', conn, if_exists='replace', index=False)

# Fecha a conexão com o banco de dados
conn.close()

In [None]:
########### Alterar tabela_fato para criar chaves estrangeiras ###########

conn = sqlite3.connect('bancodedados.db')
cursor = conn.cursor()

cursor.execute('''
    ALTER TABLE tabela_fato ADD COLUMN ID_dimensao_localidade INTEGER REFERENCES dimensao_localidade(ID)
''')
cursor.execute('''
    ALTER TABLE tabela_fato ADD COLUMN ID_dimensao_caracteristicas_individuo INTEGER REFERENCES dimensao_caracteristicas_individuo(ID)
''')
cursor.execute('''
    ALTER TABLE tabela_fato ADD COLUMN ID_dimensao_sintomas INTEGER REFERENCES dimensao_sintomas(ID)
''')
cursor.execute('''
    ALTER TABLE tabela_fato ADD COLUMN ID_dimensao_comorbidades INTEGER REFERENCES dimensao_comorbidades(ID)
''')


#Commit das mudanças e fechamento da conexão
conn.commit()
conn.close()

In [None]:
########### Cria tabela dimensao_localidade ###########

conn = sqlite3.connect('bancodedados.db')
cursor = conn.cursor()

#Apaga a tabela dimensao_localidade se ela já existe
cursor.execute('DROP TABLE IF EXISTS dimensao_localidade')

#Cria a tabela dimensao_localidade
cursor.execute('''
    CREATE TABLE dimensao_localidade (
        ID INTEGER PRIMARY KEY,
        Municipio TEXT,
        Bairro TEXT
    )
''')

#Insere os dados na tabela, usando o índice da tabela fato como chave primária
for i, row in dfFato.iterrows():
    query = f"""
        INSERT INTO dimensao_localidade (ID, Municipio, Bairro)
        VALUES ({i}, "{row['Municipio']}", "{row['Bairro']}")
    """
    cursor.execute(query)


#Commit das mudanças e fechamento da conexão
conn.commit()
conn.close()

In [None]:
########### Cria tabela dimensao_caracteristicas_individuo ###########

conn = sqlite3.connect('bancodedados.db')
cursor = conn.cursor()

#Apaga a tabela dimensao_caracteristicas_individuo se ela já existe
cursor.execute('DROP TABLE IF EXISTS dimensao_caracteristicas_individuo')

#Cria a tabela dimensao_caracteristicas_individuo
cursor.execute('''
    CREATE TABLE dimensao_caracteristicas_individuo (
        ID INTEGER PRIMARY KEY,
        FaixaEtaria TEXT,
        IdadeNaDataNotificacao TEXT,
        Sexo TEXT,
        RacaCor TEXT,
        Escolaridade TEXT,
        Gestante TEXT
    )
''')

#Insere os dados na tabela, usando o índice da tabela fato como chave primária
for i, row in dfFato.iterrows():
    query = f"""
        INSERT INTO dimensao_caracteristicas_individuo (ID, FaixaEtaria, IdadeNaDataNotificacao, Sexo, RacaCor, Escolaridade, Gestante)
        VALUES ({i}, "{row['FaixaEtaria']}", "{row['IdadeNaDataNotificacao']}", "{row['Sexo']}", "{row['RacaCor']}", "{row['Escolaridade']}", "{row['Gestante']}")
    """
    cursor.execute(query)


#Commit das mudanças e fechamento da conexão
conn.commit()
conn.close()

In [None]:
########### Cria tabela dimensao_sintomas ###########

conn = sqlite3.connect('bancodedados.db')
cursor = conn.cursor()

#Apaga a tabela dimensao_sintomas se ela já existe
cursor.execute('DROP TABLE IF EXISTS dimensao_sintomas')

#Cria a tabela dimensao_sintomas
cursor.execute('''
    CREATE TABLE dimensao_sintomas (
        ID INTEGER PRIMARY KEY,
        Febre TEXT,
        DificuldadeRespiratoria TEXT,
        Tosse TEXT,
        Coriza TEXT,
        DorGarganta TEXT,
        Diarreia TEXT,
        Cefaleia TEXT
    )
''')

#Insere os dados na tabela, usando o índice da tabela fato como chave primária
for i, row in dfFato.iterrows():
    query = f"""
        INSERT INTO dimensao_sintomas (ID, Febre, DificuldadeRespiratoria, Tosse, Coriza, DorGarganta, Diarreia, Cefaleia)
        VALUES ({i}, "{row['Febre']}", "{row['DificuldadeRespiratoria']}", "{row['Tosse']}", "{row['Coriza']}", "{row['DorGarganta']}", "{row['Diarreia']}", "{row['Cefaleia']}")
    """
    cursor.execute(query)


#Commit das mudanças e fechamento da conexão
conn.commit()
conn.close()

In [None]:
########### Cria tabela dimensao_comorbidades ###########

conn = sqlite3.connect('bancodedados.db')
cursor = conn.cursor()

#Apaga a tabela dimensao_comorbidades se ela já existe
cursor.execute('DROP TABLE IF EXISTS dimensao_comorbidades')

#Cria a tabela dimensao_comorbidades
cursor.execute('''
    CREATE TABLE dimensao_comorbidades (
        ID INTEGER PRIMARY KEY,
        ComorbidadePulmao TEXT,
        ComorbidadeCardio TEXT,
        ComorbidadeRenal TEXT,
        ComorbidadeDiabetes TEXT,
        ComorbidadeTabagismo TEXT,
        ComorbidadeObesidade TEXT
    )
''')

#Insere os dados na tabela, usando o índice da tabela fato como chave primária
for i, row in dfFato.iterrows():
    query = f"""
        INSERT INTO dimensao_comorbidades (ID, ComorbidadePulmao, ComorbidadeCardio, ComorbidadeRenal, ComorbidadeDiabetes, ComorbidadeTabagismo, ComorbidadeObesidade)
        VALUES ({i}, "{row['ComorbidadePulmao']}", "{row['ComorbidadeCardio']}", "{row['ComorbidadeRenal']}", "{row['ComorbidadeDiabetes']}", "{row['ComorbidadeTabagismo']}", "{row['ComorbidadeObesidade']}")
    """
    cursor.execute(query)


#Commit das mudanças e fechamento da conexão
conn.commit()
conn.close()

In [None]:
conn = sqlite3.connect('bancodedados.db')

consultaTabela = pd.read_sql_query("SELECT * from dimensao_comorbidades", conn)

conn.close()

consultaTabela

In [None]:
########### Preencher chaves estrangeiras tabela_fato ###########

conn = sqlite3.connect('bancodedados.db')
cursor = conn.cursor()

#Insere os dados nas colunas de chave estrangeira da tabela_fato
cursor.execute('''
    UPDATE tabela_fato SET ID_dimensao_localidade = ID
''')
cursor.execute('''
    UPDATE tabela_fato SET ID_dimensao_caracteristicas_individuo = ID
''')
cursor.execute('''
    UPDATE tabela_fato SET ID_dimensao_sintomas = ID
''')
cursor.execute('''
    UPDATE tabela_fato SET ID_dimensao_comorbidades = ID
''')

#Commit das mudanças e fechamento da conexão
conn.commit()
conn.close()

In [None]:
########### Visualizar tabela criada ###########
# Criar a conexão com o banco de dados
conn = sqlite3.connect('bancodedados.db')

# Executar a consulta SQL para selecionar todos os dados da tabela (Ex.: dimensao_comorbidades)
consultaTabela = pd.read_sql_query("SELECT * from dimensao_comorbidades", conn)

# Fechar a conexão com o banco de dados
conn.close()

# Visualizar a tabela
consultaTabela