# Conectando com o Postgres

Imports

In [14]:
import pandas as pd
from sqlalchemy import create_engine
from sqlalchemy.pool import NullPool
import psycopg2

### Criando conexão

In [15]:
conn_string = 'postgresql://uospmgae:kFBbjgeZBH7RFuJcY3D9hYseJXh0HZjE@motty.db.elephantsql.com/uospmgae'

In [29]:
db = create_engine(conn_string, poolclass=NullPool)
conn_db = db.connect()

### Inserindo tabela

In [24]:
#Insere a tabela no postgre utilizando sqlalchemy / Faz um drop table antes
def inserir_tabela_df(nome_tabela, data_frame, conexao):
    data_frame.to_sql(nome_tabela, con=conexao, if_exists='replace',index=False)

#Adicina dados a tabela no postgre utilizando sqlalchemy
def inserir_dados_df(nome_tabela, data_frame, conexao):
    data_frame.to_sql(nome_tabela, con=conexao, if_exists='append',index=False)


#Fecha a conexão com o postgre quando utilizando sqlalchemy
def fechar_conexao(conexao):
    conexao.close()
    

#Realiza operações na tabela com psycopg2
def operacao_tabela(comando_sql, conn_string):
    conn = psycopg2.connect(conn_string)
    conn.autocommit = True
    cursor = conn.cursor()
    cursor.execute(comando_sql)
    conn.close()

### Inserindo tabelas no BD

In [15]:
""" cria tabelas no PostgreSQL database"""
cmd_criar_tb = (
    """
    CREATE TABLE regiao_saude (
        cod_reg_saude INTEGER PRIMARY KEY,
        nome_reg_saude VARCHAR(255) NOT NULL,
        latitude FLOAT,
        longitude FLOAT,
        limite_geografico TEXT
    )
    """,
    """
    CREATE TABLE municipio (
            cod_mun INTEGER PRIMARY KEY,
            cod_uf INTEGER NOT NULL,
            cod_reg_saude INTEGER,
            nome_mun VARCHAR(255) NOT NULL,
            latitude FLOAT,
            longitude FLOAT,
            populacao_2011 INTEGER,
            populacao_2021 INTEGER,
            densidade_2021 FLOAT,
            area FLOAT,
            uf VARCHAR(2),
            nome_uf VARCHAR(255),
            pais VARCHAR(3),
            FOREIGN KEY (cod_reg_saude)
                REFERENCES regiao_saude (cod_reg_saude)     
    )
    """,
    """ CREATE TABLE servico_sentinela (
            id_serv SERIAL PRIMARY KEY,
            cod_mun INTEGER NOT NULL,
            nome_serv VARCHAR(255),
            FOREIGN KEY (cod_mun)
                REFERENCES municipio (cod_mun)
            )
    """,
    """ CREATE TABLE fluxo_aereo (
            id_lig SERIAL PRIMARY KEY,
            total_passagens_2019 INTEGER, 
            total_passagens_2020 INTEGER,
            tempo_medio_2019 FLOAT,
            tempo_medio_2020 FLOAT,
            cod_mun_origem INTEGER NOT NULL,
            cod_mun_destino INTEGER NOT NULL,
            FOREIGN KEY (cod_mun_origem)
                REFERENCES municipio (cod_mun),
            FOREIGN KEY (cod_mun_destino)
                REFERENCES municipio (cod_mun)
            )
    """,
    """ CREATE TABLE fluxo_rodoviario (
            id BIGINT PRIMARY KEY,
            freq_saida_2016 FLOAT NOT NULL,
            cod_mun_a INTEGER NOT NULL,
            cod_mun_b INTEGER NOT NULL,
            FOREIGN KEY (cod_mun_a)
                REFERENCES municipio (cod_mun),
            FOREIGN KEY (cod_mun_b)
                REFERENCES municipio (cod_mun)
            )
    """,
    """ CREATE TABLE fluxo_hidro (
            id BIGINT PRIMARY KEY,
            freq_saida_2016 FLOAT NOT NULL,
            cod_mun_a INTEGER NOT NULL,
            cod_mun_b INTEGER NOT NULL,
            FOREIGN KEY (cod_mun_a)
                REFERENCES municipio (cod_mun),
            FOREIGN KEY (cod_mun_b)
                REFERENCES municipio (cod_mun)
            )
    """)

In [16]:
#Executando comando de criação de tabelas
for cmd in cmd_criar_tb:
    operacao_tabela(cmd, conn_string)

### Populando tabelas

In [23]:
from os import listdir
from os.path import isfile, join
path = "../data/integrado"
nome_files = [f for f in listdir(path) if isfile(join(path, f))]

dic_df = {}
for nome_file in nome_files:
    
    dic_df[nome_file[:-4]] = pd.read_csv(path+"/"+nome_file)

In [18]:
#Inserindo os dados dos dataframes nas tabelas

# nomes_tb = [nome_file[:-4] for nome_file in nome_files]
nomes_tb = [
 'regiao_saude',
 'municipio',
 'servico_sentinela',
 'fluxo_aereo',
 'fluxo_hidro',
 'fluxo_rodoviario']

for nome in nomes_tb:
    df = dic_df[nome]
    inserir_dados_df(nome, df, conn_db)

fechar_conexao(conn_db)

Update em tabela

In [30]:
inserir_dados_df("temp_table",  dic_df["cidades_regic"], conn_db)

In [20]:
sql = """
        ALTER TABLE municipio
        ADD COLUMN PIB FLOAT, 
        ADD COLUMN hierarquia VARCHAR(255), 
        ADD COLUMN nome_hierarquia VARCHAR(255),
        ADD COLUMN indice_atracao FLOAT,
        ADD COLUMN ia_saude_bm FLOAT,
        ADD COLUMN ia_saude_a FLOAT,
        ADD COLUMN ia_aeroporto FLOAT,
        ADD COLUMN ia_transporte FLOAT,
        ADD COLUMN num_leitos FLOAT;
"""

operacao_tabela(sql, conn_string)

In [31]:
#Utilizar uma tabela auxiliar
sql = """
    UPDATE municipio AS m
    SET PIB= t.pib, hierarquia= t.hierarquia, 
    nome_hierarquia= t.nome_hierarquia, indice_atracao= t.indice_atracao,
    ia_saude_bm= t.ia_saude_bm, ia_saude_a= t.ia_saude_a,
    ia_aeroporto= t.ia_aeroporto, ia_transporte= t.ia_transporte,
    num_leitos= t.num_leitos
    FROM temp_table AS t
    WHERE m.cod_mun = t.cod_mun
"""

operacao_tabela(sql, conn_string)
