In [None]:
# üì¶ Cria√ß√£o e Configura√ß√£o do Banco de Dados

Este notebook conecta ao banco PostgreSQL criado no Docker e executa os comandos SQL necess√°rios para estruturar o banco de dados. Al√©m de criar as tabelas, tamb√©m configura √≠ndices para otimiza√ß√£o de consultas e insere dados iniciais para teste.

## Objetivos:
- Estabelecer conex√£o segura com o PostgreSQL
- Criar esquema de tabelas para dados brutos e predi√ß√µes
- Configurar √≠ndices para otimiza√ß√£o de performance
- Inserir dados de exemplo para valida√ß√£o


In [None]:
#conex√£o com o banco de dados (com tratamentos de erros)

import psycopg2
import os
from dotenv import load_dotenv
from psycopg2 import OperationalError

# Carregar vari√°veis de ambiente
load_dotenv()

# Par√¢metros de conex√£o
db_params = {
    "host": os.getenv("DB_HOST", "localhost"),
    "port": os.getenv("DB_PORT", "5433"),
    "database": os.getenv("DB_NAME", "weather"),
    "user": os.getenv("DB_USER", "postgres"),
    "password": os.getenv("DB_PASSWORD", "postgres")
}

# Fun√ß√£o para conectar com tratamento de erros
def connect_to_db(params):
    try:
        conn = psycopg2.connect(**params)
        print("‚úÖ Conex√£o estabelecida com sucesso!")
        return conn
    except OperationalError as e:
        print(f"‚ùå Erro ao conectar ao banco de dados: {e}")
        return None

# Estabelecer conex√£o
conn = connect_to_db(db_params)

if conn:
    cursor = conn.cursor()
else:
    raise Exception("N√£o foi poss√≠vel estabelecer conex√£o com o banco de dados.")

In [None]:
# criar tabela raw_data 

# Defini√ß√£o da tabela para dados brutos clim√°ticos
create_raw_data_table = """
CREATE TABLE IF NOT EXISTS raw_data (
    id SERIAL PRIMARY KEY,
    city VARCHAR(50) NOT NULL,
    temperature REAL NOT NULL,
    humidity REAL NOT NULL,
    timestamp TIMESTAMP DEFAULT CURRENT_TIMESTAMP
);
"""

try:
    cursor.execute(create_raw_data_table)
    conn.commit()
    print("‚úÖ Tabela 'raw_data' criada com sucesso!")
except Exception as e:
    conn.rollback()
    print(f"‚ùå Erro ao criar tabela 'raw_data': {e}")

In [None]:
#criar tabela model_predictions 

# Defini√ß√£o da tabela para armazenar predi√ß√µes do modelo
create_predictions_table = """
CREATE TABLE IF NOT EXISTS model_predictions (
    id SERIAL PRIMARY KEY,
    humidity REAL NOT NULL,
    predicted_temperature REAL NOT NULL,
    actual_temperature REAL,
    prediction_error REAL,
    model_version VARCHAR(50),
    timestamp TIMESTAMP DEFAULT CURRENT_TIMESTAMP
);
"""

try:
    cursor.execute(create_predictions_table)
    conn.commit()
    print("‚úÖ Tabela 'model_predictions' criada com sucesso!")
except Exception as e:
    conn.rollback()
    print(f"‚ùå Erro ao criar tabela 'model_predictions': {e}")

In [None]:
# cria√ß√£o de indices para otimiza√ß√£o 

# Criar √≠ndices para otimizar consultas frequentes
create_indices = [
    "CREATE INDEX IF NOT EXISTS idx_raw_data_city ON raw_data(city);",
    "CREATE INDEX IF NOT EXISTS idx_raw_data_timestamp ON raw_data(timestamp);",
    "CREATE INDEX IF NOT EXISTS idx_predictions_timestamp ON model_predictions(timestamp);"
]

for index_query in create_indices:
    try:
        cursor.execute(index_query)
        conn.commit()
        print(f"‚úÖ √çndice criado: {index_query}")
    except Exception as e:
        conn.rollback()
        print(f"‚ùå Erro ao criar √≠ndice: {e}")

In [None]:
# inser√ß√£o de dados iniciais para teste 

from datetime import datetime, timedelta
import random

# Gerar dados fict√≠cios para cinco cidades
cities = ['S√£o Paulo', 'Rio de Janeiro', 'Bras√≠lia', 'Curitiba', 'Recife']
base_time = datetime.now() - timedelta(days=30)  # Dados dos √∫ltimos 30 dias

# Preparar dados para inser√ß√£o
sample_data = []
for city in cities:
    # Gerar 10 registros por cidade
    for i in range(10):
        # Gerar timestamp com intervalos de 3 horas
        timestamp = base_time + timedelta(hours=3*i)
        # Temperatura em Celsius (variando entre 15-35)
        temperature = round(random.uniform(15, 35), 1)
        # Umidade em % (variando entre 30-90)
        humidity = round(random.uniform(30, 90), 1)
        sample_data.append((city, temperature, humidity, timestamp))

# SQL para inser√ß√£o
insert_query = """
INSERT INTO raw_data (city, temperature, humidity, timestamp)
VALUES (%s, %s, %s, %s);
"""

try:
    cursor.executemany(insert_query, sample_data)
    conn.commit()
    print(f"‚úÖ {len(sample_data)} registros de exemplo inseridos com sucesso!")
except Exception as e:
    conn.rollback()
    print(f"‚ùå Erro ao inserir dados de exemplo: {e}")

In [None]:
# encerramento e valida√ß√£o 

# Verificar os dados inseridos
cursor.execute("SELECT COUNT(*) FROM raw_data")
count = cursor.fetchone()[0]
print(f"Total de registros na tabela raw_data: {count}")

# Verificar estrutura da tabela
cursor.execute("""
SELECT column_name, data_type 
FROM information_schema.columns 
WHERE table_name = 'raw_data'
""")
columns = cursor.fetchall()
print("\nEstrutura da tabela raw_data:")
for col in columns:
    print(f"- {col[0]}: {col[1]}")

# Fechar conex√£o
cursor.close()
conn.close()
print("\n‚úÖ Processo conclu√≠do! Banco de dados configurado com sucesso.")