In [1]:
# =============================================================================
# IMPORTA√á√ïES E CONFIGURA√á√ïES INICIAIS
# =============================================================================

import psycopg2
import os
import requests
import json
from datetime import datetime, timedelta
from dotenv import load_dotenv
from psycopg2 import OperationalError, InterfaceError, DatabaseError
import time
from contextlib import contextmanager
import logging

# Configurar logging
logging.basicConfig(level=logging.INFO, format='%(asctime)s - %(levelname)s - %(message)s')
logger = logging.getLogger(__name__)

print("üìö Bibliotecas importadas com sucesso!")

üìö Bibliotecas importadas com sucesso!


In [2]:
# =============================================================================
# CONFIGURA√á√ÉO DE VARI√ÅVEIS DE AMBIENTE
# =============================================================================

# Carregar configura√ß√µes do ambiente
load_dotenv()

# Configura√ß√µes da API
API_KEY = os.getenv("API_KEY")
WEATHER_CITIES = os.getenv("WEATHER_CITY", "curitiba,sao paulo,rio de janeiro,brasilia,recife").split(",")
WEATHER_UNITS = os.getenv("WEATHER_UNITS", "metric")

# Par√¢metros de conex√£o do banco
DB_PARAMS = {
    "host": os.getenv("DB_HOST", "localhost"),
    "port": os.getenv("DB_PORT", "5433"),
    "database": os.getenv("DB_NAME", "weather"),
    "user": os.getenv("DB_USER", "postgres"),
    "password": os.getenv("DB_PASSWORD", "root")
}

print(f"üîë API Key configurada: {'‚úÖ' if API_KEY else '‚ùå'}")
print(f"üèôÔ∏è Cidades configuradas: {[city.strip() for city in WEATHER_CITIES]}")
print(f"üå°Ô∏è Unidades: {WEATHER_UNITS}")

üîë API Key configurada: ‚ùå
üèôÔ∏è Cidades configuradas: ['curitiba', 'sao paulo', 'rio de janeiro', 'brasilia', 'recife']
üå°Ô∏è Unidades: metric


In [3]:
# =============================================================================
# CLASSE PARA GERENCIAR CONEX√ÉO COM O BANCO
# =============================================================================

class ImprovedDatabaseManager:
    def __init__(self, db_params):
        self.db_params = db_params
        self.conn = None
        self._max_retries = 3
        self._retry_delay = 2
    
    @contextmanager
    def get_connection(self):
        """Context manager para conex√µes seguras"""
        conn = None
        try:
            conn = psycopg2.connect(**self.db_params)
            conn.autocommit = False
            yield conn
        except Exception as e:
            if conn:
                try:
                    conn.rollback()
                except Exception:
                    pass
            raise e
        finally:
            if conn and not conn.closed:
                try:
                    conn.close()
                except Exception as e:
                    logger.warning(f"‚ö†Ô∏è Erro ao fechar conex√£o: {e}")
    
    def test_connection(self):
        """Testa a conex√£o com o banco"""
        try:
            with self.get_connection() as conn:
                with conn.cursor() as cursor:
                    cursor.execute("SELECT 1")
                    cursor.fetchone()
                    conn.commit()
            logger.info("‚úÖ Conex√£o com PostgreSQL testada com sucesso!")
            return True
        except Exception as e:
            logger.error(f"‚ùå Erro ao testar conex√£o: {e}")
            return False
    
    def execute_query(self, query, params=None, fetch=False, commit=True):
        """Executa uma query com tratamento robusto de erros"""
        for attempt in range(self._max_retries):
            try:
                with self.get_connection() as conn:
                    with conn.cursor() as cursor:
                        cursor.execute(query, params)
                        
                        result = None
                        if fetch:
                            result = cursor.fetchall()
                        
                        if commit:
                            conn.commit()
                        
                        return result if fetch else True
                        
            except (OperationalError, InterfaceError, DatabaseError) as e:
                logger.warning(f"‚ö†Ô∏è Erro de banco na tentativa {attempt + 1}: {e}")
                if attempt < self._max_retries - 1:
                    time.sleep(self._retry_delay)
                    continue
                else:
                    logger.error(f"‚ùå Falha ap√≥s {self._max_retries} tentativas")
                    return None
                    
            except Exception as e:
                logger.error(f"‚ùå Erro inesperado: {e}")
                return None
        
        return None
    
    def execute_batch(self, queries_and_params):
        """Executa m√∫ltiplas queries em uma √∫nica transa√ß√£o"""
        try:
            with self.get_connection() as conn:
                with conn.cursor() as cursor:
                    results = []
                    for query_info in queries_and_params:
                        if isinstance(query_info, tuple) and len(query_info) >= 2:
                            query, params = query_info[0], query_info[1]
                            fetch = query_info[2] if len(query_info) > 2 else False
                        else:
                            query = query_info
                            params = None
                            fetch = False
                        
                        cursor.execute(query, params)
                        
                        if fetch:
                            results.append(cursor.fetchall())
                        else:
                            results.append(True)
                    
                    conn.commit()
                    return results
                    
        except Exception as e:
            logger.error(f"‚ùå Erro na execu√ß√£o em lote: {e}")
            return None

    def get_table_columns(self, table_name):
        """Obt√©m as colunas de uma tabela"""
        query = """
        SELECT column_name, data_type 
        FROM information_schema.columns 
        WHERE table_name = %s 
        ORDER BY ordinal_position
        """
        result = self.execute_query(query, (table_name,), fetch=True)
        return result if result else []

In [4]:
# Inicializar gerenciador melhorado do banco
db = ImprovedDatabaseManager(DB_PARAMS)
if db.test_connection():
    print("üéØ Gerenciador de banco inicializado e testado com sucesso!")
else:
    raise Exception("‚ùå N√£o foi poss√≠vel inicializar o gerenciador de banco")

2025-05-24 16:08:41,602 - INFO - ‚úÖ Conex√£o com PostgreSQL testada com sucesso!


üéØ Gerenciador de banco inicializado e testado com sucesso!


In [5]:
# =============================================================================
# FUN√á√ÉO PARA BUSCAR DADOS DA API
# =============================================================================

def fetch_weather_data(city, api_key, units="metric"):
    """Busca dados clim√°ticos atuais de uma cidade"""
    base_url = "http://api.openweathermap.org/data/2.5/weather"
    
    params = {
        'q': city.strip(),
        'appid': api_key,
        'units': units,
        'lang': 'pt_br'
    }
    
    try:
        response = requests.get(base_url, params=params, timeout=10)
        response.raise_for_status()
        data = response.json()
        
        # Extrair dados relevantes
        weather_info = {
            'city': data['name'],
            'country': data['sys']['country'],
            'temperature': round(data['main']['temp'], 1),
            'humidity': data['main']['humidity'],
            'pressure': data['main'].get('pressure'),  # Usar .get() para evitar erro se n√£o existir
            'description': data['weather'][0]['description'],
            'timestamp': datetime.now()
        }
        
        return weather_info
        
    except requests.exceptions.RequestException as e:
        logger.error(f"‚ùå Erro na requisi√ß√£o para {city}: {e}")
        return None
    except KeyError as e:
        logger.error(f"‚ùå Dados incompletos na resposta da API para {city}: {e}")
        return None
    except Exception as e:
        logger.error(f"‚ùå Erro inesperado ao buscar dados para {city}: {e}")
        return None

In [6]:
# Testar a fun√ß√£o com uma cidade
print("üß™ Testando conex√£o com a API...")
if API_KEY and WEATHER_CITIES:
    test_data = fetch_weather_data(WEATHER_CITIES[0], API_KEY, WEATHER_UNITS)
    if test_data:
        print(f"‚úÖ Teste bem-sucedido! Dados de {test_data['city']}: {test_data['temperature']}¬∞C, {test_data['humidity']}%")
    else:
        print("‚ùå Falha no teste da API")
else:
    print("‚ö†Ô∏è API Key ou cidades n√£o configuradas")

üß™ Testando conex√£o com a API...
‚úÖ Teste bem-sucedido! Dados de Curitiba: 18.1¬∞C, 73%


In [7]:
# =============================================================================
# VERIFICA√á√ÉO E AJUSTE DA ESTRUTURA DA TABELA
# =============================================================================

print("üîç Verificando estrutura da tabela existente...")

# Verificar colunas existentes
existing_columns = db.get_table_columns('raw_data')
if existing_columns:
    print("üìã Colunas existentes na tabela raw_data:")
    for col_name, col_type in existing_columns:
        print(f"   - {col_name}: {col_type}")
    
    # Definir colunas necess√°rias com seus tipos
    required_columns = {
        'description': 'TEXT',
        'country': 'TEXT', 
        'pressure': 'REAL'
    }
    
    # Verificar colunas existentes
    column_names = [col[0] for col in existing_columns]
    
    # Adicionar colunas que est√£o faltando
    for col_name, col_type in required_columns.items():
        if col_name not in column_names:
            print(f"‚ö†Ô∏è Coluna '{col_name}' n√£o encontrada. Adicionando...")
            add_column_query = f"ALTER TABLE raw_data ADD COLUMN {col_name} {col_type};"
            if db.execute_query(add_column_query):
                print(f"‚úÖ Coluna '{col_name}' adicionada com sucesso!")
            else:
                print(f"‚ùå Erro ao adicionar coluna '{col_name}'")
        else:
            print(f"‚úÖ Coluna '{col_name}' j√° existe!")
else:
    print("‚ùå N√£o foi poss√≠vel obter informa√ß√µes da tabela raw_data")

üîç Verificando estrutura da tabela existente...
üìã Colunas existentes na tabela raw_data:
   - id: integer
   - city: character varying
   - temperature: real
   - humidity: real
   - timestamp: timestamp without time zone
   - pressure: real
   - description: text
   - country: text
‚úÖ Coluna 'description' j√° existe!
‚úÖ Coluna 'country' j√° existe!
‚úÖ Coluna 'pressure' j√° existe!


In [8]:
# =============================================================================
# CRIA√á√ÉO DE √çNDICES ADICIONAIS (SE NECESS√ÅRIO)
# =============================================================================

print("üèóÔ∏è Verificando e criando √≠ndices necess√°rios...")

# √çndices que queremos garantir que existam
additional_indexes = [
    ("CREATE INDEX IF NOT EXISTS idx_raw_data_city ON raw_data(city);", "idx_raw_data_city"),
    ("CREATE INDEX IF NOT EXISTS idx_raw_data_timestamp ON raw_data(timestamp);", "idx_raw_data_timestamp"),
    ("CREATE INDEX IF NOT EXISTS idx_raw_data_city_timestamp ON raw_data(city, timestamp);", "idx_raw_data_city_timestamp"),
]

for index_query, index_name in additional_indexes:
    if db.execute_query(index_query):
        print(f"‚úÖ √çndice {index_name} criado/verificado")
    else:
        print(f"‚ùå Erro ao criar √≠ndice {index_name}")

üèóÔ∏è Verificando e criando √≠ndices necess√°rios...
‚úÖ √çndice idx_raw_data_city criado/verificado
‚úÖ √çndice idx_raw_data_timestamp criado/verificado
‚úÖ √çndice idx_raw_data_city_timestamp criado/verificado


In [9]:
# =============================================================================
# INSER√á√ÉO DE DADOS REAIS DA API
# =============================================================================

print("üåê Buscando dados clim√°ticos reais das cidades configuradas...")

# Query de inser√ß√£o - usando apenas as colunas que existem na tabela
# Vamos verificar quais colunas existem antes de fazer o INSERT
print("üîç Verificando colunas para INSERT...")

# Obter colunas atualizadas ap√≥s as altera√ß√µes
updated_columns = db.get_table_columns('raw_data')
available_columns = [col[0] for col in updated_columns] if updated_columns else []

print(f"üìã Colunas dispon√≠veis: {available_columns}")

# Construir INSERT baseado nas colunas dispon√≠veis
base_columns = ['city', 'temperature', 'humidity', 'timestamp']
optional_columns = ['description', 'country', 'pressure']

# Colunas que realmente vamos usar
insert_columns = []
insert_values = []

for col in base_columns:
    if col in available_columns:
        insert_columns.append(col)
        insert_values.append('%s')

for col in optional_columns:
    if col in available_columns:
        insert_columns.append(col)
        insert_values.append('%s')

# Construir a query dinamicamente
insert_query = f"""
INSERT INTO raw_data ({', '.join(insert_columns)})
VALUES ({', '.join(insert_values)});
"""

print(f"üîß Query de inser√ß√£o gerada: {insert_query}")

üåê Buscando dados clim√°ticos reais das cidades configuradas...
üîç Verificando colunas para INSERT...
üìã Colunas dispon√≠veis: ['id', 'city', 'temperature', 'humidity', 'timestamp', 'pressure', 'description', 'country']
üîß Query de inser√ß√£o gerada: 
INSERT INTO raw_data (city, temperature, humidity, timestamp, description, country, pressure)
VALUES (%s, %s, %s, %s, %s, %s, %s);



In [10]:
successful_inserts = 0
failed_inserts = 0

if API_KEY and WEATHER_CITIES:
    for city in WEATHER_CITIES:
        print(f"üèôÔ∏è Processando {city.strip()}...")
        
        # Buscar dados da API
        weather_data = fetch_weather_data(city, API_KEY, WEATHER_UNITS)
        
        if weather_data:
            # Construir tupla de valores baseada nas colunas dispon√≠veis
            values = []
            
            for col in insert_columns:
                if col == 'city':
                    values.append(weather_data['city'])
                elif col == 'temperature':
                    values.append(weather_data['temperature'])
                elif col == 'humidity':
                    values.append(weather_data['humidity'])
                elif col == 'timestamp':
                    values.append(weather_data['timestamp'])
                elif col == 'description':
                    values.append(weather_data.get('description'))
                elif col == 'country':
                    values.append(weather_data.get('country'))
                elif col == 'pressure':
                    values.append(weather_data.get('pressure'))
            
            # Inserir no banco
            success = db.execute_query(insert_query, tuple(values))
            
            if success:
                print(f"   ‚úÖ {weather_data['city']}: {weather_data['temperature']}¬∞C, {weather_data['humidity']}% umidade")
                successful_inserts += 1
            else:
                print(f"   ‚ùå Erro ao inserir dados de {city}")
                failed_inserts += 1
        else:
            print(f"   ‚ùå N√£o foi poss√≠vel obter dados de {city}")
            failed_inserts += 1
        
        # Pequena pausa para respeitar rate limits da API
        time.sleep(1)
else:
    print("‚ö†Ô∏è API Key ou cidades n√£o configuradas. Pulando inser√ß√£o de dados.")

print(f"\nüìä Resumo da inser√ß√£o:")
print(f"   ‚úÖ Sucessos: {successful_inserts}")
print(f"   ‚ùå Falhas: {failed_inserts}")
total_attempts = successful_inserts + failed_inserts
if total_attempts > 0:
    print(f"   üìà Taxa de sucesso: {(successful_inserts/total_attempts*100):.1f}%")

üèôÔ∏è Processando curitiba...
   ‚úÖ Curitiba: 18.1¬∞C, 73% umidade
üèôÔ∏è Processando sao paulo...
   ‚úÖ S√£o Paulo: 20.2¬∞C, 80% umidade
üèôÔ∏è Processando rio de janeiro...
   ‚úÖ Rio de Janeiro: 23.5¬∞C, 59% umidade
üèôÔ∏è Processando brasilia...
   ‚úÖ Bras√≠lia: 25.5¬∞C, 49% umidade
üèôÔ∏è Processando recife...
   ‚úÖ Recife: 28.0¬∞C, 78% umidade

üìä Resumo da inser√ß√£o:
   ‚úÖ Sucessos: 5
   ‚ùå Falhas: 0
   üìà Taxa de sucesso: 100.0%


In [11]:
# =============================================================================
# CRIA√á√ÉO DE TABELA MODEL_PREDICTIONS (SE N√ÉO EXISTIR)
# =============================================================================

print("ü§ñ Verificando tabela model_predictions...")

create_predictions_table = """
CREATE TABLE IF NOT EXISTS model_predictions (
    id SERIAL PRIMARY KEY,
    city VARCHAR(100),
    humidity REAL NOT NULL,
    predicted_temperature REAL NOT NULL,
    actual_temperature REAL,
    prediction_error REAL,
    model_version VARCHAR(50),
    timestamp TIMESTAMP DEFAULT CURRENT_TIMESTAMP,
    created_at TIMESTAMP DEFAULT CURRENT_TIMESTAMP
);
"""

if db.execute_query(create_predictions_table):
    print("‚úÖ Tabela model_predictions criada/verificada")
    
    # Criar √≠ndices para model_predictions
    predictions_indexes = [
        "CREATE INDEX IF NOT EXISTS idx_predictions_city ON model_predictions(city);",
        "CREATE INDEX IF NOT EXISTS idx_predictions_timestamp ON model_predictions(timestamp);",
        "CREATE INDEX IF NOT EXISTS idx_predictions_model_version ON model_predictions(model_version);",
    ]
    
    for idx_query in predictions_indexes:
        db.execute_query(idx_query)
else:
    print("‚ùå Erro ao criar tabela model_predictions")

ü§ñ Verificando tabela model_predictions...
‚úÖ Tabela model_predictions criada/verificada


In [12]:
# =============================================================================
# CRIA√á√ÉO DE VIEWS E RELAT√ìRIOS
# =============================================================================

print("üîç Criando views para an√°lises...")

# Criar view para an√°lises (com tratamento para pressure que pode ser NULL)
create_view_query = """
CREATE OR REPLACE VIEW weather_summary AS
SELECT 
    city,
    DATE(timestamp) as date,
    COUNT(*) as measurements,
    ROUND(AVG(temperature)::numeric, 1) as avg_temperature,
    ROUND(MIN(temperature)::numeric, 1) as min_temperature,
    ROUND(MAX(temperature)::numeric, 1) as max_temperature,
    ROUND(AVG(humidity)::numeric, 1) as avg_humidity,
    ROUND(AVG(COALESCE(pressure, 0))::numeric, 1) as avg_pressure
FROM raw_data
GROUP BY city, DATE(timestamp)
ORDER BY city, date DESC;
"""

if db.execute_query(create_view_query):
    print("‚úÖ View 'weather_summary' criada para an√°lises")
else:
    print("‚ùå Erro ao criar view 'weather_summary'")

üîç Criando views para an√°lises...
‚úÖ View 'weather_summary' criada para an√°lises


In [13]:
# =============================================================================
# GERA√á√ÉO DE RELAT√ìRIOS
# =============================================================================

print("üìä Gerando relat√≥rio dos dados inseridos...")

try:
    # Contar registros totais
    total_result = db.execute_query("SELECT COUNT(*) FROM raw_data", fetch=True)
    total_records = total_result[0][0] if total_result and total_result[0] else 0
    print(f"\nüìà Total de registros na tabela raw_data: {total_records}")

    if total_records > 0:
        # Estat√≠sticas por cidade
        city_stats_query = """
        SELECT 
            city,
            COUNT(*) as registros,
            ROUND(AVG(temperature)::numeric, 1) as temp_media,
            ROUND(AVG(humidity)::numeric, 1) as umidade_media,
            MIN(timestamp) as primeiro_registro,
            MAX(timestamp) as ultimo_registro
        FROM raw_data 
        GROUP BY city 
        ORDER BY registros DESC
        """
        
        city_stats = db.execute_query(city_stats_query, fetch=True)
        
        if city_stats:
            print("\nüèôÔ∏è Estat√≠sticas por cidade:")
            print("-" * 80)
            for stat in city_stats:
                city, count, avg_temp, avg_hum, first, last = stat
                first_str = first.strftime('%d/%m %H:%M') if first else "N/A"
                last_str = last.strftime('%d/%m %H:%M') if last else "N/A"
                print(f"{city:15} | {count:3d} reg | {avg_temp:5.1f}¬∞C | {avg_hum:5.1f}% | {first_str} - {last_str}")

        # √öltimos dados inseridos
        recent_query = """
        SELECT city, temperature, humidity, description, timestamp 
        FROM raw_data 
        ORDER BY timestamp DESC 
        LIMIT 5
        """
        
        recent_data = db.execute_query(recent_query, fetch=True)
        
        if recent_data:
            print("\nüîç √öltimos 5 registros inseridos:")
            print("-" * 80)
            for record in recent_data:
                city, temp, hum, desc, ts = record
                ts_str = ts.strftime('%d/%m %H:%M:%S') if ts else "N/A"
                desc_str = (desc or "N/A")[:20]  # Tratar None e limitar tamanho
                print(f"{city:15} | {temp:5.1f}¬∞C | {hum:3.0f}% | {desc_str:20} | {ts_str}")

except Exception as e:
    logger.error(f"‚ùå Erro ao gerar relat√≥rio: {e}")

üìä Gerando relat√≥rio dos dados inseridos...

üìà Total de registros na tabela raw_data: 27

üèôÔ∏è Estat√≠sticas por cidade:
--------------------------------------------------------------------------------
Curitiba        |  11 reg |  18.4¬∞C |  78.4% | 24/05 11:34 - 24/05 16:09
Rio de Janeiro  |   4 reg |  22.3¬∞C |  75.3% | 24/05 11:34 - 24/05 16:09
Bras√≠lia        |   4 reg |  24.3¬∞C |  52.0% | 24/05 11:34 - 24/05 16:09
Recife          |   4 reg |  28.8¬∞C |  76.3% | 24/05 11:34 - 24/05 16:09
S√£o Paulo       |   4 reg |  20.2¬∞C |  76.5% | 24/05 11:34 - 24/05 16:09

üîç √öltimos 5 registros inseridos:
--------------------------------------------------------------------------------
Recife          |  28.0¬∞C |  78% | nuvens dispersas     | 24/05 16:09:09
Bras√≠lia        |  25.5¬∞C |  49% | nublado              | 24/05 16:09:08
Rio de Janeiro  |  23.5¬∞C |  59% | nublado              | 24/05 16:09:07
S√£o Paulo       |  20.2¬∞C |  80% | nublado              | 24/05 16:09:05


In [14]:
# =============================================================================
# VALIDA√á√ÉO FINAL
# =============================================================================

print("\nüîç Valida√ß√£o final do banco de dados...")

# Verificar se as tabelas foram criadas corretamente
validation_queries = [
    ("SELECT COUNT(*) FROM information_schema.tables WHERE table_name = 'raw_data'", "Tabela raw_data"),
    ("SELECT COUNT(*) FROM information_schema.tables WHERE table_name = 'model_predictions'", "Tabela model_predictions"),
    ("SELECT COUNT(*) FROM information_schema.views WHERE table_name = 'weather_summary'", "View weather_summary"),
    ("SELECT COUNT(*) FROM raw_data", "Registros em raw_data"),
]

all_validations_passed = True

for query, description in validation_queries:
    try:
        result = db.execute_query(query, fetch=True)
        count = result[0][0] if result and result[0] else 0
        
        if "Registros" in description:
            print(f"‚úÖ {description}: {count}")
        elif count > 0:
            print(f"‚úÖ {description}: Existe")
        else:
            print(f"‚ùå {description}: N√£o encontrado")
            all_validations_passed = False
            
    except Exception as e:
        print(f"‚ùå Erro ao validar {description}: {e}")
        all_validations_passed = False

# Resultado final
print("\n" + "="*60)
if all_validations_passed:
    print("üéâ CONFIGURA√á√ÉO CONCLU√çDA COM SUCESSO!")
    print("‚úÖ Banco de dados estruturado e funcionando corretamente")
    print("‚úÖ Dados reais inseridos da API OpenWeatherMap")
    print("‚úÖ Views de an√°lise criadas")
    print("‚úÖ Sistema pronto para uso!")
else:
    print("‚ö†Ô∏è CONFIGURA√á√ÉO PARCIALMENTE CONCLU√çDA")
    print("‚ö†Ô∏è Alguns componentes podem n√£o estar funcionando corretamente")
    print("‚ö†Ô∏è Verifique os logs acima para mais detalhes")

print("="*60)
print("üéØ Configura√ß√£o do banco de dados finalizada!")


üîç Valida√ß√£o final do banco de dados...
‚úÖ Tabela raw_data: Existe
‚úÖ Tabela model_predictions: Existe
‚úÖ View weather_summary: Existe
‚úÖ Registros em raw_data: 27

üéâ CONFIGURA√á√ÉO CONCLU√çDA COM SUCESSO!
‚úÖ Banco de dados estruturado e funcionando corretamente
‚úÖ Dados reais inseridos da API OpenWeatherMap
‚úÖ Views de an√°lise criadas
‚úÖ Sistema pronto para uso!
üéØ Configura√ß√£o do banco de dados finalizada!
