In [4]:
import wbdata
import pandas as pd
from datetime import datetime

# -------------------------------------------------------
#  Indicadores a coletar
# -------------------------------------------------------
indicadores = {
    # Econômicos

    'NY.GDP.MKTP.CD': 'PIB_USD',         # PIB (em USD)
    'NY.GNP.PCAP.CD': 'Renda_per_capita', # Renda per capita
    'FP.CPI.TOTL.ZG': 'Inflacao',         # Inflação
    'NY.GDP.MKTP.KD.ZG': 'Crescimento_PIB', # Crescimento do PIB
    'BX.KLT.DINV.CD.WD': 'Invest_Estrangeiro', # Investimento Estrangeiro

    # Ambientais

    #'EN.ATM.CO2E.PC': 'CO2_per_capita',  # CO2 per capita VALIDAR NÃO FUNCIONA
    'AG.LND.FRST.ZS': 'Florestas_percentual', # Percentual de florestas
    #'SH.H2O.SAFE.ZS': 'Agua_Potavel',     # Acesso à água potável VALIDAR NÃO FUNCIONA
    'EG.USE.PCAP.KG.OE': 'Energia_per_capita', # Consumo de energia per capita

    # Segurança e sociais

   'MS.MIL.XPND.GD.ZS': 'Gasto_Militar_PIB', # Gasto militar como % do PIB
   'VC.IHR.PSRC.P5': 'Taxa_Homicidios_100mil', # Taxa de homicídios por 100 mil habitantes
   'SL.UEM.TOTL.ZS': 'Desemprego_percentual', # Taxa de desemprego
   'SP.DYN.LE00.IN': 'Expectativa_vida',   # Expectativa de vida
   'SH.XPD.CHEX.GD.ZS': 'Gasto_saude_PIB'   # Gasto com saúde como % do PIB
}

# -------------------------------------------------------
# Coleta os dados (todos os anos disponíveis)
# -------------------------------------------------------
print("Baixando os dados disponíveis da API...")

try:
    # Chama a API do Banco Mundial sem o parâmetro data_date para pegar todos os anos
    df = wbdata.get_dataframe(indicators=indicadores)
    
except RuntimeError as e:
    print(f"Erro ao buscar dados: {e}")
    # Caso um erro ocorra, exiba a lista de indicadores que causaram o problema
    print("\nIndicadores problemáticos:")
    print(indicadores)

# -------------------------------------------------------
#  Limpeza e formatação
# -------------------------------------------------------
print(" Limpando e formatando os dados...")

# Resetando o índice para transformar as datas em colunas
df = df.reset_index()

# Converte a coluna 'date' para o formato datetime
df['date'] = pd.to_datetime(df['date'], errors='coerce')

# -------------------------------------------------------
# Exporta
# -------------------------------------------------------
print("Salvando em CSV...")

# Salva os dados em um arquivo CSV
df.to_csv("df_indicadores_mundiais_todos_anos.csv", index=False)

# -------------------------------------------------------
# Visualiza
# -------------------------------------------------------
print("Dados prontos! Veja os primeiros registros:")
print(df.head())


Baixando os dados disponíveis da API...
 Limpando e formatando os dados...
Salvando em CSV...
Dados prontos! Veja os primeiros registros:
                       country       date       PIB_USD  Renda_per_capita  \
0  Africa Eastern and Southern 2024-01-01  1.287677e+12       1575.408338   
1  Africa Eastern and Southern 2023-01-01  1.176910e+12       1565.552899   
2  Africa Eastern and Southern 2022-01-01  1.191639e+12       1535.048887   
3  Africa Eastern and Southern 2021-01-01  1.085605e+12       1452.456826   
4  Africa Eastern and Southern 2020-01-01  9.334072e+11       1381.686079   

    Inflacao  Crescimento_PIB  Invest_Estrangeiro  Florestas_percentual  \
0   4.425471         2.766804        7.845909e+09                   NaN   
1   7.126975         1.891307        2.140412e+10                   NaN   
2  10.773751         3.555769        2.116323e+10             29.737205   
3   7.240978         4.563568        5.435770e+10             29.955194   
4   5.405162        -2.8

In [6]:
# ==========================================================
# Importando bibliotecas necessárias
# ==========================================================
import os
from sqlalchemy import create_engine
from dotenv import load_dotenv, find_dotenv

# Carrega as variáveis de ambiente a partir do arquivo .env
load_dotenv(find_dotenv())

# ==========================================================
# Definindo as credenciais do banco (Render)
# ==========================================================
host = os.getenv("HOST")
port = int(os.getenv("PORT"))
database = os.getenv("DATABASE")
user = os.getenv("USER")
password = os.getenv("PASSWORD")

# ==========================================================
# Criando a conexão com o PostgreSQL usando SQLAlchemy
# ==========================================================
engine = create_engine(
    f"postgresql://{user}:{password}@{host}:{port}/{database}"
)

# ==========================================================
# Salvando no banco (tabela: dados_banco_mundial)
# if_exists:
#   - 'replace' -> apaga e recria a tabela
#   - 'append' -> adiciona os dados
# ==========================================================
df.to_sql("tbl_dados_banco_mundial", engine, if_exists="replace", index=False)

print(" Dados salvos no banco Render com sucesso!")

 Dados salvos no banco Render com sucesso!
