In [1]:
import wbdata
import pandas as pd
from datetime import datetime

# -------------------------------------------------------
#  Indicadores a coletar
# -------------------------------------------------------
indicadores = {
    # Econômicos

    'NY.GDP.MKTP.CD': 'PIB_USD',         # PIB (em USD)
    'NY.GNP.PCAP.CD': 'Renda_per_capita', # Renda per capita
    'FP.CPI.TOTL.ZG': 'Inflacao',         # Inflação
    'NY.GDP.MKTP.KD.ZG': 'Crescimento_PIB', # Crescimento do PIB
    'BX.KLT.DINV.CD.WD': 'Invest_Estrangeiro', # Investimento Estrangeiro

    # Ambientais

    #'EN.ATM.CO2E.PC': 'CO2_per_capita',  # CO2 per capita VALIDAR NÃO FUNCIONA
    'AG.LND.FRST.ZS': 'Florestas_percentual', # Percentual de florestas
    #'SH.H2O.SAFE.ZS': 'Agua_Potavel',     # Acesso à água potável VALIDAR NÃO FUNCIONA
    'EG.USE.PCAP.KG.OE': 'Energia_per_capita', # Consumo de energia per capita

    # Segurança e sociais

   'MS.MIL.XPND.GD.ZS': 'Gasto_Militar_PIB', # Gasto militar como % do PIB
   'VC.IHR.PSRC.P5': 'Taxa_Homicidios_100mil', # Taxa de homicídios por 100 mil habitantes
   'SL.UEM.TOTL.ZS': 'Desemprego_percentual', # Taxa de desemprego
   'SP.DYN.LE00.IN': 'Expectativa_vida',   # Expectativa de vida
   'SH.XPD.CHEX.GD.ZS': 'Gasto_saude_PIB'   # Gasto com saúde como % do PIB
}

# -------------------------------------------------------
# Coleta os dados (todos os anos disponíveis)
# -------------------------------------------------------
print("Baixando os dados disponíveis da API...")

try:
    # Chama a API do Banco Mundial sem o parâmetro data_date para pegar todos os anos
    df = wbdata.get_dataframe(indicators=indicadores)
    
except RuntimeError as e:
    print(f"Erro ao buscar dados: {e}")
    # Caso um erro ocorra, exiba a lista de indicadores que causaram o problema
    print("\nIndicadores problemáticos:")
    print(indicadores)

# -------------------------------------------------------
#  Limpeza e formatação
# -------------------------------------------------------
print(" Limpando e formatando os dados...")

# Resetando o índice para transformar as datas em colunas
df = df.reset_index()

# Converte a coluna 'date' para o formato datetime
df['date'] = pd.to_datetime(df['date'], errors='coerce')

# -------------------------------------------------------
# Exporta
# -------------------------------------------------------
print("Salvando em CSV...")

# Salva os dados em um arquivo CSV
df.to_csv("df_indicadores_mundiais_todos_anos.csv", index=False)

# -------------------------------------------------------
# Visualiza
# -------------------------------------------------------
print("Dados prontos! Veja os primeiros registros:")
print(df.head())


Key '-7694437903385842267' not in persistent cache.
Key '-1746871428592387251' not in persistent cache.
Key '-356269328356522696' not in persistent cache.
Key '-7810073603228419389' not in persistent cache.
Key '-3059043584793063638' not in persistent cache.
Key '-2590480234417095189' not in persistent cache.
Key '-5364350236098221816' not in persistent cache.
Key '-5955664481038808909' not in persistent cache.
Key '5548308604572111642' not in persistent cache.
Key '-6604360417972149059' not in persistent cache.
Key '-4838353758280686896' not in persistent cache.
Key '8389361212230798029' not in persistent cache.
Key '8496234110338532716' not in persistent cache.
Key '1913549162205886303' not in persistent cache.
Key '4645091030622532557' not in persistent cache.
Key '-6210159681436140868' not in persistent cache.
Key '487224120098595183' not in persistent cache.
Key '-5753917696452903279' not in persistent cache.
Key '-214567563186726301' not in persistent cache.
Key '-186271975942371

Baixando os dados disponíveis da API...




 Limpando e formatando os dados...
Salvando em CSV...
Dados prontos! Veja os primeiros registros:
       country       date  PIB_USD  Renda_per_capita  Inflacao  \
0  Afghanistan 1960-01-01      NaN               NaN       NaN   
1  Afghanistan 1961-01-01      NaN               NaN       NaN   
2  Afghanistan 1962-01-01      NaN               NaN       NaN   
3  Afghanistan 1963-01-01      NaN               NaN       NaN   
4  Afghanistan 1964-01-01      NaN               NaN       NaN   

   Crescimento_PIB  Invest_Estrangeiro  Florestas_percentual  \
0              NaN                 NaN                   NaN   
1              NaN                 NaN                   NaN   
2              NaN                 NaN                   NaN   
3              NaN                 NaN                   NaN   
4              NaN                 NaN                   NaN   

   Energia_per_capita  Gasto_Militar_PIB  Taxa_Homicidios_100mil  \
0                 NaN                NaN            

In [3]:
# ==========================================================
# Importando bibliotecas necessárias
# ==========================================================
import os
from sqlalchemy import create_engine
from dotenv import load_dotenv, find_dotenv

# Carrega as variáveis de ambiente a partir do arquivo .env
load_dotenv(find_dotenv())

# ==========================================================
# Definindo as credenciais do banco (Render)
# ==========================================================
host = os.getenv("HOST")
port = int(os.getenv("PORT"))
database = os.getenv("DATABASE")
user = os.getenv("USER")
password = os.getenv("PASSWORD")

# ==========================================================
# Criando a conexão com o PostgreSQL usando SQLAlchemy
# ==========================================================
engine = create_engine(
    f"postgresql://{user}:{password}@{host}:{port}/{database}"
)

# ==========================================================
# Salvando no banco (tabela: dados_banco_mundial)
# if_exists:
#   - 'replace' -> apaga e recria a tabela
#   - 'append' -> adiciona os dados
# ==========================================================
df.to_sql("tbl_dados_banco_mundial", engine, if_exists="replace", index=False)

print("✅ Dados salvos no banco Render com sucesso!")

✅ Dados salvos no banco Render com sucesso!
