# Coleta IIP

In [6]:
core_indicators = [
    # Headlines
    "NIIP", "TA_AFR", "TL_AFR",
    # Direct Investment
    "D", "D_F5", "D_FL",
    # Portfolio Investment
    "P_MV", "P_F5_MV", "P_F3_MV",
    # Other Investment
    "O_FL1", "O_F4_NV", "O_F2_NV", "O_F81",
    # Reserve Assets
    "R", "R_F11_MV", "R_FK_MV", "R_F12_MV",
    # SDR allocations (passivo, para net de SDR)
    "O_F12",
]

In [7]:
important_countries = [
    # Maiores economias / benchmarks
    "USA","CHN","DEU","JPN","GBR","FRA","ITA","IND","CAN","AUS","KOR","ESP","NLD",
    # Europa ampliada
    "IRL","CHE","LUX","SWE","DNK","FIN","POL","AUT","BEL","CZE","HUN","ROU","PRT","GRC",
    # Américas (desenvolvidos + EM)
    "BRA","MEX","ARG","COL","CHL","PER","URY",
    # Ásia emergente e manufatura
    "TWN","SGP","HKG","THA","MYS","VNM","IDN","PHL",
    # Oriente Médio / petróleo
    "SAU","ARE","QAT","KWT","IRN","ISR",
    # Commodities avançados / energia
    "NOR","RUS",
    # África (representativos)
    "ZAF","EGY","NGA","GHA","KEN",
]

In [None]:
import sdmx
import pandas as pd
import os
from pathlib import Path

nome_base = 'IIP'

# Usar caminho absoluto para garantir que funciona independente do CWD
output_dir = Path("/opt/airflow/data_layer/raw/Resultados")

# Cliente IMF
client = sdmx.Client("IMF_DATA")
base = client.dataflow(nome_base)
nome_estrutura = list(base.structure.keys())[0]
estrutura = base.structure[nome_estrutura]

params = dict(
    startPeriod="2000",
)

df_final = pd.DataFrame() 


# Abrir o arquivo para adicionar conteúdo (append)
with open("1_DICIONARIO.txt", "a", encoding="utf-8") as f:

    for country in important_countries:
        f.write("----------------------\n\n")
        for i,core_indicator in enumerate(core_indicators):
            # key = f'BRA+USA+CHN+IND.{indicador}.USD.A'
            key = dict(
                COUNTRY = country,
                # BOP_ACCOUNTING_ENTRY = ac,
                INDICATOR = core_indicator,
                FREQUENCY = "Q",
                # UNIT= "USDB"
            )

            # Baixar os dados
            data_msg = client.data(nome_base, key=key, params=params, dsd=estrutura)

            # Converter para pandas DataFrame
            df = sdmx.to_pandas(
                data_msg, 
                #datetime="TIME_PERIOD"
                )

            df = df.reset_index()

            df_final = pd.concat([df_final, df], ignore_index=True)
            if not df.empty:
                print(f"País {country},indicador: {core_indicator}")
                f.write(f"\nPaís {country},indicador: {core_indicator}")
            print(f"Finalizada etapa {i}") if i == 1 else print

display(df_final.head())

# Salvar usando caminho absoluto
output_file = output_dir / f"{nome_base}.csv"
df_final.to_csv(output_file, index=False)
print(f"✓ Arquivo final salvo com sucesso: {output_file}")

País USA,indicador: NIIP
País USA,indicador: TA_AFR
Finalizada etapa 1
País USA,indicador: TL_AFR
País USA,indicador: D
País USA,indicador: D_F5
País USA,indicador: D_FL
País USA,indicador: P_MV
País USA,indicador: P_F5_MV
País USA,indicador: P_F3_MV
País USA,indicador: O_FL1
País USA,indicador: O_F4_NV
País USA,indicador: O_F2_NV
País USA,indicador: O_F81
País USA,indicador: R
País USA,indicador: R_F11_MV
País USA,indicador: R_FK_MV
País USA,indicador: R_F12_MV
País USA,indicador: O_F12
País CHN,indicador: NIIP
País CHN,indicador: TA_AFR
Finalizada etapa 1
País CHN,indicador: TL_AFR
País CHN,indicador: D
País CHN,indicador: D_F5
País CHN,indicador: D_FL
País CHN,indicador: P_MV
País CHN,indicador: P_F5_MV
País CHN,indicador: P_F3_MV
País CHN,indicador: O_FL1
País CHN,indicador: O_F4_NV
País CHN,indicador: O_F2_NV
País CHN,indicador: O_F81
País CHN,indicador: R
País CHN,indicador: R_F11_MV
País CHN,indicador: R_FK_MV
País CHN,indicador: R_F12_MV
País CHN,indicador: O_F12
País DEU,indic

Unnamed: 0,COUNTRY,BOP_ACCOUNTING_ENTRY,INDICATOR,UNIT,FREQUENCY,TIME_PERIOD,value,index
0,USA,NETAL_P,NIIP,USD,Q,2005-Q4,-1857865000000.0,
1,USA,NETAL_P,NIIP,USD,Q,2006-Q1,-1655616000000.0,
2,USA,NETAL_P,NIIP,USD,Q,2006-Q2,-1678770000000.0,
3,USA,NETAL_P,NIIP,USD,Q,2006-Q3,-2005759000000.0,
4,USA,NETAL_P,NIIP,USD,Q,2006-Q4,-1807819000000.0,
