# Etapa 2

In [279]:
import pandas as pd

# A inflação dos EUA afeta o valor do dólar globalmente, inclusive em relação ao real.
CPI_EUA = pd.read_csv("data/CPI eua.csv")

# A taxa de juros dos EUA influencia o valor do dólar e, portanto, pode impactar o câmbio USD/BRL.
JUROS_EUA = pd.read_csv("data/Federal Funds Effective.csv")

# A inflação nos EUA afeta o poder de compra do dólar, o que pode influenciar sua taxade câmbio com o real
INFLACAO_EUA= pd.read_csv('data/Inflação eua.csv')

# A força da economia dos EUA, refletida no PIB, afeta o valor da sua moeda em relação a outras, incluindo o real.
PIB_EUA = pd.read_csv('data/PIB eua.csv')

# O câmbio euro/dólar pode fornecer informações sobre a força do dólar em relação a uma moeda forte, o que pode ser útil para prever o valor em relação ao real.
RELACAO_EURO_DOLAR = pd.read_csv('data/Relação euro_dolar.csv', sep=";", encoding="iso-8859-1")

# O PIB brasileiro reflete a força da economia do Brasil, que pode impactar a taxa de câmbio USD/BRL.
PIB_BR = pd.read_excel('data/PIB Br.xlsx')

# As reservas internacionais brasileiras podem influenciar a estabilidade e o valor do real frente ao dólar.
RESERVAR_INTERNACIONAIS = pd.read_csv('data/reservas internacionais.csv', sep=";", encoding="iso-8859-1")

# O risco-país pode ser um fator importante para o valor do real, já que o risco afeta a atratividade dos investimentos no Brasil.
RISCO_BR = pd.read_excel('data/Risco Br.xlsx')

# Esta taxa mede o valor do real ajustado pela inflação, sendo um importante indicador para prever a evolução da taxa de câmbio.
TAXA_CAMBIO_REAL_EFETIVA = pd.read_csv('data/Taxa Cambio Real Efetiva.csv', sep=";", encoding="iso-8859-1")

# Esta taxa mede o valor do real ajustado pela inflação, sendo um importante indicador para prever a evolução da taxa de câmbio.
TAXA_SELIC = pd.read_csv('data/Taxa Selic.csv', sep=";")

# Este é o dataset central, contendo o histórico do câmbio entre o dólar e o real
USD_BRL_HIST = pd.read_csv('data/USD_BRL Dados Históricos.csv')

# Etapa 3

In [280]:
CPI_EUA["ts"] = pd.to_datetime(CPI_EUA["DATE"])
CPI_EUA.drop(columns=["DATE"], inplace=True)
CPI_EUA.rename(columns={CPI_EUA.columns[0]: "CPI_EUA"}, inplace=True)

JUROS_EUA["ts"] = pd.to_datetime(JUROS_EUA["DATE"])
JUROS_EUA.drop(columns=["DATE"], inplace=True)
JUROS_EUA.rename(columns={JUROS_EUA.columns[0]: "JUROS_EUA"}, inplace=True)
JUROS_EUA['JUROS_EUA'] = pd.to_numeric(JUROS_EUA['JUROS_EUA'], errors='coerce')

INFLACAO_EUA["ts"] = pd.to_datetime(INFLACA_EUA["DATE"])
INFLACAO_EUA.drop(columns=["DATE"], inplace=True)
INFLACAO_EUA.rename(columns={INFLACAO_EUA.columns[0]: "INFLACAO"}, inplace=True)

quarter_to_month = {'T1': '01', 'T2': '04', 'T3': '07', 'T4': '10'}
PIB_BR["ts"] = PIB_BR[PIB_BR.columns[0]].apply(
    lambda x: f"{x.split()[0]}-{quarter_to_month[x.split()[1]]}-01"
)
PIB_BR["ts"] = pd.to_datetime(PIB_BR["ts"])
PIB_BR.drop(columns=PIB_BR.columns[0:2], inplace=True)

PIB_EUA["ts"] = pd.to_datetime(PIB_EUA["DATE"])
PIB_EUA.drop(columns=["DATE"], inplace=True)
PIB_EUA.rename(columns={PIB_EUA.columns[0]: "PIB_EUA"}, inplace=True)

RELACAO_EURO_DOLAR["ts"] = pd.to_datetime(RELACAO_EURO_DOLAR["Data"], format="%m/%Y", errors="coerce")
RELACAO_EURO_DOLAR.drop(columns=["Data"], inplace=True)
RELACAO_EURO_DOLAR.rename(columns={RELACAO_EURO_DOLAR.columns[0]: "REL_EURO_DOLAR"}, inplace=True)
RELACAO_EURO_DOLAR['REL_EURO_DOLAR'] = RELACAO_EURO_DOLAR['REL_EURO_DOLAR'].str.replace(',', '.', regex=False)
RELACAO_EURO_DOLAR['REL_EURO_DOLAR'] = pd.to_numeric(RELACAO_EURO_DOLAR['REL_EURO_DOLAR'], errors='coerce')


RESERVAR_INTERNACIONAIS["ts"] = pd.to_datetime(RESERVAR_INTERNACIONAIS["Data"], format="%m/%Y", errors="coerce")
RESERVAR_INTERNACIONAIS.drop(columns=["Data"], inplace=True)
RESERVAR_INTERNACIONAIS.rename(columns={RESERVAR_INTERNACIONAIS.columns[0]: "RESERVA_INTERNACIONAL"}, inplace=True)
RESERVAR_INTERNACIONAIS['RESERVA_INTERNACIONAL'] = pd.to_numeric(RESERVAR_INTERNACIONAIS['RESERVA_INTERNACIONAL'], errors='coerce')


RISCO_BR["ts"] = pd.to_datetime(RISCO_BR["Mês"], format="%b-%y", errors="coerce")
RISCO_BR.drop(columns=["Mês"], inplace=True)
RISCO_BR.rename(columns={RISCO_BR.columns[0]: "RISCO_BR"}, inplace=True)

TAXA_CAMBIO_REAL_EFETIVA["ts"] = pd.to_datetime(TAXA_CAMBIO_REAL_EFETIVA["Data"], format="%m/%Y", errors="coerce")
TAXA_CAMBIO_REAL_EFETIVA.drop(columns=["Data"], inplace=True)
TAXA_CAMBIO_REAL_EFETIVA.rename(columns={TAXA_CAMBIO_REAL_EFETIVA.columns[0]: "TAXA_CAMBIO"}, inplace=True)
TAXA_CAMBIO_REAL_EFETIVA['TAXA_CAMBIO'] = TAXA_CAMBIO_REAL_EFETIVA['TAXA_CAMBIO'].str.replace(',', '.', regex=False)
TAXA_CAMBIO_REAL_EFETIVA['TAXA_CAMBIO'] = pd.to_numeric(TAXA_CAMBIO_REAL_EFETIVA['TAXA_CAMBIO'], errors='coerce')


TAXA_SELIC["ts"] = pd.to_datetime(TAXA_SELIC["Data"], format="%d/%m/%Y", errors="coerce")
TAXA_SELIC.drop(columns=["Data"], inplace=True)
TAXA_SELIC.rename(columns={TAXA_SELIC.columns[0]: "SELIC"}, inplace=True)
TAXA_SELIC['SELIC'] = TAXA_SELIC['SELIC'].str.replace(',', '.', regex=False)
TAXA_SELIC['SELIC'] = pd.to_numeric(TAXA_SELIC['SELIC'], errors='coerce')


USD_BRL_HIST["ts"] = pd.to_datetime(USB_BRL_HIST["Data"], format="%d.%m.%Y", errors="coerce")
USD_BRL_HIST.drop(columns=["Data", "Último", "Abertura", "Vol."], inplace=True)
USD_BRL_HIST.rename(columns={
    "Máxima": "MAX",
    "Mínima": "MIN",
    "Var%": "VARIACAO",
}, inplace=True)
USD_BRL_HIST['MAX'] = USD_BRL_HIST['MAX'].str.replace(',', '.', regex=False)
USD_BRL_HIST['MIN'] = USD_BRL_HIST['MIN'].str.replace(',', '.', regex=False)
USD_BRL_HIST['VARIACAO'] = USD_BRL_HIST['VARIACAO'].str.replace(',', '.', regex=False)
USD_BRL_HIST['VARIACAO'] = USD_BRL_HIST['VARIACAO'].str.replace('%', '', regex=False)
USD_BRL_HIST['MAX'] = pd.to_numeric(USD_BRL_HIST['MAX'], errors='coerce')
USD_BRL_HIST['MIN'] = pd.to_numeric(USD_BRL_HIST['MIN'], errors='coerce')
USD_BRL_HIST['VARIACAO'] = pd.to_numeric(USD_BRL_HIST['VARIACAO'], errors='coerce')

In [281]:
dataframes = [
    CPI_EUA, 
    JUROS_EUA,
    INFLACAO_EUA, 
    PIB_BR, 
    PIB_EUA, 
    RELACAO_EURO_DOLAR, 
    RESERVAR_INTERNACIONAIS, 
    RISCO_BR, 
    TAXA_CAMBIO_REAL_EFETIVA, 
    TAXA_SELIC,
    USD_BRL_HIST
]

merged = dataframes[0]
for df in dataframes[1:]:
    merged = merged.merge(df, on='ts', how='outer')

In [282]:
indexed = merged.set_index("ts")
grouped = indexed.resample("W").mean().ffill()

In [283]:
table = grouped[result.index>pd.Timestamp("2013-11-24")]
table.info()

<class 'pandas.core.frame.DataFrame'>
DatetimeIndex: 567 entries, 2013-12-01 to 2024-10-06
Data columns (total 12 columns):
 #   Column                 Non-Null Count  Dtype  
---  ------                 --------------  -----  
 0   CPI_EUA                567 non-null    float64
 1   JUROS_EUA              567 non-null    float64
 2   INFLACAO               567 non-null    float64
 3   PIB_EUA                567 non-null    float64
 4   REL_EURO_DOLAR         567 non-null    float64
 5   RESERVA_INTERNACIONAL  567 non-null    float64
 6   RISCO_BR               567 non-null    float64
 7   TAXA_CAMBIO            567 non-null    float64
 8   SELIC                  567 non-null    float64
 9   MAX                    567 non-null    float64
 10  MIN                    567 non-null    float64
 11  VARIACAO               567 non-null    float64
dtypes: float64(12)
memory usage: 57.6 KB
