# IPCA
Realize uma análise histórica da taxa Selic e do IPCA nos últimos 30 anos, destacando os períodos de governo no Brasil.

## Coleta de dados do ipca

### Subtask:
Buscar e coletar os dados históricos do IPCA utilizando o pacote `python-bcb` ou outra fonte confiável para o período desejado (últimos 25 anos ou a partir de 1995).

In [1]:
%pip install python-bcb

Collecting python-bcb
  Downloading python_bcb-0.3.3-py3-none-any.whl.metadata (2.5 kB)
Downloading python_bcb-0.3.3-py3-none-any.whl (19 kB)
Installing collected packages: python-bcb
Successfully installed python-bcb-0.3.3


**Reasoning**:
Use the `python-bcb` library to fetch the IPCA data starting from the year 1995 and display the head and info of the resulting DataFrame.

In [2]:
from bcb import sgs
import pandas as pd
from datetime import datetime

# Define the start date for IPCA data collection (from 2000-01-01)
start_date_ipca = '1995-01-01'

# Define the end date as today
end_date_ipca = datetime.now().strftime('%Y-%m-%d')

# Use the bcb.sgs.get() function to retrieve the IPCA series data (code 433)
try:
    df_ipca = sgs.get(('IPCA', 433), start=start_date_ipca, end=end_date_ipca)

    if not df_ipca.empty:
        print("Dados do IPCA coletados com sucesso!")
        print("\nInformações do DataFrame do IPCA:")
        df_ipca.info()

        print("\nPrimeiras 5 linhas do DataFrame do IPCA:")
        display(df_ipca.head())

        print("\nÚltimas 5 linhas do DataFrame do IPCA:")
        display(df_ipca.tail())

    else:
        print("Não foi possível coletar dados do IPCA para o período especificado.")
        df_ipca = None

except Exception as e:
    print(f"Ocorreu um erro ao coletar dados do IPCA: {e}")
    df_ipca = None

Dados do IPCA coletados com sucesso!

Informações do DataFrame do IPCA:
<class 'pandas.core.frame.DataFrame'>
DatetimeIndex: 366 entries, 1995-01-01 to 2025-06-01
Data columns (total 1 columns):
 #   Column  Non-Null Count  Dtype  
---  ------  --------------  -----  
 0   IPCA    366 non-null    float64
dtypes: float64(1)
memory usage: 5.7 KB

Primeiras 5 linhas do DataFrame do IPCA:


Unnamed: 0_level_0,IPCA
Date,Unnamed: 1_level_1
1995-01-01,1.7
1995-02-01,1.02
1995-03-01,1.55
1995-04-01,2.43
1995-05-01,2.67



Últimas 5 linhas do DataFrame do IPCA:


Unnamed: 0_level_0,IPCA
Date,Unnamed: 1_level_1
2025-02-01,1.31
2025-03-01,0.56
2025-04-01,0.43
2025-05-01,0.26
2025-06-01,0.24


## Carregamento e Pré-processamento dos dados do IPCA

### Subtask:
Carregar os dados do IPCA em um DataFrame pandas, limpar e formatar, garantindo que a coluna de data esteja no formato correto e que não haja valores ausentes ou inconsistentes.

In [3]:
# Check the data types and information of the IPCA DataFrame
print("Informações do DataFrame do IPCA antes do pré-processamento:")
df_ipca.info()

# Check for missing values
print("\nValores ausentes no DataFrame do IPCA:")
print(df_ipca.isnull().sum())

# Check the frequency of the index (should be monthly for IPCA)
print("\nFrequência do índice do DataFrame do IPCA:")
print(df_ipca.index.freq)

# Rename the column for clarity
df_ipca.rename(columns={'IPCA': 'IPCA (%)'}, inplace=True)

# Display the first few rows and information after renaming
print("\nInformações do DataFrame do IPCA após renomear a coluna:")
df_ipca.info()
print("\nPrimeiras 5 linhas do DataFrame do IPCA após pré-processamento:")
display(df_ipca.head())

Informações do DataFrame do IPCA antes do pré-processamento:
<class 'pandas.core.frame.DataFrame'>
DatetimeIndex: 366 entries, 1995-01-01 to 2025-06-01
Data columns (total 1 columns):
 #   Column  Non-Null Count  Dtype  
---  ------  --------------  -----  
 0   IPCA    366 non-null    float64
dtypes: float64(1)
memory usage: 5.7 KB

Valores ausentes no DataFrame do IPCA:
IPCA    0
dtype: int64

Frequência do índice do DataFrame do IPCA:
None

Informações do DataFrame do IPCA após renomear a coluna:
<class 'pandas.core.frame.DataFrame'>
DatetimeIndex: 366 entries, 1995-01-01 to 2025-06-01
Data columns (total 1 columns):
 #   Column    Non-Null Count  Dtype  
---  ------    --------------  -----  
 0   IPCA (%)  366 non-null    float64
dtypes: float64(1)
memory usage: 5.7 KB

Primeiras 5 linhas do DataFrame do IPCA após pré-processamento:


Unnamed: 0_level_0,IPCA (%)
Date,Unnamed: 1_level_1
1995-01-01,1.7
1995-02-01,1.02
1995-03-01,1.55
1995-04-01,2.43
1995-05-01,2.67


## Cálculo do IPCA Acumulado 12M

In [5]:
# Calculate the 12-month rolling sum of the IPCA
# The .rolling(12) method creates a rolling window of 12 periods
# The .sum() method calculates the sum within each window
# .dropna() is used to remove the initial NaN values before the first 12 months
df_ipca['IPCA Acumulado 12M (%)'] = df_ipca['IPCA (%)'].rolling(12).sum().dropna()

print("Coluna 'IPCA Acumulado 12M (%)' adicionada ao DataFrame do IPCA.")
print("\nPrimeiras 5 linhas do DataFrame do IPCA com a nova coluna:")
display(df_ipca.head())

print("\nÚltimas 5 linhas do DataFrame do IPCA com a nova coluna:")
display(df_ipca.tail())

print("\nInformações do DataFrame do IPCA após adicionar a coluna acumulada:")
df_ipca.info()

Coluna 'IPCA Acumulado 12M (%)' adicionada ao DataFrame do IPCA.

Primeiras 5 linhas do DataFrame do IPCA com a nova coluna:


Unnamed: 0_level_0,IPCA (%),IPCA Acumulado 12M (%)
Date,Unnamed: 1_level_1,Unnamed: 2_level_1
1995-01-01,1.7,
1995-02-01,1.02,
1995-03-01,1.55,
1995-04-01,2.43,
1995-05-01,2.67,



Últimas 5 linhas do DataFrame do IPCA com a nova coluna:


Unnamed: 0_level_0,IPCA (%),IPCA Acumulado 12M (%)
Date,Unnamed: 1_level_1,Unnamed: 2_level_1
2025-02-01,1.31,4.95
2025-03-01,0.56,5.35
2025-04-01,0.43,5.4
2025-05-01,0.26,5.2
2025-06-01,0.24,5.23



Informações do DataFrame do IPCA após adicionar a coluna acumulada:
<class 'pandas.core.frame.DataFrame'>
DatetimeIndex: 366 entries, 1995-01-01 to 2025-06-01
Data columns (total 2 columns):
 #   Column                  Non-Null Count  Dtype  
---  ------                  --------------  -----  
 0   IPCA (%)                366 non-null    float64
 1   IPCA Acumulado 12M (%)  355 non-null    float64
dtypes: float64(2)
memory usage: 8.6 KB


## Visualização (Variação Mensal + Acumulado 12M)

### Subtask:
Criar um gráfico da série histórica do IPCA.

In [6]:
import plotly.graph_objects as go

# Create a base line plot for the IPCA data
fig = go.Figure()

# Add trace for 12-Month Accumulated IPCA (Primary Y-axis)
fig.add_trace(go.Scatter(x=df_ipca.index,
                         y=df_ipca['IPCA Acumulado 12M (%)'].values,
                         mode='lines',
                         name='IPCA Acumulado 12M (%)',
                         yaxis='y1'))

# Add trace for Monthly IPCA (Secondary Y-axis)
fig.add_trace(go.Scatter(x=df_ipca.index,
                         y=df_ipca['IPCA (%)'].values,
                         mode='lines',
                         name='IPCA Mensal (%)',
                         yaxis='y2'))


# Update layout for better readability and add title
fig.update_layout(
    title='Evolução Histórica do IPCA Mensal e Acumulado 12M (A partir de 2000)', # Updated title
    xaxis_title='Data',
    # Configure primary y-axis for Accumulated IPCA
    yaxis=dict(
        title="IPCA Acumulado 12M (%)",
        side='left',
        showgrid=False
    ),
    # Configure secondary y-axis for Monthly IPCA
    yaxis2=dict(
        title="IPCA Mensal (%)",
        overlaying='y',
        side='right',
        showgrid=True
    ),
    hovermode='x unified',
    showlegend=True,
    legend=dict(
        orientation="h",
        yanchor="top",
        y=-0.15,
        xanchor="center",
        x=0.5
    ),
    margin=dict(l=0, r=0, t=50, b=100)
)

# Display the interactive plot
fig.show()

## Salvar dados em JSON

In [7]:
import json

# Prepare the data in the specified JSON format
# We will use the 'IPCA Acumulado 12M (%)' column and filter out rows with NaN values
ipca_data_for_json = df_ipca.dropna(subset=['IPCA Acumulado 12M (%)']).reset_index()

# Create a list of dictionaries with 'date' and 'rate'
data_list = []
for index, row in ipca_data_for_json.iterrows():
    data_list.append({
        "date": row['Date'].strftime('%Y-%m-%d'), # Format date as YYYY-MM-DD
        "rate": row['IPCA Acumulado 12M (%)']
    })

# Create the final JSON structure
json_output = {
    "indicatorName": "IPCA Acumulado 12M (%)", # Corrected indicator name
    "data": data_list
}

# Define the filename
filename = 'ipca_acum_12m.json'

# Save the data to a JSON file
with open(filename, 'w') as f:
    json.dump(json_output, f, indent=4)

print(f"Dados do IPCA Acumulado 12M salvos em '{filename}' com sucesso!")

Dados do IPCA Acumulado 12M salvos em 'ipca_acum_12m.json' com sucesso!
