# API Exercise Notebook

This notebook will extract historical data of the brazilian National Broad Consumer Price Index (IPCA), an index used to measure the variation of inflation in Brazil. Data will be collected used an API provided by the brazilian Central Bank.

In [24]:
# importing libraries
import requests
import pandas as pd

The parameter "**t**" indicates which table we want to request. In this case we want the table nº **1737**, returning the IPCA table.

The parameter "**p**" indicates which period we want to request. In this case we want **all**, returning all months since December 1979, up to July 2022.

The parameter "**v**" indicates which variables we want to request. In this case we want **all**, returning all variables available:


*   Index
*   Monthly variation
*   3 months cumulative variation
*   6 months cumulative variation
*   Year cumulative variation
*   12 months cumulative variation

The parameter "**n1**" indicates that we want to request national data. On this parameter it would be possible to select specific regions, states or cities.

All these parameters will be added to the base url.

In [36]:
# parameters
base_url = 'https://apisidra.ibge.gov.br/values'
table = '1737'
period = 'last 12'
variables = 'all'
territory = 'n1/all'

Concatenating the url and the chosen parameters.

In [37]:
url = base_url +'/t/'+ table +'/p/'+ period +'/v/'+ variables +'/'+ territory

Sending the request, and saving the response to the **response** variable.

In [38]:
response = requests.get( url )

Requisition status, 2XX would be sucess.

In [39]:
response

<Response [200]>

Checking response content.

In [40]:
response.content

b'[\r\n  {\r\n    "NC": "N\xc3\xadvel Territorial (C\xc3\xb3digo)",\r\n    "NN": "N\xc3\xadvel Territorial",\r\n    "MC": "Unidade de Medida (C\xc3\xb3digo)",\r\n    "MN": "Unidade de Medida",\r\n    "V": "Valor",\r\n    "D1C": "M\xc3\xaas (C\xc3\xb3digo)",\r\n    "D1N": "M\xc3\xaas",\r\n    "D2C": "Vari\xc3\xa1vel (C\xc3\xb3digo)",\r\n    "D2N": "Vari\xc3\xa1vel",\r\n    "D3C": "Brasil (C\xc3\xb3digo)",\r\n    "D3N": "Brasil"\r\n  },\r\n  {\r\n    "NC": "1",\r\n    "NN": "Brasil",\r\n    "MC": "30",\r\n    "MN": "N\xc3\xbamero-\xc3\xadndice",\r\n    "V": "5876.0500000000000",\r\n    "D1C": "202108",\r\n    "D1N": "agosto 2021",\r\n    "D2C": "2266",\r\n    "D2N": "IPCA - N\xc3\xbamero-\xc3\xadndice (base: dezembro de 1993 = 100)",\r\n    "D3C": "1",\r\n    "D3N": "Brasil"\r\n  },\r\n  {\r\n    "NC": "1",\r\n    "NN": "Brasil",\r\n    "MC": "2",\r\n    "MN": "%",\r\n    "V": "0.87",\r\n    "D1C": "202108",\r\n    "D1N": "agosto 2021",\r\n    "D2C": "63",\r\n    "D2N": "IPCA - Varia\xc3

Checking response type.

In [41]:
type( response.content )

bytes

Checking how it looks using .text command.

In [42]:
response.text

'[\r\n  {\r\n    "NC": "Nível Territorial (Código)",\r\n    "NN": "Nível Territorial",\r\n    "MC": "Unidade de Medida (Código)",\r\n    "MN": "Unidade de Medida",\r\n    "V": "Valor",\r\n    "D1C": "Mês (Código)",\r\n    "D1N": "Mês",\r\n    "D2C": "Variável (Código)",\r\n    "D2N": "Variável",\r\n    "D3C": "Brasil (Código)",\r\n    "D3N": "Brasil"\r\n  },\r\n  {\r\n    "NC": "1",\r\n    "NN": "Brasil",\r\n    "MC": "30",\r\n    "MN": "Número-índice",\r\n    "V": "5876.0500000000000",\r\n    "D1C": "202108",\r\n    "D1N": "agosto 2021",\r\n    "D2C": "2266",\r\n    "D2N": "IPCA - Número-índice (base: dezembro de 1993 = 100)",\r\n    "D3C": "1",\r\n    "D3N": "Brasil"\r\n  },\r\n  {\r\n    "NC": "1",\r\n    "NN": "Brasil",\r\n    "MC": "2",\r\n    "MN": "%",\r\n    "V": "0.87",\r\n    "D1C": "202108",\r\n    "D1N": "agosto 2021",\r\n    "D2C": "63",\r\n    "D2N": "IPCA - Variação mensal",\r\n    "D3C": "1",\r\n    "D3N": "Brasil"\r\n  },\r\n  {\r\n    "NC": "1",\r\n    "NN": "Brasil",

Checking how it looks as a JSON.

In [43]:
response.json()

[{'NC': 'Nível Territorial (Código)',
  'NN': 'Nível Territorial',
  'MC': 'Unidade de Medida (Código)',
  'MN': 'Unidade de Medida',
  'V': 'Valor',
  'D1C': 'Mês (Código)',
  'D1N': 'Mês',
  'D2C': 'Variável (Código)',
  'D2N': 'Variável',
  'D3C': 'Brasil (Código)',
  'D3N': 'Brasil'},
 {'NC': '1',
  'NN': 'Brasil',
  'MC': '30',
  'MN': 'Número-índice',
  'V': '5876.0500000000000',
  'D1C': '202108',
  'D1N': 'agosto 2021',
  'D2C': '2266',
  'D2N': 'IPCA - Número-índice (base: dezembro de 1993 = 100)',
  'D3C': '1',
  'D3N': 'Brasil'},
 {'NC': '1',
  'NN': 'Brasil',
  'MC': '2',
  'MN': '%',
  'V': '0.87',
  'D1C': '202108',
  'D1N': 'agosto 2021',
  'D2C': '63',
  'D2N': 'IPCA - Variação mensal',
  'D3C': '1',
  'D3N': 'Brasil'},
 {'NC': '1',
  'NN': 'Brasil',
  'MC': '2',
  'MN': '%',
  'V': '2.38',
  'D1C': '202108',
  'D1N': 'agosto 2021',
  'D2C': '2263',
  'D2N': 'IPCA - Variação acumulada em 3 meses',
  'D3C': '1',
  'D3N': 'Brasil'},
 {'NC': '1',
  'NN': 'Brasil',
  'MC': 

In [44]:
type( response.json() )

list

Converting it to a **DataFrame**.

In [62]:
df = pd.DataFrame( response.json() )

In [63]:
df.head()

Unnamed: 0,NC,NN,MC,MN,V,D1C,D1N,D2C,D2N,D3C,D3N
0,Nível Territorial (Código),Nível Territorial,Unidade de Medida (Código),Unidade de Medida,Valor,Mês (Código),Mês,Variável (Código),Variável,Brasil (Código),Brasil
1,1,Brasil,30,Número-índice,5876.0500000000000,202108,agosto 2021,2266,IPCA - Número-índice (base: dezembro de 1993 =...,1,Brasil
2,1,Brasil,2,%,0.87,202108,agosto 2021,63,IPCA - Variação mensal,1,Brasil
3,1,Brasil,2,%,2.38,202108,agosto 2021,2263,IPCA - Variação acumulada em 3 meses,1,Brasil
4,1,Brasil,2,%,4.51,202108,agosto 2021,2264,IPCA - Variação acumulada em 6 meses,1,Brasil


In [64]:
df.shape

(73, 11)

Chosing a specific variable (we collected all at the beginning), to check if it has correctly selected the last 12 months values.

In [66]:
df.loc[ df['D2C'] == '2266' ]

Unnamed: 0,NC,NN,MC,MN,V,D1C,D1N,D2C,D2N,D3C,D3N
1,1,Brasil,30,Número-índice,5876.05,202108,agosto 2021,2266,IPCA - Número-índice (base: dezembro de 1993 =...,1,Brasil
7,1,Brasil,30,Número-índice,5944.21,202109,setembro 2021,2266,IPCA - Número-índice (base: dezembro de 1993 =...,1,Brasil
13,1,Brasil,30,Número-índice,6018.51,202110,outubro 2021,2266,IPCA - Número-índice (base: dezembro de 1993 =...,1,Brasil
19,1,Brasil,30,Número-índice,6075.69,202111,novembro 2021,2266,IPCA - Número-índice (base: dezembro de 1993 =...,1,Brasil
25,1,Brasil,30,Número-índice,6120.04,202112,dezembro 2021,2266,IPCA - Número-índice (base: dezembro de 1993 =...,1,Brasil
31,1,Brasil,30,Número-índice,6153.09,202201,janeiro 2022,2266,IPCA - Número-índice (base: dezembro de 1993 =...,1,Brasil
37,1,Brasil,30,Número-índice,6215.24,202202,fevereiro 2022,2266,IPCA - Número-índice (base: dezembro de 1993 =...,1,Brasil
43,1,Brasil,30,Número-índice,6315.93,202203,março 2022,2266,IPCA - Número-índice (base: dezembro de 1993 =...,1,Brasil
49,1,Brasil,30,Número-índice,6382.88,202204,abril 2022,2266,IPCA - Número-índice (base: dezembro de 1993 =...,1,Brasil
55,1,Brasil,30,Número-índice,6412.88,202205,maio 2022,2266,IPCA - Número-índice (base: dezembro de 1993 =...,1,Brasil


In [67]:
df.loc[ df['D2C'] == '2266' ].shape

(12, 11)