
# IPCA x Combustíveis: Uma visão a partir da Ciência de Dados

**Disclaimer**: *Essa é apenas uma visão de um estudante de ciência de dados. Caso veja algo que não faça sentido por favor me avise que irei corrigir assim que possível.*

Tendo em vista a alta no valor dos combustíveis e a disparada do indice IPCA, veremos a seguir a relação entre esses dois fatores e como isso impactou a vida dos brasileiros.

Índice Nacional de Preços ao Consumidor Amplo – IPCA que tem por objetivo medir a inflação de um conjunto de produtos e serviços comercializados no varejo, referentes ao consumo pessoal das famílias.

Fonte: https://www.ibge.gov.br/estatisticas/economicas/precos-e-custos/9256-indice-nacional-de-precos-ao-consumidor-amplo.html

Os jornalistas e economistas sempre dizem que o valor dos Combustíveis causa impacto no IPCA. Mas será se isso é realmente verdade? Vamos analisar os dados :)

** Dataframes utilizados **

Infelizmente somente os dois últimos meses da série histórica da gasolina/etanol está disponível no portal de dados https://dados.gov.br. 

IPCA:  https://dados.gov.br/dataset/4449-indice-nacional-de-precos-ao-consumidor-amplo-ipca-precos-monitorados-total

Preços de combustíveis: https://dados.gov.br/dataset/serie-historica-de-precos-de-combustiveis-por-revenda



In [None]:
import pandas as pandas

url_dados_ipca = 'http://api.bcb.gov.br/dados/serie/bcdata.sgs.4449/dados?formato=csv'
ipca_dados = pandas.read_csv(url_dados_ipca, delimiter=';')

url_dados_combustiveis_marco_2021 = 'https://www.gov.br/anp/pt-br/centrais-de-conteudo/dados-abertos/arquivos/shpc/dsan/2021/2021-03-gasolina-etanol.csv'
combustiveis_dados_marco_2021 = pandas.read_csv(url_dados_combustiveis_marco_2021, delimiter=';', error_bad_lines=False, warn_bad_lines=True)

url_dados_combustiveis_abril_2021 = 'https://www.gov.br/anp/pt-br/centrais-de-conteudo/dados-abertos/arquivos/shpc/dsan/2021/2021-04-gasolina-etanol.csv'
dados_combustiveis_abril_2021 = pandas.read_csv(url_dados_combustiveis_abril_2021, delimiter=';', error_bad_lines=False, warn_bad_lines=True)




  exec(code_obj, self.user_global_ns, self.user_ns)


  exec(code_obj, self.user_global_ns, self.user_ns)


In [None]:
from dateutil.relativedelta import relativedelta
from datetime import datetime
import seaborn as sns
import matplotlib.pyplot as plt


### IPCA ###
um_ano_atras = datetime.today() + relativedelta(months=-12)
hoje = datetime.today()
date_format = '%d/%m/%Y'
datas = []

for data in ipca_dados['data']:
    if ((datetime.strptime(hoje.strftime('%d/%m/%Y'), date_format) - datetime.strptime(data, date_format)).days < 500):
        datas.append(data)

ipca_dados['valor'] = (ipca_dados['valor'].replace(',','.', regex=True).astype(float))
sns.set()
plt.figure(figsize=(25,10))
ax = sns.barplot(x='data', y='valor', data=ipca_dados.query('data in @datas'), order=datas)
ax.set_xlabel('',fontsize=20);
ax.set_ylabel('Valor em %',fontsize=20);
ax.set_title('Variação do IPCA nos últimos 500 dias', fontsize=20)
plt.show()

print('\n')

#### Combustiveis ####

## TODO ordenar os dados

sigla = 'SAO PAULO'
tipo_produto = 'GASOLINA'

combustiveis_dados_marco_2021['Valor de Venda'] = (combustiveis_dados_marco_2021['Valor de Venda'].replace(',','.', regex=True).astype(float))
sns.set()
plt.figure(figsize=(20,8))
ax = sns.barplot(x='Valor de Venda', y='Data da Coleta', data=combustiveis_dados_marco_2021.query('`Município` == @sigla and `Produto` == @tipo_produto'))
ax.set_xlabel('Valor em R$ por litro',fontsize=20);
ax.set_ylabel('Data da Coleta',fontsize=20);
ax.set_title('Variação do Preço da Gasolina para o Mês de Março de 2021 no Munícipio de São Paulo', fontsize=20)
plt.show()

print('\n')

dados_combustiveis_abril_2021['Valor de Venda'] = (dados_combustiveis_abril_2021['Valor de Venda'].replace(',','.', regex=True).astype(float))
sns.set()
plt.figure(figsize=(20,8))
ax = sns.barplot(x='Valor de Venda', y='Data da Coleta', data=dados_combustiveis_abril_2021.query('`Município` == @sigla and `Produto` == @tipo_produto'))
ax.set_xlabel('Valor em R$ por litro',fontsize=20);
ax.set_ylabel('Data da Coleta',fontsize=20);
ax.set_title('Variação do Preço da Gasolina para o Mês de Abril de 2021 no Munícipio de São Paulo', fontsize=20)
plt.show()


sigla = 'RIO DE JANEIRO'
tipo_produto = 'GASOLINA'

combustiveis_dados_marco_2021['Valor de Venda'] = (combustiveis_dados_marco_2021['Valor de Venda'].replace(',','.', regex=True).astype(float))
sns.set()
plt.figure(figsize=(20,8))
ax = sns.barplot(x='Valor de Venda', y='Data da Coleta', data=combustiveis_dados_marco_2021.query('`Município` == @sigla and `Produto` == @tipo_produto'))
ax.set_xlabel('Valor em R$ por litro',fontsize=20);
ax.set_ylabel('Data da Coleta',fontsize=20);
ax.set_title('Variação do Preço da Gasolina para o Mês de Março de 2021 no Munícipio de Rio de Janeiro', fontsize=20)
plt.show()

print('\n')

Observando apenas os dois meses que encontrei, parece existir uma relação entre o valor da Gasolina/Etanol e o IPCA.