Trabalho final do Curso de Introdução à análise de dados com Python, do Curso de Verão do Instituto de Matemática e Estatística da Universidade de São Paulo.

O objetivo do trabalho é responder a questão: *O orçamento do Instituto Brasileiro do Meio Ambiente e Recursos Naturais (IBAMA) cresceu nos últimos anos?*

O primeiro passo é importar os pacotes necessários para a análise. Neste caso, o pandas será utilizado para tratamentos dos dados e o plotnine para a construção de gráficos.

In [1]:
import pandas as pd
import plotnine as plotnine

O segundo passo é importar os dados que serão trabalhados. O link para fazer download da tabela é : https://dados.mma.gov.br/dataset/orcamento-anual-mma/resource/b818f1ab-0816-4d27-a20f-148b5fe47801

In [None]:
orcamento = pd.read_csv('./consolidado_consulta_painel_de_dados_abertos_2012_a_2021.csv', 
on_bad_lines='skip', 
encoding='Latin1', 
delimiter=';', 
low_memory=False)

Para me certificar sobre a importação correta, utilizei o seguinte código:

In [None]:
orcamento.info ()

A tabela possui 7 colunas e 10 linhas . Contudo, o nome das colunas estão desconfigurados e os números estão como objetos. Para dar prosseguimento a análise, precisei renomear 3 colunas, por meio de dicionários.A tabela possui 7 colunas e 10 linhas . Contudo, o nome das colunas estão desconfigurados e os números estão como objetos. Para dar prosseguimento a análise, precisei renomear 3 colunas, por meio de dicionários.

In [None]:
orcamento.rename(columns={'ï»¿Ano': 'Ano', 
'DotaÃ§Ã£o Inicial': 'dotacao_inicial', 
'DotaÃ§Ã£o Atual': 'dotacao_atual' }, inplace = True)


orcamento.info ()

Em seguida, transformei as strings em números, em que primeiramente foi necessário retirar os pontos como marcadores de casa decimais e depois inserir a vígula. Ao final, aplicado a função .info ( ) para conferir se a conversão das variáveis ocorreu corretamente.

In [None]:
orcamento["Projeto de Lei"] = orcamento["Projeto de Lei"].str.replace(".", "")
orcamento["Projeto de Lei"] = orcamento["Projeto de Lei"].str.replace(",", ".")

orcamento['Projeto de Lei'] = pd.to_numeric(orcamento['Projeto de Lei'], errors="coerce")


orcamento["dotacao_inicial"] = orcamento["dotacao_inicial"].str.replace(".", "")
orcamento["dotacao_inicial"] = orcamento["dotacao_inicial"].str.replace(",", ".")

orcamento['dotacao_inicial'] = pd.to_numeric(orcamento['dotacao_inicial'], errors="coerce")

orcamento["dotacao_atual"] = orcamento["dotacao_atual"].str.replace(".", "")
orcamento["dotacao_atual"] = orcamento["dotacao_atual"].str.replace(",", ".")

orcamento['dotacao_atual'] = pd.to_numeric(orcamento['dotacao_atual'], errors="coerce")

orcamento["Empenhado"] = orcamento["Empenhado"].str.replace(".", "")
orcamento["Empenhado"] = orcamento["Empenhado"].str.replace(",", ".")

orcamento['Empenhado'] = pd.to_numeric(orcamento['Empenhado'], errors="coerce")


orcamento["Liquidado"] = orcamento["Liquidado"].str.replace(".", "")
orcamento["Liquidado"] = orcamento["Liquidado"].str.replace(",", ".")

orcamento['Liquidado'] = pd.to_numeric(orcamento['Liquidado'], errors="coerce")


orcamento["Pago"] = orcamento["Pago"].str.replace(".", "")
orcamento["Pago"] = orcamento["Pago"].str.replace(",", ".")

orcamento['Pago'] = pd.to_numeric(orcamento['Pago'], errors="coerce")



orcamento.info ()

Ajustando os valores para que facilitar a leitura. Por se tratar de bilhões, divirei todas as colunas por 1 bilhão para facilitar a leitura e diminuir a quantidade de números no gráfico.

In [None]:
orcamento['Projeto de Lei'] = (orcamento['Projeto de Lei']/1000000000)

orcamento['dotacao_inicial'] = orcamento['dotacao_inicial']/1000000000

orcamento['dotacao_atual'] = orcamento['dotacao_atual']/1000000000

orcamento['Empenhado'] = orcamento['Empenhado']/1000000000

orcamento['Liquidado'] = orcamento['Liquidado']/1000000000

orcamento['Pago'] = orcamento['Pago']/1000000000

Com os devidos ajustes feitos, podemos montar nosso gráfico. Importante ressaltar que os valores não estão corrigidos pela inflação. Para uma comparação mais exata, os valores devem ser corrigidos. A linha vermelha indicará o valor estimado no projeto de lei e a linha azul o valor que foi pago ao ministério.

In [None]:
graph = (ggplot(orcamento, aes(x ='Ano', y='Projeto de Lei')) +
geom_line( aes(x ='Ano', y='Projeto de Lei'),color = 'red') +
geom_line(aes(x ='Ano', y='Pago'), color = 'blue') +
labs (title = "Orçamento previsto/pago do MMA  por ano", 
      x ="Ano", 
      y ="Valores em R$ (em bi)",
      caption = 'Dados abertos do MMA') +
scale_x_continuous( breaks = [2012, 2013, 2014, 2015,2016,2017,2018,2019,2020,2021])+
theme_bw()
)

ggsave(graph, "trabalho_final.png")

Analisando o gráfico, podemos perceber que o valor previsto na lei orçamentária anual é sempre relativamente maior do que o valor efetivamente pago pelo Ministério do Meio Ambiente. Além disso, pode-se perceber dois momentos emblemáticos no orçamento do MMA. Primeiro, o grande corte que acontece de 2013 para 2014 e, depois, a redução gradativa que acontece a partir de 2019. Assim, a resposta para a questão é que desde 2019 o orçamento do MMA está diminuindo gradativamente.