# **Tratamento, Visualização e Análise dos Dados da Arrecadação Federal nos anos de 2017 a 2021**
#Notebook do TCC da Pós-Graduação em Ciência de Dados - FURG
## Carlos Eduardo Fonseca Cardoso
## Fernando José Mostaert Locio
### Veruska Bersanetti Barbieri Sampaio

Base de dados obtida em **https**://www.gov.br/receitafederal/pt-br/acesso-a-informacao/dados-abertos/receitadata/arrecadacao/analise-gerencial-da-arrecadacao-angela-1 Acesso em janeiro de 2022.

In [26]:
#Importando as bibliotecas
import pandas as pd
import numpy as np
import plotly.graph_objects as go
import plotly.express as px

In [3]:
#Carregando os dados e visualizando as cinco primeiras linhas do data frame
df = pd.read_excel('/content/Angela - Arrecadação por mês - Cnae e Tributo.xlsx')
df.head()

Unnamed: 0,Ano,Mês,Seção - Sigla,Seção - Nome,II,IE,IPI,IRPF,IRPJ,IRRF,...,ITR,Cofins,Pis/Pasep,CSLL,Cide,Contribuição Previdenciária,CPSSS,Pagamento Unificado,Outras Receitas Administradas,Receitas Não Administradas
0,2016,Jan,A,"Agricultura, pecuária, prod. florestal, pesca ...",2742218.0,,893858.5,,146667900.0,49347430.0,...,2222251.21,37609110.0,8484832.0,77514370.0,142078.8,8008290.0,,41971220.0,3377850.67,1511241.0
1,2016,Jan,B,Indústrias extrativas,42899800.0,,24953910.0,,516453300.0,163430800.0,...,2391927.42,122691100.0,25694930.0,212367600.0,13041970.0,11200040.0,,160988900.0,1448689.59,613493900.0
2,2016,Jan,C,Indústrias de transformação,1633818000.0,1040859.45,2849757000.0,9117.98,3010670000.0,3359712000.0,...,630487.68,6030543000.0,1295735000.0,1325159000.0,623615800.0,646795500.0,1263.79,1951566000.0,95494213.69,2453095000.0
3,2016,Jan,D,Eletricidade e gás,5328420.0,,2175445.0,,995310100.0,547590100.0,...,920472.99,1352860000.0,298104600.0,425645600.0,2746902.0,680414.9,,179025500.0,865732.36,1646606.0
4,2016,Jan,E,"Água, esgoto, ativ. de gestão de resíduos e de...",354256.6,,1432422.0,,53338130.0,157670900.0,...,6683.0,223045300.0,56909460.0,26390890.0,73401.7,7286866.0,,59672190.0,515722.66,714449.1


In [4]:
#Vendo as cinco últimas linhas
df.tail()

Unnamed: 0,Ano,Mês,Seção - Sigla,Seção - Nome,II,IE,IPI,IRPF,IRPJ,IRRF,...,ITR,Cofins,Pis/Pasep,CSLL,Cide,Contribuição Previdenciária,CPSSS,Pagamento Unificado,Outras Receitas Administradas,Receitas Não Administradas
1723,2021,Dez,Q,Saúde humana e serviços sociais,1837388.97,1276.98,911307.86,1407.1,246266100.0,712228000.0,...,20470.4,432976400.0,107197700.0,131204400.0,1555471.23,2486479000.0,3792720.3,234161200.0,58649488.65,17073355.71
1724,2021,Dez,R,"Artes, cultura, esporte e recreação",377323.99,,494951.82,7927.79,26593150.0,80560980.0,...,78627.89,45538190.0,12075000.0,12990410.0,359132.58,239917700.0,747342.24,11992060.0,1303507.65,4088742.67
1725,2021,Dez,S,Outras atividades de serviços,3227004.55,74.73,6215959.61,67.59,34930840.0,349110800.0,...,1623395.14,87742420.0,33822430.0,18067740.0,1269768.63,1121591000.0,4471620.44,56769080.0,9672343.96,6376141.24
1726,2021,Dez,T,Serviços domésticos,,,,,14645.5,57239.57,...,,76870.48,16689.61,12857.82,,8272762.0,,17.25,25274.74,1713.85
1727,2021,Dez,U,Organismos internac. e outras instituições ext...,,,,,,22281.63,...,,820.04,19494.01,270.02,,37551.09,,25670.5,154.23,36800.56


# **Obtendo informações sobre a base de dados**

In [5]:
#identificando as colunas
df.columns

Index(['Ano', 'Mês', 'Seção - Sigla', 'Seção - Nome', 'II', 'IE', 'IPI',
       'IRPF', 'IRPJ', 'IRRF', 'IOF', 'ITR', 'Cofins', 'Pis/Pasep', 'CSLL',
       'Cide', 'Contribuição Previdenciária', 'CPSSS', 'Pagamento Unificado',
       'Outras Receitas Administradas', 'Receitas Não Administradas'],
      dtype='object')

In [6]:
#Identificando os setores de arrecadação (coluna "Seção - Nome")
df['Seção - Nome'].unique()

array(['Agricultura, pecuária, prod. florestal, pesca e aqüicultura',
       'Indústrias extrativas', 'Indústrias de transformação',
       'Eletricidade e gás',
       'Água, esgoto, ativ. de gestão de resíduos e descontaminação',
       'Construção',
       'Comércio; reparação de veículos automotores e motocicletas',
       'Transporte, armazenagem e correio', 'Alojamento e alimentação',
       'Inválido', 'Informação e comunicação',
       'Atividades financeiras, de seguros e serviços relacionados',
       'Atividades imobiliárias',
       'Atividades profissionais, científicas e técnicas',
       'Atividades administrativas e serviços complementares',
       'Não informado',
       'Administração pública, defesa e seguridade social', 'Educação',
       'Pessoa Física', 'Saúde humana e serviços sociais',
       'Artes, cultura, esporte e recreação',
       'Outras atividades de serviços', 'Serviços domésticos',
       'Organismos internac. e outras instituições extraterritoriais']

In [7]:
#Outras informações
df.info()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 1728 entries, 0 to 1727
Data columns (total 21 columns):
 #   Column                         Non-Null Count  Dtype  
---  ------                         --------------  -----  
 0   Ano                            1728 non-null   int64  
 1   Mês                            1728 non-null   object 
 2   Seção - Sigla                  1728 non-null   object 
 3   Seção - Nome                   1728 non-null   object 
 4   II                             1520 non-null   float64
 5   IE                             475 non-null    float64
 6   IPI                            1575 non-null   float64
 7   IRPF                           923 non-null    float64
 8   IRPJ                           1646 non-null   float64
 9   IRRF                           1728 non-null   float64
 10  IOF                            1472 non-null   float64
 11  ITR                            1588 non-null   float64
 12  Cofins                         1716 non-null   f

In [8]:
#Identificando a quantitdade de dados faltantes em cada coluna
df.isnull().sum()

Ano                                 0
Mês                                 0
Seção - Sigla                       0
Seção - Nome                        0
II                                208
IE                               1253
IPI                               153
IRPF                              805
IRPJ                               82
IRRF                                0
IOF                               256
ITR                               140
Cofins                             12
Pis/Pasep                           0
CSLL                               61
Cide                              269
Contribuição Previdenciária        54
CPSSS                             603
Pagamento Unificado                 0
Outras Receitas Administradas       2
Receitas Não Administradas         22
dtype: int64

# Tratamento e preparação dos dados

In [9]:
#removendo a coluna sem interesse: " Seção - Sigla"
df2 = df.drop('Seção - Sigla', axis=1)
df2.head()

Unnamed: 0,Ano,Mês,Seção - Nome,II,IE,IPI,IRPF,IRPJ,IRRF,IOF,ITR,Cofins,Pis/Pasep,CSLL,Cide,Contribuição Previdenciária,CPSSS,Pagamento Unificado,Outras Receitas Administradas,Receitas Não Administradas
0,2016,Jan,"Agricultura, pecuária, prod. florestal, pesca ...",2742218.0,,893858.5,,146667900.0,49347430.0,609206.8,2222251.21,37609110.0,8484832.0,77514370.0,142078.8,8008290.0,,41971220.0,3377850.67,1511241.0
1,2016,Jan,Indústrias extrativas,42899800.0,,24953910.0,,516453300.0,163430800.0,1230717.0,2391927.42,122691100.0,25694930.0,212367600.0,13041970.0,11200040.0,,160988900.0,1448689.59,613493900.0
2,2016,Jan,Indústrias de transformação,1633818000.0,1040859.45,2849757000.0,9117.98,3010670000.0,3359712000.0,109169800.0,630487.68,6030543000.0,1295735000.0,1325159000.0,623615800.0,646795500.0,1263.79,1951566000.0,95494213.69,2453095000.0
3,2016,Jan,Eletricidade e gás,5328420.0,,2175445.0,,995310100.0,547590100.0,12592110.0,920472.99,1352860000.0,298104600.0,425645600.0,2746902.0,680414.9,,179025500.0,865732.36,1646606.0
4,2016,Jan,"Água, esgoto, ativ. de gestão de resíduos e de...",354256.6,,1432422.0,,53338130.0,157670900.0,532902.9,6683.0,223045300.0,56909460.0,26390890.0,73401.7,7286866.0,,59672190.0,515722.66,714449.1


In [10]:
#Renomeando a coluna "Seção - Nome" para "Setor"
df2.rename(columns={'Seção - Nome': 'Setor'}, inplace = True)
df2. head()


Unnamed: 0,Ano,Mês,Setor,II,IE,IPI,IRPF,IRPJ,IRRF,IOF,ITR,Cofins,Pis/Pasep,CSLL,Cide,Contribuição Previdenciária,CPSSS,Pagamento Unificado,Outras Receitas Administradas,Receitas Não Administradas
0,2016,Jan,"Agricultura, pecuária, prod. florestal, pesca ...",2742218.0,,893858.5,,146667900.0,49347430.0,609206.8,2222251.21,37609110.0,8484832.0,77514370.0,142078.8,8008290.0,,41971220.0,3377850.67,1511241.0
1,2016,Jan,Indústrias extrativas,42899800.0,,24953910.0,,516453300.0,163430800.0,1230717.0,2391927.42,122691100.0,25694930.0,212367600.0,13041970.0,11200040.0,,160988900.0,1448689.59,613493900.0
2,2016,Jan,Indústrias de transformação,1633818000.0,1040859.45,2849757000.0,9117.98,3010670000.0,3359712000.0,109169800.0,630487.68,6030543000.0,1295735000.0,1325159000.0,623615800.0,646795500.0,1263.79,1951566000.0,95494213.69,2453095000.0
3,2016,Jan,Eletricidade e gás,5328420.0,,2175445.0,,995310100.0,547590100.0,12592110.0,920472.99,1352860000.0,298104600.0,425645600.0,2746902.0,680414.9,,179025500.0,865732.36,1646606.0
4,2016,Jan,"Água, esgoto, ativ. de gestão de resíduos e de...",354256.6,,1432422.0,,53338130.0,157670900.0,532902.9,6683.0,223045300.0,56909460.0,26390890.0,73401.7,7286866.0,,59672190.0,515722.66,714449.1


In [11]:
#Estabelecendo-se a análise dos últimos 5 anos, vamos remover as informações do ano de 2016.
#Ficamos com 1440 linhas
df3 = df2.drop(df2[df2.Ano == 2016].index)
df3

Unnamed: 0,Ano,Mês,Setor,II,IE,IPI,IRPF,IRPJ,IRRF,IOF,ITR,Cofins,Pis/Pasep,CSLL,Cide,Contribuição Previdenciária,CPSSS,Pagamento Unificado,Outras Receitas Administradas,Receitas Não Administradas
288,2017,Jan,"Agricultura, pecuária, prod. florestal, pesca ...",2.248591e+06,1382.39,8.360691e+05,,1.544228e+08,5.597589e+07,625248.36,1942365.06,3.857621e+07,8.526059e+06,8.073038e+07,9.668999e+04,6.137935e+06,,4.169120e+07,1.508836e+06,1.846202e+06
289,2017,Jan,Indústrias extrativas,1.662834e+07,,1.394180e+07,,3.801761e+08,2.774016e+08,888253.59,445107.88,1.088241e+08,2.292479e+07,1.605933e+08,2.026124e+07,3.841794e+06,,1.631219e+08,4.222456e+06,1.261245e+09
290,2017,Jan,Indústrias de transformação,1.465066e+09,488813.04,2.674739e+09,870.46,2.544520e+09,3.638375e+09,19941552.81,171135.85,5.597807e+09,1.213181e+09,1.168991e+09,5.140432e+08,5.255699e+08,6029.86,1.832474e+09,1.288138e+08,3.946924e+09
291,2017,Jan,Eletricidade e gás,4.191275e+07,,1.424212e+07,,8.366208e+08,6.584174e+08,2032159.28,519398.13,1.157488e+09,2.585321e+08,3.572667e+08,1.821654e+06,2.352614e+06,,1.899801e+08,3.119898e+06,1.005273e+07
292,2017,Jan,"Água, esgoto, ativ. de gestão de resíduos e de...",5.164032e+05,,2.417608e+06,,6.358600e+07,2.257991e+08,1254102.74,4177.75,2.651261e+08,6.128071e+07,2.913744e+07,1.677557e+05,6.713660e+06,622.77,5.695715e+07,2.096652e+06,5.652979e+05
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
1723,2021,Dez,Saúde humana e serviços sociais,1.837389e+06,1276.98,9.113079e+05,1407.10,2.462661e+08,7.122280e+08,521940.56,20470.40,4.329764e+08,1.071977e+08,1.312044e+08,1.555471e+06,2.486479e+09,3792720.30,2.341612e+08,5.864949e+07,1.707336e+07
1724,2021,Dez,"Artes, cultura, esporte e recreação",3.773240e+05,,4.949518e+05,7927.79,2.659315e+07,8.056098e+07,401435.94,78627.89,4.553819e+07,1.207500e+07,1.299041e+07,3.591326e+05,2.399177e+08,747342.24,1.199206e+07,1.303508e+06,4.088743e+06
1725,2021,Dez,Outras atividades de serviços,3.227005e+06,74.73,6.215960e+06,67.59,3.493084e+07,3.491108e+08,382996.02,1623395.14,8.774242e+07,3.382243e+07,1.806774e+07,1.269769e+06,1.121591e+09,4471620.44,5.676908e+07,9.672344e+06,6.376141e+06
1726,2021,Dez,Serviços domésticos,,,,,1.464550e+04,5.723957e+04,20.81,,7.687048e+04,1.668961e+04,1.285782e+04,,8.272762e+06,,1.725000e+01,2.527474e+04,1.713850e+03


In [12]:
#Preenchendo valores nulos (NaN) com zero
df4 = df3.fillna(value=0)
df4

Unnamed: 0,Ano,Mês,Setor,II,IE,IPI,IRPF,IRPJ,IRRF,IOF,ITR,Cofins,Pis/Pasep,CSLL,Cide,Contribuição Previdenciária,CPSSS,Pagamento Unificado,Outras Receitas Administradas,Receitas Não Administradas
288,2017,Jan,"Agricultura, pecuária, prod. florestal, pesca ...",2.248591e+06,1382.39,8.360691e+05,0.00,1.544228e+08,5.597589e+07,625248.36,1942365.06,3.857621e+07,8.526059e+06,8.073038e+07,9.668999e+04,6.137935e+06,0.00,4.169120e+07,1.508836e+06,1.846202e+06
289,2017,Jan,Indústrias extrativas,1.662834e+07,0.00,1.394180e+07,0.00,3.801761e+08,2.774016e+08,888253.59,445107.88,1.088241e+08,2.292479e+07,1.605933e+08,2.026124e+07,3.841794e+06,0.00,1.631219e+08,4.222456e+06,1.261245e+09
290,2017,Jan,Indústrias de transformação,1.465066e+09,488813.04,2.674739e+09,870.46,2.544520e+09,3.638375e+09,19941552.81,171135.85,5.597807e+09,1.213181e+09,1.168991e+09,5.140432e+08,5.255699e+08,6029.86,1.832474e+09,1.288138e+08,3.946924e+09
291,2017,Jan,Eletricidade e gás,4.191275e+07,0.00,1.424212e+07,0.00,8.366208e+08,6.584174e+08,2032159.28,519398.13,1.157488e+09,2.585321e+08,3.572667e+08,1.821654e+06,2.352614e+06,0.00,1.899801e+08,3.119898e+06,1.005273e+07
292,2017,Jan,"Água, esgoto, ativ. de gestão de resíduos e de...",5.164032e+05,0.00,2.417608e+06,0.00,6.358600e+07,2.257991e+08,1254102.74,4177.75,2.651261e+08,6.128071e+07,2.913744e+07,1.677557e+05,6.713660e+06,622.77,5.695715e+07,2.096652e+06,5.652979e+05
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
1723,2021,Dez,Saúde humana e serviços sociais,1.837389e+06,1276.98,9.113079e+05,1407.10,2.462661e+08,7.122280e+08,521940.56,20470.40,4.329764e+08,1.071977e+08,1.312044e+08,1.555471e+06,2.486479e+09,3792720.30,2.341612e+08,5.864949e+07,1.707336e+07
1724,2021,Dez,"Artes, cultura, esporte e recreação",3.773240e+05,0.00,4.949518e+05,7927.79,2.659315e+07,8.056098e+07,401435.94,78627.89,4.553819e+07,1.207500e+07,1.299041e+07,3.591326e+05,2.399177e+08,747342.24,1.199206e+07,1.303508e+06,4.088743e+06
1725,2021,Dez,Outras atividades de serviços,3.227005e+06,74.73,6.215960e+06,67.59,3.493084e+07,3.491108e+08,382996.02,1623395.14,8.774242e+07,3.382243e+07,1.806774e+07,1.269769e+06,1.121591e+09,4471620.44,5.676908e+07,9.672344e+06,6.376141e+06
1726,2021,Dez,Serviços domésticos,0.000000e+00,0.00,0.000000e+00,0.00,1.464550e+04,5.723957e+04,20.81,0.00,7.687048e+04,1.668961e+04,1.285782e+04,0.000000e+00,8.272762e+06,0.00,1.725000e+01,2.527474e+04,1.713850e+03


In [13]:
#Organizando a formatação dos valores numéricos
#No Pandas, o separador de milhar é a vírgula e o das casas decimais é o ponto
pd.set_option('float_format','{:,.2f}'.format)
df4

Unnamed: 0,Ano,Mês,Setor,II,IE,IPI,IRPF,IRPJ,IRRF,IOF,ITR,Cofins,Pis/Pasep,CSLL,Cide,Contribuição Previdenciária,CPSSS,Pagamento Unificado,Outras Receitas Administradas,Receitas Não Administradas
288,2017,Jan,"Agricultura, pecuária, prod. florestal, pesca ...",2248591.04,1382.39,836069.05,0.00,154422811.29,55975890.46,625248.36,1942365.06,38576205.99,8526058.52,80730376.36,96689.99,6137935.29,0.00,41691196.63,1508836.18,1846202.05
289,2017,Jan,Indústrias extrativas,16628341.31,0.00,13941801.33,0.00,380176085.34,277401636.86,888253.59,445107.88,108824088.05,22924791.60,160593326.44,20261243.76,3841793.54,0.00,163121931.63,4222456.02,1261245233.25
290,2017,Jan,Indústrias de transformação,1465066190.37,488813.04,2674738855.28,870.46,2544520188.38,3638374827.49,19941552.81,171135.85,5597807037.68,1213181012.25,1168990630.04,514043187.41,525569907.82,6029.86,1832473517.08,128813783.66,3946924269.94
291,2017,Jan,Eletricidade e gás,41912748.99,0.00,14242124.32,0.00,836620799.56,658417372.13,2032159.28,519398.13,1157488183.32,258532112.47,357266685.91,1821653.95,2352613.89,0.00,189980075.27,3119897.50,10052729.02
292,2017,Jan,"Água, esgoto, ativ. de gestão de resíduos e de...",516403.19,0.00,2417607.54,0.00,63586002.30,225799121.75,1254102.74,4177.75,265126088.50,61280712.39,29137442.85,167755.68,6713660.15,622.77,56957149.55,2096651.55,565297.88
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
1723,2021,Dez,Saúde humana e serviços sociais,1837388.97,1276.98,911307.86,1407.10,246266139.36,712227960.06,521940.56,20470.40,432976434.83,107197692.71,131204355.24,1555471.23,2486479261.19,3792720.30,234161197.69,58649488.65,17073355.71
1724,2021,Dez,"Artes, cultura, esporte e recreação",377323.99,0.00,494951.82,7927.79,26593153.12,80560976.88,401435.94,78627.89,45538189.14,12074995.79,12990407.68,359132.58,239917748.61,747342.24,11992058.58,1303507.65,4088742.67
1725,2021,Dez,Outras atividades de serviços,3227004.55,74.73,6215959.61,67.59,34930836.04,349110752.09,382996.02,1623395.14,87742417.38,33822425.33,18067741.72,1269768.63,1121590704.43,4471620.44,56769081.00,9672343.96,6376141.24
1726,2021,Dez,Serviços domésticos,0.00,0.00,0.00,0.00,14645.50,57239.57,20.81,0.00,76870.48,16689.61,12857.82,0.00,8272761.74,0.00,17.25,25274.74,1713.85


In [14]:
#Criando a coluna "Total", que receberá a soma dos tributos em cada mês e ano por setor
df4['Total'] = (df4['II'] + df4['IE'] + df4['IPI'] + df4['IRPF'] + df4['IRPJ'] + df4['IRRF'] + df4['IOF'] + df4['ITR'] 
                + df4['Cofins'] + df4['Pis/Pasep'] + df4['CSLL'] + df4['Cide'] + df4['Contribuição Previdenciária'] + df4['CPSSS'] 
                + df4['Pagamento Unificado'] + df4['Outras Receitas Administradas'] + df4['Receitas Não Administradas'])
df4.head()

Unnamed: 0,Ano,Mês,Setor,II,IE,IPI,IRPF,IRPJ,IRRF,IOF,...,Cofins,Pis/Pasep,CSLL,Cide,Contribuição Previdenciária,CPSSS,Pagamento Unificado,Outras Receitas Administradas,Receitas Não Administradas,Total
288,2017,Jan,"Agricultura, pecuária, prod. florestal, pesca ...",2248591.04,1382.39,836069.05,0.0,154422811.29,55975890.46,625248.36,...,38576205.99,8526058.52,80730376.36,96689.99,6137935.29,0.0,41691196.63,1508836.18,1846202.05,395165858.66
289,2017,Jan,Indústrias extrativas,16628341.31,0.0,13941801.33,0.0,380176085.34,277401636.86,888253.59,...,108824088.05,22924791.6,160593326.44,20261243.76,3841793.54,0.0,163121931.63,4222456.02,1261245233.25,2434516090.6
290,2017,Jan,Indústrias de transformação,1465066190.37,488813.04,2674738855.28,870.46,2544520188.38,3638374827.49,19941552.81,...,5597807037.68,1213181012.25,1168990630.04,514043187.41,525569907.82,6029.86,1832473517.08,128813783.66,3946924269.94,25271111809.42
291,2017,Jan,Eletricidade e gás,41912748.99,0.0,14242124.32,0.0,836620799.56,658417372.13,2032159.28,...,1157488183.32,258532112.47,357266685.91,1821653.95,2352613.89,0.0,189980075.27,3119897.5,10052729.02,3534358553.74
292,2017,Jan,"Água, esgoto, ativ. de gestão de resíduos e de...",516403.19,0.0,2417607.54,0.0,63586002.3,225799121.75,1254102.74,...,265126088.5,61280712.39,29137442.85,167755.68,6713660.15,622.77,56957149.55,2096651.55,565297.88,715622796.59


In [15]:
#Informações sobre o data frame após tratamento e preparação dos dados
df4.info()

<class 'pandas.core.frame.DataFrame'>
Int64Index: 1440 entries, 288 to 1727
Data columns (total 21 columns):
 #   Column                         Non-Null Count  Dtype  
---  ------                         --------------  -----  
 0   Ano                            1440 non-null   int64  
 1   Mês                            1440 non-null   object 
 2   Setor                          1440 non-null   object 
 3   II                             1440 non-null   float64
 4   IE                             1440 non-null   float64
 5   IPI                            1440 non-null   float64
 6   IRPF                           1440 non-null   float64
 7   IRPJ                           1440 non-null   float64
 8   IRRF                           1440 non-null   float64
 9   IOF                            1440 non-null   float64
 10  ITR                            1440 non-null   float64
 11  Cofins                         1440 non-null   float64
 12  Pis/Pasep                      1440 non-null  

# **Análise e visualização dos dados**
1. Utilizamos principalmente a função groupby() combinada com a função de agregação *agg*.  
2. Para os gráficos, utilizamos a biblioteca Plotly, especificamente Plotly Express.

In [16]:
#Calculando o total da arrecadação por ano usando a função de agregação 'agg'
df4.groupby('Ano').agg({'Total':np.sum})


Unnamed: 0_level_0,Total
Ano,Unnamed: 1_level_1
2017,1034255233854.57
2018,1193637510805.71
2019,1391129677075.95
2020,1356488758874.6
2021,1745010004541.46


In [28]:
#Resetando os índices para fazer com que 'Ano' e 'Total' sejam colunas
df_agrupado_pelo_ano = df4.groupby('Ano', sort=False).agg({'Total':np.sum}).reset_index()
df_agrupado_pelo_ano

Unnamed: 0,Ano,Total
0,2017,1034255233854.57
1,2018,1193637510805.71
2,2019,1391129677075.95
3,2020,1356488758874.6
4,2021,1745010004541.46


In [27]:
#Plotando gráfico de barras da arrecadação total por ano
px.bar(df_agrupado_pelo_ano, x='Ano', y='Total', width=500, height=500,
       color_discrete_sequence=px.colors.qualitative.D3, template='plotly_white')

In [24]:
#Plotando gráfico de linha da arrecadação total por ano
px.line(df_agrupado_pelo_ano, x='Ano', y='Total', width=500, height=500, 
        color_discrete_sequence=px.colors.qualitative.D3, template='plotly_white')

In [22]:
#Agrupando a arrecadação total por ano e Mês
df_agrupado_pelo_ano_e_mes = df4.groupby(['Ano', 'Mês'], sort=False).agg({'Total':np.sum}).reset_index()
df_agrupado_pelo_ano_e_mes

Unnamed: 0,Ano,Mês,Total
0,2017,Jan,113851499681.31
1,2017,Fev,68569678593.07
2,2017,Mar,74636713634.71
3,2017,Abr,95761349384.19
4,2017,Mai,73131115647.09
5,2017,Jun,79942285356.11
6,2017,Jul,85747875961.94
7,2017,Ago,79146855134.2
8,2017,Set,81186886043.69
9,2017,Out,96499835755.3


In [23]:
#Gráfico da evolução mensal da arrecadação por ano
px.line(df_agrupado_pelo_ano_e_mes, x='Mês', y='Total', color="Ano", width=1000, height=500,
        color_discrete_sequence=px.colors.qualitative.D3, template='plotly_white')

In [None]:
#Plotando gráfico de barras da arrecadação total por ano e mês
px.bar(df_agrupado_pelo_ano_e_mes, x='Ano', y='Total', color = 'Mês', barmode = 'group', width=1100,
       height=500, color_discrete_sequence=px.colors.qualitative.Set3, template='plotly_white')

In [None]:
#Agrupando total da arrecadaçao por ano e setor
df_agrupado_pelo_ano_e_setor = df4.groupby(['Ano', 'Setor'], sort=False).agg({'Total':np.sum}).reset_index()
df_agrupado_pelo_ano_e_setor

Unnamed: 0,Ano,Setor,Total
0,2017,"Agricultura, pecuária, prod. florestal, pesca ...",3067299544.81
1,2017,Indústrias extrativas,16898191405.25
2,2017,Indústrias de transformação,257447705351.84
3,2017,Eletricidade e gás,29380340517.03
4,2017,"Água, esgoto, ativ. de gestão de resíduos e de...",9202952068.99
...,...,...,...
115,2021,Saúde humana e serviços sociais,35699224630.69
116,2021,"Artes, cultura, esporte e recreação",2990294628.55
117,2021,Outras atividades de serviços,10003071093.75
118,2021,Serviços domésticos,87858713.98


In [None]:
#Gráfico de barras do total da arrecadaçao por ano e setor
px.bar(df_agrupado_pelo_ano_e_setor, x='Ano', y='Total', color = 'Setor', barmode = 'group',
       color_discrete_sequence=px.colors.qualitative.Set3, template='plotly_white')

In [None]:
#Setores que tiveram arrecadação acima de 50 bilhões -2017 a 2021
df_mask_50bi=df_agrupado_pelo_ano_e_setor['Total']>=50000000000
filtro_df_50bi = df_agrupado_pelo_ano_e_setor[df_mask_50bi]
filtro_df_50bi

Unnamed: 0,Ano,Setor,Total
2,2017,Indústrias de transformação,257447705351.84
6,2017,Comércio; reparação de veículos automotores e ...,149828983477.39
11,2017,"Atividades financeiras, de seguros e serviços ...",214288542552.93
16,2017,"Administração pública, defesa e seguridade social",89100173440.64
26,2018,Indústrias de transformação,309114796220.05
30,2018,Comércio; reparação de veículos automotores e ...,169332493986.66
35,2018,"Atividades financeiras, de seguros e serviços ...",220623497619.47
40,2018,"Administração pública, defesa e seguridade social",82204772992.09
50,2019,Indústrias de transformação,363417173704.15
54,2019,Comércio; reparação de veículos automotores e ...,211351189561.36


In [None]:
#Visualização gráfica dos setores com arrecadação acima de 50 bilhões - 2017 a 2021
px.bar(filtro_df_50bi, x='Ano', y='Total', color = 'Setor', barmode = 'group',
       color_discrete_sequence=px.colors.qualitative.Set3, template='plotly_white', width=1100,
       height=500)

In [None]:
#Filtrando o ano de 2017 por Setor
df_mask = df_agrupado_pelo_ano_e_setor['Ano']==2017
filtro_df_2017 = df_agrupado_pelo_ano_e_setor[df_mask]
#Ordenando o data frame filtrado, de forma decrescente por total
filtro_df_2017 = filtro_df_2017.sort_values(by=['Total'],ignore_index=True, ascending=False)
filtro_df_2017

Unnamed: 0,Ano,Setor,Total
0,2017,Indústrias de transformação,257447705351.84
1,2017,"Atividades financeiras, de seguros e serviços ...",214288542552.93
2,2017,Comércio; reparação de veículos automotores e ...,149828983477.39
3,2017,"Administração pública, defesa e seguridade social",89100173440.64
4,2017,Pessoa Física,41052130449.38
5,2017,Informação e comunicação,36015796434.33
6,2017,Atividades administrativas e serviços compleme...,33925378777.46
7,2017,"Transporte, armazenagem e correio",32782348558.72
8,2017,Eletricidade e gás,29380340517.03
9,2017,"Atividades profissionais, científicas e técnicas",26530751398.28


In [None]:
#Filtrando o ano de 2018 por Setor
df_mask = df_agrupado_pelo_ano_e_setor['Ano']==2018
filtro_df_2018 = df_agrupado_pelo_ano_e_setor[df_mask]
#Ordenando o data frame filtrado, de forma decrescente por total
filtro_df_2018 = filtro_df_2018.sort_values(by=['Total'],ignore_index=True, ascending=False)
filtro_df_2018

Unnamed: 0,Ano,Setor,Total
0,2018,Indústrias de transformação,309114796220.05
1,2018,"Atividades financeiras, de seguros e serviços ...",220623497619.47
2,2018,Comércio; reparação de veículos automotores e ...,169332493986.66
3,2018,"Administração pública, defesa e seguridade social",82204772992.09
4,2018,Construção,44608773529.17
5,2018,Informação e comunicação,43952565663.31
6,2018,Pessoa Física,42623969641.64
7,2018,"Transporte, armazenagem e correio",38999435556.77
8,2018,Atividades administrativas e serviços compleme...,38189233913.32
9,2018,Eletricidade e gás,36688849668.61


In [None]:
#Filtrando o ano de 2019 por Setor
df_mask = df_agrupado_pelo_ano_e_setor['Ano']==2019
filtro_df_2019 = df_agrupado_pelo_ano_e_setor[df_mask]
#Ordenando o data frame filtrado, de forma decrescente por total
filtro_df_2019 = filtro_df_2019.sort_values(by=['Total'],ignore_index=True, ascending=False)
filtro_df_2019

Unnamed: 0,Ano,Setor,Total
0,2019,Indústrias de transformação,363417173704.15
1,2019,"Atividades financeiras, de seguros e serviços ...",267197755187.77
2,2019,Comércio; reparação de veículos automotores e ...,211351189561.36
3,2019,"Administração pública, defesa e seguridade social",91219292074.79
4,2019,"Transporte, armazenagem e correio",50335671833.73
5,2019,Pessoa Física,47742118025.94
6,2019,Informação e comunicação,46939535508.03
7,2019,Atividades administrativas e serviços compleme...,46928069075.46
8,2019,Eletricidade e gás,43632042490.73
9,2019,"Atividades profissionais, científicas e técnicas",40797938332.03


In [None]:
#Filtrando o ano de 2020 por Setor
df_mask = df_agrupado_pelo_ano_e_setor['Ano']==2020
filtro_df_2020 = df_agrupado_pelo_ano_e_setor[df_mask]
#Ordenando o data frame filtrado, de forma decrescente por total
filtro_df_2020 = filtro_df_2020.sort_values(by=['Total'],ignore_index=True, ascending=False)
filtro_df_2020

Unnamed: 0,Ano,Setor,Total
0,2020,Indústrias de transformação,323908966173.85
1,2020,"Atividades financeiras, de seguros e serviços ...",245215944634.35
2,2020,Comércio; reparação de veículos automotores e ...,226717470204.04
3,2020,"Administração pública, defesa e seguridade social",96284659096.38
4,2020,Informação e comunicação,53189237390.04
5,2020,Pessoa Física,50300754573.59
6,2020,"Transporte, armazenagem e correio",49351539559.24
7,2020,Atividades administrativas e serviços compleme...,47847909905.57
8,2020,"Atividades profissionais, científicas e técnicas",45839803707.08
9,2020,Eletricidade e gás,37352636669.09


In [None]:
#Filtrando o ano de 2021 por Setor
df_mask = df_agrupado_pelo_ano_e_setor['Ano']==2021
filtro_df_2021 = df_agrupado_pelo_ano_e_setor[df_mask]
#Ordenando o data frame filtrado, de forma decrescente por total
filtro_df_2021 = filtro_df_2021.sort_values(by=['Total'],ignore_index=True, ascending=False)
filtro_df_2021

Unnamed: 0,Ano,Setor,Total
0,2021,Indústrias de transformação,456763243044.67
1,2021,"Atividades financeiras, de seguros e serviços ...",291777119949.31
2,2021,Comércio; reparação de veículos automotores e ...,284721414767.93
3,2021,"Administração pública, defesa e seguridade social",99411691643.79
4,2021,Indústrias extrativas,72578355353.01
5,2021,Pessoa Física,70523793742.07
6,2021,Informação e comunicação,68693365743.06
7,2021,"Transporte, armazenagem e correio",60361001175.13
8,2021,"Atividades profissionais, científicas e técnicas",59937211126.54
9,2021,Atividades administrativas e serviços compleme...,59704592440.52


In [None]:
#Gráfico de barras da arrecadação por setor - 2017 a 2021
fig1 = px.bar(filtro_df_2017, x='Ano', y='Total', color = 'Setor', barmode = 'group', orientation = 'v', width=1000, height=500)
fig1.show()
fig2 = px.bar(filtro_df_2018, x='Ano', y='Total', color = 'Setor', barmode = 'group', orientation = 'v', width=1000, height=500)
fig2.show()
fig3 = px.bar(filtro_df_2019, x='Ano', y='Total', color = 'Setor', barmode = 'group', orientation = 'v', width=1000, height=500)
fig3.show()
fig4 = px.bar(filtro_df_2020, x='Ano', y='Total', color = 'Setor', barmode = 'group', orientation = 'v', width=1000, height=500)
fig4.show()
fig5 = px.bar(filtro_df_2021, x='Ano', y='Total', color = 'Setor', barmode = 'group', orientation = 'v', width=1000, height=500)
fig5.show()

In [None]:
#Vendo os setores de maior arrecadação por percentual - 2017 a 2021 
fig1 = px.pie(filtro_df_2017, names='Setor', values = 'Total', width=900, height=500, title = 2017)
fig1.show()
fig2 = px.pie(filtro_df_2018, names='Setor', values = 'Total', width=1000, height=500, title = 2018) 
fig2.show()
fig3 = px.pie(filtro_df_2019, names='Setor', values = 'Total', width=1000, height=500, title = 2019) 
fig3.show()
fig4 = px.pie(filtro_df_2020, names='Setor', values = 'Total', width=1000, height=500, title = 2020) 
fig4.show()
fig5 = px.pie(filtro_df_2021, names='Setor', values = 'Total', width=1000, height=500, title = 2021) 
fig5.show()

In [None]:
#Melhorando a visualização com apenas os setores que tiveram mais de 10 bilhões de arrecadação - 2017 a 2021. 
#Os setores com arrecadação menor que 10 bi, foram renomeados para "Outros Serotres"
filtro_df_2017.loc[filtro_df_2017['Total'] <= 10000000000, 'Setor'] = 'Outros Setores'
fig1 = px.pie(filtro_df_2017, values='Total', names='Setor', title = 2017, width=900, height=500)
fig1.show()

filtro_df_2018.loc[filtro_df_2018['Total'] <= 10000000000, 'Setor'] = 'Outros Setores'
fig2 = px.pie(filtro_df_2018, values='Total', names='Setor', title = 2018, width=900, height=500)
fig2.show()

filtro_df_2019.loc[filtro_df_2019['Total'] <= 10000000000, 'Setor'] = 'Outros Setores'
fig3 = px.pie(filtro_df_2019, values='Total', names='Setor', title = 2019, width=900, height=500)
fig3.show()

filtro_df_2020.loc[filtro_df_2020['Total'] <= 10000000000, 'Setor'] = 'Outros Setores'
fig4 = px.pie(filtro_df_2020, values='Total', names='Setor', title = 2020, width=900, height=500)
fig4.show()

filtro_df_2021.loc[filtro_df_2021['Total'] <= 10000000000, 'Setor'] = 'Outros Setores'
fig5 = px.pie(filtro_df_2021, values='Total', names='Setor', title = 2021, width=900, height=500)
fig5.show()

# **Analisando o IRPF**

In [None]:
#Agrupando a arrecadação de 2017 a 2021 pelo IRPF (anos e meses). 
df_agrupado_pelo_ano_mes_e_IRPF = df4.groupby(['Ano', 'Mês'], sort=False).agg({'IRPF':np.sum}).reset_index()
df_agrupado_pelo_ano_mes_e_IRPF

Unnamed: 0,Ano,Mês,IRPF
0,2017,Jan,2581968859.02
1,2017,Fev,930170893.36
2,2017,Mar,1214993247.77
3,2017,Abr,8416190821.41
4,2017,Mai,3098466548.11
5,2017,Jun,2674194325.67
6,2017,Jul,2531125335.55
7,2017,Ago,2378440249.11
8,2017,Set,2431664604.01
9,2017,Out,2336872276.13


In [None]:
#Agrupando a arrecadação de 2017 a 2021 pelo IRPF (apenas anos). 
df_agrupado_pelo_ano_e_IRPF = df4.groupby(['Ano'], sort=False).agg({'IRPF':np.sum}).reset_index()
df_agrupado_pelo_ano_e_IRPF

Unnamed: 0,Ano,IRPF
0,2017,32042575258.32
1,2018,33856672837.03
2,2019,39010327862.93
3,2020,41220076353.07
4,2021,55980875027.09


In [None]:
#Visualizando arrecadação do IRPF de 2017 a 2021
px.bar(df_agrupado_pelo_ano_e_IRPF, x='Ano', y='IRPF', width=500, height=500,
       color_discrete_sequence=px.colors.qualitative.D3, template='plotly_white')

In [None]:
#Verificando o comportamento da arrecadação do IRPF
px.line(df_agrupado_pelo_ano_e_IRPF, x='Ano', y='IRPF', width=700, height=600, 
        color_discrete_sequence=px.colors.qualitative.D3, template='plotly_white')

In [None]:
#Vendo que nos anos de 2020 e 2021 o IRPF teve comportamento diferente
px.line(df_agrupado_pelo_ano_mes_e_IRPF, x='Mês', y='IRPF', color="Ano", width=1000, height=500,
         color_discrete_sequence=px.colors.qualitative.D3, template='plotly_white')

# **Manipulação e análise dos dados (continuação)**
 Foi realizada a inversão do data frame
  

In [None]:
#Inicialmente, agrupou-se a arrecadação de 2017 a 2021 apenas pelo ano e pela soma de cada tributo 
df_agrupado_pelo_ano_e_tributos = df4.groupby(['Ano'], sort=False).agg({'II':np.sum, 'IE':np.sum, 'IPI':np.sum,'IRPF':np.sum,'IRPJ':np.sum,'IRRF':np.sum,'IOF':np.sum,'ITR':np.sum,'Cofins':np.sum,'Pis/Pasep':np.sum,'CSLL':np.sum,'Cide':np.sum, 'Contribuição Previdenciária':np.sum, 'CPSSS':np.sum, 'Pagamento Unificado':np.sum, 'Outras Receitas Administradas':np.sum, 'Receitas Não Administradas':np.sum}).reset_index()
df_agrupado_pelo_ano_e_tributos

Unnamed: 0,Ano,II,IE,IPI,IRPF,IRPJ,IRRF,IOF,ITR,Cofins,Pis/Pasep,CSLL,Cide,Contribuição Previdenciária,CPSSS,Pagamento Unificado,Outras Receitas Administradas,Receitas Não Administradas
0,2017,32517611827.21,12911311.4,47637602541.73,32042575258.32,108391353040.78,207128022677.7,34523946030.54,1354621283.34,190332219859.12,52329635873.12,59117522051.01,8619436507.36,25228748097.33,33803628036.96,134622605495.86,16312716830.08,50280077132.71
1,2018,40686675830.25,8854913.2,53396370463.46,33856672837.03,128274908712.46,214861210932.71,36314587856.56,1509064056.41,211215425212.33,57726273258.36,67738726966.47,7552109708.89,79953370473.79,33620012145.95,139174995325.33,16455820036.12,71292432076.39
2,2019,43006889628.23,3040745.96,55168989911.51,39010327862.93,150397221928.61,228520674999.04,40859698906.95,1757823343.92,216864161063.64,60109900600.24,75857291629.84,6977178361.15,211719551013.03,33332286956.26,137668906809.02,19024496145.71,70851237169.91
3,2020,45913810219.68,1168501.84,56771081776.85,41220076353.07,158843890529.13,223028785887.24,21614549314.18,1887762832.58,192086802834.29,57519868583.19,77615588041.31,6594395396.6,218287924627.93,39673408972.51,136193062672.14,17436677105.34,61799905226.72
4,2021,62072081407.4,1836077.46,73806379095.19,55980875027.09,235232287072.8,256691943487.11,48625111971.11,2336866930.2,255356855367.38,72920233547.6,113809299621.12,8729713586.56,299075092648.24,40863657171.67,104985759566.73,20853506159.5,93668505804.3


In [None]:
#Inveretendo o data frame agrupado por ano e tributos
df_invertido_agrupado_pelo_ano_e_tributos = df_agrupado_pelo_ano_e_tributos.transpose().reset_index()
df_invertido_agrupado_pelo_ano_e_tributos

Unnamed: 0,index,0,1,2,3,4
0,Ano,2017.0,2018.0,2019.0,2020.0,2021.0
1,II,32517611827.21,40686675830.25,43006889628.23,45913810219.68,62072081407.4
2,IE,12911311.4,8854913.2,3040745.96,1168501.84,1836077.46
3,IPI,47637602541.73,53396370463.46,55168989911.51,56771081776.85,73806379095.19
4,IRPF,32042575258.32,33856672837.03,39010327862.93,41220076353.07,55980875027.09
5,IRPJ,108391353040.78,128274908712.46,150397221928.61,158843890529.13,235232287072.8
6,IRRF,207128022677.7,214861210932.71,228520674999.04,223028785887.24,256691943487.11
7,IOF,34523946030.54,36314587856.56,40859698906.95,21614549314.18,48625111971.11
8,ITR,1354621283.34,1509064056.41,1757823343.92,1887762832.58,2336866930.2
9,Cofins,190332219859.12,211215425212.33,216864161063.64,192086802834.29,255356855367.38


In [None]:
#Retirando a primeira linha do data frame acima
df2_invertido_agrupado_pelo_ano_e_tributos = df_invertido_agrupado_pelo_ano_e_tributos.drop(0)
df2_invertido_agrupado_pelo_ano_e_tributos

Unnamed: 0,index,0,1,2,3,4
1,II,32517611827.21,40686675830.25,43006889628.23,45913810219.68,62072081407.4
2,IE,12911311.4,8854913.2,3040745.96,1168501.84,1836077.46
3,IPI,47637602541.73,53396370463.46,55168989911.51,56771081776.85,73806379095.19
4,IRPF,32042575258.32,33856672837.03,39010327862.93,41220076353.07,55980875027.09
5,IRPJ,108391353040.78,128274908712.46,150397221928.61,158843890529.13,235232287072.8
6,IRRF,207128022677.7,214861210932.71,228520674999.04,223028785887.24,256691943487.11
7,IOF,34523946030.54,36314587856.56,40859698906.95,21614549314.18,48625111971.11
8,ITR,1354621283.34,1509064056.41,1757823343.92,1887762832.58,2336866930.2
9,Cofins,190332219859.12,211215425212.33,216864161063.64,192086802834.29,255356855367.38
10,Pis/Pasep,52329635873.12,57726273258.36,60109900600.24,57519868583.19,72920233547.6


In [None]:
#Alterando o nome das colunas
df2_invertido_agrupado_pelo_ano_e_tributos.rename(columns={'index': 'Tributo', 0: '2017', 1 : '2018', 2 : '2019', 3 : '2020', 4 : '2021'}, inplace = True)
df2_invertido_agrupado_pelo_ano_e_tributos

Unnamed: 0,Tributo,2017,2018,2019,2020,2021
1,II,32517611827.21,40686675830.25,43006889628.23,45913810219.68,62072081407.4
2,IE,12911311.4,8854913.2,3040745.96,1168501.84,1836077.46
3,IPI,47637602541.73,53396370463.46,55168989911.51,56771081776.85,73806379095.19
4,IRPF,32042575258.32,33856672837.03,39010327862.93,41220076353.07,55980875027.09
5,IRPJ,108391353040.78,128274908712.46,150397221928.61,158843890529.13,235232287072.8
6,IRRF,207128022677.7,214861210932.71,228520674999.04,223028785887.24,256691943487.11
7,IOF,34523946030.54,36314587856.56,40859698906.95,21614549314.18,48625111971.11
8,ITR,1354621283.34,1509064056.41,1757823343.92,1887762832.58,2336866930.2
9,Cofins,190332219859.12,211215425212.33,216864161063.64,192086802834.29,255356855367.38
10,Pis/Pasep,52329635873.12,57726273258.36,60109900600.24,57519868583.19,72920233547.6


In [None]:
#Filtrando cada ano e ordenando de forma decrescente (do tributo de maior arrecadação para o de menor)
#2017
df2_invertido_agrupado_pelo_ano_e_tributos[['Tributo','2017']].sort_values(by=['2017'], ascending=False)


Unnamed: 0,Tributo,2017
6,IRRF,207128022677.7
9,Cofins,190332219859.12
15,Pagamento Unificado,134622605495.86
5,IRPJ,108391353040.78
11,CSLL,59117522051.01
10,Pis/Pasep,52329635873.12
17,Receitas Não Administradas,50280077132.71
3,IPI,47637602541.73
7,IOF,34523946030.54
14,CPSSS,33803628036.96


In [None]:
#2018
df2_invertido_agrupado_pelo_ano_e_tributos[['Tributo','2018']].sort_values(by=['2018'],ascending=False)

Unnamed: 0,Tributo,2018
6,IRRF,214861210932.71
9,Cofins,211215425212.33
15,Pagamento Unificado,139174995325.33
5,IRPJ,128274908712.46
13,Contribuição Previdenciária,79953370473.79
17,Receitas Não Administradas,71292432076.39
11,CSLL,67738726966.47
10,Pis/Pasep,57726273258.36
3,IPI,53396370463.46
1,II,40686675830.25


In [None]:
#2019
df2_invertido_agrupado_pelo_ano_e_tributos[['Tributo','2019']].sort_values(by=['2019'], ascending=False)

Unnamed: 0,Tributo,2019
6,IRRF,228520674999.04
9,Cofins,216864161063.64
13,Contribuição Previdenciária,211719551013.03
5,IRPJ,150397221928.61
15,Pagamento Unificado,137668906809.02
11,CSLL,75857291629.84
17,Receitas Não Administradas,70851237169.91
10,Pis/Pasep,60109900600.24
3,IPI,55168989911.51
1,II,43006889628.23


In [None]:
#2020
df2_invertido_agrupado_pelo_ano_e_tributos[['Tributo','2020']].sort_values(by=['2020'], ascending=False)

Unnamed: 0,Tributo,2020
6,IRRF,223028785887.24
13,Contribuição Previdenciária,218287924627.93
9,Cofins,192086802834.29
5,IRPJ,158843890529.13
15,Pagamento Unificado,136193062672.14
11,CSLL,77615588041.31
17,Receitas Não Administradas,61799905226.72
10,Pis/Pasep,57519868583.19
3,IPI,56771081776.85
1,II,45913810219.68


In [None]:
#2021
df2_invertido_agrupado_pelo_ano_e_tributos[['Tributo','2021']].sort_values(by=['2021'], ascending=False)

Unnamed: 0,Tributo,2021
13,Contribuição Previdenciária,299075092648.24
6,IRRF,256691943487.11
9,Cofins,255356855367.38
5,IRPJ,235232287072.8
11,CSLL,113809299621.12
15,Pagamento Unificado,104985759566.73
17,Receitas Não Administradas,93668505804.3
3,IPI,73806379095.19
10,Pis/Pasep,72920233547.6
1,II,62072081407.4


In [None]:
#Vendo no gráfico o valor da arrecadação por tributo em cada ano do período.
fig1 = px.bar(df2_invertido_agrupado_pelo_ano_e_tributos[['Tributo','2017']].sort_values(by=['2017'],ascending=True), x='2017', y= 'Tributo', width=550, height=450, color_discrete_sequence=px.colors.qualitative.D3, template='plotly_white') 
fig1.show()

fig2 = px.bar(df2_invertido_agrupado_pelo_ano_e_tributos[['Tributo','2018']].sort_values(by=['2018'],ascending=True), x='2018', y= 'Tributo', width=550, height=450, color_discrete_sequence=px.colors.qualitative.D3, template='plotly_white') 
fig2.show()

fig3 = px.bar(df2_invertido_agrupado_pelo_ano_e_tributos[['Tributo','2019']].sort_values(by=['2019'],ascending=True), x='2019', y= 'Tributo', width=550, height=450, color_discrete_sequence=px.colors.qualitative.D3, template='plotly_white') 
fig3.show()

fig4 = px.bar(df2_invertido_agrupado_pelo_ano_e_tributos[['Tributo','2020']].sort_values(by=['2020'],ascending=True), x='2020', y= 'Tributo', width=550, height=450, color_discrete_sequence=px.colors.qualitative.D3, template='plotly_white') 
fig4.show()

fig5 = px.bar(df2_invertido_agrupado_pelo_ano_e_tributos[['Tributo','2021']].sort_values(by=['2021'],ascending=True), x='2021', y= 'Tributo', width=550, height=450, color_discrete_sequence=px.colors.qualitative.D3, template='plotly_white') 
fig5.show()

In [None]:
#Mostrando arrecadação do período - Percentual por tributo.
fig1 = px.pie(df2_invertido_agrupado_pelo_ano_e_tributos, names= 'Tributo', values ='2017', width=850, height=520, title = 2017)
fig1.update_traces(textposition='inside', textinfo='percent+label') 
fig1.show()

fig2 = px.pie(df2_invertido_agrupado_pelo_ano_e_tributos, names= 'Tributo', values ='2018', width=850, height=520, title = 2018)
fig2.update_traces(textposition='inside', textinfo='percent+label') 
fig2.show()

fig3 = px.pie(df2_invertido_agrupado_pelo_ano_e_tributos, names= 'Tributo', values ='2019', width=850, height=520, title = 2019)
fig3.update_traces(textposition='inside', textinfo='percent+label') 
fig3.show()

fig4 = px.pie(df2_invertido_agrupado_pelo_ano_e_tributos, names= 'Tributo', values ='2020', width=850, height=520, title = 2020)
fig4.update_traces(textposition='inside', textinfo='percent+label') 
fig4.show()

fig5 = px.pie(df2_invertido_agrupado_pelo_ano_e_tributos, names= 'Tributo', values ='2021', width=850, height=520, title = 2021)
fig5.update_traces(textposition='inside', textinfo='percent+label') 
fig5.show()