<img src="bolsafamilia.jpg" width="800"/>

<h1>Pagamentos do programa Bolsa Família  Janeiro de 2020</h1><br>
Está apresentação foi criada por <b>Fabricio Almeida da Silva</b>. Farei algumas análises sobre os dados encontrados neste <a href="http://www.dados.gov.br/dataset/bolsa-familia-pagamentos/resource/6337fab7-c6c8-4ad5-8519-838ae9ad9933">DataSet</a> do programa Bolsa Família relativo ao mês de Janeiro de 2020.

#### O que queremos desse DataSet?
1 - Número de beneficiários Bolsa Família por estado
<br> 2 - Valor total de beneficios(em dinheiro) por estado
<br> 3 - As 10 cidades com o maior número de beneficiários
<br> 4 - As 10 cidades com o maior valor total de beneficios(em dinheiro)
<br> 5 - Valor total pago aos beneficiarios no mês de janeiro de 2020

In [104]:
#Importando as bilbliotecas necessárias
import pandas as pd
import plotly
import plotly.graph_objs as go
import plotly.offline as py
plotly.offline.init_notebook_mode(connected=True)
import locale
locale.setlocale(locale.LC_ALL, "Portuguese_Brazil.1252")

'Portuguese_Brazil.1252'

In [105]:
#Importando o DataSet Bolsa Família relativo a Janeiro de 2020
df = pd.read_csv('202001_BolsaFamilia_Pagamentos.csv', sep= ';', encoding='ISO-8859-1')
df.head()

Unnamed: 0,MÊS REFERÊNCIA,MÊS COMPETÊNCIA,UF,CÓDIGO MUNICÍPIO SIAFI,NOME MUNICÍPIO,NIS FAVORECIDO,NOME FAVORECIDO,VALOR PARCELA
0,202001,201901,MG,4123,BELO HORIZONTE,12581466091,ADRIANA RANGEL SANSAO,25300
1,202001,201901,MG,4123,BELO HORIZONTE,16057458312,ALEXSANDRA PEREIRA MUTZ,25300
2,202001,201901,MG,4123,BELO HORIZONTE,16127018278,ELIANA CRISTINA ROCHA SILVA,21200
3,202001,201901,MG,4123,BELO HORIZONTE,12135368026,ELIANE PEREIRA,21200
4,202001,201901,MG,4123,BELO HORIZONTE,16271288457,IOLANDA DE ASSIS SILVA CESARINO,29400


In [106]:
#Tamanho do dataframe
df.shape

(13301798, 8)

In [107]:
#Tipos de dados das colunas no dataframe
df.dtypes

MÊS REFERÊNCIA             int64
MÊS COMPETÊNCIA            int64
UF                        object
CÓDIGO MUNICÍPIO SIAFI     int64
NOME MUNICÍPIO            object
NIS FAVORECIDO             int64
NOME FAVORECIDO           object
VALOR PARCELA             object
dtype: object

In [108]:
#Excluindo as colunas que não iremos precisar
df.drop('MÊS REFERÊNCIA', inplace=True, axis=1)
df.drop('MÊS COMPETÊNCIA', inplace=True, axis=1)
df.drop('CÓDIGO MUNICÍPIO SIAFI', inplace=True, axis=1)
df.drop('NIS FAVORECIDO', inplace=True, axis=1)
df.head()

Unnamed: 0,UF,NOME MUNICÍPIO,NOME FAVORECIDO,VALOR PARCELA
0,MG,BELO HORIZONTE,ADRIANA RANGEL SANSAO,25300
1,MG,BELO HORIZONTE,ALEXSANDRA PEREIRA MUTZ,25300
2,MG,BELO HORIZONTE,ELIANA CRISTINA ROCHA SILVA,21200
3,MG,BELO HORIZONTE,ELIANE PEREIRA,21200
4,MG,BELO HORIZONTE,IOLANDA DE ASSIS SILVA CESARINO,29400


In [109]:
#Renomeando as colunas
df = df.rename(columns={'VALOR PARCELA': 'valor'})
df = df.rename(columns={'NOME MUNICÍPIO': 'municipio'})
df = df.rename(columns={'UF': 'uf'})
df = df.rename(columns={'NOME FAVORECIDO': 'favorecido'})
df.head()

Unnamed: 0,uf,municipio,favorecido,valor
0,MG,BELO HORIZONTE,ADRIANA RANGEL SANSAO,25300
1,MG,BELO HORIZONTE,ALEXSANDRA PEREIRA MUTZ,25300
2,MG,BELO HORIZONTE,ELIANA CRISTINA ROCHA SILVA,21200
3,MG,BELO HORIZONTE,ELIANE PEREIRA,21200
4,MG,BELO HORIZONTE,IOLANDA DE ASSIS SILVA CESARINO,29400


In [110]:
#Convertendo a coluna valor de object para float
df['valor'] = df['valor'].str.replace('.', '').str.replace(',', '.').astype("float")

### 1 - Número de beneficiários Bolsa Família por estado

In [111]:
#Criando a variavel estados_beneficiarios que recebe a contagem dos beneficiarios por estado
estados_beneficiarios = df.uf.value_counts()
estados_beneficiarios.head(27)

BA    1756158
SP    1406214
PE    1129471
CE    1018022
MG     988240
MA     932253
PA     928797
RJ     827020
PB     503919
PI     438913
AM     389239
AL     389138
PR     345636
RN     340825
RS     336812
GO     286249
SE     280256
ES     170655
MT     146210
MS     115804
SC     112366
TO     110322
AC      87094
RO      75572
AP      75329
DF      66688
RR      44596
Name: uf, dtype: int64

In [112]:
#Plotando gráfico
data_estados_beneficiarios = [go.Bar(x=estados_beneficiarios.index,
        y=estados_beneficiarios.values,
        marker = {'color':'lightblue'})]


layout_estados_beneficiarios = go.Layout(title='Número de beneficiários Bolsa Família por estado',
                   yaxis={'title':'Beneficiários(em milhões)'},
                   xaxis={'title':'Estados'})

fig = go.Figure(data=data_estados_beneficiarios, layout=layout_estados_beneficiarios)
py.iplot(fig)

### 2 - Valor total de beneficios(em dinheiro) por estado

In [113]:
#Criando a variavel estados_valor que recebe a soma dos valores ordenados por estado
estados_valor = df.groupby(by='uf').valor.sum()

In [114]:
#Classificando os valores em ordem decrescente
estados_valor = estados_valor.sort_values(ascending=False)
estados_valor.head(27)

uf
BA    331509144.0
SP    243031821.0
PE    209482184.0
MA    201008543.0
CE    193928986.0
PA    187357920.0
MG    180549476.0
RJ    154423484.0
PB    102480740.0
PI     93077045.0
AM     89997046.0
AL     75871404.0
RN     64485783.0
RS     58169198.0
PR     56773228.0
SE     48053315.0
GO     45408714.0
ES     30045406.0
MT     24875571.0
AC     23751168.0
MS     21082352.0
TO     21036677.0
SC     19692859.0
AP     17126057.0
DF     12109549.0
RO     11459692.0
RR      9783196.0
Name: valor, dtype: float64

In [115]:
#Plotando o gráfico
data_estados_valor = [go.Bar(x=estados_valor.index,
        y=estados_valor.values,
        marker = {'color':'lightblue'})]


layout_estados_valor = go.Layout(title='Valor total de beneficios por estado',
                   yaxis={'title':'Valores(em milhões)'},
                   xaxis={'title':'Estados'})

fig = go.Figure(data=data_estados_valor, layout=layout_estados_valor)
py.iplot(fig)

### 3 - As 10 cidades com o maior número de beneficiários

In [116]:
#Criando a variavel municipio_beneficiarios que recebe a contagem dos valores por municipio
municipio_beneficiarios = df.municipio.value_counts().head(10)
municipio_beneficiarios.head(10)

SAO PAULO         401880
RIO DE JANEIRO    231050
FORTALEZA         199669
SALVADOR          154209
BELEM             119578
MANAUS            116723
RECIFE             86771
SAO LUIS           72626
NOVA IGUACU        66908
BRASILIA           66688
Name: municipio, dtype: int64

In [117]:
#Plotando o gráfico
data_municipio_beneficiarios = [go.Bar(x=municipio_beneficiarios.index,
        y=municipio_beneficiarios.values,
        marker = {'color':'lightgreen'})]


layout_municipio_beneficiarios = go.Layout(title='Top 10 - Número de beneficiários Bolsa Família por Município',
                   yaxis={'title':'Beneficiários(mil)'},
                   xaxis={'title':'Município'})

fig = go.Figure(data=data_municipio_beneficiarios, layout=layout_municipio_beneficiarios)
py.iplot(fig)

### 4 - As 10 cidades com o maior valor total de beneficios(em dinheiro)

In [118]:
#Criando a variavel municipio_valor que recebe a soma dos valores ordenados por municipio
municipio_valor = df.groupby(by='municipio').valor.sum()

In [119]:
#Classificando os valores em ordem decrescente
municipio_valor = municipio_valor.sort_values(ascending=False).head(10)
municipio_valor.head(10)

municipio
SAO PAULO         64306351.0
RIO DE JANEIRO    40415653.0
FORTALEZA         36565617.0
SALVADOR          23812838.0
MANAUS            18725068.0
BELEM             18630913.0
NOVA IGUACU       13766088.0
BRASILIA          12109549.0
SAO LUIS          11731408.0
RECIFE            11579990.0
Name: valor, dtype: float64

In [120]:
#Plotando o gráfico
data_municipio_valor = [go.Bar(x=municipio_valor.index,
        y=municipio_valor.values,
        marker = {'color':'lightgreen'})]


layout_municipio_valor = go.Layout(title='Top 10 - Valor total de beneficios por Município',
                   yaxis={'title':'Valores(em milhões)'},
                   xaxis={'title':'Município'})

fig = go.Figure(data=data_municipio_valor, layout=layout_municipio_valor)
py.iplot(fig)

### 5 - Valor total pago aos beneficiarios no mês de janeiro de 2020

In [121]:
#Realizando a soma beneficios pagos e adicionando a variavel total_valor_beneficios
total_valor_beneficios = df['valor'].sum()

#Convertendo o resultado para apresentar o valor em Real(R$)
total_valor_beneficios = locale.currency(total_valor_beneficios, grouping=True)

#Imprimindo na tela o valor total
print(total_valor_beneficios)


R$ 2.526.570.558,00
