In [5]:
import json
import glob
import os.path
import pandas as pd

resultado = []
for path in glob.glob("../data/diarios/*-atos.json"):
    data = os.path.basename(path).split("-atos")[0]
    with open(path) as json_file:
        diarios = json.load(json_file)        
        
        # remove conteúdo desnecessário para a análise.
        # transforma json strings em dicts python para facilitar manipulação.
        # cria estrutura própria para manipulação dos dados.
        for diario in diarios:
            diario = json.loads(diario)
            del diario["cabecalho"]
            for ato in diario["atos"]:
                ato = json.loads(ato) 
                del ato["texto"]
                ato["municipio"] = diario["id"]
                data_quebrada = diario["data_publicacao"].split("-")
                ato["ano"] = int(data_quebrada[0])
                ato["mes"] = int(data_quebrada[1])
                ato["dia"] = int(data_quebrada[2])
                ato["num_nomeacoes"] = len(ato["cpf_nomeacoes"])
                del ato["cpf_nomeacoes"]
                ato["num_exoneracoes"] = len(ato["cpf_exoneracoes"])
                del ato["cpf_exoneracoes"]
                resultado.append(ato)

df = pd.DataFrame.from_records(resultado)
print(df.shape)
print(df.head())

(12743, 9)
        cod  possui_nomeacoes  possui_exoneracoes  municipio   ano  mes  dia  \
0  7FAF9A43             False               False  arapiraca  2022    2   25   
1  799E1734             False               False  arapiraca  2022    2   25   
2  AE23279C             False               False  arapiraca  2022    2   25   
3  A3E1293A             False               False  arapiraca  2022    2   25   
4  1E3A9996             False               False  arapiraca  2022    2   25   

   num_nomeacoes  num_exoneracoes  
0              0                0  
1              0                0  
2              0                0  
3              0                0  
4              0                0  


In [13]:
print("\n## Total de nomeações: " + df["num_nomeacoes"].sum().astype(str))

print("\n## Nomeações por mês\n")
print(df.groupby(["ano", "mes"])["num_nomeacoes"].sum().sort_values(ascending=False).head(10))

print("\n## Top 10 Municípios com maior número de nomeações\n")
print(df.groupby(["municipio"])["num_nomeacoes"].sum().sort_values(ascending=False).head(10))


## Total de nomeações: 1350

## Nomeações por mês

ano   mes
2022  3      593
      4      293
      2      215
      5      141
      1      108
Name: num_nomeacoes, dtype: int64

## Top 15 Municípios com maior número de nomeações

municipio
delmiro-gouveia         241
mata-grande             219
rio-largo               120
teotonio-vilela          93
sao-jose-da-tapera       78
pariconha                57
poco-das-trincheiras     57
arapiraca                54
marechal-deodoro         53
pao-de-acucar            50
Name: num_nomeacoes, dtype: int64


In [14]:
print("\n## Total de exonerações: " + df["num_exoneracoes"].sum().astype(str))

print("\n## Exonerações por mês\n")
print(df.groupby(["ano", "mes"])["num_exoneracoes"].sum().sort_values(ascending=False).head(10))

print("\n## Top 10 Municípios com maior número de exonerações\n")
print(df.groupby(["municipio"])["num_exoneracoes"].sum().sort_values(ascending=False).head(10))


## Total de exonerações: 200

## Exonerações por mês

ano   mes
2022  2      61
      4      44
      5      42
      3      39
      1      14
Name: num_exoneracoes, dtype: int64

## Top 15 Municípios com maior número de exonerações

municipio
delmiro-gouveia         38
minador-do-negrao       33
maragogi                21
inhapi                  15
rio-largo               13
poco-das-trincheiras    12
marechal-deodoro         9
sao-jose-da-tapera       9
atalaia                  6
piranhas                 6
junqueiro                5
ouro-branco              5
pilar                    5
pao-de-acucar            4
cacimbinhas              3
Name: num_exoneracoes, dtype: int64
