In [4]:
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns; sns.set(style='whitegrid')

# Movimentações Processuais
O arquivo sgt_movimentos.csv contém uma estrutura simplificada da tabela de movimentos processuais disponível no SGT em:
https://www.cnj.jus.br/sgt/consulta_publica_movimentos.php.
Atributos:
- **codigo**: código identificador único da Movimentação Processual.
- **descricao**: descrição da Movimentação Processual;
- **cod_pai**: código identificador da Movimentação Processual pai;
- **cod_filhos**: lista com os códigos dos movimentos processuais filhos daquele movimento;

In [5]:
sgt_movimentos = pd.read_csv('../data/sgt_movimentos.csv', sep=';')
sgt_movimentos['codigo'] = sgt_movimentos['codigo'].astype(float)
sgt_movimentos.set_index('codigo', inplace=True)
sgt_movimentos.head()

Unnamed: 0_level_0,descricao,cod_pai,cod_filhos
codigo,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1
1.0,Magistrado,,"3,193,11009,7,11,25,56,63,83,108,113,117,122,1..."
3.0,Decisão,1.0,"7,11,25,56,63,83,108,113,117,122,133,138,146,1..."
7.0,Conversão,3.0,2668211214012473
11.0,Declaração,3.0,26994110031215012151
14.0,Serventuário,,"15,18,48,104,865,12522,16,979,980,478,479,480,..."


# Dados Justiça Eleitoral, Classe Execução Fiscal (número 1116)

## dados básicos

In [6]:
df_base = pd.read_csv('../data/processed/samples/justica_estadual/dados_basicos.csv', index_col=0)
df_base['dadosBasicos.dataAjuizamento'] = pd.to_datetime(df_base['dadosBasicos.dataAjuizamento'],
                                                         format='%Y%m%d%H%M%S', errors='coerce')
print(df_base.shape)
df_base.head()

(46998, 17)


  interactivity=interactivity, compiler=compiler, result=result)


Unnamed: 0_level_0,millisInsercao,siglaTribunal,grau,dadosBasicos.valorCausa,dadosBasicos.procEl,dadosBasicos.competencia,dadosBasicos.codigoLocalidade,dadosBasicos.dscSistema,dadosBasicos.tamanhoProcesso,dadosBasicos.dataAjuizamento,dadosBasicos.totalAssuntos,dadosBasicos.nivelSigilo,dadosBasicos.classeProcessual,dadosBasicos.orgaoJulgador.nomeOrgao,dadosBasicos.orgaoJulgador.codigoMunicipioIBGE,dadosBasicos.orgaoJulgador.codigoOrgao,dadosBasicos.orgaoJulgador.instancia
dadosBasicos.numero,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1,Unnamed: 7_level_1,Unnamed: 8_level_1,Unnamed: 9_level_1,Unnamed: 10_level_1,Unnamed: 11_level_1,Unnamed: 12_level_1,Unnamed: 13_level_1,Unnamed: 14_level_1,Unnamed: 15_level_1,Unnamed: 16_level_1,Unnamed: 17_level_1
50006423320208130620,1596842405951,TJMG,G1,2157.81,1.0,8.0,620,8.0,0.0,2020-03-18 06:06:29,1.0,0,1116,"2ª Vara Cível, Criminal e da Infância e da Juv...",3162005,5843,ORIG
50006431820208130620,1596839821655,TJMG,G1,751.18,1.0,8.0,620,8.0,0.0,2020-03-18 06:11:46,1.0,0,1116,"2ª Vara Cível, Criminal e da Infância e da Juv...",3162005,5843,ORIG
50006440320208130620,1596840618466,TJMG,G1,719.03,1.0,8.0,620,8.0,0.0,2020-03-18 06:16:33,1.0,0,1116,"1ª Vara Cível, Criminal e de Execuções Penais ...",3162005,5836,ORIG
50006458520208130620,1596839978166,TJMG,G1,1321.8,1.0,8.0,620,8.0,0.0,2020-03-18 06:21:42,1.0,0,1116,"2ª Vara Cível, Criminal e da Infância e da Juv...",3162005,5843,ORIG
50006467020208130620,1596839983462,TJMG,G1,1071.21,1.0,8.0,620,8.0,0.0,2020-03-18 06:32:59,1.0,0,1116,"1ª Vara Cível, Criminal e de Execuções Penais ...",3162005,5836,ORIG


## movimentos

In [7]:
df_moves = pd.read_csv('../data/processed/samples/justica_estadual/movimentos.csv', index_col=0)
df_moves['dataHora'] = pd.to_datetime(df_moves['dataHora'], format='%Y%m%d%H%M%S')
print(df_moves.shape)
df_moves.head()

  interactivity=interactivity, compiler=compiler, result=result)


(1720223, 18)


Unnamed: 0_level_0,identificadorMovimento,tipoResponsavelMovimento,complementoNacional,idDocumentoVinculado,movimentoLocal,nivelSigilo,dataHora,tipoDecisao,movimentoNacional.codigoNacional,orgaoJulgador.nomeOrgao,orgaoJulgador.codigoMunicipioIBGE,orgaoJulgador.codigoOrgao,orgaoJulgador.instancia,movimentoNacional,orgaoJulgador,movimentoLocal.movimentoLocalPai,movimentoLocal.codigoMovimento,movimentoLocal.codigoPaiNacional
dadosBasicos.numero,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1,Unnamed: 7_level_1,Unnamed: 8_level_1,Unnamed: 9_level_1,Unnamed: 10_level_1,Unnamed: 11_level_1,Unnamed: 12_level_1,Unnamed: 13_level_1,Unnamed: 14_level_1,Unnamed: 15_level_1,Unnamed: 16_level_1,Unnamed: 17_level_1,Unnamed: 18_level_1
50006423320208130620,1,0.0,[{'descricaoComplemento': 'tipo_de_distribuica...,[],,0.0,2020-03-18 06:06:30,,26.0,"2ª Vara Cível, Criminal e da Infância e da Juv...",3162005.0,5843.0,ORIG,,,,,
50006423320208130620,2,0.0,"[{'descricaoComplemento': 'tipo_de_documento',...",[],,0.0,2020-03-19 14:54:37,,60.0,"2ª Vara Cível, Criminal e da Infância e da Juv...",3162005.0,5843.0,ORIG,,,,,
50006423320208130620,3,0.0,"[{'descricaoComplemento': 'tipo_de_conclusao',...",[],,0.0,2020-03-19 14:55:01,,51.0,"2ª Vara Cível, Criminal e da Infância e da Juv...",3162005.0,5843.0,ORIG,,,,,
50006423320208130620,4,1.0,[],[],,0.0,2020-03-24 14:17:33,,11010.0,"2ª Vara Cível, Criminal e da Infância e da Juv...",3162005.0,5843.0,ORIG,,,,,
50006423320208130620,5,0.0,"[{'descricaoComplemento': 'tipo_de_documento',...",[],,0.0,2020-06-10 11:09:43,,60.0,"2ª Vara Cível, Criminal e da Infância e da Juv...",3162005.0,5843.0,ORIG,,,,,


## assuntos

In [8]:
df_assuntos = pd.read_csv('../data/processed/samples/justica_estadual/assuntos.csv', index_col=0)
print(df_assuntos.shape)
df_assuntos.head()

(77517, 9)


  interactivity=interactivity, compiler=compiler, result=result)


Unnamed: 0_level_0,principal,assuntoLocal,codigoNacional,assuntoLocal.codigoAssunto,assuntoLocal.codigoPaiNacional,assuntoLocal.descricao,codigoAssunto,codigoPaiNacional,descricao
dadosBasicos.numero,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1,Unnamed: 7_level_1,Unnamed: 8_level_1,Unnamed: 9_level_1
50006423320208130620,True,,5952.0,,,,,,
50006423320208130620,True,,5952.0,,,,,,
50006431820208130620,True,,5952.0,,,,,,
50006431820208130620,True,,5952.0,,,,,,
50006440320208130620,True,,5952.0,,,,,,


# Criando pares de transições entre movimentos dos processos

## Duração dos movimentos de cada processo

In [9]:
%%time
# Duração dos movimentos de cada processo
df_moves.sort_values(['dadosBasicos.numero', 'dataHora'], inplace=True)
df_moves['duracao_movimento'] = df_moves.groupby(['dadosBasicos.numero'])['dataHora'].apply(lambda x: x - x.shift())
df_moves['duracao_movimento'].describe()

CPU times: user 25.9 s, sys: 136 ms, total: 26 s
Wall time: 25.8 s


count                     1675280
mean      43 days 21:45:50.663690
std      176 days 18:42:19.255856
min               0 days 00:00:00
25%               0 days 01:02:00
50%        6 days 01:05:29.500000
75%       27 days 22:15:35.500000
max           13867 days 00:00:00
Name: duracao_movimento, dtype: object

## Transição do movimento (para agrupar)

In [10]:
%%time
# Ordena tabela e une nome dos nós
df_moves.sort_values(['dadosBasicos.numero', 'dataHora'], inplace=True)
df_moves['transicao_movimento'] = df_moves.groupby(['dadosBasicos.numero'])['movimentoNacional.codigoNacional'].apply(lambda x: x.shift().astype(str) + ' -> ' + x.astype(str))

CPU times: user 35.9 s, sys: 171 ms, total: 36.1 s
Wall time: 36 s


In [11]:
# Adiona campo de sigla do tribunal para table de dados básicos
df_moves = df_moves.merge(df_base['siglaTribunal'], left_index=True, right_index=True)
df_moves.head()

Unnamed: 0_level_0,identificadorMovimento,tipoResponsavelMovimento,complementoNacional,idDocumentoVinculado,movimentoLocal,nivelSigilo,dataHora,tipoDecisao,movimentoNacional.codigoNacional,orgaoJulgador.nomeOrgao,...,orgaoJulgador.codigoOrgao,orgaoJulgador.instancia,movimentoNacional,orgaoJulgador,movimentoLocal.movimentoLocalPai,movimentoLocal.codigoMovimento,movimentoLocal.codigoPaiNacional,duracao_movimento,transicao_movimento,siglaTribunal
dadosBasicos.numero,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1,Unnamed: 7_level_1,Unnamed: 8_level_1,Unnamed: 9_level_1,Unnamed: 10_level_1,Unnamed: 11_level_1,Unnamed: 12_level_1,Unnamed: 13_level_1,Unnamed: 14_level_1,Unnamed: 15_level_1,Unnamed: 16_level_1,Unnamed: 17_level_1,Unnamed: 18_level_1,Unnamed: 19_level_1,Unnamed: 20_level_1,Unnamed: 21_level_1
34619888190009,1988.009.000003-8_1_1,,,,,,2003-11-07,,51.0,,...,,,,,,,,NaT,nan -> 51.0,TJRJ
34619888190009,1988.009.000003-8_2_2,,,,,,2003-12-10,,123.0,,...,,,,,,,,33 days,51.0 -> 123.0,TJRJ
34619888190009,1988.009.000003-8_7_3,,,,,,2004-07-09,,861.0,,...,,,,,,,,212 days,123.0 -> 861.0,TJRJ
34619888190009,1988.009.000003-8_1_5,,,,,,2005-03-03,,51.0,,...,,,,,,,,237 days,861.0 -> 51.0,TJRJ
34619888190009,1988.009.000003-8_8_4,,,,,,2005-03-03,,893.0,,...,,,,,,,,0 days,51.0 -> 893.0,TJRJ


### Cria pares

In [12]:
# siglaTribunal,codigoOrgao,C1,C2,C1-descricao,C2-descricao,quant,tempo-min,tempo-max,mediana
df_moves['duracao_movimento_dias'] = df_moves['duracao_movimento'].dt.days
df_pares = df_moves.groupby(
    ['transicao_movimento', 'siglaTribunal', 'orgaoJulgador.codigoOrgao']
)['duracao_movimento_dias'].agg(
    ['count', 'min', 'max', 'median']
)
df_pares.reset_index(inplace=True)
df_pares[['C1', 'C2']] = df_pares['transicao_movimento'].str.split(' -> ', expand=True)
df_pares['C1-descricao'] = df_pares['C1'].astype(float).map(sgt_movimentos['descricao'])
df_pares['C2-descricao'] = df_pares['C2'].astype(float).map(sgt_movimentos['descricao'])
df_pares.head()

Unnamed: 0,transicao_movimento,siglaTribunal,orgaoJulgador.codigoOrgao,count,min,max,median,C1,C2,C1-descricao,C2-descricao
0,1051.0 -> 1051.0,TJMG,3668.0,1,0.0,0.0,0.0,1051.0,1051.0,Decurso de Prazo,Decurso de Prazo
1,1051.0 -> 1051.0,TJMG,3786.0,1,209.0,209.0,209.0,1051.0,1051.0,Decurso de Prazo,Decurso de Prazo
2,1051.0 -> 1051.0,TJMG,3840.0,1,0.0,0.0,0.0,1051.0,1051.0,Decurso de Prazo,Decurso de Prazo
3,1051.0 -> 1051.0,TJMG,3867.0,1,15.0,15.0,15.0,1051.0,1051.0,Decurso de Prazo,Decurso de Prazo
4,1051.0 -> 1051.0,TJMG,3949.0,4,31.0,51.0,34.0,1051.0,1051.0,Decurso de Prazo,Decurso de Prazo


In [26]:
nome_orgaos = df_moves.set_index('orgaoJulgador.codigoOrgao')['orgaoJulgador.nomeOrgao'].dropna().drop_duplicates()
nome_orgaos.head()

orgaoJulgador.codigoOrgao
3948.0    Vara Única da comarca de Mar de Espanha
3688.0     Vara Única da comarca de Campina Verde
3993.0           Vara Única da comarca de Extrema
5317.0      Vara Única da comarca de Itamarandiba
3772.0    Vara Única da comarca de Estrela do Sul
Name: orgaoJulgador.nomeOrgao, dtype: object

In [27]:
df_pares['nomeOrgao'] = df_pares['orgaoJulgador.codigoOrgao'].astype(float).map(nome_orgaos)
df_pares.head()

Unnamed: 0,transicao_movimento,siglaTribunal,orgaoJulgador.codigoOrgao,count,min,max,median,C1,C2,C1-descricao,C2-descricao,nomeOrgao
0,1051.0 -> 1051.0,TJMG,3668.0,1,0.0,0.0,0.0,1051.0,1051.0,Decurso de Prazo,Decurso de Prazo,Vara Única da comarca de Arinos
1,1051.0 -> 1051.0,TJMG,3786.0,1,209.0,209.0,209.0,1051.0,1051.0,Decurso de Prazo,Decurso de Prazo,Vara Única da comarca de Barroso
2,1051.0 -> 1051.0,TJMG,3840.0,1,0.0,0.0,0.0,1051.0,1051.0,Decurso de Prazo,Decurso de Prazo,Vara Única da comarca de Espera Feliz
3,1051.0 -> 1051.0,TJMG,3867.0,1,15.0,15.0,15.0,1051.0,1051.0,Decurso de Prazo,Decurso de Prazo,"1ª Vara Cível, Criminal e de Execuções Crimina..."
4,1051.0 -> 1051.0,TJMG,3949.0,4,31.0,51.0,34.0,1051.0,1051.0,Decurso de Prazo,Decurso de Prazo,"2ª Vara Cível, Criminal e da Infância e da Juv..."


In [None]:
df_pares.shape

In [30]:
df_pares.to_csv('pares.csv', index=False)