In [114]:
import pandas as pd

import numpy as np

import pymongo

from slugify import slugify

In [115]:
MONGODB_URL = "mongodb://35.237.232.73:27017/"

client = pymongo.MongoClient(MONGODB_URL)

In [116]:
DATABASE_NAME = "dados_diversos"

COLLECTION_NAME = "mpm_serventias"

serventias = list(client[DATABASE_NAME][COLLECTION_NAME].find())

print(f"Total de seventias {len(serventias)}")

Total de seventias 39099


In [117]:
class Base:
    def __init__(self, filename, csv=False):
        if csv:
            self.df = pd.read_csv(filename, sep=";")
        else:
            self.df = pd.read_excel(filename, sep=";")

    @property
    def shape(self):
        return self.df.shape
    
    def head(self, n=5):
        return self.df.head(n)

# Entrância


In [118]:
class Entrancia(Base):
    def __init__(self):
        Base.__init__(self, "mpm_serventias.csv", True)
    
    def processar(self, documents):
        for documento in documents:
            seq_orgao = int(documento["SEQ_ORGAO"])

            entrancia = self._calcular(seq_orgao)

            self._salvar(documento, entrancia)
    
    def _calcular(self, seq_orgao): 
        df_f_orgao = self.df[self.df["SEQ_ORGAO"] == seq_orgao]

        if len(df_f_orgao) == 0:
            print(f"Orgão {seq_orgao} não encontrado!")
            return None

        seq_orgao_pai = df_f_orgao['SEQ_ORGAO_PAI'].values[0]

        """
        Filtra as varas que tem o mesmo orgão pai
        """
        df_f_orgao_pai = self.df[self.df["SEQ_ORGAO_PAI"] == seq_orgao_pai]

        if len(df_f_orgao_pai) == 0:
            print(f"Orgão pai {seq_orgao_pai} não encontrado para o orgão {seq_orgao}!")
            return None

        total = df_f_orgao_pai["SEQ_ORGAO_PAI"].notnull().count()

        if total == None:
            print(f"Orgao {seq_orgao} não possui orgão pai!")
            return None

        if total == 1:
            return 1
        elif total in [2, 3, 4]:
            return 2
        else:
            return 3
    
    def _salvar(self, documento, entrancia):

        collection = client[DATABASE_NAME][COLLECTION_NAME]

        _id =  documento["_id"]

        collection.update_one(
            {
                "_id": _id 
            }, 
            {
                '$set': { 'TIP_ENTRANCIA': entrancia }
            }
        )

In [119]:
et = Entrancia()
et.shape

  exec(code_obj, self.user_global_ns, self.user_ns)


(39100, 17)

In [120]:
et.head()

Unnamed: 0,SEQ_ORGAO,NOMEDAVARA,SEQ_ORGAO_PAI,TIP_ORGAO,SEQ_CIDADE,DSC_CIDADE,SIG_UF,COD_IBGE,DSC_TIP_ORGAO,TIP_ESFERA_JUSTICA,INT_ORDEM_ORGAO,DSC_ORGAO,DSC_DENOM_SERVENTIA_JUDICIAL,endereco_serventia,cep_serventia,LATITUDE,LONGITUDE
0,1,Conselho Nacional de Justiça,,CNJ,743.0,BRASÍLIA,DF,5300108.0,Conselho Nacional de Justiça,S,0.0,Conselho Nacional de Justiça,,,,,
1,2,Conselho da Justiça Federal,1.0,CONSF,743.0,BRASÍLIA,DF,5300108.0,Conselho da Justiça Federal,F,0.0,Conselho da Justiça Federal,,,,,
2,3,Tribunal Regional Federal da 1ª Região,2.0,TRIBF,743.0,BRASÍLIA,DF,5300108.0,Tribunal Regional Federal,F,,Tribunal Regional Federal da 1ª Região,,,,,
3,4,Tribunal Regional Federal da 2ª Região,2.0,TRIBF,4155.0,RIO DE JANEIRO,RJ,3304557.0,Tribunal Regional Federal,F,,Tribunal Regional Federal da 2ª Região,,,,,
4,5,Tribunal Regional Federal da 3ª Região,2.0,TRIBF,4795.0,SAO PAULO,SP,3550308.0,Tribunal Regional Federal,F,,Tribunal Regional Federal da 3ª Região,,,,1050182067.0,607162856.0


In [121]:
et.processar(serventias)

KeyboardInterrupt: 

# Força de Trabalho

In [92]:
class ForcaDeTrabalho(Base):
    def __init__(self):
        Base.__init__(self, "dados-pessoal-TJSP.xlsx")
        
    def processar(self, documentos):
        for documento in documentos:
            seq_orgao = int(documento["SEQ_ORGAO"])
            
            forca_trabalho = self._buscar(seq_orgao)
            self._inseir(documento, forca_trabalho)

    def _inseir(self, documento, forca_trabalho):
        collection = client[DATABASE_NAME][COLLECTION_NAME]
    
        _id = documento["_id"]

        collection.update_one(
            {
                "_id": _id 
            },
            {
                "$set": { 
                    "QTD_ESTAGIARIOS": forca_trabalho["qtd_estagiarios"],
                    "QTD_TERCERIADOS": forca_trabalho["qtd_terceriados"],
                    "QTD_CEDIDOS": forca_trabalho["qtd_cedidos"],
                    "QTD_COMISSIONADO": forca_trabalho["qtd_comissionado"],
                    "QTD_EFETIVOS": forca_trabalho["qtd_efetivos"],
                    
                }
            }
        )

    def _buscar(self, seq_orgao):
        forca_trabalho = {
            "qtd_estagiarios": None,
            "qtd_terceriados": None,
            "qtd_cedidos": None,
            "qtd_comissionado": None,
            "qtd_efetivos": None,
        }

        df_f = self.df[self.df["seq_orgao"] == seq_orgao]

        if len(df_f) == 0:
            return forca_trabalho

        for _, row in df_f.iterrows():
            
            descricao = slugify(row["Descrição da variável"])
            quantidade = int(row["Qtd"])
            
            if descricao == "tfauxe-total-da-forca-de-trabalho-auxiliar-estagiarios":
                forca_trabalho["qtd_estagiarios"] = quantidade 
                
            if descricao == "tfauxt-total-da-forca-de-trabalho-auxiliar-terceirizados":
                forca_trabalho["qtd_terceriados"] = quantidade
                
            if descricao == "tpefet-total-de-pessoal-do-quadro-efetivo":
                forca_trabalho["qtd_efetivos"] = quantidade
                
            if descricao == "tpi-total-de-pessoal-que-ingressou-por-cessao-ou-requisicao":
                forca_trabalho["qtd_cedidos"] = quantidade
                
            if descricao == "tpsv-total-de-pessoal-comissionado-sem-vinculo":
                forca_trabalho["qtd_comissionado"] = quantidade
            
        return forca_trabalho

In [93]:
ft = ForcaDeTrabalho()
ft.shape

(16585, 7)

In [94]:
ft.head()

Unnamed: 0,Descrição da variável,Tribunal descrição,Tribunal UF,seq_orgao,Tipo de Unidade Judiciária - Descrição,Classificação da Unidade Judiciária - Descrição,Qtd
0,TFAUXE - TOTAL DA FORÇA DE TRABALHO AUXILIAR -...,JUIZADO ESPECIAL CIVEL CRIM. DE ADAMANTINA,SP,9252,UNIDADES JUDICIÁRIAS DE PRIMEIRO GRAU,JE - JUIZADO ESPECIAL;,3
1,TFAUXT - TOTAL DA FORÇA DE TRABALHO AUXILIAR -...,JUIZADO ESPECIAL CIVEL CRIM. DE ADAMANTINA,SP,9252,UNIDADES JUDICIÁRIAS DE PRIMEIRO GRAU,JE - JUIZADO ESPECIAL;,0
2,TPEFET - TOTAL DE PESSOAL DO QUADRO EFETIVO,JUIZADO ESPECIAL CIVEL CRIM. DE ADAMANTINA,SP,9252,UNIDADES JUDICIÁRIAS DE PRIMEIRO GRAU,JE - JUIZADO ESPECIAL;,13
3,TPI - TOTAL DE PESSOAL QUE INGRESSOU POR CESSÃ...,JUIZADO ESPECIAL CIVEL CRIM. DE ADAMANTINA,SP,9252,UNIDADES JUDICIÁRIAS DE PRIMEIRO GRAU,JE - JUIZADO ESPECIAL;,0
4,TPSV - TOTAL DE PESSOAL COMISSIONADO SEM VÍNCULO,JUIZADO ESPECIAL CIVEL CRIM. DE ADAMANTINA,SP,9252,UNIDADES JUDICIÁRIAS DE PRIMEIRO GRAU,JE - JUIZADO ESPECIAL;,1


In [95]:
ft.processar(serventias)

KeyboardInterrupt: 

# Pocessos Pendentes

In [108]:
class ProcessosPendentes(Base):
    def __init__(self):
        Base.__init__(self, "casos-pendentes-TJSP.xlsx")
    
    def processar(self, documentos):
        for documento in documentos:
            seq_orgao = int(documento["SEQ_ORGAO"])

            processos_pendentes = self._buscar(seq_orgao)
            self._inseir(documento, processos_pendentes)
        
    def _inseir(self, documento, processos_pendentes):
        collection = client[DATABASE_NAME][COLLECTION_NAME]

        _id = documento["_id"]

        collection.update_one(
            {
                "_id": _id 
            },
            {
                '$set': { 'QTD_PROC_PENDENTES': processos_pendentes }
            }
        )

    def _buscar(self, seq_orgao):
        df_f = self.df[self.df["seq_orgao"] == seq_orgao]

        if len(df_f) != 1:
            return None
        
        processos_pendentes = int(df_f['Qtd'].values[0])
        
        return processos_pendentes        

In [111]:
pp = ProcessosPendentes()
pp.shape

(2807, 4)

In [112]:
pp.head()

Unnamed: 0,Vara,seq_orgao,Classificação da Unidade Judiciária - Descrição,Qtd
0,01 ACIDENTES TRABALHO DE CENTRAL,10544,V - VARA;,215993
1,01 ACIDENTES TRABALHO DE SANTOS,10258,V - VARA;,168834
2,01 CIVEL DE AMERICANA,9264,V - VARA;,383553
3,01 CIVEL DE ARACATUBA,9292,V - VARA;,228712
4,01 CIVEL DE ARARAQUARA,9306,V - VARA;,100250


In [113]:
pp.processar(serventias)

Orgão 2 com mais de uma registros na tabela
Orgão 3 com mais de uma registros na tabela
Orgão 4 com mais de uma registros na tabela
Orgão 5 com mais de uma registros na tabela
Orgão 6 com mais de uma registros na tabela
Orgão 7 com mais de uma registros na tabela
Orgão 8 com mais de uma registros na tabela
Orgão 9 com mais de uma registros na tabela
Orgão 10 com mais de uma registros na tabela
Orgão 11 com mais de uma registros na tabela
Orgão 12 com mais de uma registros na tabela
Orgão 13 com mais de uma registros na tabela
Orgão 14 com mais de uma registros na tabela
Orgão 15 com mais de uma registros na tabela


KeyboardInterrupt: 