## Construção de JSON com Expressões Chaves

Neste notebook será executada uma rotina utilitária para construir um arquivo JSON com todas as expressões presentes na coluna de expressões chaves do conjunto de dados, separando-as pelo ramo do Direito específico. Esse arquivo JSON será utilizado no processo de classificação do modelo simples que será construído com o propósito de comparação com o modelo desenvolvido no projeto.

In [16]:
# Imports
from google.colab import drive
import pandas as pd
import json

In [17]:
# Constants definition
CONSTANTS = {
    'SPREADSHEET_PATH': '/content/drive/My Drive/MAC499 - Kaique e Yurick/DB/Acordaos_Final_Full_Info_Dataset.csv'
}

In [3]:
# Mounting Google Drive

drive.mount('/content/drive', force_remount=True)

Mounted at /content/drive


In [13]:
# Read the full dataset from .csv file
documents = pd.read_csv(CONSTANTS['SPREADSHEET_PATH'])

# Pre-process keywords column
documents['expressoes_chave'] = documents['expressoes_chave'].apply(lambda expr: expr.replace('"', '').replace("'", '').replace('`', '').replace('´', '').replace('\n', ';').replace(',', ';').replace('-', '').replace("“", '').replace("”", ''))
documents

Unnamed: 0.1,Unnamed: 0,cod_acordao,ramo,tipo_acordao,cabecalho,ementa,decisao,indexacao,somente_ementa,indicacao_exclusiva_ementa_voto,expressoes_chave
0,0,EXT 1259,Direito Penal (Direito Processual Penal),EXT,Ext 1259 / DF - DISTRITO FEDERAL EXTRADIÇÃO Re...,EMENTA Extradição instrutória. Duplicidade do ...,"A Turma deferiu a extradição, nos termos do vo...","['INEXISTÊNCIA', 'CONOTAÇÃO', 'CRIME POLÍTICO'...",Sim,Sim,prática delitiva
1,1,RCL 1601,Direito Previdenciário,RCL,Rcl 1601 / SE - SERGIPE RECLAMAÇÃO Relator(a):...,"Reclamação. Tutela antecipada. Decisão que, an...",O Tribunal julgou improcedente a reclamação. V...,"['(CÍVEL)', 'DESCABIMENTO', 'RECLAMAÇÃO', 'INS...",Sim,Sim,tutela antecipada
2,2,MS 23855,Direito Civil (Direito Comercial/Direito de Fa...,MS,MS 23855 / MS - MATO GROSSO DO SUL MANDADO DE ...,"EMENTA: Mandado de segurança, contra ato do Pr...","O Tribunal, por unanimidade, concedeu a segura...","['(CÍVEL)', 'NULIDADE', 'DECRETO PRESIDENCIAL'...",Sim,Não,imóvel rural; imóvel; proprietário
3,3,EXT 1370,Direito Internacional (Público ou Privado),EXT,Ext 1370 / DF - DISTRITO FEDERAL EXTRADIÇÃO Re...,Ementa: Direito Internacional Público. Extradi...,"A Turma deferiu o pedido de extradição, nos te...",['VIDE EMENTA'],Sim,Sim,direito público internacional
4,4,AO 1833,"Direito Administrativo (Licitações, Contratos ...",AO,AO 1833 / AC - ACRE AÇÃO ORIGINÁRIA Relator(a)...,Ementa: AÇÃO ORIGINÁRIA. APELAÇÃO EM AÇÃO CIVI...,"A Turma, por unanimidade, deu parcial provimen...","['NOTIFICAÇÃO PRÉVIA', 'REDAÇÃO ORIGINAL', 'LE...",Sim,Sim,uso irregular de verbas públicas
...,...,...,...,...,...,...,...,...,...,...,...
5519,5767,RE 228220,Direito do Trabalho,RE,RE 228220 / MG - MINAS GERAIS RECURSO EXTRAORD...,EMENTA: TRABALHISTA. REDE FERROVIÁRIA FEDERAL ...,A Turma não conheceu do recurso extraordinário...,"['INADMISSIBILIDADE', 'RECURSO EXTRAORDINÁRIO'...",Sim,Sim,trabalhista
5520,5768,HC 111586,Direito Penal (Direito Processual Penal),HC,HC 111586 / SP - SÃO PAULO HABEAS CORPUS Relat...,EMENTA Habeas corpus. Constitucional. Processu...,"Por maioria de votos, a Turma concedeu, em par...","['ENTENDIMENTO', 'PLENÁRIO', 'SUPREMO TRIBUNAL...",Sim,Sim,habeas corpus; tráfico de entorpecentes ; libe...
5521,5769,RHC 118977,Direito Penal (Direito Processual Penal),RHC,RHC 118977 / MS - MATO GROSSO DO SUL RECURSO O...,EMENTA Recurso ordinário em habeas corpus. Pro...,A Turma negou provimento ao recurso ordinário ...,"['IMPOSSIBILIDADE', 'CONSIDERAÇÃO', 'CONDENAÇÃ...",Sim,Sim,Constrangimento ilegal; habeas corpus; recurso...
5522,5770,HC 126665,Direito Penal (Direito Processual Penal),HC,HC 126665 / SP - SÃO PAULO HABEAS CORPUS Relat...,Ementa: HABEAS CORPUS CONTRA DECISÃO MONOCRÁTI...,"Por maioria de votos, a Turma não admitiu a im...","['VIDE EMENTA', 'FUNDAMENTAÇÃO COMPLEMENTAR', ...",Sim,Sim,Furto e receptação; Prisão preventiva; garanti...


In [18]:
# Build the keywords structure and content
branches_dicts = {'Direito Penal (Direito Processual Penal)': [],
                  'Direito Administrativo (Licitações, Contratos Administrativos, Servidores, Desapropriação, Tribunal de Contas, Improbidade, etc.)': [],
                  'Direito Tributário/Direito Financeiro': [],
                  'Direito Civil (Direito Comercial/Direito de Família)': [],
                  'Direito Previdenciário': [],
                  'Direito do Trabalho': [],
                  'Direito Processual Civil': [],
                  'Direito Eleitoral': [],
                  'Direito do Consumidor': [],
                  'Direito Internacional (Público ou Privado)': [],
                  'Direito Militar': [],
                  'Direito Econômico (Direito concorrencial e Agências Reguladoras Setoriais, Intervenção no Domínio Econômico)': [],
                  'Direito Ambiental': []}
for index, row in documents.iterrows():
  words = row['expressoes_chave'].split(';')
  for word in words:
    word = word.strip().strip('.').lower()
    if word not in branches_dicts[row.ramo] and word != "":
      branches_dicts[row.ramo].append(word)

In [15]:
# Save keywords to external JSON file
with open("/content/drive/My Drive/MAC499 - Kaique e Yurick/DB/keywords.json", "w") as kw:
  json.dump(branches_dicts, kw)