In [3]:
import re
import os

from pymongo import MongoClient
import pandas as pd
from tqdm._tqdm_notebook import tqdm_notebook
tqdm_notebook.pandas()

In [4]:
pd.set_option('display.max_colwidth', 2000)

In [5]:
MONGO_URI = os.getenv("MONGO_URI")
MONGO_DATABASE = os.getenv("MONGO_DATABASE")
client = MongoClient(MONGO_URI)
db = client[MONGO_DATABASE]

selected_keys = {"acordaoId": 1, "index": 1, "observacao": 1, "partesTexto": 1,
                 "citacoesObs": 1, "publicacao": 1, "citacoes_revistas": 1}
page_ranks_cursor = db["acordaos"].find({}, selected_keys)
df_before = pd.DataFrame(page_ranks_cursor)

db = client["DJs_v7"]
page_ranks_cursor = db["acordaos"].find({}, selected_keys)
df_after = pd.DataFrame(page_ranks_cursor)

In [6]:
def getMatchText(text, regexExp):
    match = re.search(regexExp, text)
    if match == None:
        return ""
    else:
        return (match.group(1)).strip()

def normalizeId(Id):
    acNo = getMatchText(Id, "[A-Z]+\s+(\d+)\s*.*")
    typeInv = Id.replace(acNo, " ").upper().strip()
    idList = typeInv.split()
    Id = " ".join(reversed(idList))
    return Id + " " + acNo

In [7]:
df_before["citacoesObs"] = df_before["citacoesObs"].apply(lambda ids: [normalizeId(id) for id in ids])

### Medidas descritivas da rede de acórdãos como era antes 

In [8]:
# Número de decisões
len(df_before)

76378

In [9]:
# Número de decisões com campo observação vazio (sem citações)
len(df_before[(df_before["observacao"] == "")])

43187

In [10]:
# Campo observação não vazio e sem citações
df_before[(df_before["observacao"] != "") & ~df_before["observacao"].str.contains("[Cc]it")][["acordaoId", "observacao"]]

# O motivo do resultado abaixo é que a extração dos dados foi feita usando padrões antigo que não eram mais válidos

Unnamed: 0,acordaoId,observacao
1,AGR AI 383828,"Votação: unânime. Resultado: desprovido. Número de páginas: (05). Análise:(ANA). Revisão:(RCO/AAF). Inclusão: 30/06/03, (MLR). Alteração: 02/07/03, (MLR)."
3,AGR AI 394182,"Votação: unânime. Resultado: desprovido. Número de páginas: (05). Análise:(JEN). Revisão:(VAS). Inclusão: 05/08/03, (SVF)."
5,AGR RE 351132,"Votação: unânime. Resultado: desprovido. Número de páginas: (05). Análise:(VAS). Revisão:(RCO). Inclusão: 26/11/03, (SVF). Alteração: 06/02/06, (MLR)."
6,AGR AI 394737,"Votação: unânime. Resultado: desprovido. -Obs: O AI-394737-AgR foi objeto de embargos, rejeitados em 09/09/2003. Número de páginas: (06). Análise:(VAS). Revisão:(RCO). Inclusão: 19/09/03, (MLR). Alteração: 13/05/04, (JVC)."
7,AGR AI 412808,"Votação: unânime. Resultado: desprovido. Número de páginas: (5). Análise:(JEN). Revisão:(VAS). Inclusão: 01/08/03, (SVF)."
...,...,...
76363,AGR RE 910617,ARE 917126 AgR PROCESSO ELETRÔNICO JULG-24-11-2015 UF-MA TURMA-02 MIN-DIAS TOFFOLI N.PÁG-009 DJe-254 DIVULG 16-12-2015 PUBLIC 17-12-2015 ARE 910870 AgR PROCESSO ELETRÔNICO JULG-17-11-2015 UF-RS TURMA-02 MIN-DIAS TOFFOLI N.PÁG-008 DJe-252 DIVULG 15-12-2015 PUBLIC 16-12-2015 ARE 864668 AgR ACÓRDÃO ELETRÔNICO JULG-27-10-2015 UF-PE TURMA-02 MIN-DIAS TOFFOLI N.PÁG-007 DJe-250 DIVULG 11-12-2015 PUBLIC 14-12-2015
76364,AGR ARE 744404,RE 898967 AgR PROCESSO ELETRÔNICO JULG-01-03-2016 UF-PE TURMA-02 MIN-DIAS TOFFOLI N.PÁG-011 DJe-051 DIVULG 17-03-2016 PUBLIC 18-03-2016 RE 906625 AgR PROCESSO ELETRÔNICO JULG-01-03-2016 UF-PB TURMA-02 MIN-DIAS TOFFOLI N.PÁG-012 DJe-051 DIVULG 17-03-2016 PUBLIC 18-03-2016
76366,AGR ARE 881868,ARE 918548 AgR PROCESSO ELETRÔNICO JULG-24-11-2015 UF-PR TURMA-02 MIN-DIAS TOFFOLI N.PÁG-018 DJe-018 DIVULG 29-01-2016 PUBLIC 01-02-2016
76373,AGR ARE 907036,ARE 907036 AgR-ED PROCESSO ELETRÔNICO JULG-15-12-2015 UF-PR TURMA-01 MIN-ROBERTO BARROSO N.PÁG-006 DJe-025 DIVULG 11-02-2016 PUBLIC 12-02-2016


In [11]:
# Decisões que possuem citações
df_before[(df_before["citacoesObs"].str.len() > 0)][["acordaoId", "citacoesObs"]]

Unnamed: 0,acordaoId,citacoesObs
0,MS 24305,"[ADI 1303, MS 21269, MS 21517, RE 235487]"
2,HC 82445,"[HC 69141, HC 76555]"
4,AGR RE 234954,"[RE 223796, RE 227106]"
8,AGR RE 223510,[RE 199366]
10,ED ED AGR RE 167522,"[MS 1957, MS 2924]"
...,...,...
72496,RE 598572,"[RE 138284, RE 177296, RE 351717, RE 377457, RE 583712, RE 406955, RE 627543, RE 370590, RE 335275, RE 490576, AR 2322, AC 1109]"
72497,RE 841526,"[RE 161422, RE 215981, RE 481110, AI 577908, AI 299125, RE 607771, AI 852237, RE 677283, ARE 754778, RE 215981, RE 592581, AI 603865, AI 799789, RE 594902, ARE 662563, ADPF 347, RE 272839, RE 580252, RE 121130, RE 272839, HC 84072, ARE 700927]"
72574,RE 655265,"[MS 25504, ADI 3460, MS 27609, MS 27608, ADC 12, RE 184425, RE 392976, MS 26668, AI 733252, AI 839058, AI 418727, RE 184425]"
73007,RE 641320,"[HC 82959, HC 75299, HC 93596, HC 94526, HC 94810, HC 94829, HC 110892, HC 72643, RE 592581, ADI 5240, ADPF 347, ADI 1105, ADI 1127, ADI 1946, ADI 2209, ADI 2596, ADI 2652, ADI 3046, ADI 3324, ADI 2405, ADI 1344, RP 1417, PET 3388, ADI 4425, ADI 4357, ADPF 347, HC 76930, HC 87985, HC 93596, RHC 65127, HC 67072, HC 66593, HC 74732, HC 68310, MI 283, ADI 1105, ADI 1127, RMS 22307, MI 543, MI 670, RE 405579, ADPF 54, MI 708, MI 712, PET 3388, MS 26603, MS 26602, MS 26604, ADI 2332, ADPF 54, ADI 2084, ADI 1797, ADI 1668, ADI 1344, ADI 2332]"


In [12]:
# Decisões que deveriam ter citações, mas por algum motivo nenhuma foi detectada
df_before[df_before["observacao"].str.contains("[Cc]it") &
          (df_before["citacoesObs"].str.len() == 0)][["acordaoId", "observacao"]]

# Alguns casos aqui possuem espaço para melhora. Outros sofreram com extração incorreta
# decorrente do uso de padrões antigos de extração extração das decisões

Unnamed: 0,acordaoId,observacao
55,AGR RE 354935,"Votação: unânime. Resultado: desprovido. Acórdaõs citados: RE-195894, AI-250852-AgR. Número de páginas: (05). Análise:(DMV). Revisão:(RCO). Inclusão: 22/09/03, (MLR). Alteração: 25/09/03, (MLR)."
97,HC 82142,"Votação: unânime. Resultado: concessão parcial da ordem, para assentar a incompetência da justiça comum quanto aos crimes militares, excetuado o de formação de quadrilha e estendendo a ordem ao demais co-réus militares. Acórdãos citados: RHC-56046 (RTJ-87/47), RHC-56275 (RTJ-87/460), RHC-59444, RHC-61367 (RTJ-109/105), HC-68928 (RTJ-138/569), HC-69571 (RTJ-144/283), RE-121124 (RTJ-132/917; STJ - CC-2686, CC-3532 Número de páginas: (18). Análise:(MML). Revisão:(RCO). Inclusão: 30/11/03, (MLR)."
117,AO 609,"Votação: unânime. Resultado: provido o recurso dos autores e parcialmente provido o recurso do Estado do Rio Grande do Sul. Acórdãos citados: AORQO-263; AO-303; AORQO-331; AO-517; (RTJ-172/738); RE-145018; (RTJ-149/928); Número de páginas: (13). Análise:(CMM). Revisão:(AAF). Inclusão: 25/04/01, (MLR). Alteração: 12/07/04, (NT)."
128,HC 80587,"Votação: Unânime. Resultado: Indeferido. Acórdãos citados do STJ : HC-6779, HC-8551, RHC-4569, REsp-130611. Veja: RE-77713, RE-18082. Número de páginas: (22). Análise:(CRP). Revisão:(RCO/AAF). Inclusão: 24/09/01, (SVF)."
167,RE 285047,"Votação: Por maioria, vencido o Min. Marco Aurélio. Resultado: Não conhecido. Acórdãos citados: HC-72131 (RTJ-186/980), HC-75306; STJ: REsp-2320 (RSTJ-23/378). Número de páginas: (16). Análise:(PCC). Revisão:(). Inclusão: 03/02/05, (PCC)."
...,...,...
71096,MS 33406,"AMARAL, Héctor A. La Doctrina de Los Propios Actos de La Administración Pública. Depalma, 1988. p. 133-138. ARAGÃO, Alexandre Santos de. Curso de Direito Administrativo. Forense, 2012. p. 65-69, item VI.6. BERTONCINI, Mateus Eduardo Siqueira Nunes. Princípios de Direito Administrativo Brasileiro. Malheiros, 2002. p. 178-180, item 4.5.7. BINENBOJM, Gustavo. Temas de Direito Administrativo e Constitucional. Renovar, 2008. p. 735-740, itens II.2.2 a II.2.2.2. BORDA, Alejandro. La Teoria de Los Actos Propios. 2. ed. Abeledo Perrot, 1992. p. 136-138. CARVALHO, Raquel Melo Urbano de. Curso de Direito Administrativo. JusPodivm, 2008. p. 78-94, itens 8 a 8.4. CANOTILHO, José Joaquim Gomes. Direito Constitucional e Teoria da Constituição. Almedina, 1998. p. 250. COSTA, Judith Martins. A Ilicitude Derivada do Exercício do Comportamento Contraditório de Um Direito: o Renascer do Venire Contra Factum Proprium. Revista Forense, 2004. v. 376. p. 109-129. FACCI, Lucio Picanço. A Proibição do Comportamento Contraditório no Âmbito da Administração Pública: A Tutela da Confiança nas Relações Jurídico-Administrativas. Revista da EMERJ, 2011. v. 14, n. 53, p. 197-229. FERRAZ, Sérgio. O princípio da segurança jurídica em face das reformas constitucionais. Revista Forense. v. 334. p. 191-210. FIGUEIREDO, Lúcia Valle. Curso de Direito Administrativo. 9. ed. Malheiros, 2008. p. 257-260, itens ns. 3.2 a 4. JUSTEN FILHO, Marçal. Curso de Direito Administrativo. 4. ed. Saraiva, 2009. p. 1097-1100, itens XVII.1 a XVII.3.1. MEIRELLES, Hely Lopes. Direito Administrativo Brasileiro. 34. ed. Atualização: Eurico de Andrade Azevedo, Délcio Balestero Aleixo e José Emmanuel Burle Filho. Malheiros, 2008. p. 99-101, item 2.3.7. MELLO, Celso Antônio Bandeira de. Curso de Direito Administrativo. 26. ed. Malheiros, 2009. p. 87, item 77 e 123-125, item 27. PIETRO, Maria Sylvia Zanella di. Direito Administrativo. 22. ed. Atlas, 2009. p. 87-88, item 3.3.15.4. SCHREIBER, Anderson. A Proibição de Comportame..."
71552,SEGUNDO AGR RCL 20132,"BADARÓ, Gustavo. Processo penal. Rio de Janeiro: Campus Elsevier, 2012. p. 89. MARQUES, José Frederico. Elementos de Direito Processual Penal. Campinas: Bookseller, 1997. v. 1. p. 128. NOGUEIRA, Carlos Frederico Coelho apud TOURINHO FILHO, Fernando da Costa. Comentários ao Código de Processo Penal. São Paulo: Edipro, 2002. v. 1 p. 409. (op. cit., p. 424). TOURINHO FILHO, Fernando da Costa. Processo Penal. 29. ed. São Paulo: Saraiva, 2007. v. 1. p. 424."
71561,AP 700,"BADARÓ, Gustavo. Processo Penal. Rio de Janeiro: Campus Elsevier, 2012. p. 425. BITENCOURT, Cezar Roberto. Direito penal das licitações. São Paulo: Saraiva, 2012. p. 155 e 156. CAPEZ, Fernando. Curso de direito penal. 12. ed. São Paulo: Saraiva, 2014. v. 3. p. 760. JUSTEN FILHO, Marçal. Comentários à lei de Licitações e Contratos Administrativos. 16. ed. São Paulo: Revista dos Tribunais, 2014. p. 1172. MARQUES, José Frederico. Elementos de direito processual penal. Campinas: Bookseller, 1997. v. 1. p. 260. TOURINHO FILHO, Fernando da Costa. Processo penal. 31. ed. São Paulo: Saraiva, 2009. v. 2. p. 217."
71882,AGR RHC 117825,"AVENA, Norberto. Processo Penal Esquematizado. 2. ed. Método, 2010. p. 503-504, item 8.5.4. FERNANDES, Antonio Scarance. A Lei de Interceptação Telefônica. Justiça Penal - Provas Ilícitas e Reforma Pontual. Revista dos Tribunais, 1997. v. 4. p. 48-70, 58-59, item 7. ______. Processo Penal Constitucional. 6. ed. Revista dos tribunais, 2010. p. 99-102, itens 7.13 e 7.14. FEITOZA, Denilson. Direito Processual Penal – Teoria, Crítica e Praxis. 6. ed. Impetus, 2009. p. 790-792, item 15.12.2.3. GOMES, Luiz Flávio; CERVINI, RAÚL. Interceptação Telefônica. Revista dos Tribunais, 1997. p. 219, item 44. GOMES, Luiz Flávio; MACIEL, Silvio. Interceptação Telefônica – Comentários à Lei 9.296, de 24/07/96. Revista dos Tribunais, 2011. p. 106-112, item 6. GRECO FILHO, Interceptação Telefônica. Saraiva, 1996. p. 31. ______. Interceptação Telefônica – Considerações sobre a Lei nº 9.296, de 24 de julho de 1996. 2. ed. Saraiva, 2005. p. 33-39. GRINOVER, Ada Pellegrini; GOMES FILHO, Antonio Magalhães; FERNANDES, Antonio Scarance. As Nulidades no Processo Penal. 12. ed. Revista dos Tribunais, 2011. p. 176-177. JESUS, Damásio Evangelista de. Interceptação de Comunicações Telefônicas – Notas à Lei 9.296, de 24.07.1996. Revista dos Tribunais, v. 735. p. 458-173, 469. LOPES JUNIOR, Aury. Direito Processual Penal e Sua Conformidade Constitucional. 3. ed. Lumen Juris, 2008. v. 1. p. 539-541, item 5.4. NUCCI, Guilherme de Souza. Código de Processo Penal Comentado. 9. ed. Revista dos Tribunais, 2009. p. 365, item 44. OLIVEIRA, Eugênio Pacelli de; FISCHER, Douglas Comentários ao Código de Processo Penal. 3. ed. Lumen Juris, 2011. p. 303-305, item 157.9. SIQUEIRA FILHO, Élio Wanderley de. A escuta telefônica – Comentários à Lei 9.296/96. Revista dos Tribunais, v. 737. p. 471-480, 476. SILVA, César Dario Mariano da. Provas Ilícitas. 2. ed. Leud, 2002. p. 64, item 3.3.5. STRECK, Lenio Luiz. As Interceptações Telefônicas e os Direitos Fundamentais – A Lei 9.296/96 e seus Reflexos Penais e Proces..."


In [13]:
# Decisões que deveriam ter e têm citações
df_before[(df_before["citacoesObs"].str.len() > 0) &
          df_before["observacao"].str.contains("[Cc]it")][["observacao", "citacoesObs"]]

Unnamed: 0,observacao,citacoesObs
0,"Votação: Unânime. Resultado: Concedida a segurança, nos termos do voto do Relator. Acórdãos citados: ADI-1303-MC (RTJ-174/743), MS-21269 (RTJ-148/393), MS-21517 (RTJ-150/751), RE-235487 (RTJ-181/1141). Número de páginas: (29). Análise:(JBM). Inclusão: 14/06/2004, (SVF). Alteração: 13/02/06, (MLR).","[ADI 1303, MS 21269, MS 21517, RE 235487]"
2,"Votação: unânime. Resultado: indeferido. Acórdãos citados: HC-69141 (RTJ-142/865), HC-76555. Número de páginas: (04). Análise:(VAS). Revisão:(RCO). Inclusão: 12/12/03, (MLR).","[HC 69141, HC 76555]"
4,"Votação: unânime. Resultado: desprovido. Acórdãos citados: RE-223796, RE-227106. - Obs: O RE-234954-AgR foi objeto dos RE-AgR-ED rejeitados em 03/06/2003. Número de páginas: (07). Análise:(VAS). Revisão:(RCO). Inclusão: 08/10/03, (MLR). Alteração, 06/05/04, (JVC).","[RE 223796, RE 227106]"
8,"Votação: unânime. Resultado: desprovido. Acórdão citado: RE-199366. Número de páginas: (6). Análise:(VAS). Revisão:(RCO/AAF). Inclusão: 22/05/03, (SVF). Alteração: 01/09/03, (SVF).",[RE 199366]
10,"Votação: unânime. Resultado: rejeitados. Acórdãos citados:MS-1957, MS-2924. Número de páginas: (06). Análise:(VAS). Revisão:(RCO/AAF). Inclusão: 17/03/03, (MLR). Alteração: 10/05/04, (MLR).","[MS 1957, MS 2924]"
...,...,...
72496,"- Acórdão(s) citado(s): (CONTRIBUIÇÃO SOCIAL, LEI COMPLEMENTAR) RE 138284 (TP), RE 177296 (TP), RE 351717 (TP), RE 377457 (TP), RE 583712 (TP). (PRINCÍPIO DA CAPACIDADE CONTRIBUTIVA) RE 406955, RE 627543 (TP). (PODER JUDICIÁRIO, SUPRESSÃO, EQUIPARAÇÃO, ALÍQUOTA DIFERENCIADA) RE 370590 AgR (2ªT), RE 335275 AgR-segundo (1ªT), RE 490576 AgR (2ªT), AR 2322 AgR (TP). (INSTITUIÇÃO FINANCEIRA, CONTRIBUIÇÃO PREVIDENCIÁRIA PATRONAL, PRINCÍPIO DA IGUALDADE TRIBUTÁRIA) AC 1109. - Veja RE 599309 RG do STF. Número de páginas: 43. Análise: 23/08/2016, KBP.","[RE 138284, RE 177296, RE 351717, RE 377457, RE 583712, RE 406955, RE 627543, RE 370590, RE 335275, RE 490576, AR 2322, AC 1109]"
72497,". - Acórdão(s) citado(s): (RESPONSABILIDADE CIVIL DO ESTADO ) RE 607771 AgR (2ªT), AI 852237 AgR (2ªT), RE 677283 AgR (2ªT), ARE 754778 AgR (1ªT). (RESPONSABILIDADE CIVIL DO ESTADO, SISTEMA CARCERÁRIO, MORTE, PRESO) RE 215981 (2ªT), RE 592581 (TP), AI 603865 AgR (1ªT), AI 799789 AgR (1ªT), RE 594902 AgR (1ªT), ARE 662563 AgR (2ªT), ADPF 347 MC (TP). (RESPONSABILIDADE CIVIL DOS ESTADO, DANO MORAL, SISTEMA CARCERÁRIO) RE 272839 (2ªT), RE 580252 RG. (PRESO, SUÍCIDIO, INEXISTÊNCIA, OBRIGAÇÃO, AÇÃO DE INDENIZAÇÃO, RESPONSABILIDADE CIVIL DO ESTADO) RE 121130 (2ªT). (RESPONSABILIDADE OBJETIVA, AFERIÇÃO, REPARAÇÃO DE DANO, DOLO, CULPA, AGENTE) RE 272839 (2ªT), HC 84072 (1T). (RESPONSABILIDADE CIVIL DO ESTADO,SISTEMA CARCERÁRIO, SUICÍDIO, PRESO) ARE 700927 AgR (2ªT). - Decisões monocráticas citadas: (RESPONSABILIDADE CIVIL DO ESTADO,SISTEMA CARCERÁRIO, SUICÍDIO, PRESO) RE 161422. (RESPONSABILIDADE CIVIL DOS ESTADO, DANO MORAL, SISTEMA CARCERÁRIO) RE 215981, RE 481110, AI 577908. (RESPONSABILIDADE CIVIL DO ESTADO, ÔNUS DA PROVA) AI 299125. - Acórdão(s) citado(s) - outros tribunais: STJ: REsp 1374284. Número de páginas: 101. Análise: 18/08/2016, JRS.","[RE 161422, RE 215981, RE 481110, AI 577908, AI 299125, RE 607771, AI 852237, RE 677283, ARE 754778, RE 215981, RE 592581, AI 603865, AI 799789, RE 594902, ARE 662563, ADPF 347, RE 272839, RE 580252, RE 121130, RE 272839, HC 84072, ARE 700927]"
72574,"- Acórdão(s) citado(s): (MOMENTO, COMPROVAÇÃO, TEMPO DE ATIVIDADE JURÍDICA) ADI 3460 (TP), MS 27609 (TP), MS 27608 (TP). (PODER NORMATIVO, CNJ) ADC 12 (TP). (COMPROVAÇÃO, HABILITAÇÃO LEGAL, INSCRIÇÃO, CONCURSO PÚBLICO) RE 184425 (2ªT), RE 392976 (1ªT), MS 26668 (TP), AI 733252 AgR (2ªT), AI 839058 AgR (2ªT), AI 418727 ED (1ªT). (MOMENTO, CUMPRIMENTO, REQUISITO, CARGO PÚBLICO) RE 184425 (2ªT). - Decisão monocrática citada: (MOMENTO, COMPROVAÇÃO, TEMPO DE ATIVIDADE JURÍDICA) MS 25504 MC. Número de páginas: 88. Análise: 18/08/2016, IMC.","[MS 25504, ADI 3460, MS 27609, MS 27608, ADC 12, RE 184425, RE 392976, MS 26668, AI 733252, AI 839058, AI 418727, RE 184425]"
73007,"- Acórdão(s) citado(s): (CUMPRIMENTO DA PENA, REGIME INTEGRALMENTE FECHADO, PRINCÍPIO DA INDIVIDUALIZAÇÃO DA PENA) HC 82959 (TP). (CUMPRIMENTO DA PENA, REGIME PRISIONAL MAIS GRAVOSO) HC 75299 (1ªT), HC 93596 (2ªT), HC 94526 (1ªT), HC 94810 (1ªT), HC 94829 (1ªT), HC 110892 (2ªT), HC 72643 (1ªT). (PODER JUDICIÁRIO, DETERMINAÇÃO, REALIZAÇÃO, OBRA PÚBLICA, ESTABELECIMENTO PENAL) RE 592581 (TP). (VALIDADE, CONVÊNIO, CNJ, AUDIÊNCIA DE CUSTÓDIA) ADI 5240 (TP). (PRECARIEDADE, SISTEMA PRISIONAL BRASILEIRO) ADPF 347 MC (TP). (STF, INTERPRETAÇÃO CORRETIVA, LEI) ADI 1105 (TP), ADI 1127 (TP), ADI 1946 (TP), ADI 2209 (TP), ADI 2596 (TP), ADI 2652 (TP), ADI 3046 (TP), ADI 3324 (TP), ADI 2405 MC (TP), ADI 1344 MC (TP), RP 1417 (TP). (STF, COMPLEX ENFORCEMENT) Pet 3388 (TP), ADI 4425 QO (TP), ADI 4357 QO (TP), ADPF 347 MC (TP). (INEXISTÊNCIA, VAGA, ESTABELECIMENTO PENAL, CUMPRIMENTO DA PENA, REGIME PRISIONAL MAIS GRAVOSO) HC 76930 (1ªT), HC 87985 (2ªT), HC 93596 (2ªT), RHC 65127 (2ªT), RTJ 129/1153 (HC 67072), RTJ 127/926 (HC 66593), RTJ 167/185 (HC 74732), RTJ 133/793 (HC 68310). (STF, SENTENÇA MANIPULATIVA COM EFEITO ADITIVO) MI 283 (TP), ADI 1105 (TP), ADI 1127 (TP), RMS 22307 (2ªT), MI 543 (TP), MI 670 (TP), RE 405579 (TP), ADPF 54 (TP), MI 708 (TP), MI 712 (TP), Pet 3388 (TP), MS 26603 (TP), MS 26602 (TP), MS 26604 (TP), ADI 2332 MC (TP), ADPF 54 QO (TP), ADI 2084 (TP), ADI 1797 (TP), ADI 1668 (TP), ADI 1344 (TP). (STF, SENTENÇA MANIPULATIVA COM EFEITO SUBSTITUTIVO) ADI 2332 MC (TP). - Acórdão(s) citado(s) - outros tribunais: RT 609/325, RT 613/319, RT 645/285, RT 672/312, RT 679/332, RT 728/552, RT 759/627. STJ: REsp 574511, HC 13526, HC 13897, HC 48629, HC 66806, RHC 18802, RT 669/371, RT 735/516 . - Legislação estrangeira citada: art. 61 do Código Penal de Portugal, § 57 do Strafgesetzbuch (StGB) da Alemanha, art. 176 do Código Penal da Itália, art. 13 do Código Penal da Argentina. - Decisão estrangeira citada: casos Brown vs. Board of Education of Topeka, de 1954, Colem...","[HC 82959, HC 75299, HC 93596, HC 94526, HC 94810, HC 94829, HC 110892, HC 72643, RE 592581, ADI 5240, ADPF 347, ADI 1105, ADI 1127, ADI 1946, ADI 2209, ADI 2596, ADI 2652, ADI 3046, ADI 3324, ADI 2405, ADI 1344, RP 1417, PET 3388, ADI 4425, ADI 4357, ADPF 347, HC 76930, HC 87985, HC 93596, RHC 65127, HC 67072, HC 66593, HC 74732, HC 68310, MI 283, ADI 1105, ADI 1127, RMS 22307, MI 543, MI 670, RE 405579, ADPF 54, MI 708, MI 712, PET 3388, MS 26603, MS 26602, MS 26604, ADI 2332, ADPF 54, ADI 2084, ADI 1797, ADI 1668, ADI 1344, ADI 2332]"


In [14]:
# Soma do número de citações de todas as decisões
sum(df_before["citacoesObs"].apply(lambda x: len(x)))

19171

### Medidas descritivas da rede de acórdãos como é agora 

In [15]:
# Número de decisões
len(df_after)

103168

In [16]:
# Número de decisões com campo observação vazio (sem citações)
len(df_after[(df_after["observacao"] == "")])

4444

In [17]:
df_after[(df_after["observacao"] == "")]["acordaoId"]

4555              AGR RE 230739
6360                   HC 82420
7091               AGR RCL 2182
7676                QO PET 2935
11548                  HC 84802
                  ...          
103163    ED ED AGR ARE 1208076
103164    ED AGR ED ARE 1217415
103165            AGR HC 173987
103166       ED AGR ARE 1220362
103167           AGR RHC 176636
Name: acordaoId, Length: 4444, dtype: object

In [18]:
# Campo observação não vazio e sem citações
def remove_useless_observation_segment(txt):
    txt = re.sub(
        r"((Número\s*de\s*p[aá]ginas|Altera[aç][aã]o|Revis[aã]o|Inclus[aã]o|An[aá]lise|Obs\.|Vota[cç][aã]o|Resultado):)[^\.]*\.", "", txt, flags=re.IGNORECASE
    )
    # Além disso, uma decisão específica começa com a string “Veja” Será feita uma exceção para este caso.    
    veja_pattern = r"(^Veja[^\.]*\.)?(.*)\-?\s*Veja.*"
    while re.match(veja_pattern, txt, flags=re.IGNORECASE):
        txt = re.sub(
            veja_pattern, r"\2", txt, flags=re.IGNORECASE
        )
    return txt.strip(" -")

df_obs_nao_vazio = df_after[(df_after["observacao"].apply(lambda x: remove_useless_observation_segment(x)) != "") &
         ~df_after["observacao"].str.contains("[Cc]it")]

In [17]:
df_obs_nao_vazio.to_csv("observacao_sem_citacoes.csv", sep="@")
df_obs_nao_vazio[["acordaoId", "observacao", "partesTexto"]]
## no banco V5 tinham 1375 decisões assim
## no banco V6 tinham 949 decisões assim

Unnamed: 0,acordaoId,observacao,partesTexto
0,AGR RE 308114,"O RE 308114 AgR foi objeto de embargos de declaração rejeitados em 17/09/2002. Número de páginas: (06). Análise:(CRP). Revisão:(CTM). Inclusão: 01/07/02, (SVF). Alteração: 01/08/05, (MLR). Alteração: 25/05/2018, JRM.",AGTE. : GUIDO - COMÉRCIO E TRANSPORTE DE MATERIAIS PARA CONSTRUÇÕES LTDA \nADVDOS. : CLAUDIO ZANKOSKI E OUTROS \nAGDO. : ESTADO DO PARANÁ \nADVDA. : PGE-PR - MÁRCIA DIEGUEZ LEUZINGER E OUTRO
21,AGR AI 336079,"O AI 336079 AgR foi objeto dos embargos de declaração rejeitados em 28/09/2004. Número de páginas: (08). Análise:(ANA). Revisão:(VAS/RCO). Inclusão: 11/09/03, (MLR). Alteração: 02/12/04, (SVF). Alteração: 25/09/2018, JLS.",AGTE. : MUNICÍPIO DE MANAUS \nADV. : ANTÔNIO DIONYSIO CARVALHO PAIXÃO \nAGDA. : CONSTRUTORA ANDRADE GUTIERREZ S/A \nADVDOS. : JOSÉ MAURÍCIO BALBI SOLLERO E OUTROS
28,AGR RE 345871,"O AI 345871 AgR foi objeto de embargos de declaração rejeitados em 12/04/2005. O RE 345871 AgR foi objeto de embargos de declaração rejeitados em 12/04/2005. Número de páginas: (07). Análise:(VAS). Revisão:(FLO/RCO). Inclusão: 12/12/03, (SVF). Alteração: 01/08/05, (MLR). Alteração: 12/09/2018, ALS.",AGTE. : DISTRITO FEDERAL \nADV. : PGDF - RENATO GUANABARA LEAL DE ARAÚJO \nAGDOS. : SHIRLEY FERREIRA DE OLIVEIRA E OUTROS \nADVDOS. : MARCOS LUIS BORGES DE RESENDE E OUTROS
109,AGR AI 406993,"AI 406993 AgR foi objeto de embargos de declaração rejeitados em 27/09/2005. Número de páginas: (06). Análise:(DMV). Revisão:(FLO). Inclusão: 20/08/03, (MLR). Alteração: 10/03/06, (NAL). Alteração: 20/03/2019, HAC.",AGTES. : JOÃO CUCHARO E OUTROS \nADVDOS. : AGUINALDO DE BASTOS E OUTROS \nAGDO. : MUNICÍPIO DE JUNDIAI \nADVD. : ROLFF MILANI DE CARVALHO
115,ED RE 337680,"- O AI 429950 foi objeto de embargos de declaração rejeitados em 09/12/2003. Número de páginas: (5). Análise:(ANA). Revisão:(RCO/AAF). Inclusão: 23/06/03, (SVF). Alteração: 21/11/05, (MLR). Alteração: 29/08/2018, HAC.",EMBTE. : USINA SANTA RITA S/A AÇÚCAR E ÁLCOOL \nADV. : HAMILTON DIAS DE SOUZA \nEMBDA. : UNIÃO \nADVDA. : PFN - ELYADIR FERREIRA BORGES
...,...,...,...
77991,HC 129734,"- Caso ""OPERAÇÃO HERODES"". Número de páginas: 12. Análise: 22/01/2018, JRS. Revisão: 22/02/2018, KBP.",PACTE.(S) : FABIO FELIX DOS REIS \nIMPTE.(S) : RALPH HAGE NICOLAU RITTER VIANNA \nCOATOR(A/S)(ES) : RELATOR DO RHC Nº 61.038 DO SUPERIOR TRIBUNAL DE JUSTIÇA
79058,AGR ARE 980355,"- O ARE 980355 AgR foi objeto de embargos de declaração acolhidos com efeitos infringentes. Número de páginas: 10. Análise: 13/10/2017, MJC.",AGTE.(S) : PHENIX SEGURADORA S/A \nADV.(A/S) : PAULA CASSETTARI FLORES \nADV.(A/S) : THIAGO ZUCCHETTI CARRION \nAGDO.(A/S) : LEILA REGINA TECHIO \nADV.(A/S) : JORENILDA LUCIA STUKER SCHMIDT
82708,AGR RE 1094802,"- O ARE 1107360 AgR foi objeto de embargos de declaração acolhidos com efeitos infringentes. Número de páginas: 8. Análise: 01/06/2018, BMP.",AGTE.(S) : EMPRESA BRASILEIRA DE SERVICOS HOSPITALARES - EBSERH \nADV.(A/S) : KARLA SOARES DE ARAUJO AMORIM \nADV.(A/S) : JOSEAM CATANHEDE DE OLIVEIRA \nADV.(A/S) : ANTONIO SABINO DA SILVA FILHO \nAGDO.(A/S) : ANA CLAUDIA DA SILVA MOURA \nADV.(A/S) : ANA AUGUSTA LIMA SOARES BARBOSA
84818,AGR ARE 1110171,"- O ARE 1110171 AgR foi objeto de embargos de declaração acolhidos com efeitos modificativos. Número de páginas: 3. Análise: 24/09/2018, ER.",AGTE.(S) : B.J.S.R. \nADV.(A/S) : EDUARDO XIBLE SALLES RAMOS \nADV.(A/S) : LETICIA SOBRINHO DE AGUIAR \nADV.(A/S) : RODRIGO MELO MESQUITA \nAGDO.(A/S) : UNIÃO \nPROC.(A/S)(ES) : PROCURADOR-GERAL DA FAZENDA NACIONAL


In [19]:
# Aprimoramento de detecção de corpo de texto sobre publicação ou divulgação
df_public_pattern = df_after[df_after["publicacao"].apply(lambda x: " PUBLIC " not in x) & df_after["publicacao"].apply(lambda x: "PUBLIC" in x)]
# df_public_pattern = df_after[df_after["publicacao"].apply(lambda x: " DIVULG " not in x) & df_after["publicacao"].apply(lambda x: "DIVULG" in x)]

df_public_pattern[["publicacao"]]

Unnamed: 0,publicacao
16,DJ 14-05-2001 PP-00189 EMENT VOL-02030-02 PP-00267\r\nREPUBLICAÇÃO: DJ 18-05-2001 PP-00065
190,DJ 14-05-2001 PP-00189 EMENT VOL-02030-03 PP-00486\r\nREPUBLICAÇÃO: DJ 18-05-2001 PP-00064
225,DJ 14-05-2001 PP-00189 EMENT VOL-02030-04 PP-00860\r\nREPUBLICAÇÃO: DJ 18-05-2001 PP-00087
304,DJ 14-05-2001 PP-00189 EMENT VOL-02030-04 PP-00884\r\nREPUBLICAÇÃO: DJ 18-05-2001 PP-00066
316,DJ 14-05-2001 PP-00189 EMENT VOL-02030-05 PP-01010\r\nREPUBLICAÇÃO: DJ 18-05-2001 PP-00088
...,...
22856,DJe-106 DIVULG-20-09-2007 PUBLIC-21-09-2007\r\nDJ 21-09-2007 PP-00024\r\nEMENT VOL-02290-01 PP-00208
23085,"DJe-106 DIVULG-20-09-2007 PUBLIC-21-09-2007\r\nDJ 21-09-2007 PP-00043 EMENT VOL-02290-02 PP-00262\r\nRTJ VOL-00203-03 PP-01164\r\nRMDPPP v. 4, n. 20, 2007, p. 107-114"
23102,"DJe-106 DIVULG-20-09-2007 PUBLIC-21-09-2007\r\nDJ 21-09-2007 PP-00020 EMENT VOL-02290-01 PP-00019\r\nRT v. 97, n. 867, 2008, p. 93-97"
23182,DJe-106 DIVULG-20-09-2007 PUBLIC-21-09-2007\r\nDJ 21-09-2007 PP-00025\r\nEMENT VOL-02290-02 PP-00379


In [20]:
df_public_pattern[df_public_pattern["publicacao"].apply(lambda x: True if re.search("\sDIVULG\-?\s?|\sREPUBLICAÇÃO\s*|\sPUBLIC\-?\s+", x) else None)]

# Este problema foi resolvido e a função de detecção de publicação em revistas já foi escrita

Unnamed: 0,_id,acordaoId,publicacao,citacoes_revistas,partesTexto,observacao,citacoesObs,index
16,5e327362d0a3cf19aa5ba25b,MS 23193,DJ 14-05-2001 PP-00189 EMENT VOL-02030-02 PP-00267\r\nREPUBLICAÇÃO: DJ 18-05-2001 PP-00065,[],IMPTE. : JOSÉ TEIXEIRA \nADVDOS. : LÉO EDUARDO RIBEIRO PRADO E OUTRO \nIMPDO. : PRESIDENTE DA REPÚBLICA,"Acórdãos citados : MS 20430, MS 20714, MD 20882, RMS 21300, (RTJ 142/782), RMS 21597, MS 22022, (RTJ 168/163), MS 22164, (RTJ 164/158), MS 22225, MS 22319, (RTJ 162/918), MS 22519, MS 23311, (RTJ 172/501, RTJ 124/948). Número de páginas: (63). Análise: (CMM). Revisão: (AAF). Inclusão: 19/06/01, (SVF). Alteração: 13/02/06, (MLR). Alteração: 17/01/2018, GIB.","[MS 20430, MS 20714, MD 20882, RMS 21300, RMS 21597, MS 22022, MS 22164, MS 22225, MS 22319, MS 22519, MS 23311]",164
190,5e3275cbd0a3cf19aa5ba309,HC 80566,DJ 14-05-2001 PP-00189 EMENT VOL-02030-03 PP-00486\r\nREPUBLICAÇÃO: DJ 18-05-2001 PP-00064,[],PACTE. : LUIZ FELIPE GABRIEL GOMES \nIMPTE. : ADILSON RAMOS JÚNIOR \nCOATOR : SUPERIOR TRIBUNAL DE JUSTIÇA,"Veja: HC 42967. O HC 80566 foi objeto dos EDHC, rejeitados. Número de páginas: (19). Análise: (CTM). Revisão: (RCO/AAF). Inclusão: 28/08/01, (MLR). Alteração: 08/11/01, (MLR). Alteração: 16/01/2018, GIB.",[],240
225,5e3275f3d0a3cf19aa5ba32c,RE 232331,DJ 14-05-2001 PP-00189 EMENT VOL-02030-04 PP-00860\r\nREPUBLICAÇÃO: DJ 18-05-2001 PP-00087,[],RECTE. : ESTADO DO CEARÁ \nADV. : PGE-CE - GERARDO RODRIGUES DE ALBUQUERQUE FILHO \nRECDOS. : RAIMUNDO EDUARDO DE OLIVEIRA E OUTROS \nADV. : EVANDRO FERREIRA MONTE,"Veja : RE 231234, RE 255408. Número de páginas: (06). Análise: (CRP). Revisão: (RCO/AAF). Inclusão: 04/06/01, (SVF). Alteração: 09/08/01, (SVF). Alteração: 17/01/2018, GIB.",[],193
304,5e32769cd0a3cf19aa5ba37b,AGR AI 238279,DJ 14-05-2001 PP-00189 EMENT VOL-02030-04 PP-00884\r\nREPUBLICAÇÃO: DJ 18-05-2001 PP-00066,[],AGTES. : ANTÔNIO FRANCISCO BERNARDES DE ASSIS E OUTROS \nADVDOS. : MARCO ANTÔNIO BILIBIO CARVALHO E OUTROS \nAGDO. : BANCO CENTRAL DO BRASIL \nADVDOS. : DANIELA ZARZAR PEREIRA DE MELO E OUTRO,"Acórdão citado: RE 234388. Número de páginas: (06). Análise: (MML). Revisão: (RCO/AAF). Inclusão: 03/08/01, (SVF). Alteração: 16/12/01, (SVF). Alteração: 12/01/2018, GIB.",[RE 234388],340
316,5e3276a7d0a3cf19aa5ba387,RE 255639,DJ 14-05-2001 PP-00189 EMENT VOL-02030-05 PP-01010\r\nREPUBLICAÇÃO: DJ 18-05-2001 PP-00088,[],RECTE. : AROLDO GUILHERME SCHATTSCHNEIDER \nADVDOS. : SÍLVIA DOMINGUES SANTOS MANSUR E OUTROS \nRECDO. : MINISTÉRIO PÚBLICO FEDERAL,"Acórdão citado: HC 67759. Número de páginas: (09). Análise: (FCB). Revisão: (COF/AAF). Inclusão: 21/09/01, (MLR). Alteração: 17/01/2018, GIB.",[HC 67759],326
...,...,...,...,...,...,...,...,...
22856,5e332e56d0a3cf34f6749c1b,AGR RCL 2663,DJe-106 DIVULG-20-09-2007 PUBLIC-21-09-2007\r\nDJ 21-09-2007 PP-00024\r\nEMENT VOL-02290-01 PP-00208,[],AGTE.(S) : UNIÃO \nADV.(A/S) : ADVOGADO-GERAL DA UNIÃO \nAGDO.(A/S) : RELATOR DO AI Nº200304010361080 DO TRIBUNAL \n REGIONAL FEDERAL DA 4ª REGIÃO \nINTDO.(A/S) : LUCIANE SANTOS LIMA \nADV.(A/S) : WASHINGTON DIAS DA SILVA,"-Acórdãos citados: ADC 4, Rcl 1459, Rcl 1578, Rcl 2421 AgR, Rcl 2482 (RTJ 195/435), Rcl 2497, Rcl 4383. - Veja REsp 697752 do STJ. Número de páginas: 13 Análise: 08/10/2007, ACL.","[ADC 4, RCL 1459, RCL 1578, AGR RCL 2421, RCL 2482, RCL 2497, RCL 4383, STJ DO RESP VEJA 697752]",2353
23085,5e332fa7d0a3cf34f6749d00,HC 88978,"DJe-106 DIVULG-20-09-2007 PUBLIC-21-09-2007\r\nDJ 21-09-2007 PP-00043 EMENT VOL-02290-02 PP-00262\r\nRTJ VOL-00203-03 PP-01164\r\nRMDPPP v. 4, n. 20, 2007, p. 107-114","[RMDPPP 20/107, RTJ 203/1164]",PACTE.(S) : JAIME PEREIRA SARDINHA \nIMPTE.(S) : GILSOMAR SILVA BARBALHO \nCOATOR(A/S)(ES) : SUPERIOR TRIBUNAL DE JUSTIÇA,"-Acórdãos citados: HC 45553, HC 69958, HC 72992 (RTJ 168/863), HC 81260 (RTJ 181/680), HC 84768 (RTJ 194/298), RHC 88144, HC 89433. Número de páginas: 12 Análise: 04/10/2007, ACL. Revisão: 31/10/2007, RCO.","[HC 45553, HC 69958, HC 72992, HC 81260, HC 84768, RHC 88144, HC 89433]",2637
23102,5e332fbdd0a3cf34f6749d11,AR 1572,"DJe-106 DIVULG-20-09-2007 PUBLIC-21-09-2007\r\nDJ 21-09-2007 PP-00020 EMENT VOL-02290-01 PP-00019\r\nRT v. 97, n. 867, 2008, p. 93-97",[RT 867/93],AUTOR : INSTITUTO NACIONAL DO SEGURO SOCIAL - INSS \nADV. : MARCELO DE SIQUEIRA FREITAS \nRÉUS : ERMELINDA MARINA POMBO DA COSTA MONTEIRO E \n OUTROS \nADV. : JOSÉ MAGALHÃES PIMENTEL,"-Acórdãos citados: AC 1567, AC 1613, AC 1623, AC 1628, AC 1634, AC 1639, AC 1659, AC 1713, RE 89108 (RTJ 101/207), RE 148551, RE 193456 (RTJ 166/640), RE 209900 ED, RE 328812 AgR (RTJ 185/345). Número de páginas: 11 Análise: 04/10/2007, ACL.","[AC 1567, AC 1613, AC 1623, AC 1628, AC 1634, AC 1639, AC 1659, AC 1713, RE 89108, RE 148551, RE 193456, ED RE 209900, AGR RE 328812]",2617
23182,5e333027d0a3cf34f6749d61,HC 91572,DJe-106 DIVULG-20-09-2007 PUBLIC-21-09-2007\r\nDJ 21-09-2007 PP-00025\r\nEMENT VOL-02290-02 PP-00379,[],PACTE.(S) : CHARLES CRUZ DA SILVA \nIMPTE.(S) : ERNO SORVOS \nCOATOR(A/S)(ES) : SUPERIOR TRIBUNAL DE JUSTIÇA,"- Acórdãos citados: HC 84474, HC 87620. Número de páginas: 10 Análise: 08/10/2007, FMN.","[HC 84474, HC 87620]",2704


## [A fazer] Citações que não são capturadas e precisam ser checadas ainda após nova extração

In [21]:
# Encontrar casos em que deveria haver decisões citadas, mas não há por alguma razão
df_after[df_after["observacao"].str.contains("órdão") & ~df_after["observacao"].str.contains("ecis") &
         ~df_after["observacao"].str.contains("[Tt]ribunais") &
         (df_after["citacoesObs"].apply(lambda x: len(x)) == 0)][["acordaoId", "observacao"]]

Unnamed: 0,acordaoId,observacao
69,AGR RE 222874,"Acórdão citado: 201462. Número de páginas: (05). Análise:(DMV). Revisão:(FLO/RCO). Inclusão: 22/08/03, (MLR). Alteração: 04/04/2019, HAC."
317,HC 80587,"Acórdãos citados do STJ : HC 6779, HC 8551, RHC 4569, REsp 130611. Veja: RE 77713, RE 18082. Número de páginas: (22). Análise:(CRP). Revisão:(RCO/AAF). Inclusão: 24/09/01, (SVF). Alteração: 30/01/2018, CLS."
368,MC ADI 2254,"Acórdão citado: (RTJ 100/1003). Número de páginas: (23). Análise:(DMV). Revisão:(FLO). Inclusão: 02/04/04, (SVF). Alteração: 14/04/04, (NT). Alteração: 13/11/2018, CLS."
397,AGR RE 285167,"Acórdãos citados: RE230156. Número de páginas: (06). Análise:(MML). Revisão:(RCO/AAF). Inclusão: 29/05/01, (SVF). Alteração: 16/01/2018, ALS."
685,AGR AI 304365,"Acórdãos citados : RTJ 107/661; RTJ 120/912; RTJ 125/705. Número de páginas: (05). Análise: (MML). Revisão: (COF). Inclusão: 31/07/01, (SVF). Alteração: 29/01/2018, GIB."
...,...,...
86276,AGR ARE 1157575,"- Acórdão(s) citado(s): (OFENSA REFLEXA) RTJ 120/912, RTJ 132/455. Número de páginas: 6. Análise: 22/01/2019, MJC."
86304,AGR HC 141996,"- Acórdão(s) citado(s): (HC, AUSÊNCIA, PERTINÊNCIA, LOCOMOÇÃO FÍSICA, DESCABIMENTO) RTJ 116./523, RTJ 141/159, RTJ 135/593, RTJ 142/896, RTJ 197/587. Número de páginas: 10. Análise: 13/12/2018, BMP."
86375,AGR ARE 1154088,"- Acórdão(s) citado(s): (OFENSA REFLEXA) RTJ 120/912, RTJ 132/455. (RE, REEXAME DE FATO) RTJ 161/992, RTJ 186/703, RTJ 152/612, RTJ 153/1019, RTJ 158/693. Número de páginas: 8. Análise: 23/01/2019, MJC."
86672,AGR ARE 1146806,"- Acórdão(s) citado(s): (RE, REEXAME DE FATO E PROVA) RTJ 161/992, RTJ 186/703, RTJ 152/612, RTJ 153/1019, RTJ 158/693. Número de páginas: 6. Análise: 23/01/2019, MJC."


In [22]:
# def denormalize_id(txt):
#     parts = [s for s in re.split("(\w+\s+)(\w+\s+\d+)", txt) if s.strip() != '']
#     start = parts[-1].strip()
#     rest = " ".join([s.strip() for s in parts[:-1]])
    
#     return start + " " + rest


# df_after["acordaoId_"] = df_after.index.map(lambda x: denormalize_id(x))
# Olhar "HC 86878 AGR"

def remove_uninteresting_citations(txt):
    txt = re.sub(
        r"(Ac[oó]rd[aã]o\(?s?\)?\s*(citado\(?s?\)?)?\s*(de)?\s*\-?\s*outros?\s*tribuna(is|l)|Ac[oó]rd[aã]o\(?s?\)?\s*(citado\(?s?\)?)?\s*(do)?\s*:?\s*(STJ|TST|TSE)|Decis([aã]o|[oõ]es)\s*monocr[aá]ticas?\s*citad[ao]s?|Legisla[cç][aã]o\s*estrangeira\s*citada).*", "", txt, flags=re.IGNORECASE
    )
    return remove_useless_observation_segment(txt)

# Encontrar casos em que deveria haver decisões citadas, mas não há por alguma razão
df_citacoes_com_problemas = df_after[(df_after["observacao"].str.contains("[Cc][Ii][Tt]") | df_after["observacao"].str.contains("órdão")) &
         (df_after["observacao"].apply(lambda x: remove_uninteresting_citations(x) != "")) &
         (df_after["citacoesObs"].apply(lambda x: len(x)) == 0)]
# df_citacoes_com_problemas.to_csv("observacao_sem_citacoes.csv", sep="@")
df_citacoes_com_problemas[["acordaoId", "observacao"]]

# Enviar planilha ao André com algumas sugestões de correções
# mandar também problemas de casamento de parênteses
# df_after[df_after["observacao"].apply(lambda dec: True if re.search(r"\([^\(\)]+\(", remove_uninteresting_citations(dec)) is not None else False) &
#          ~df_after["observacao"].apply(lambda dec: True if re.search(r"\([^\(\)]*\([^\(\)]+\)[^\(\)]+\)|\([^\(\)]+\([^\(\)]+\)[^\(\)]*\)", remove_uninteresting_citations(dec)) is not None else False)
#         ].to_csv("descasamento_de_parenteses.csv", sep="@")
# txt = """Acórdãos citados: RE 101114 (RTJ 108/1369), RE 113149 (RJ 136/774), RE 117788, RE 117907,
#          RE 120117 (RTJ 147/286) RTJ 108/1369, 114/361. Número de páginas: (11). Análise: (MML).
#          Revisão: (CTM/AAF). Inclusão: 07/11/02, (MLR). Alteração: 15/06/2018, GIB."""


Unnamed: 0,acordaoId,observacao
19,AGR RE 356736,"Votação: unânime. Resultado: desprovimento. Acórdãos citados: RTJ-158/327, RTJ-158/934. Decisão monocrática: RE-233929, AI-269131, AI-271425, AI-272123, RE-338927, RE-360269. Número de páginas: (09). Análise:(CEL). Revisão:(RCO). Inclusão: 01/04/04, (SVF). Alteração: 25/10/2018, PDR."
69,AGR RE 222874,"Acórdão citado: 201462. Número de páginas: (05). Análise:(DMV). Revisão:(FLO/RCO). Inclusão: 22/08/03, (MLR). Alteração: 04/04/2019, HAC."
368,MC ADI 2254,"Acórdão citado: (RTJ 100/1003). Número de páginas: (23). Análise:(DMV). Revisão:(FLO). Inclusão: 02/04/04, (SVF). Alteração: 14/04/04, (NT). Alteração: 13/11/2018, CLS."
397,AGR RE 285167,"Acórdãos citados: RE230156. Número de páginas: (06). Análise:(MML). Revisão:(RCO/AAF). Inclusão: 29/05/01, (SVF). Alteração: 16/01/2018, ALS."
685,AGR AI 304365,"Acórdãos citados : RTJ 107/661; RTJ 120/912; RTJ 125/705. Número de páginas: (05). Análise: (MML). Revisão: (COF). Inclusão: 31/07/01, (SVF). Alteração: 29/01/2018, GIB."
...,...,...
86276,AGR ARE 1157575,"- Acórdão(s) citado(s): (OFENSA REFLEXA) RTJ 120/912, RTJ 132/455. Número de páginas: 6. Análise: 22/01/2019, MJC."
86304,AGR HC 141996,"- Acórdão(s) citado(s): (HC, AUSÊNCIA, PERTINÊNCIA, LOCOMOÇÃO FÍSICA, DESCABIMENTO) RTJ 116./523, RTJ 141/159, RTJ 135/593, RTJ 142/896, RTJ 197/587. Número de páginas: 10. Análise: 13/12/2018, BMP."
86375,AGR ARE 1154088,"- Acórdão(s) citado(s): (OFENSA REFLEXA) RTJ 120/912, RTJ 132/455. (RE, REEXAME DE FATO) RTJ 161/992, RTJ 186/703, RTJ 152/612, RTJ 153/1019, RTJ 158/693. Número de páginas: 8. Análise: 23/01/2019, MJC."
86672,AGR ARE 1146806,"- Acórdão(s) citado(s): (RE, REEXAME DE FATO E PROVA) RTJ 161/992, RTJ 186/703, RTJ 152/612, RTJ 153/1019, RTJ 158/693. Número de páginas: 6. Análise: 23/01/2019, MJC."


In [23]:
txt = "Acórdãos citados de outros tribunais: HC 6918, (STJ). Número de páginas: (08). Análise:(CRP). Revisão:(CMM/AAF). Inclusão: 05/12/01, (SVF). Alteração: 06/12/01, (SVF). Alteração: 01/03/2018, JRM."
txt = "Votação: unânime. Resultado: indeferido. Acórdãos citados: STJ: RESP-4889, RESP-27028. Número de páginas: (05). Análise:(JOY). Revisão:(MSA/RCO). Inclusão: 28/10/04, (MLR). Alteração: 24/11/04, (NT). Alteração: 06/09/2019, (PDR)."
# re.search(r"(Acórdãos?\s*(de)?\s*\-?\s*outros\s*tribunais|Acórdão\(?s\)?\*citado\(s?\)?\s*\-?\s*outros\s*tribunais|Acórdãos? citados do STJ|Decisões monocráticas citad[ao]s?|Decisão monocrática citada).*", txt, flags=re.IGNORECASE)

re.sub(r"(Acórdão\(?s?\)?\s*(citado\(?s?\)?)?\s*(do)?\s*:?\s*(STJ|TST)).*", "", txt, flags=re.IGNORECASE)
# re.search(r"(Acórdão\(?s?\)?\s*(citado\(?s?\)?)?\s*(de)?\s*\-?\s*outros?\s*tribuna(is|l))", txt, flags=re.IGNORECASE)

'Votação: unânime. Resultado: indeferido. '

In [24]:
df_citacoes_com_problemas[df_citacoes_com_problemas["observacao"].str.contains("Acórdãos citados competência da Justiça do Trabalho:")]

Unnamed: 0,_id,acordaoId,publicacao,citacoes_revistas,partesTexto,observacao,citacoesObs,index
4411,5e329fccd0a3cf19aa5bb386,EDV RE 146942,DJ 09-08-2002 PP-00085 EMENT VOL-02077-01 PP-00090,[],EMBTE. : UNIVERSIDADE DE SÃO PAULO - USP \nADVDOS. : JOSÉ ALBERTO COUTO MACIEL E OUTROS \nEMBDOS. : LUIZ ROBERTO ALVES E OUTROS \nADVDO. : ANTÔNIO ROBERTO SANDOVAL FILHO,"Acórdãos citados competência da Justiça do Trabalho: RE 141051, RE 141862, RE 143876. Acórdãos citados competência da Justiça comum Estadual: RE 148753, RE 172209. Número de páginas: (11). Análise:(VAS). Revisão:(RCO/AAF). Inclusão: 20/02/03, (SVF). Alteração: 05/06/2018, JRM.",[],4590


In [25]:
# "observacao_lab" é a coluna onde são examinadas regex para melhorar a extração das decisões
def get_stj_tse_mention(txt):
    match = re.search(r"(STJ|TSE)\s*:[^;\.]+", txt)
    return match.group() if match is not None else ""

df_after["observacao_lab"] = df_after["observacao"].apply(lambda x: get_stj_tse_mention(x))

In [26]:
df_after[(df_after["observacao_lab"] == "") & 
         df_after["observacao"].apply(lambda x: True if re.search(r"\((STJ|TSE|TST)\)", remove_useless_observation_segment(x)) else False) #&
        ][["observacao", "observacao_lab"]]#.to_csv("stf_stj_citacoes_dois_pontos.csv", sep="@")

Unnamed: 0,observacao,observacao_lab
91,"Acórdãos citados: HC 17073 (STJ), HC 7731 (STJ). Número de páginas: (5). Análise:(MML). Revisão:(COF/AAF). Inclusão: 08/07/03, (SVF). Alteração: 02/02/06, (SVF). Alteração: 27/08/2018, HAC.",
155,"Acórdãos citados: RE 100397 ED, Rcl 217; RESP 29101 (STJ). Número de páginas: (05). Análise:(MML). Revisão:(AAF). Inclusão: 30/05/03, (SVF). Alteração: 02/06/03, (SVF). Alteração: 05/09/2018, ALS.",
276,"Acórdãos de outros Tribunais: HC 6918, (STJ). Número de páginas: (08). Análise:(CRP). Revisão:(CMM/AAF). Inclusão: 05/12/01, (SVF). Alteração: 06/12/01, (SVF). Alteração: 01/03/2018, JRM.",
814,"Acórdãos citados : RVC 4886, (RTJ-146/49), HC 13772 (STJ). Número de páginas: (13). Análise:(CRP). Revisão:(CMM/AAF). Inclusão: 06/12/01, (SVF). Alteração: 09/03/2018, JLS.",
1473,"Acórdão citado: EARMS 2331 (STJ). Número de páginas: (08). Análise:(FLO). Revisão:(CMM/AAF). Inclusão: 22/02/02, (MLR). Alteração: 04/03/02, (MLR). Alteração: 14/02/2018, ALS.",
1949,"Acórdãos citados: ADI 1751, HC 63373 (RHC 64373) (RTJ 121/96), HC 67039, HC 68348 (RTJ 135/1041), HC 74678, HC 75261 (RTJ 163/759), HC 75338 (RTJ 167/206), HC 75677, HC 78051 (RTJ 170/935), HC 80204 (RTJ 176/816), RHC 80478, HC 80810, RESP 88881, RE 143776; RMS 6735 (STJ). Número de páginas: (76). Análise:(MML). Revisão:(AAF). Inclusão: 07/07/03, (SVF). Alteração: 08/06/04, (NT). Alteração: 04/09/2018, ALS.",
2380,"Acórdão citado: RE 252245, (Reclamação nº 479 (STJ). Número de páginas: (10). Análise:(CRP). Revisão:(RCO/AAF). Inclusão: 07/06/02, (MLR). Alteração: 11/06/02, (MLR). Alteração: 11/04/2018, JRM.",
2450,"Acórdãos citados: AGRRCL 1067 (RTJ 171/751), RCL 1105, RE 201158, AGRAG 202645, AGRAG 213885, em sentido contrário: RE 179276 (RTJ 173/251), RE 196567, RE 223230 (RTJ 172/639), AGMC 1626 (STJ). Número de páginas: (13). Análise:(CMM). Inclusão: 17/04/02, (MLR). Alteração: 19/04/02, (MLR). Alteração: 17/04/2018, JRM.",
2456,"Acórdãos citados: HC 81162, HC 12487 (STJ), RHC 11225 (STJ). Número de páginas: (09). Análise:(MML). Revisão:(RCO). Inclusão: 15/04/02, (MLR). Alteração: 16/04/2018, JRM.",
2889,"Acórdão citado de outro tribunal: INQ-214/DF (STJ). Número de páginas: (07). Análise:(MML). Revisão:(CTM/AAF). Inclusão: 25/06/02, (SVF). Alteração: 27/06/02, (SVF). Alteração: 18/04/2018, ALS.",


In [26]:
txt = "Acórdão citado: RE 252245, (Reclamação nº 479 (STJ). Número de páginas: (10). Análise:(CRP). Revisão:(RCO/AAF). Inclusão: 07/06/02, (MLR). Alteração: 11/06/02, (MLR). Alteração: 11/04/2018, JRM."
get_stj_tse_mention(txt)
re.sub(r"[,;]?[\w\d\s]+\((STJ|TSE|TST)\)", "", txt)

'Acórdão citado: RE 252245, (. Número de páginas: (10). Análise:(CRP). Revisão:(RCO/AAF). Inclusão: 07/06/02, (MLR). Alteração: 11/06/02, (MLR). Alteração: 11/04/2018, JRM.'

In [27]:
df_after[(df_after["observacao_lab"] == "") & 
         df_after["observacao"].apply(lambda x: True if re.search(r"\((STJ|TSE|TST)\)", remove_useless_observation_segment(x)) else False)
        ][["observacao"]].apply(lambda x: re.sub(r"[,;]?[\w\d\s]+\((STJ|TSE|TST)\)", "", x["observacao"]), axis=1)

91                                                                                                                                                                                                                                                                                                     Acórdãos citados:. Número de páginas: (5). Análise:(MML). Revisão:(COF/AAF). Inclusão: 08/07/03, (SVF). Alteração: 02/02/06, (SVF). Alteração: 27/08/2018, HAC.
155                                                                                                                                                                                                                                                                                 Acórdãos citados: RE 100397 ED, Rcl 217. Número de páginas: (05). Análise:(MML). Revisão:(AAF). Inclusão: 30/05/03, (SVF). Alteração: 02/06/03, (SVF). Alteração: 05/09/2018, ALS.
276                                                                                       

In [29]:
txt = "- Veja HC 14411 do STJ. - Veja Processo-crime 656/2000 da Comarca de Belém do São Francisco - PE. Número de páginas: 7. Análise: 22/09/2010, KBP. Revisão: 23/09/2010, IMC."

txt = re.sub(
    r"(^Veja[^\.]*\.)?(.*)\-?\s*Veja.*", r"\2", txt, flags=re.IGNORECASE
)

re.match(
    r"(^Veja[^\.]*\.)?(.*)\-?\s*Veja.*", txt, flags=re.IGNORECASE
)
veja_pattern = r"(^Veja[^\.]*\.)?(.*)\-?\s*Veja.*"

while re.match(veja_pattern, txt, flags=re.IGNORECASE):
    txt = re.sub(
        veja_pattern, r"\2", txt, flags=re.IGNORECASE
    )
txt

'- '

In [29]:
magazines_list = ["MAG-CD", "MAG-DVD", "RGJ-CD", "JTARS", "BIBJURID-DVD",
                  "JCSTF", "JPSTF", "JPO-DVD", "JBCC", "JBC", "JBT",
                  "JC", "JTJ", "JTJ-CD", "JURISonline-INT",
                  "JurisSíntese-DVD", "JurisSíntese-INT", "LEXJTACSP",
                  "LEXSTF", "LEXSTF-CD", "MAG-INT", "NRDF",
                  "PLENUMonline-INT", "REPIOB", "RADCOAST", "RB", "RCJ",
                  "RDA", "RDC", "RDP", "RDTAPET", "RDJTJDFT", "RDJ", "RET",
                  "RJDTACSP", "RJADCOAS", "RJTJRS", "RJTJRS-INT",
                  "RDECTRAB", "RDDP", "RDDT", "RMP", "RT", "RF", "RIP",
                  "RIOBTP", "RJTS", "RJSP", "RJMG", "RJP", "RJP-CD",
                  "REVJMG", "REVJMG-INT", "RLTR", "RMDPPP", "RNDJ",
                  "RPTGJ", "RSJADV", "RST", "RSTP", "RTFP", "RTJ",
                  "RTJE", "SINTESE-INT", "COAD-INT"
                 ]
max_mag_size = max([len(mag) for mag in magazines_list])
for mag in magazines_list:
    dec_cit_size = sum(df_after["observacao"].apply(lambda x: 0 if re.search("(\s+|\()" + mag + "[^\w]+", x) is None else 1))
    dec_cit_count = sum(df_after["observacao"].apply(lambda x: len(re.findall("[^\w]+(" + mag + "\-?[\s\d]+\/\d+)", x))))
    if (dec_cit_size > 0):
        print(mag + " " * (max_mag_size - len(mag)), dec_cit_size, " " * (4 - len(str(dec_cit_size))), dec_cit_count)
        
# + Identificar citações de revistas
# + Ver como é feita a citação da revista na 'observação' comparando em como ela é citada em 'publicação'
# padrão de citação: "[^\w]+(\w+\-?[\s\d]+\/\d+)"

# Buscar citações em publicações para traduzir para acordaoId
# Usar casos exemplo para testar extração de decisões


# Pegar uma amostra de citações de revista que não encontraram decisões e descobrir
# se realmente as decisões não foram extraídas.

JTJ              13    9
LEXSTF           18    28
RDA              121   209
RDC              511   0
RDP              4     3
RDJ              1     1
RJDTACSP         1     1
RDDT             1     2
RT               675   2292
RF               181   335
RJSP             3     3
RMDPPP           1     1
RTJ              10573  32265


In [30]:
# REMOÇÃO DE CONTEÚDO ENTRE PARÊNTESES
txt = """- Acórdão(s) citado(s): (EMBARGOS INFRINGENTES, AÇÃO PENAL ORIGINÁRIA) HC 72465 (1ªT).
         (DUPLO GRAU DE JURISDIÇÃO, EXCEÇÕES) AP 470 (TP).
         (EMBARGOS INFRINGENTES, AÇÃO PENAL ORIGINÁRIA, TRIBUNAL INFERIOR) HC 71124 (1ªT), HC 71949 (1ªT),
         HC 71951 (1ªT), HC 72465 (1ªT), RHC 53947 (2ªT).
         (EMBARGOS INFRINGENTES, AÇÃO DE CONTROLE CONCENTRADO DE CONSTITUCIONALIDADE) ADI 1591 (1ªT),
         ADI 1289 EI (TP). (EMBARGOS INFRINGENTES, AÇÃO RESCISÓRIA, ÂMBITO, STF) AR 1472 EI-AgR (TP),
         AR 1178 EI-QO (TP). (EMBARGOS INFRINGENTES, AUSÊNCIA, QUÓRUM MÍNIMO) AO 1046 ED (TP).
         (EMBARGOS INFRINGENTES, CABIMENTO, HIPÓTESE) ADI 171 EI, ADI 1591 EI (TP), HC 88247 AgR-AgR (TP),
         HC 72664 EI-AgR (2ªT), RE 172004 EI-AgR (2ªT), AI 617763 AgR-ED-AgR-ED (2ªT), AI 828792 AgR-EI (1ªT),
         ADI 29 EI (TP), RCL 377 EI-AGR (TP). (DUPLO GRAU DE JURISDIÇÃO, CONVENÇÃO AMERICANA DE DIREITOS HUMANOS)
         RHC 79785 (TP). (REGIMENTO INTERNO, ALCANCE, PODER NORMATIVO) ADI 1105 (TP), ADI 2580 (TP), ADI 2970 (TP),
         MS 28447 (TP), ADI 1503 (TP), ADI 1152(TP).
         (RECEPÇÃO, CONSTITUIÇÃO FEDERAL DE 1988, REGIMENTO INTERNO DO STF, FORÇA DE LEI) AI 148475 AgR (1ªT),
         SL 32 AgR (TP), RE 146747 EDv-AgR (TP), Pet 2961 QO (2ªT), RE 433592 AgR-ED-EDv-AgR (TP), RCL 377 EI-AGR,
         SS 260 QO (TP), RTJ 190/1084, RTJ 147/1010, RTJ 151/278. (REGIMENTO INTERNO DO STF, REVOGAÇÃO TÁCITA)
         RE 220286 EDv-AgR (TP), RE 146747 EDv-AgR (TP), MS 1637 EI (TP) .
         (APLICAÇÃO, NORMA MAIS FAVORÁVEL, TRATADO INTERNACIONAL, DIREITOS HUMANOS) HC 96772 (2ªT), HC 90450 (2ªT).
         (EMBARGOS INFRINGENTES, VALIDADE, NORMA, REGIMENTO INTERNO) HC 71124 (1ªT), ADI 171 EI, ADI 29 EI-AGR (TP).
         (AGRAVO REGIMENTAL, INDEFERIMENTO LIMINAR, MS) Rp 1299 - RTJ 119/980, MS 23466 AgR (2ªT).
         (RECEPÇÃO, CONSTITUIÇÃO FEDERAL DE 1988, EMBARGOS INFRINGENTES, REGIMENTO INTERNO DO STF) SS 327,
         SL 32 AgR (TP), RE 140829 EDv-ED (TP), AP 409 EI, RCL 377 EI-AGR, SS 260 QO (TP).
         (COMPETÊNCIA, STF, DISPOSIÇÃO, MATÉRIA PROCESSUAL, ÂMBITO, CONSTITUIÇÃO FEDERAL DE 1967) AP 409 EI,
         RP 700 EI-AGR (TP), RTJ 54/183, RTJ 69/138. (SUPRALEGALIDADE, TRATADO INTERNACIONAL, DIREITOS HUMANOS)
         RE 349703 (TP). (PRISÃO PREVENTIVA, CLAMOR PÚBLICO) RTJ 112/1115, RTJ 172/159, RTJ 180/262, RTJ 187/933,
         RTJ 193/1050. (RECLAMAÇÃO, PRINCÍPIO DA RESERVA ABSOLUTA DE LEI FORMAL) RP 1092 - RTJ 112/540.
         (RECEPÇÃO, CONSTITUIÇÃO FEDERAL, EFEITO, LEIS ANTERIORES) RTJ 71/289, RTJ 77/657.
         - Decisões monocráticas citadas: (EMBARGOS INFRINGENTES, CABIMENTO, HIPÓTESE) HC 83678 AgR, HC 92303 EI,
         RHC 97473 EI, HC 104075 ED. (EMBARGOS INFRINGENTES, NORMA, VALIDADE) AP 409 EI.
         - Acórdão(s) citado(s) - outros tribunais: STJ: Agravo Regimental nos Embargos de Divergência em Agravo
         1.321.228. (EMBARGOS INFRINGENTES, AÇÃO PENAL ORIGINÁRIA, TRIBUNAL INFERIOR) RT 571/295.
         Sentença n. 51 de 1985 do Reinado da Espanha.
         - Legislação estrangeira citada: art. 130 da Constituição de Portugal de 1822, art. 24 e art. 102,
         n. 1, da Constituição da Espanha de 1812, arts. 68 e 68.1 da Constituição da França, art. 134 da Constituição
         da Italia, arts. 103 e 125 da Constituição da Bélgica, art. 32, 3 da Constituição da Suíça, art.
         200 da Constituição da Venezuela, art. 99 e 100 da Constituição do Perú, arts. art. 29, 174, 175, 186,
         199 e art 234 da Constituição da Colômbia de 1991, art. 57, 2º da Lei Orgânica do Poder Judiciário
         (Lei n. 6, de 1º de julho de 1985) da Espanha. - Decisões estrangeiras citadas: Sentença 51 de 1985 e
         Sentença n. 66 de 2001 do Tribunal Constitucional espanhol, Sentença C-142 de 1993, Sentença C-650 de 2001,
         Sentença C-934 de 2006 e C-545 de 2008 da Corte Constitucional Colômbiana, § 74 e § 90 do trecho da Sentença
         da Corte Interamericana de Direitos Humanos no Caso Barreto Leiva contra Venezuela. - Veja AP 470 do STF.
         Número de páginas: 277. Análise: 09/04/2014, RAF. Revisão: 17/07/2014, JOS."""

# Ver casos em que parênteses não casam
# \([^\(]+\) # casa
# \([^\(\)]+\( # não casa

In [58]:

# dec = "Acórdãos citados: AI-199935-AgR, AI-214562-AgR; RTJ-144/948, RTJ-165/681- 682. Número de páginas: (07). Análise:(NAL). Inclusão: 31/08/05, (SVF)."
# df_after[df_after["observacao"].apply(lambda dec: True if re.search(r"\([^\(\)]+\(", remove_uninteresting_citations(dec)) is not None else False) &
#          ~df_after["observacao"].apply(lambda dec: True if re.search(r"\([^\(\)]*\([^\(\)]+\)[^\(\)]+\)|\([^\(\)]+\([^\(\)]+\)[^\(\)]*\)", remove_uninteresting_citations(dec)) is not None else False)
#         ]#.to_csv("descasamento_de_parenteses.csv", sep="@")
# Análise realizada e foram feitas leves modificações para lidar com isso

# check decisions ids between parenthesis
# df_after[df_after["observacao"].apply(lambda dec:
#                                       True if re.search(r"\([^\(\w]*(\w{2,}[\s-]+\d+\s*\w*[^\)\/\d]*)\)",
#                                                         remove_uninteresting_citations(dec)) is not None else False) &
#          ~df_after["observacao"].apply(lambda dec:
#                                       True if re.search(r"\((\w{2,}[\s-]+\d+\s*\w*)\)",
#                                                         remove_uninteresting_citations(dec)) is not None else False)
#         ].to_csv("decision_ids_between_parenthesis.csv", sep="@")
# INFORMAR RESULTADO DAS OBSERVAÇÕES
# Nada a aproveitar. Pode descartar tudo.

In [30]:
txt = """- Acórdão(s) citado(s): (RECLAMAÇÃO, CONTRUÇÃO PRETORIANA) STF: RTJ 112/504. (RECLAMAÇÃO, GARANTIA DA
         AUTORIDADE, STF) STF: Rcl 1722 (TP), Rcl 2143 AgR (TP), Rcl 2256 (TP), Rcl 935 (TP); RTJ 149/354. (RECLAMAÇÃO,
         GARANTIA DA AUTORIDADE, MEDIDA CAUTELAR, CONTROLE ABSTRATO STF: Rcl 1723 AgR-QO (TP), Rcl 2256 (TP);
         RTJ 157/433 (MEDIDA CAUTELAR, AÇÃO DIRETA DE INCONSTITUCIONALIDADE, EFICÁCIA EX NUNC) STF: RTJ 124/80.
         (MEDIDA CAUTELAR, AÇÃO DIRETA DE INCONSTITUCIONALIDADE, EFICÁCIA EX TUNC, EXCEPCIONALIDADE) STF:
         ADI 2381 MC-ED; RTJ 138/86. - Veja ADI 2381 MC e ADI 2737 do STF e Agravo Regimental em Suspensão de Liminar 70006089866 do TJRS e Mandado de Segurança 005/1.03.0001168-6 da 3ª Vara Cível Comarca de Bento Gonçalves.
         Número de páginas: 32. Análise: 26/02/2013, SEV. Revisão: 03/04/2013, AAT."""
veja_pattern = r"(^Veja[^\.]*\.)?(.*)\-?\s*Veja.*"
# re.search(veja_pattern, txt, flags=re.IGNORECASE)
# re.sub(
#         veja_pattern, r"\2", txt, flags=re.IGNORECASE
#     )
while re.search(veja_pattern, txt, flags=re.IGNORECASE):
    txt = re.sub(
        veja_pattern, r"\2", txt, flags=re.IGNORECASE
    )
txt

'- Acórdão(s) citado(s): (RECLAMAÇÃO, CONTRUÇÃO PRETORIANA) STF: RTJ 112/504. (RECLAMAÇÃO, GARANTIA DA\n         AUTORIDADE, STF) STF: Rcl 1722 (TP), Rcl 2143 AgR (TP), Rcl 2256 (TP), Rcl 935 (TP); RTJ 149/354. (RECLAMAÇÃO,\n         GARANTIA DA AUTORIDADE, MEDIDA CAUTELAR, CONTROLE ABSTRATO STF: Rcl 1723 AgR-QO (TP), Rcl 2256 (TP);\n         RTJ 157/433 (MEDIDA CAUTELAR, AÇÃO DIRETA DE INCONSTITUCIONALIDADE, EFICÁCIA EX NUNC) STF: RTJ 124/80.\n         (MEDIDA CAUTELAR, AÇÃO DIRETA DE INCONSTITUCIONALIDADE, EFICÁCIA EX TUNC, EXCEPCIONALIDADE) STF:\n         ADI 2381 MC-ED; RTJ 138/86. - \n         Número de páginas: 32. Análise: 26/02/2013, SEV. Revisão: 03/04/2013, AAT.'

In [331]:
# Buscar citações em publicações para traduzir para acordaoId

# ENCONTRAR CITAÇÃO QUE EXISTE EM OBSERVACAO E CITACOES_REVISTAS
# cit_magazine = "RTJ 168/863"
found_acordao_id = lambda cit_magazine_lst, cit_magazine: True if cit_magazine in cit_magazine_lst else False
# for index, row in df_after.iterrows():
# COMMON CASE of decision ids
txt = """- Acórdão(s) citado(s): (CONTRADITÓRIO, AMPLA DEFESA, COISA JULGADA, DEVIDO PROCESSO LEGAL)
         ARE 748371 RG . (RECEITAS TRIBUTÁRIAS, PARTICIPAÇÃO DOS MUNICÍPIOS, EXCLUSÃO, REDUÇÃO, SUPRESSÃO)
         RE 572762 RG , RTJ 82/200, RTJ 85/712, RTJ 86/722, RTJ 89/233, RTJ 516/223.
         (HONORÁRIOS ADVOCATÍCIOS, MAJORAÇÃO) AO 2063 AgR (TP). Número de páginas: 13. Análise: 09/01/2020, BMP."""
# CASE WHICH MAGAZINE CODES ARE REMOVED between parenthesis
txt = """Acórdãos citados: MI 211 (RTJ 157/411, JUA-1771/1918), MI 263 (RTJ 157/22), MI 274 AgR (RTJ 152/357),
         MS 21521 (RTJ 150/119), RE 140863, RE 161224, RE 179646, AI 221703 AgR.
         Número de páginas: (4). Análise:(CEL). Revisão:(FLO). Inclusão: 01/08/03, (SVF).
         Alteração: 05/12/03, (SVF). Alteração: 03/09/2018, JLS."""
# MAGAZINE CODES THAT SHOUD BE REMOVED
txt = """- Acórdãos citados: ADI 596 MC - Tribunal Pleno, ADI 939, ADI 1610 MC - Tribunal Pleno,
         ADI 2105 MC - Tribunal Pleno, ADI 2661 MC - Tribunal Pleno, RE 18331, RE 204769,
         AI 725227 AgR; TRF 4ª Região: 2007.71.08.012143-2; RTJ 87/374, RTJ 144/435,
         RTJ 167/661; RF 145/164; RDA 34/132. - Decisão monocrática citada: RE 428354.
         - Veja Informativo 125 do STF (Pet 1466) e Exposição Interministerial 84 do Ministério da Fazenda
         e da Casa Civil. - Decisões estrangeiras citadas: Caso McCulloch v. Maryland, de 1819 e
         Caso Panhandle Oil Co. v. State of Mississippi Ex Rel. Knox (277 U.S. 218), julgado em 1928,
         ambos da Suprema Corte do Estados Unidos da América Número de páginas: 44.
         Análise: 28/03/2012, MMR. Revisão: 20/04/2012, SEV."""
# DECISÕES SEGUIDAS DE CITAÇÕES DE REVISTA APÓS '-' (EQUIVALENTE A PARÊNTESES)
txt = """- Acórdão(s) citado(s): (HC, REEXAME, FATO, PROVA) HC 65887 , HC 66381 , HC 68610 (1ªT) - RTJ 136/1221,
         HC 69780 (1ªT) - RTJ 195/486, HC 70763 (1ªT) - RTJ 165/877, HC 72496 (1ªT) - RTJ 186/237,
         HC 72992 (1ªT) - RTJ 168/863, HC 73449 (1ªT) - RTJ 163/650, HC 96820 (1ªT), RHC 99388 (2ªT),
         HC 100067 (1ªT), HC 112507 (2ªT), RHC 131136 AgR (2ªT), HC 60555 (1ªT) - RTJ 110/555,
         HC 67349 (1ªT) - RTJ 129/1199, RHC 63806 (1ªT) - RTJ 137/198. (FUNDAMENTAÇÃO, DECISÃO JUDICIAL)
         RE 140370 (1ªT) - RTJ 150/269, AI 152586 AgR , RE 327143 AgR (2ªT), AI 529105 AgR (2ªT),
         AI 637301 AgR (1ªT), AI 731527 AgR (2ªT), AI 791292 QO-RG , AI 838209 AgR (2ªT), AI 842316 AgR (1ªT),
         AI 840788 AgR (1ªT), RTJ 170/627. (HC, SUPRESSÃO DE INSTÂNCIA) HC 73390 (2ªT), HC 79551 (1ªT),
         HC 80747 (1ªT) - RTJ 182/243, HC 81115 (1ªT), HC 83842 (2ªT) - RTJ 192/233, HC 97761 (2ªT).
         (ALEGAÇÃO, NULIDADE, PRECLUSÃO) HC 53508 (1ªT) - RTJ 76/435, HC 72454 (1ªT), HC 74339 (1ªT),
         HC 58994 (1ªT) - RTJ 104/540, RT 451/490. (HC, SUCEDÂNEO, REVISÃO CRIMINAL) HC 70457 ,
         HC 98206 (1ªT), HC 98412 (2ªT), RHC 116674 (2ªT), HC 122753 AgR (2ªT), RHC 130270 (1ªT),
         RHC 128723 AgR (1ªT), RHC 133200 (2ªT), HC 134974 (2ªT), HC 123182 AgR (1ªT), HC 134976 AgR (1ªT),
         HC 137059 AgR (2ªT). - Acórdão(s) citado(s) - outros tribunais: STJ: HC 130146, RHC 68917 EDcl-AgRg.
         Número de páginas: 20. Análise: 11/09/2019, JRS."""
# sequência mal formada de decisões citadas
txt = """Acórdãos citados: RE 101114 (RTJ 108/1369), RE 113149 (RJ 136/774), RE 117788, RE 117907,
         RE 120117 (RTJ 147/286) RTJ 108/1369, 114/361. Número de páginas: (11). Análise: (MML).
         Revisão: (CTM/AAF). Inclusão: 07/11/02, (MLR). Alteração: 15/06/2018, GIB."""
# manter acordao Id entre parênteses e remover citação à revista
txt = """- Acórdão(s) citado(s): (PRINCÍPIO DO JUIZ NATURAL) TJ 169/557 (HC 73801), RTJ 179/378 (HC 79865).
         (EXTRADIÇÃO, DUPLA TIPICIDADE) Ext 977 (TP). (PRINCÍPIO DA CONTENCIOSIDADE LIMITADA)
         Ext 669 (TP) - RTJ 161/409. (PRISÃO PREVENTIVA PARA EXTRADIÇÃO) HC 81127 (TP), Ext 1313 (1ªT).
         - Legislação estrangeira citada: Código Penal Uruguaio. Número de páginas: 10. Análise: 13/06/2017, JSF."""
# Parênteses descasados
txt = """- Acórdão(s) citado(s): (MOTIVAÇÃO "PER RELATIONEM") (HC 69438 (1ªT) , HC 69987 (TP), HC 54513 (2ªT),
         RE 37879 (TP), RE 49074 (1ªT). Número de páginas: 9. Análise: 20/02/2013, MAC."""
# Dois níveis de parênteses
txt = """- Acórdão(s) citado(s): (SUPREMO TRIBUNAL FEDERAL (STF), COMPETÊNCIA ORIGINÁRIA, HABEAS CORPUS,
         TURMA RECURSAL DOS JUIZADOS ESPECIAIS CÍVEIS E CRIMINAIS) HC 71713 (TP), HC 77647 (1ªT), HC 81340 (2ªT);
         RTJ 168/222, RTJ 175/279, RTJ 177/784. (PENA PRIVATIVA DE LIBERDADE, SUBSTITUIÇÃO, PENA DE MULTA)
         HC 66887 (1ªT); RTJ 125/548, RTJ 143/199. (PENA PRIVATIVA DE LIBERDADE, SUBSTITUIÇÃO,
         PENA RESTRITIVA DE DIREITO) RTJ 159/132. - Decisão monocrática citada: (SUPREMO TRIBUNAL FEDERAL (STF),
         COMPETÊNCIA ORIGINÁRIA, HABEAS CORPUS, TURMA RECURSAL DOS JUIZADOS ESPECIAIS CÍVEIS E CRIMINAIS)
         HC 81228 MC. - Veja Recurso 2001.700.007575-4 do Conselho Recursal e Proceso crime 17461-2/00 do
         Juizado Especial Criminal da Comarca do Rio de Janeiro/RJ. Número de páginas: 15. Análise: 12/03/2013,
         IMC. Revisão: 11/04/2013, MMR."""
# Decisão do STF após sequência de texto mal cercada de parênteses
txt = """- Acórdão(s) citado(s): (RECLAMAÇÃO, CONTRUÇÃO PRETORIANA) STF: RTJ 112/504. (RECLAMAÇÃO, GARANTIA DA
         AUTORIDADE, STF) STF: Rcl 1722 (TP), Rcl 2143 AgR (TP), Rcl 2256 (TP), Rcl 935 (TP); RTJ 149/354. (RECLAMAÇÃO,
         GARANTIA DA AUTORIDADE, MEDIDA CAUTELAR, CONTROLE ABSTRATO STF: Rcl 1723 AgR-QO (TP), Rcl 2256 (TP);
         RTJ 157/433 (MEDIDA CAUTELAR, AÇÃO DIRETA DE INCONSTITUCIONALIDADE, EFICÁCIA EX NUNC) STF: RTJ 124/80.
         (MEDIDA CAUTELAR, AÇÃO DIRETA DE INCONSTITUCIONALIDADE, EFICÁCIA EX TUNC, EXCEPCIONALIDADE) STF:
         ADI 2381 MC-ED; RTJ 138/86. - Veja ADI 2381 MC e ADI 2737 do STF e Agravo Regimental em Suspensão de Liminar 70006089866 do TJRS e Mandado de Segurança 005/1.03.0001168-6 da 3ª Vara Cível Comarca de Bento Gonçalves.
         Número de páginas: 32. Análise: 26/02/2013, SEV. Revisão: 03/04/2013, AAT."""
# Outro exemplo de sequência mal cercada de parênteses
txt = """- Acórdão(s) citado(s): (EDITAL, "LEI DO CONCURSO PÚBLICO") RE 526600 AgR (1ªT), RE 440335 AgR (2ªT).
         (CNJ, ATUAÇÃO ADMINISTRATIVA, CONCURSO PÚBLICO) MS 26284 (TP), MS 27160 (TP), MS 26163 (TP).
         (CONCURSO PÚBLICO, QUESTÃO IMPUGNADA, CLASSIFICAÇÃO, DIREITO ADQUIRIDO) RMS 21255 (TP).
         (ANULAÇÃO, CONCURSO PÚBLICO ENCERRADO, INTIMAÇÃO, INTERESSADO MS 25962 (TP). (ANULAÇÃO, APOSENTADORIA,
         INTIMAÇÃO, INTERESSADO) MS 24268 (TP), MS 25116 (TP). (SERVIDOR, NOMEAÇÃO, FORA DO PRAZO DE VALIDADE,
         CONCURSO PÚBLICO, INTIMAÇÃO, INTERESSADO) MS 27154 (TP). (PROCESSO JUDICIAL, ESGOTAMENTO, VIA ADMINISTRATIVA)
         RE 233582 (TP). (PRESUNÇÃO, CIÊNCIA, ATO REVOGATÓRIO) MS 22938 (TP), MS 24927 (TP), MS 24742 (TP).
         - Veja MS 28594, MS 28651 e MS 28666 do STF. Número de páginas: 76. Análise: 02/08/2013, SEV."""
# Outro caso de parênteses descasados
txt = """Acórdãos citados: ADI 766 MC (157/460), ADI 864, ADI 151/416), ADI 139 (RTJ 138/14), ADI 182 (RTJ 133/1037),
         ADI 234 (RTJ 167/363), ADI 430 (RTJ 159/735). Número de páginas: (09). Análise:(MML). Revisão:(CTM/AAF).
         Inclusão: 07/11/02, (MLR). Alteração: 11/11/02, (MLR). Alteração: 28/05/2018, ALS."""
# outro caso de parênteses descasados (2)
txt = """- Acórdão(s) citado(s): (SÚMULA 343) RE 328812 (TP), RE 564781 AgR (2ªT), RE 500043 AgR 12ªT);
         - Decisões monocráticas citadas: (SÚMULA 343) RE 569140, RE 579740, RE 262589. Número de páginas: 23.
         Análise: 21/02/2013, MJC."""
# Padrão de citação de decisão monocrática mal formado
txt = """Votação: unânime. Resultado: desprovido. Acórdão citado: AI-345003-AgR-ED Decisão monocrática citada: AI-145153.
         Número de páginas: (08). Análise:(RDC). Revisão:(). Inclusão: 25/01/05, (CSM)."""
# problema com extração de padrão após 'Obs.'
txt = """Acórdãos citados: RHC 53192, HC 62786, RHC 63601 (RTJ 118/484), HC 70607, RHC 71354 (RTJ 156/562),
         HC 72277, HC 73545, HC 74106, HC 75385, HC 77583, HC 79750, HC 80096, HC 80379, RHC 81522, HC 81534;
         RTJ 63/410, RTJ 138/829; RTJ 141/816, RTJ 142/855.
         Obs.: - Art. 7, nº 5 da Convenção Americana sobre Direitos Humanos. Número de páginas: (23).
         Análise:(DMV). Revisão:(FLO/RCO). Inclusão: 19/02/04, (MLR). Alteração: 03/01/06, (MLR).
         Alteração: 06/11/2018, CLS."""
# interrupção de extração de decisões após começarem a aparecer decisões do STJ
txt = """Acórdão citado: STJ - REsp 431760. Número de páginas: 20 Análise: 05/09/2007, ACL. Revisão: 28/09/2007, RCO."""
# Citações de revistas
txt = """- Acórdãos citados: AC 471 AgR (RTJ 192/778), AC 491 AgR (RTJ 192/411), AC 510 AgR, AC 865 AgR, AC 1317 MC-ED,
         Pet 1859 AgR (RTJ 174/437), Pet 2835 QO (RTJ 191/483), Pet 2961 QO (RTJ 191/123), RE 407099; RTJ 174/437,
         RTJ 191/123, RTJ 191/483. - Decisão monocrática citada: AC 1449.
         - Veja Apelação Cível n° 100.015.2005.001342-9. Número de páginas: 22. Análise: 04/06/2007, AAC."""

# Pegar uma amostra de citações de revista que não encontraram decisões e descobrir
# se realmente as decisões não foram extraídas.

# NOVO PADRÃO DE CITAÇÃO: RTJ-170/627-628 (o código depois do '-' no final significa o quê? Faz diferença?)
# > aparentemente não faz diferença

# súmulas não são decisões de fato (devem ser ignoradas)
# Olhar conclusões sobre padrões problemáticos e avaliar se vale a pena cuidar deles

quotes = []
txt = re.sub(r"art\.", "art", txt, flags=re.IGNORECASE)
txt = re.sub("(STF:|\-?\s*(t|p)\w*\s*pleno|CASO\s+LÍDER)", "", txt, flags=re.IGNORECASE)
# Verificar se é usado o padrão que remove o máximo possível de caracteres após modificar o padrão aqui
# Em alguns espelhos o padrão que aparece no final acaba aparecendo no começo.
# Então não é possível remover todo o texto que vem depois.
txt = re.sub(
    r"((Número\s*de\s*p[aá]ginas|Altera[aç][aã]o|Revis[aã]o|Inclus[aã]o|An[aá]lise|Obs\.|Vota[cç][aã]o|Resultado):)[^\.]*\.", "", txt, flags=re.IGNORECASE
)
# Além disso, uma decisão específica começa com a string “Veja” Será feita uma exceção para este caso.    
veja_pattern = r"(^Veja[^\.]*\.)?(.*)\-?\s*Veja.*"
while re.search(veja_pattern, txt, flags=re.IGNORECASE):
    txt = re.sub(
        veja_pattern, r"\2", txt, flags=re.IGNORECASE
    )
# Remoção de decisões pertencentes ao STJ ou ao TSE - este padrão pode ser usado para remover tudo que vem depois,
# TESTAR ISSO DEPOIS

# ver posteriormente que tipo de informação é inserida entre '()' nas citações
txt = re.sub(r"(STJ|TSE|TRE|TST|TRF\s*\-?[\s\w]*)\s*:.+[;\.]\s*", "", txt)

search_pattern = (
    "[Aa]c[óo]rd[ãa]o\s*\(?\s*s?\s*\)?\s+[Cc]itado\s*\(?\s*s?\s*\)?\s*[:;,]\s*(\.(?!\s)*|[^:]*)?"
)
#     Acórdão seguido eventualmente de espaços, seguido eventualmente de (s) com eventuais espaços dentro,
#     seguido de espaços, seguido de Citado, seguido eventualmente de espaços, seguido eventualmente de (s)
#     com eventuais espaços dentro seguido de eventuais espaços e eventualmente ':', seguido de caracteres
#     que não sejam ':'. A última sequência (caracteres que não sejam ':') é que o que seve ser capturado.
dec = re.search((search_pattern), txt, flags=re.IGNORECASE)

if dec:
    dec = dec.group(1)
    dec = re.sub(r"[Dd]ecis(?:ão|ões)\s*monocráticas?\s*citada\s*\(?\s*s?\s*\)?\s*", "", dec, flags=re.IGNORECASE)
    print(dec) #######################################
    if (len(dec) > 2) and (dec[-2] == "."):
        dec = dec[:-2]

    dec = re.sub(r"(\d+)\.(\d+)", r"\1\2", dec)
    dec = re.sub(r"[,;]?[\w\d\s\.\/\-]+\((STJ|TSE|TST|TRE|TRF\s*\-?[\s\w]*)\)", "", dec)
    # remover menções a revistas entre parênteses porque isso significa que o próprio
    # id do acórdão citado já é referenciado
    dec = re.sub("\(([A-Z]+\-?[\s\d]+\/\d+\-?\d*,?\s*)+\)", ",", dec)
    dec = re.sub("\-\s*[A-Z]+\-?[\s\d]+\/\d+\-?\d*", ",", dec)
    # manter citação à decisão e não à revista como no exemplo: 'TJ 169/557 (HC 73801)'
    dec = re.sub(r"(\w+\-?[\s\d]+\/\d+\-?\d*)\s+\(([^\d]{2,}[\s-]+\d+[^\d\)]*)\)", r"\2,", dec)

    print(dec) #######################################
    # REMOVER CONTEÚDO ENTRE PARÊNTESES AQUI
    while re.search(r"\([^\(\)]+\)", dec):
        dec = re.sub(r"\([^\(\)]+\)", ",", dec)
    print(dec) #######################################

    # VER O EFEITO DO SPLIT NO PARÊNTESES PARA ENTENDER QUE PADRÃO É EXTRAÍDO          
    dec = re.split("[;,.()]", dec)
    for q in dec:
        q = q.strip()
        print(q) #######################################
        if re.search(r"embargos?\sde|(de|em)\sembargos?|RISTF|ESTRANGEIRA|(\-\s*STJ|\s+STJ|STJ\s+\-|TRF)", q, flags=re.IGNORECASE):
            break

        acordaoId_pattern = "([^\d\s]{2,}[\s-]+\d+[^\d\/]*)$"
        m = re.search(acordaoId_pattern, q)
        print(q, m) #######################################
        if m is None:
            n = re.search("([A-Z]+)\-?\s*(\d+\/\d+)", q)
            print("m is none", n) #######################################
            if (n is not None) and (not q.startswith("-")):
                n = " ".join(n.groups())
                print(n, n in revistas_to_acordao_id_dict) #######################################
                if n in revistas_to_acordao_id_dict:
                    quotes.append(revistas_to_acordao_id_dict[n])
                else:
                    quotes.append(n)
        while m:
            m = m.group()
            q = q.replace(m, "")
            m = m.replace("-", " ")
            m = m.strip().upper()
            m = " ".join(m.split())
            m = normalizeId(m)
            quotes.append(m)
            m = re.search(acordaoId_pattern, q)
sorted(set(quotes))

AC 471 AgR (RTJ 192/778), AC 491 AgR (RTJ 192/411), AC 510 AgR, AC 865 AgR, AC 1317 MC-ED,
         Pet 1859 AgR (RTJ 174/437), Pet 2835 QO (RTJ 191/483), Pet 2961 QO (RTJ 191/123), RE 407099; RTJ 174/437,
         RTJ 191/123, RTJ 191/483. - 
AC 471 AgR ,, AC 491 AgR ,, AC 510 AgR, AC 865 AgR, AC 1317 MC-ED,
         Pet 1859 AgR ,, Pet 2835 QO ,, Pet 2961 QO ,, RE 407099; RTJ 174/437,
         RTJ 191/123, RTJ 191/483. - 
AC 471 AgR ,, AC 491 AgR ,, AC 510 AgR, AC 865 AgR, AC 1317 MC-ED,
         Pet 1859 AgR ,, Pet 2835 QO ,, Pet 2961 QO ,, RE 407099; RTJ 174/437,
         RTJ 191/123, RTJ 191/483. - 
AC 471 AgR
AC 471 AgR <_sre.SRE_Match object; span=(0, 10), match='AC 471 AgR'>

 None
m is none None
AC 491 AgR
AC 491 AgR <_sre.SRE_Match object; span=(0, 10), match='AC 491 AgR'>

 None
m is none None
AC 510 AgR
AC 510 AgR <_sre.SRE_Match object; span=(0, 10), match='AC 510 AgR'>
AC 865 AgR
AC 865 AgR <_sre.SRE_Match object; span=(0, 10), match='AC 865 AgR'>
AC 1317 MC-ED
AC 1317 MC

['AGR AC 471',
 'AGR AC 491',
 'AGR AC 510',
 'AGR AC 865',
 'AGR PET 1859',
 'ED MC AC 1317',
 'QO PET 2835',
 'QO PET 2961',
 'RE 407099',
 'RTJ 174/437']

In [94]:
def traslations_magazine_citations(txt):
    txt = re.sub("STF:|\-\s*tribunal\s+pleno", "", txt, flags=re.IGNORECASE)
    # Verificar se é usado o padrão que remove o máximo possível de caracteres após modificar o padrão aqui
    # Em alguns espelhos o padrão que aparece no final acaba aparecendo no começo.
    # Então não é possível remover todo o texto que vem depois.
    txt = re.sub(
        r"((Número\s*de\s*p[aá]ginas|Altera[aç][aã]o|Revis[aã]o|Inclus[aã]o|An[aá]lise|Obs\.|Vota[cç][aã]o|Resultado):)[^\.]*\.", "", txt, flags=re.IGNORECASE
    )
    # Além disso, uma decisão específica começa com a string “Veja” Será feita uma exceção para este caso.    
    veja_pattern = r"(^Veja[^\.]*\.)?(.*)\-?\s*Veja.*"
    while re.search(veja_pattern, txt, flags=re.IGNORECASE):
        txt = re.sub(
            veja_pattern, r"\2", txt, flags=re.IGNORECASE
        )
    # Remoção de decisões pertencentes ao STJ ou ao TSE - este padrão pode ser usado para remover tudo que vem depois,
    # TESTAR ISSO DEPOIS

    # ver posteriormente que tipo de informação é inserida entre '()' nas citações
    txt = re.sub(r"(STJ|TSE|TRE|TST|TRF\s*\-?[\s\w]*)\s*:.+[;\.]\s*", "", txt)
    search_pattern = "[Aa]c[óo]rd[ãa]o\s*\(?\s*s?\s*\)?\s+[Cc]itado\s*\(?\s*s?\s*\)?\s*[:;,]\s*(\.(?!\s)*|[^:]*)?"
    dec = re.search((search_pattern), txt, flags=re.IGNORECASE)

    quotes = []
    if dec:
        dec = dec.group(1)
        if (len(dec) > 2) and (dec[-2] == "."):
            dec = dec[:-2]

        dec = re.sub(r"(\d+)\.(\d+)", r"\1\2", dec)
        dec = re.sub(r"[,;]?[\w\d\s\.\/\-]+\((STJ|TSE|TST|TRE|TRF\s*\-?[\s\w]*)\)", "", dec)

        # manter citação à decisão e não à revista como no exemplo: 'TJ 169/557 (HC 73801)'    
        dec = re.sub(r"(\w+\-?[\s\d]+\/\d+\-?\d*)\s+\(([^\d]{2,}[\s-]+\d+[^\d\)]*)\)", r"\2", dec)
        # remover menções a revistas entre parênteses ou após um '-' porque isso significa que o próprio
        # id do acórdão citado já é referenciado
        dec = re.sub("\(([A-Z]+\-?[\s\d]+\/\d+\-?\d*,?\s*)+\)", ",", dec)
        dec = re.sub("\-\s*[A-Z]+\-?[\s\d]+\/\d+\-?\d*", "", dec)
        # VER O EFEITO DO SPLIT NO PARÊNTESES PARA ENTENDER QUE PADRÃO É EXTRAÍDO          
        dec = re.split("[;,.()]", dec)
        for q in dec:
            q = q.strip()

            acordaoId_pattern = "([^\d\s]{2,}[\s-]+\d+[^\d]*)$"
            m = re.search(acordaoId_pattern, q)
            if m is None:
                n = re.search("([A-Z]+)\-?\s*(\d+\/\d+)", q)
                if (n is not None) and (not q.startswith("-")):
                    n = " ".join(n.groups())
                    if n in revistas_to_acordao_id_dict:
                        quotes.append(revistas_to_acordao_id_dict[n])

    return quotes

In [96]:
s_citacoes_encontradas = df_after.loc[:, "observacao"].progress_apply(lambda txt: traslations_magazine_citations(txt))
df_after.loc[s_citacoes_encontradas[s_citacoes_encontradas.apply(lambda x: True if len(x) > 0 else False)].index, ["publicacao", "observacao"]].tail(60)

HBox(children=(FloatProgress(value=0.0, max=103168.0), HTML(value='')))




Unnamed: 0_level_0,publicacao,observacao
acordaoId,Unnamed: 1_level_1,Unnamed: 2_level_1
AGR HC 120393,PROCESSO ELETRÔNICO \r\nDJe-188 DIVULG 21-09-2015 PUBLIC 22-09-2015,"- Acórdão(s) citado(s): (MOTIVAÇÃO ""PER RELATIONEM"") HC 69438 (1ªT), HC 69987 (TP), AI 734689 AgR (2ªT), AI 825520 AgR-ED (2ªT), ARE 657355 AgR (1ªT), RE 585932 AgR (2ªT), HC 54513 (2ªT). (PRINCÍPIO DO ""PAS DE NULLITÉ SANS GRIEF"") HC 107769 (1ªT), HC 112558 (2ªT), RHC 116390 (2ªT). (NULIDADE, COMPROVAÇÃO DE PREJUÍZO) HC 85155 (2ªT), HC 100329 (2ªT), HC 104648 (2ªT), HC 110160 (2ªT), HC 112191 (2ªT), HC 116132 (2ªT), HC 117102 (2ªT), RTJ 182/662-663, RTJ 220/385, RT 567/398, RT 570/388, RT 603/311. Número de páginas: 13. Análise: 19/10/2015, MAD."
AGR RE 892938,PROCESSO ELETRÔNICO \r\nDJe-160 DIVULG 14-08-2015 PUBLIC 17-08-2015,"- Acórdão(s) citado(s): (PRESUNÇÃO DE INOCÊNCIA) RE 482006 (TP), HC 95886 (2ªT), RE 814792 AgR (2ªT), RTJ 183/327. (MAUS ANTECEDENTES, INQUÉRITO) RE 464947. Número de páginas: 13. Análise: 21/08/2015, BMP."
AGR ARE 847535,ACÓRDÃO ELETRÔNICO\r\nDJe-154 DIVULG 05-08-2015 PUBLIC 06-08-2015,"- Acórdão(s) citado(s): (CONCURSO PÚBLICO, INVESTIGAÇÃO SOCIAL) RE 450971 AgR (1ªT), RTJ 183/327. (PRINCÍPIO DA PRESUNÇÃO DE INOCÊNCIA) RE 482006 (TP), HC 95886 (2ªT), RTJ 139/885, RT 418/286, RT 422/307, RT 572/391, RT 586/338. Número de páginas: 12. Análise: 14/08/2015, MJC."
EXT 1361,ACÓRDÃO ELETRÔNICO\r\nDJe-156 DIVULG 07-08-2015 PUBLIC 10-08-2015,"- Acórdão(s) citado(s): (INCORPORAÇÃO, TRATADO INTERNACIONAL, ORDENAMENTO JURÍDICO BRASILEIRO) RTJ 174/463, RTJ 179/493. (CONCORDÂNCIA, EXTRADITANDO, PEDIDO, EXTRADIÇÃO) Ext 583 (TP), RTJ 64/22, RTJ 85/7, RTJ 132/137, EXT 352 (TP). (MANDADO DE PRISÃO, EXPEDIÇÃO, AUTORIDADE COMPETENTE, ESTADO REQUERENTE) EXT 478 (TP), EXT 744 (TP), RTJ 89/716, EXT 633 (TP). (PRINCÍPIO DO JUIZ NATURAL) RTJ 169/557, RTJ 179/378, RTJ 193/357. (FURTO DE USO) RTJ 34/655, RTJ 37/96, RTJ 86/42, HC 31892 (TP), RE 63884 (1ªT). (EXTRADIÇÃO, COMUTAÇÃO DA PENA, PRISÃO PERPÉTUA) Ext 426 (TP), Ext 486 (TP), Ext 811 (TP), Ext 838 (TP), Ext 855 (TP), Ext 944 (TP), Ext 985 (TP), Ext 1051 (TP), Ext 1103 (TP), Ext 1104 (TP), Ext 703 ED (2ªT), Ext 1343 (2ªT), EXT 654 (TP), EXT 711 (TP), EXT 773 (TP). (EXTRADITANDO, FILHO BRASILEIRO) Ext 510 (TP), Ext 803 (TP), Ext 822 (TP), Ext 833 (TP), RTJ 191/17, RTJ 177/1250, RTJ 165/472,RTJ 148/110, RTJ 172/751, RTJ 155/34, RTJ 183/42. - Acórdão(s) citado(s) - outros tribunais: (FURTO DE USO) RT 486/320, RT 491/336, RT 523/417, RT 553/370, RT 553/387. Número de páginas: 27. Análise: 31/08/2015, IMC. Revisão: 30/11/2015, KBP."
SEGUNDOS ED ARE 919464,PROCESSO ELETRÔNICO \r\nDJe-018 DIVULG 29-01-2016 PUBLIC 01-02-2016,"- Acórdão(s) citado(s): (INTEMPESTIVIDADE, RECURSO INCABÍVEL) AI 515208 AgR (2ªT), AI 521217 AgR (2ªT), AI 528553 AgR (2ªT), AI 588190 AgR (1ªT), AI 600672 ED (2ªT), AI 600452 AgR (1ªT), AI 602116 AgR (2ªT), AI 718826 AgR (2ªT), AI 578079 AgR (1ªT), AI 733719 AgR (2ªT), AI 746533 ED (TP), AI 766488 AgR (1ªT), ARE 663031 AgR (2ªT), RTJ 105/792, RTJ 105/1275, RTJ 120/458, RTJ 132/1374, RF 148/176, RF 148/179, RF 163/215, RT 489/105, REVISTA DE PROCESSO, VOLS. 1/196 – 1/210 – 4/393. (PRAZO RECURSAL) RT 473/200, RT 504/217, RT 611/155, RT 698/209, RF 251/244, RTJ 203/416. Número de páginas: 8. Análise: 03/02/2016, MJC."
AGR RHC 125242,PROCESSO ELETRÔNICO \r\nDJe-049 DIVULG 14-03-2017 PUBLIC 15-03-2017,"- Acórdão(s) citado(s): (PRINCÍPIO PAS DE NULLITÉ SANS GRIEF) HC 81510 (1ªT) - RTJ 182/662, HC 82899 (2ªT), HC 85155 (2ªT), HC 100329 (2ªT), HC 104648 (2ªT), HC 110160 (2ªT), HC 112191 (2ªT), HC 116132 (2ªT), HC 117102 (2ªT), RHC 126885 (2ªT), RTJ 220/385, RT 567/398, RT 570/388, RT 603/311. (PREVISÃO, LEI, PROCESSO, SUBSTITUIÇÃO, JUIZ) HC 68210 (TP) - RTJ 142/832, HC 68905 , HC 69601 (1ªT) - RTJ 143/962, HC 70103 (1ªT) - RTJ 148/773, HC 74109 (1ªT), ADI 1481 (TP) - RTJ 194/50. (CONVOCAÇÃO, JUIZ, TRIBUNAL) HC 86889 (1ªT) - RTJ 209/1135, RE 597133 (TP), HC 99240 (1ªT), HC 101952 (1ªT), HC 111507 (2ªT), HC 113874 (1ªT), RHC 122002 (2ªT). (HABEAS CORPUS SUBSTITUTIVO, REVISÃO CRIMINAL) HC 70457 - RTJ 151/554, HC 98206 (1ªT), HC 98412 (2ªT), RHC 116674 (2ªT), RHC 130270 (1ªT), RHC 128723 AgR (1ªT), RHC 133200 (2ªT), HC 134974 (2ªT), HC 123182 AgR (1ªT), HC 134976 AgR (1ªT), HC 137059 AgR (2ªT). - Decisões monocráticas citadas: (CONVOCAÇÃO, JUIZ, TRIBUNAL) HC 101771, HC 99241. Número de páginas: 21. Análise: 04/05/2017, AMA."
ADI 4764,PROCESSO ELETRÔNICO \r\nDJe-178 DIVULG 14-08-2017 PUBLIC 15-08-2017,"- Acórdão(s) citado(s): (FUNDAMENTAÇÃO, RECEBIMENTO, DENÚNCIA) HC 93056 (2ªT), HC 101971 (1ªT), RHC 118379 (1ªT). (NATUREZA JURÍDICA, CRIME DE RESPONSABILIDADE) Pet 1656 (TP), Pet 1954 (TP), ADI 1628 MC (TP) - RTJ 166/147, ADI 834 (TP) - RTJ 168/729. (COMPETÊNCIA LEGISLATIVA, CRIME DE RESPONSABILIDADE) ADI 341 (TP), ADI 687 (TP), ADI 1628 (TP), ADI 1879 (TP), ADI 1901 (TP), ADI 2220 (TP), ADI 2592 (TP), ADI 3279 (TP), ADI 1890 MC (TP), ADI 4791 (TP), ADI 4792 (TP), ADI 4800 (TP), ADI 2050 MC (TP). (RESPONSABILIZAÇÃO, GOVERNADOR, PRINCÍPIO REPUBLICANO) ADI 978 (TP) - RTJ 162/462, ADI 1008 (TP). (PODER LEGISLATIVO, AUTORIZAÇÃO PRÉVIA, PROCESSO PENAL, GOVERNADOR) HC 41296 (TP), RE 153968 (TP) - RTJ 151/978, Pet 673 (TP) - RTJ 148/689, RE 159230 (TP) - RTJ 158/280, ADI 1008 (TP), Rcl 511 (TP) - RTJ 166/785, ADI 4791 (TP), ADI 4792 (TP), ADI 4800 (TP), Inq 496 (TP) - RTJ 150/688, CJ 6115 (TP) - RTJ 91/423, Rcl 10 (TP) - RTJ 63/1, HC 80511 (2ªT) - RTJ 180/235, RTJ 33/590. (CONSTITUIÇÃO ESTADUAL, NORMA DE OBSERVÂNCIA OBRIGATÓRIA) ADI 216 MC (TP). (CONSTITUIÇÃO ESTADUAL, NORMA DE REPRODUÇÃO FACULTATIVA) ADI 2599 MC (TP), ADI 793 (TP). (PRESIDÊNCIA DA REPÚBLICA, COMPETÊNCIA ABSOLUTA, NOMEAÇÃO, MINISTRO, TRIBUNAL SUPERIOR) ADI 2599 MC (TP). (PRINCÍPIO REPUBLICANO, EXTENSÃO, GOVERNADOR, PRERROGATIVA CONSTITUCIONAL, PRESIDENTE DA REPÚBLICA) ADI 978 (TP). (FORO POR PRERROGATIVA DE FUNÇÃO, CESSAÇÃO, EXERCÍCIO, FUNÇÃO) Inq 687 QO (1ªT). (CONSTITUIÇÃO ESTADUAL, PRISÃO PROVISÓRIA, RESPONSABILIDADE PENAL, GOVERNADOR) ADI 978 (TP), ADI 1015 (TP), ADI 1008 (TP), ADI 1011 (TP), ADI 1012 (TP), ADI 1014 (TP), ADI 1018 (TP), ADI 1017 (TP), ADI 1013 (TP), ADI 1023 (TP), ADI 1022 (TP), ADI 1024 (TP), ADI 1025 (TP), ADI 1019 (TP), ADI 1027 (TP), ADI 1020 (TP), ADI 1021 (TP). (PRISÃO PREVENTIVA, GOVERNADOR) HC 102732 (TP). (AUTORIZAÇÃO PRÉVIA, ASSEMBLEIA LEGISLATIVA, SUSPENSÃO, PRAZO PRESCRICIONAL) RE 153968 (TP), RE 159230 (TP), QC 427 QO (TP). (AGU, PARECER FAVORÁVEL, PROCEDÊNCIA, ADI) A..."
PET 6587,PROCESSO ELETRÔNICO \r\nDJe-182 DIVULG 17-08-2017 PUBLIC 18-08-2017,"- Acórdão(s) citado(s): (IMUNIDADE PARLAMENTAR MATERIAL, AFASTAMENTO, TIPICIDADE) Inq 2282 (TP). (IMUNIDADE PARLAMENTAR MATERIAL, DECLARAÇÃO, MEIO DE COMUNICAÇÃO) Inq 1944 (TP), Inq 3817 (1ªT), AO 2002 (2ªT), Pet 5875 AgR (2ªT), Inq 617, AI 473092, Inq 2330, Inq 2878. (IMUNIDADE PARLAMENTAR MATERIAL, LOCAL) Inq 510 - RTJ 135/509, Inq 1958 (TP) - RTJ 194/56, Inq 681 QO (TP) - RTJ 155/396, Inq 2330, QC 472(TP) - RTJ 133/90, Inq 396 QO (TP) - RTJ 131/1039, RT 648/318, INQ 381-QO (TP) - RTJ 155/396. (CONTROLE, ABUSO, IMUNIDADE PARLAMENTAR MATERIAL) RE 140867 (2ªT), Inq 1958 (TP). (IMUNIDADE PARLAMENTAR MATERIAL, CORRELAÇÃO, EXERCÍCIO, MANDATO PARLAMENTAR) Inq 126 (TP) - RTJ 104/441, Inq 179 (TP) - RTJ 112/486, Inq 390 (TP) - RTJ 129/970, Inq 510 - RTJ 135/509, Inq 579 (TP) - RTJ 141/406, HC 74125 (1ªT) - RTJ 167/180, HC 74201 (1ªT) - RTJ 169/969, HC 81730 (2ªT) - RTJ 187/985, Inq 1958 (TP) - RTJ 194/56, Inq 874 AgR , Inq 1775 AgR (TP), Inq 2874 AgR (TP), Inq 3677 (TP), AO 2002 (2ªT), Inq 4177 (1ªT), Pet 6156 (2ªT), RTJ 191/448,RTJ 166/844, Inq 810 QO (TP), QC 472 (TP) - RTJ 133/90, Inq 396 QO (TP) - RTJ 131/1039, Inq 1381 QO (TP) - RTJ 172/400, Inq 381 QO (TP) - RTJ 155/396, RT 648/318. - Decisões monocráticas citadas: (IMUNIDADE PARLAMENTAR MATERIAL, PROTEÇÃO, INTERESSE PÚBLICO) Pet 5637. (IMUNIDADE PARLAMENTAR MATERIAL, DECLARAÇÃO, MEIO DE COMUNICAÇÃO) Pet 5055, Pet 5193, Inq 3706. (IMUNIDADE PARLAMENTAR, AÇÃO PENAL PRIVADA, ARQUIVAMENTO) Inq 2843, Inq 2844, Inq 3777. Número de páginas: 27. Análise: 03/10/2017, JSF."
AGR RCL 22103,PROCESSO ELETRÔNICO \r\nDJe-232 DIVULG 09-10-2017 PUBLIC 10-10-2017,"- Acórdão(s) citado(s): (MÚLTIPLOS PROCURADORES, INTIMAÇÃO) RE 164577 AgR (2ªT), RE 114830, RTJ 195/657, RTJ 160/627-628. (RECLAMAÇÃO, REQUISITOS) RTJ 132/620, RTJ 142/385, RTJ 181/925, RTJ 168/718. Número de páginas: 9. Análise: 16/10/2017, MJC."
AGR ARE 1026592,PROCESSO ELETRÔNICO \r\nDJe-234 DIVULG 11-10-2017 PUBLIC 13-10-2017,"- Acórdão(s) citado(s): (AGRAVO, PRAZO PARA INTERPOSIÇÃO) ARE 639846 AgR-QO (TP), RTJ 167/1030, RTJ 191/354-355, RTJ 199/422. (PRECLUSÃO) ARE 653964 AgR (1ªT). - Decisões monocráticas citadas: (NULIDADE, IMPEDIMENTO DO JUIZ) Rcl 18441, ARE 839827, Rcl 16963, Rcl 19232. (PRECLUSÃO) HC 122236, ARE 839827, Rcl 19232. Número de páginas: 8. Análise: 24/10/2017, MJC."


In [58]:
# Creating translation of magazine citations to decision_ids
revistas_to_acordao_id_dict = {}

def translate_revistas_citacoes_to_acordao_id(row, revistas_to_acordao_id_dict): 
    for cit_mag in row["citacoes_revistas"]:
        revistas_to_acordao_id_dict[cit_mag] = row.name


df_after.apply(translate_revistas_citacoes_to_acordao_id,
                                    args=(revistas_to_acordao_id_dict,), axis=1)
print("Número de traduções", len(revistas_to_acordao_id_dict))

Número de traduções 9414


In [59]:
revistas_to_acordao_id_dict

{'RTJ 191/483': 'QO PET 2835',
 'RT 836/442': 'QO INQ 1024',
 'RTJ 193/459': 'QO INQ 1024',
 'RTJ 177/1136': 'MC ADI 2155',
 'RTJ 191/797': 'AGR RCL 1108',
 'RTJ 183/774': 'RE 282644',
 'LEXSTF 313/291': 'RE 285047',
 'LEXSTF 314/205': 'RE 274280',
 'RTJ 177/470': 'RE 285571',
 'RJTJRS 282/84': 'EXT 747',
 'RTJ 177/969': 'RE 217194',
 'RTJ 191/271': 'RE 272872',
 'RTJ 192/222': 'HC 80405',
 'RTJ 192/78': 'ADI 2343',
 'RTJ 179/587': 'ADI 2061',
 'RTJ 177/965': 'RE 215267',
 'RTJ 191/457': 'MC ADI 2357',
 'RTJ 192/272': 'RE 265151',
 'RTJ 77/565': 'RHC 80969',
 'RTJ 183/100': 'MC ADI 1933',
 'RTJ 184/187': 'QO RE 217988',
 'RTJ 196/192': 'HC 80801',
 'LEXSTF 318/480': 'AGR RHC 80756',
 'RTJ 191/722': 'RE 297211',
 'RTJ 178/832': 'RHC 80919',
 'LEXSTF 324/344': 'HC 80240',
 'RTJ 191/399': 'ADI 909',
 'RTJ 192/131': 'MC ADI 2427',
 'RTJ 180/535': 'MC ADI 2381',
 'RTJ 184/148': 'AGR CR 9191',
 'RTJ 179/1009': 'ADI 2084',
 'RTJ 185/88': 'QO MI 635',
 'RTJ 183/327': 'RE 212198',
 'LEXSTF 340/

In [32]:
n = "RTJ-226/439"
n = " ".join(re.search("(\w+)\-?\s*(\d+\/\d+)", n).groups())
df_after[df_after["citacoes_revistas"].apply(found_acordao_id, args=(n,))]

Unnamed: 0,_id,acordaoId,publicacao,citacoes_revistas,partesTexto,observacao,citacoesObs,index,observacao_lab
43595,5e33bebdd0a3cf3007023aa2,AGR MS 30717,"PROCESSO ELETRÔNICO \r\nDJe-195 DIVULG 10-10-2011 PUBLIC 11-10-2011\r\nRTJ VOL-00226-01 PP-00439\r\nRJTJRS v. 47, n. 283, 2012, p. 48-52","[RJTJRS 283/48, RTJ 226/439]",RELATOR : MIN. RICARDO LEWANDOWSKI \nAGTE.(S) : MINISTÉRIO PÚBLICO DO ESTADO DO RIO GRANDE DO SUL \nPROC.(A/S)(ES) : PROCURADOR-GERAL DE JUSTIÇA DO ESTADO DO RIO GRANDE DO SUL \nAGDO.(A/S) : CONSELHO NACIONAL DO MINISTÉRIO PÚBLICO \nADV.(A/S) : ADVOGADO-GERAL DA UNIÃO \nINTDO.(A/S) : UNIÃO \nADV.(A/S) : ADVOGADO-GERAL DA UNIÃO,"- Acórdão citado: MS 21239. Número de páginas: 11. Análise: 10/11/2011, IMC. Revisão: 11/11/2011, KBP.",[MS 21239],4597,


In [33]:
mag = "RDC"
df_after[(df_after["observacao"].apply(lambda x: 0 if re.search("(\s+|\()" + mag + "[^\w]+", x) is None else 1) == 1) &
         (df_after["observacao"].apply(lambda x: len(re.findall("[^\w]+(" + mag + "\-?[\s\d]+\/\d+)", x))) == 0) &
         ~df_after["observacao"].apply(lambda x: True if re.search("\(" + mag + "\)", x) is not None else False)
        ]

Unnamed: 0,_id,acordaoId,publicacao,citacoes_revistas,partesTexto,observacao,citacoesObs,index,observacao_lab
9009,5e32c893d0a3cf555530cde5,AGR RE 158649,DJ 17-12-2004 PP-00066 EMENT VOL-02177-02 PP-00349,[],AGTE.(S) : RENATO DE SOUZA MARTINS \nADVDO.(A/S) : SID H. RIEDEL DE FIGUEIREDO E OUTRO (A/S) \nAGDO.(A/S) : ESTADO DO PARÁ \nADVDO.(A/S) : PGE-PA - LOANA LIA GENTIL ULIANA,"- Acórdãos citados: RMS 24458, RE 247013 AgR, RE 310388 AgR; RTJ 76/276. - Decisões monocráticas citadas: AI 303088, AI 310467, AI 338691. Número de páginas: 6. Análise: 28/01/2005, RDC.","[RMS 24458, AGR RE 247013, AGR RE 310388]",2467,
11434,5e32d37cd0a3cf555530d75e,AGR AI 482852,DJ 28-10-2004 PP-00050 EMENT VOL-02170-05 PP-00877,[],AGTE.(S) : MIRACY PIRES LUCAS E OUTRO (A/S) \nADVDO.(A/S) : MARCELISE DE MIRANDA AZEVEDO E OUTRO (A/S) \nAGDO.(A/S) : UNIVERSIDADE FEDERAL DO RIO GRANDE DO SUL \nADVDO.(A/S) : ADVOGADO-GERAL DA UNIÃO,"Número de páginas: (5). Análise: RDC. Inclusão: 24/11/2004, SVF. Alteração: 09/12/2019, (PDR).",[],5061,
11697,5e32d4e9d0a3cf555530d865,AGR AI 410501,DJ 12-11-2004 PP-00024 EMENT VOL-02172-04 PP-00710,[],AGTE. : BANCO ABN AMRO REAL S/A \nADVDOS. : CARLOS JOSÉ ELIAS JÚNIOR E OUTROS \nAGDA. : MARCIA REGINA MARQUES ANTUNES \nADVDOS. : LUIS EDUARDO RODRIGUES ALVES DIAS E OUTROS,"Número de páginas: (5). Análise: RDC. Inclusão: 06/12/2004, CFC. Alteração: 12/01/2006, AGS. Alteração: 19/12/2019, (PDR).",[],5196,


In [34]:
df_after[df_after["citacoes_revistas"].apply(lambda x: True if "JTJ" in " ".join(x) else False)]

Unnamed: 0,_id,acordaoId,publicacao,citacoes_revistas,partesTexto,observacao,citacoesObs,index,observacao_lab
525,5e3279b3d0a3cf19aa5ba458,EXT 747,"DJ 04-05-2001 PP-00033 EMENT VOL-02029-01 PP-00022\r\nRJTJRS v. 46, n. 282, 2011, p. 84-89",[RJTJRS 282/84],REQTE. : GOVERNO DA REPÚBLICA ORIENTAL DO URUGUAI \nEXTDO. : RONALD MARIO NEYRA BARREIRO \nEXTDO. : RICARDO ANACLETO RUIZ MENDIETA,"Acórdãos citados: EXT 272; EXT 524; (RTJ 134/56); HC 62438; (RTJ 115/144). Número de páginas: (11). Análise:(COF). Revisão:(AAF). Inclusão: 07/06/01, (MLR). Alteração: 15/06/07, (MLR). Alteração: 26/01/2018, CLS.","[EXT 272, EXT 524, HC 62438]",722,
8589,5e32c611d0a3cf555530cc41,QO QO ADI 807,"DJ 13-02-2004 PP-00011 EMENT VOL-02139-01 PP-00001\r\nRJTJRS v. 47, n. 284, 2012, p. 27-30",[RJTJRS 284/27],REQTE. : PROCURADOR-GERAL DA REPÚBLICA \nREQDO. : ASSEMBLÉIA LEGISLATIVA DO ESTADO DO RIO GRANDE DO SUL \nREQDO. : GOVERNADOR DO ESTADO DO RIO GRANDE DO SUL \nADV.(A/S) : PGE-RS - JOSÉ GUILHERME KLIEMANN,"Acórdãos citados: ADI 163 QO, ADI 218 (RTJ 132/1038), ADI 272 MC QO, ADI 273 MC QO, ADI 807 QO (RTJ 150/54). Número de páginas: (08). Análise:(JOY). Revisão:(RCO). Inclusão: 27/05/2004, (SVF). Alteração: 27/05/2005, (RCO). Alteração: 07/01/2019, ALS.","[QO ADI 163, ADI 218, QO MC ADI 272, QO MC ADI 273, QO ADI 807]",2100,
8873,5e32c7ecd0a3cf555530cd5d,QO AC 116,"DJ 06-02-2004 PP-00034 EMENT VOL-02138-01 PP-00016\r\nRTJ VOL-00189-03 PP-00874\r\nRJTJRS v. 41, n. 250/251, 2006, p. 31-33","[RJTJRS 250/31, RTJ 189/874]",REQTE.(S) : JOSÉ MOREIRA BENTO \nADV.(A/S) : ANTONIO CARLOS LAFOURCADE ESTRELLA \nREQDO.(A/S) : ESTADO DO RIO GRANDE DO SUL \nADV.(A/S) : PGE-RS - YASSODARA CAMOZZATO,"Acórdãos citados: AC 104, Pet 2890 (Informativo 301 do STF), Pet 2903 QO (RTJ 185/213), RE 321958, RE 375686. Número de páginas: (06). Análise:(JOY). Revisão:(RCO). Inclusão: 14/06/04, (JVC). Alteração: 14/09/05, (JOY). Alteração: 09/04/2019, HAC.","[AC 104, PET 2890, QO PET 2903, RE 321958, RE 375686]",2256,
13468,5e32e39dd0a3cf753014f40b,AGR RE 430514,"DJ 13-05-2005 PP-00019 EMENT VOL-02191-04 PP-00709\r\nRJTJRS v. 41, n. 258, 2006, p. 31-33",[RJTJRS 258/31],AGTE.(S) : INSTITUTO DE PREVIDÊNCIA DO ESTADO DO RIO \n GRANDE DO SUL - IPERGS \nADVDO.(A/S) : PGE-RS - KARINA DA SILVA BRUM E OUTRO (A/S) \nAGDO.(A/S) : NEUSA HAUSSEM \nADVDO.(A/S) : TELMO RICARDO SCHORR E OUTRO (A/S),"Acórdãos citados: ADI-2010-MC (RTJ-181/73), ADI-2189-MC (RTJ-173/786), RE-367094-AgR (RTJ-186/353), RE-372356-AgR. Número de páginas: (07). Análise:(ANA). Revisão:(). Inclusão: 17/05/05, (SVF). Alteração: 27/05/05, (AAS).","[MC ADI 2010, MC ADI 2189, AGR RE 367094, AGR RE 372356]",1187,
17909,5e330033d0a3cf7530150564,AI 527990,"DJ 05-05-2006 PP-00019 EMENT VOL-02231-07 PP-01242\r\nLEXSTF v. 28, n. 330, 2006, p. 319-324\r\nRJTJRS v. 41, n. 257, 2006, p. 31-34","[LEXSTF 330/319, RJTJRS 257/31]",AGTE.(S) : GABRIEL LIMA DA SILVA \nADV.(A/S) : DEFENSORIA PÚBLICA DA UNIÃO \nAGDO.(A/S) : MINISTÉRIO PÚBLICO DO ESTADO DO RIO GRANDE DO \n SUL,"- Acórdõas citados: HC 82959, RE 273363 (RTJ-175/1220). Número de páginas: 8. Análise: 18/05/2006, NAL.",[],5665,
23117,5e332fded0a3cf34f6749d20,RE 229096,"DJe-065 DIVULG 10-04-2008 PUBLIC 11-04-2008\r\nEMENT VOL-02314-05 PP-00985\r\nRTJ VOL-00204-02 PP-00858\r\nRJTJRS v. 45, n. 275, 2010, p. 29-42","[RJTJRS 275/29, RTJ 204/858]",RECTE.: CENTRAL RIOGRANDENSE DE AGROINSUMOS LTDA \nADVDOS.: GUSTAVO NYGAARD E OUTROS \nRECDO.: ESTADO DO RIO GRANDE DO SUL \nADVDOS.: PGE-RS - CARLOS HENRIQUE KAIPPER E OUTROS,"- Acórdãos citados: ADI 1600 (RTJ 186/855), RE 80004 (RTJ 83/809), RE 113150, RE 113701 (RTJ 125/367), RE 114950 (RTJ 125/1285). Número de páginas: 35 Análise: 11/06/2008, FMN.","[ADI 1600, RE 80004, RE 113150, RE 113701, RE 114950]",2597,
26151,5e3348cad0a3cf34f674a8fa,AGR RE 569476,"DJe-074 DIVULG 24-04-2008 PUBLIC 25-04-2008\r\nEMENT VOL-02316-09 PP-01926\r\nRTJ VOL-00205-01 PP-00468\r\nRJTJRS v. 47, n. 283, 2012, p. 45-48","[RJTJRS 283/45, RTJ 205/468]",AGTE.(S): JOÃO RIBEIRO DE JESUS E OUTRO(A/S) \nADV.(A/S): FELISBERTO VILMAR CARDOSO E OUTRO(A/S) \nAGDO.(A/S): CAIXA ECONÔMICA FEDERAL - CEF \nADV.(A/S): MARCELO OSCAR SILVA SANTOS E OUTRO(A/S),"- Acórdão citado: AI 664567 QO. Número de páginas: 7. Análise: 06/05/2008, CRE.",[QO AI 664567],5730,
26200,5e334932d0a3cf34f674a92b,RE 191668,"DJe-097 DIVULG 29-05-2008 PUBLIC 30-05-2008\r\nEMENT VOL-02321-02 PP-00268\r\nRTJ VOL-00206-01 PP-00400\r\nRT v. 97, n. 876, 2008, p. 128-131\r\nLEXSTF v. 30, n. 359, 2008, p. 226-231\r\nRJTJRS v. 47, n. 286, 2012, p. 33-37","[LEXSTF 359/226, RJTJRS 286/33, RT 876/128, RTJ 206/400]",RECTE.: MUNICÍPIO DE PORTO ALEGRE \nADV.(A/S): LUÍS MAXIMILIANO TELESCA \nRECDO.: ELMO OSVALDO KIRSCH \nADV.: ELMO OSVALDO KIRSCH,"Número de páginas: 8. Análise: 06/06/2008, CRE.",[],5902,
28472,5e33609cd0a3cf34f674b20b,HC 94768,"DJe-059 DIVULG 26-03-2009 PUBLIC 27-03-2009\r\nEMENT VOL-02354-03 PP-00642\r\nRJTJRS v. 46, n. 282, 2011, p. 90-92",[RJTJRS 282/90],PACTE.(S): CARLOS ALEXANDRE MENDONÇA DA SILVA \nIMPTE.(S): DEFENSORIA PÚBLICA DA UNIÃO \nCOATOR(A/S)(ES): RELATOR DO RECURSO ESPECIAL N° 987533 DO SUPERIOR \n TRIBUNAL DE JUSTIÇA,"- Acórdão citado: HC 85141. Número de páginas: 9 Análise: 02/04/2009, IMC. Revisão: 13/04/2009, JBM.",[HC 85141],8119,
28888,5e336365d0a3cf34f674b3ab,RE 534384,"DJe-227 DIVULG 27-11-2008 PUBLIC 28-11-2008\r\nEMENT VOL-02343-06 PP-01225\r\nRTJ VOL-00207-03 PP-01225\r\nLEXSTF v. 31, n. 361, 2009, p. 488-494\r\nRJTJRS v. 44, n. 274, 2009, p. 34-37","[LEXSTF 361/488, RJTJRS 274/34, RTJ 207/1225]",RECTE.(S): ALEXANDRE YANEFSKI MENDES \nADV.(A/S): CARLOS AUGUSTO DE PAULA ÁVILA \nRECDO.(A/S): MINISTÉRIO PÚBLICO DO ESTADO DO RIO GRANDE DO SUL,"- Acórdãos citados: HC 90262, RE 177927. Número de páginas: 9 Análise: 12/12/2008, FMN.","[HC 90262, RE 177927]",8585,


In [35]:
txt = "Acórdãos citados: MI 211 (RTJ 157/411, JUA-1771/1918), MI 263 (RTJ 157/22), MI 274 AgR (RTJ 152/357), MS 21521 (RTJ 150/119), RE 140863, RE 161224, RE 179646, AI 221703 AgR. Número de páginas: (4). Análise:(CEL). Revisão:(FLO). Inclusão: 01/08/03, (SVF). Alteração: 05/12/03, (SVF). Alteração: 03/09/2018, JLS."

re.sub("\(((\w+)\-?\s*(\d+\/\d+),?\s*)+\)", "", txt)

'Acórdãos citados: MI 211 , MI 263 , MI 274 AgR , MS 21521 , RE 140863, RE 161224, RE 179646, AI 221703 AgR. Número de páginas: (4). Análise:(CEL). Revisão:(FLO). Inclusão: 01/08/03, (SVF). Alteração: 05/12/03, (SVF). Alteração: 03/09/2018, JLS.'

In [36]:
mag = "RTJ"
df_after[df_after["observacao"].apply(lambda x: False if re.search("(\s+|\()" + mag + "[^\w]+", x) is None else True)
        ][["observacao", "citacoesObs"]]

Unnamed: 0,observacao,citacoesObs
1,"Acórdãos citados: CC 7025 (RTJ 175/908), RE 182089. Número de páginas: (12). Análise:(MML). Revisão:(AAF). Inclusão: 12/06/03, (SVF). Alteração: 04/09/2018, HAC.","[CC 7025, RE 182089]"
3,"Acórdão citado: RE 220397 (RTJ 173/662). Número de páginas: (04). Análise:(DMV). Revisão:(FLO/RCO). Inclusão: 22/08/03, (SVF). Alteração: 31/03/04, (MLR). Alteração: 04/04/2019, HAC.",[RE 220397]
12,"Acórdãos citados: ADC 4 (RTJ 169/383), Rcl 899, Rcl 1575, Rcl 1723, Rcl 2043, Pet 1404. Número de páginas: (09). Análise:(MML). Revisão:(AAF). Inclusão: 01/04/03, (MLR). Alteração: 02/04/03, (MLR). Alteração: 27/08/2018, HAC.","[ADC 4, RCL 899, RCL 1575, RCL 1723, RCL 2043, PET 1404]"
14,"Acórdãos citados: MI 211 (RTJ 157/411), MI 263 (RTJ 157/22), MI 274 AgR (RTJ 152/357), MS 21521 (RTJ 150/119), RE 140863, RE 161224, RE 179646, AI 221703 AgR. Número de páginas: (4). Análise:(CEL). Revisão:(FLO). Inclusão: 01/08/03, (SVF). Alteração: 05/12/03, (SVF). Alteração: 03/09/2018, JLS.","[MI 211, MI 263, AGR MI 274, MS 21521, RE 140863, RE 161224, RE 179646, AGR AI 221703]"
16,"Acórdãos citados : MS 20430, MS 20714, MD 20882, RMS 21300, (RTJ 142/782), RMS 21597, MS 22022, (RTJ 168/163), MS 22164, (RTJ 164/158), MS 22225, MS 22319, (RTJ 162/918), MS 22519, MS 23311, (RTJ 172/501, RTJ 124/948). Número de páginas: (63). Análise: (CMM). Revisão: (AAF). Inclusão: 19/06/01, (SVF). Alteração: 13/02/06, (MLR). Alteração: 17/01/2018, GIB.","[MS 20430, MS 20714, MD 20882, RMS 21300, RMS 21597, MS 22022, MS 22164, MS 22225, MS 22319, MS 22519, MS 23311]"
...,...,...
100753,"- Acórdão(s) citado(s): (DIREITO TRIBUTÁRIO, PRINCÍPIO DA ANTERIORIDADE) RE 1081041 AgR (2ªT), RE 1040084 AgR (1ªT). (CLÁUSULA DA RESERVA DE PLENÁRIO) RE 88160 (2ªT) - RTJ 96/1188, HC 70249 - RTJ 150/223, RE 91057 - RTJ 95/859. - Decisões monocráticas citadas: (DIREITO TRIBUTÁRIO, PRINCÍPIO DA ANTERIORIDADE) RE 1026463, RE 1053254, RE 1065092, RE 1131223, RE 1147498, RE 1160814, RE 1190379. Número de páginas: 10. Análise: 20/11/2019, BMP.","[AGR RE 1081041, AGR RE 1040084, RE 88160, HC 70249, RE 91057]"
100773,"- Acórdão(s) citado(s): (FUNDAMENTAÇÃO, DECISÃO JUDICIAL) RE 140370 (1ªT) - RTJ 150/269. (CONTRADITÓRIO, AMPLA DEFESA, COISA JULGADA, DEVIDO PROCESSO LEGAL) ARE 748371 RG . Número de páginas: 6. Análise: 04/12/2019, MJC.","[RE 140370, RG ARE 748371]"
100801,"- Acórdão(s) citado(s): (FUNDAMENTAÇÃO, DECISÃO JUDICIAL) RE 140370 (1ªT) - RTJ 150/269. (PREQUESTIONAMENTO, MATÉRIA CONSTITUCIONAL) AI 733063 AgR (2ªT), ARE 1072565 AgR (2ªT). (ATO ADMINISTRATIVO, CONTROLE JUDICIAL, PRINCÍPIO DA SEPARAÇÃO DOS PODERES) ARE 744080 AgR (2ªT), ARE 1163985 AgR (2ªT). Número de páginas: 8. Análise: 06/12/2019, MJC.","[RE 140370, AGR AI 733063, AGR ARE 1072565, AGR ARE 744080, AGR ARE 1163985]"
100959,"- Acórdão(s) citado(s): (CONTRADITÓRIO, AMPLA DEFESA, COISA JULGADA, DEVIDO PROCESSO LEGAL) ARE 748371 RG . (RECEITAS TRIBUTÁRIAS, PARTICIPAÇÃO DOS MUNICÍPIOS, EXCLUSÃO, REDUÇÃO, SUPRESSÃO) RE 572762 RG , RTJ 82/200, RTJ 85/712, RTJ 86/722, RTJ 89/233, RTJ 516/223. (HONORÁRIOS ADVOCATÍCIOS, MAJORAÇÃO) AO 2063 AgR (TP). Número de páginas: 13. Análise: 09/01/2020, BMP.","[RG ARE 748371, RG RE 572762, AGR AO 2063]"


In [37]:
df_after[df_after["citacoes_revistas"].str.len() > 0]

Unnamed: 0,_id,acordaoId,publicacao,citacoes_revistas,partesTexto,observacao,citacoesObs,index,observacao_lab
104,5e3274c1d0a3cf19aa5ba2b3,QO PET 2835,DJ 11-04-2003 PP-00038 EMENT VOL-02106-02 PP-00227\r\nRTJ VOL-00191-02 PP-00483,[RTJ 191/483],REQTE. (S) : UNIBANCO AIG SEGUROS S/A \nADV. (A/S) : MAURÍCIO PERNAMBUCO SALIN E OUTROS (A/S) \nREQDO. (A/S) : UNIÃO \nADV. (A/S) : PFN - ELYADIR FERREIRA BORGES E OUTRO (A/S),"Acórdãos citados: Pet 1162 AgR, Pet 1981 (RTJ 174/437), Pet 2772 QO. Número de páginas: (12). Análise:(PCC). Revisão:(JBM). Inclusão: 08/01/04, (SVF). Alteração: 29/03/05, (MLR). Alteração: 28/09/2018, JLS.","[AGR PET 1162, PET 1981, QO PET 2772]",66,
147,5e327564d0a3cf19aa5ba2de,QO INQ 1024,"DJ 04-03-2005 PP-00011 EMENT VOL-02182-01 PP-00049\r\n RT v. 94, n. 836, 2005, p. 442-448\r\n RTJ VOL-00193-02 PP-00459","[RT 836/442, RTJ 193/459]",AUTOR : MINISTÉRIO PÚBLICO FEDERAL \nASSIST. : SAID FELICIO FERREIRA \nDNDO. : RICARDO JOSE MAGALHAES BARROS,"Acórdãos citados: Inq 681 (RTJ 155/396), Inq 810 QO, Inq 874 AgR (RTJ 166/844), Pet 1113, Inq 1710 (RTJ 181/882), Inq 1775 AgR; RTJ 99/477, RTJ 99/487, RTJ 104/441, RTJ 112/481, RTJ 129/970, RTJ 131/1039, RTJ 133/90, RTJ 135/509, RTJ 141/406, RTJ 166/133, RTJ 167/29, RTJ 167/180, RTJ 169/969. - Veja o Informativo 291 do STF. Número de páginas: (18). Análise:(MSA). Revisão: (RCO). Inclusão: 06/06/05, (MSA). Alteração: 07/08/08, (JBM).","[INQ 681, QO INQ 810, AGR INQ 874, PET 1113, INQ 1710, AGR INQ 1775, STF DO INFORMATIVO O VEJA 291]",18,
301,5e327699d0a3cf19aa5ba378,MC ADI 2155,DJ 01-06-2001 PP-00076 EMENT VOL-02033-02 PP-00249\r\nRTJ VOL-00177-03 PP-01136,[RTJ 177/1136],REQTE. : GOVERNADOR DO ESTADO DE SÃO PAULO \nADVDA. : PGE-SP - MARCIA JUNQUEIRA S ZANOTTI \nREQDO. : GOVERNADOR DO ESTADO DO PARANÁ \nADVDA. : PGE-PR - MÁRCIA DIEGUEZ LEUZINGUER,"Acórdãos citados: ADI 84, ADI 902 MC, (RTJ 151/444), ADI 1179 MC, (RTJ 164/881), ADI 1247 MC, (RTJ 168/754), ADI 1467 MC, (RTJ 163/69), ADI 1522 MC, ADI 1587 MC, ADI 1999, ADI 2021 MC, ADI 2157 MC. Também foram citados os seguintes textos legais, todos do Dec-2736/1996 PR: item 78, do anexo I, item 6, letra b, ns. 1 e 2, item7, ns. 7, 10 e 11, item 17-A e item 22, letra a, todos da tabela I do anexo II, e item 10 da tabela II do anexo II. Número de páginas: (59). Análise:(CMM). Revisão:(AAF). Inclusão: 19/07/01, (SVF). Alteração: 06/01/05, (MLR). Alteração: 25/01/2018, ALS.","[ADI 84, MC ADI 902, MC ADI 1179, MC ADI 1247, MC ADI 1467, MC ADI 1522, MC ADI 1587, ADI 1999, MC ADI 2021, MC ADI 2157]",343,
302,5e32769ad0a3cf19aa5ba379,AGR RCL 1108,DJ 07-05-2004 PP-00020 EMENT VOL-02150-01 PP-00005\r\nRTJ VOL-00191-03 PP-00797,[RTJ 191/797],AGTES. : CIA AGRÍCOLA E INDUSTRIAL SÃO JORGE E OUTROS \nADVDOS. : CARLOS MÁRIO DA SILVA VELLOSO FILHO E OUTROS \nAGDO. : PRESIDENTE DO PRIMEIRO TRIBUNAL DE ALÇADA \n CIVIL DO ESTADO DE SÃO PAULO \nAGDO. : SUPERIOR TRIBUNAL DE JUSTIÇA,"Votação: por maioria, vencido o Min. Marco Aurélio. Resultado: acolhida a preliminar suscitada, de descabimento da reclamação, ante a preclusão. Acórdãos citados: Rcl-252 (RTJ-126/494), Rcl-509 (RTJ-174/353), AI-151063-AgR, RE-174158; RTJ-142/385. - Impedido o Min. Carlos Velloso. Número de páginas: (23). Análise:(PCC). Revisão:(JOY). Inclusão: 01/12/04, (SVF). Alteração: 04/01/05, (JVC) Alteração: 03/05/2019 , (HRS)","[RCL 252, RCL 509, AGR AI 151063, RE 174158]",342,
355,5e32775ad0a3cf19aa5ba3ae,RE 282644,DJ 20-09-2002 PP-00116 EMENT VOL-02083-05 PP-00821\r\n RTJ VOL-00183-02 PP-00774,[RTJ 183/774],RECTE. : LIBRA- ADMINISTRADORA DE CONSÓRCIOS LTDA \nADVDOS. : VILMAR JOSÉ ARRABAL DE CARVALHO E OUTROS \nRECDA. : VENDA DIRETA COMERCIAL LTDA,"Acórdãos citados: HC 72131, RE 206482, RE 331159; STJ: REsp 2320. Número de páginas: (16). Análise:(ANA). Revisão:(VAS/RCO). Inclusão: 27/11/03, (MLR). Alteração: 24/08/05, (AAS). Alteração: 04/07/2018, CLS.","[HC 72131, RE 206482, RE 331159]",283,STJ: REsp 2320
...,...,...,...,...,...,...,...,...,...
53352,5e33ee88d0a3cf5a8587227e,ED ED AGR AI 769637,ACÓRDÃO ELETRÔNICO\r\nDJe-205 DIVULG 15-10-2013 PUBLIC 16-10-2013\r\nRTJ VOL-00226-01 PP-00667,[RTJ 226/667],EMBTE.(S) : CESAR ALBERTO CABRAL E CASTRO \nADV.(A/S) : LUÍS CARLOS PARREIRAS ABRITTA \nADV.(A/S) : PEDRO AURÉLIO ROSA DE FARIAS E OUTRO(A/S) \nEMBDO.(A/S) : MINISTÉRIO PÚBLICO DO ESTADO DE MINAS GERAIS \nPROC.(A/S)(ES) : PROCURADOR-GERAL DE JUSTIÇA DO ESTADO DE MINAS GERAIS,"- Acórdão(s) citado(s): (ED, EFEITO INFRINGENTE) RE 179502 ED-ED, RTJ 134/836, RTJ 134/1296, RTJ 132/1020, RTJ 158/993, RTJ 114/885, RTJ 116/1106, RTJ 118/714, RTJ 134/1296. (CRIME, TORTURA, NATUREZA JURÍDICA) HC 92181 (2ªT), RHC 104751 (1ªT). (COMPETÊNCIA JURISDICIONAL, TORTURA, JUSTIÇA COMUM) RE 407721 (2ªT), HC 70389 (TP). (CRIME, TORTURA, PERDA DO CARGO OU FUNÇÃO PÚBLICA) HC 92181 (2ªT), AI 748600 AgR (2ªT), RHC 104751 (1ªT), RHC 49128 (1ªT). (ED, CARÁTER PROTELATÓRIO, BAIXA IMEDIATA DOS AUTOS) AI 260266 AgR-ED-ED (2ªT), AI 177313 AgR-ED-ED (2ªT), RE 190841 ED-ED-ED (2ªT), RE 179502 ED-ED-ED (2ªT), AI 421932 AgR-ED-ED-ED (2ªT), RE 167787 ED-EDv-AgR-ED (2ªT), RE 202097 ED-EDv-AgR-ED-ED-ED (TP), RTJ 186/715. (INTERRUPÇÃO, PRESCRIÇÃO, SESSÃO DE JULGAMENTO) HC 70810 (1ªT), AP 396 ED (TP), HC 70641 (1ªT), RTJ 62/54, RTJ 87/827, RTJ 95/1058, RTJ 111/644, RTJ 137/1215, RTJ 139/511. - Decisão monocrática citada: (ASSUNTO) RE 652048. - Acórdão(s) citado(s) - outros tribunais: STJ: HC 49128, HC 134218, HC 92247, REsp 799468. Número de páginas: 22. Análise: 25/10/2013, AND.","[ED ED RE 179502, HC 92181, RHC 104751, RE 407721, HC 70389, HC 92181, AGR AI 748600, RHC 104751, RHC 49128, ED ED AGR AI 260266, ED ED AGR AI 177313, ED ED ED RE 190841, ED ED ED RE 179502, ED ED ED AGR AI 421932, ED AGR EDV ED RE 167787, ED ED ED AGR EDV ED RE 202097, HC 70810, ED AP 396, HC 70641]",2950,"STJ: HC 49128, HC 134218, HC 92247, REsp 799468"
53358,5e33eea2d0a3cf5a85872284,MS 32033,PROCESSO ELETRÔNICO \r\nDJe-033 DIVULG 17-02-2014 PUBLIC 18-02-2014\r\nRTJ VOL-00227-01 PP-00330,[RTJ 227/330],IMPTE.(S) : RODRIGO SOBRAL ROLLEMBERG \nADV.(A/S) : MARIA CLAUDIA BUCCHIANERI PINHEIRO \nIMPDO.(A/S) : PRESIDENTE DA CÂMARA DOS DEPUTADOS \nADV.(A/S) : ADVOGADO-GERAL DA UNIÃO \nIMPDO.(A/S) : PRESIDENTE DO SENADO FEDERAL \nADV.(A/S) : ALBERTO CASCAIS E OUTRO(A/S) \nINTDO.(A/S) : PARTIDO SOCIALISTA DOS TRABALHADORES UNIFICADO - PSTU \nADV.(A/S) : BRUNO COLARES SOARES FIGUEIREDO ALVES E OUTRO(A/S) \nINTDO.(A/S) : REDE SUSTENTABILIDADE \nADV.(A/S) : ROGERIO PAZ LIMA \nINTDO.(A/S) : PARTIDO POLÍTICO SOLIDARIEDADE \nADV.(A/S) : MARCILIO DUARTE LIMA \nINTDO.(A/S) : PEDRO TAQUES \nADV.(A/S) : MARCO AURÉLIO MARRAFON E OUTRO(A/S) \nINTDO.(A/S) : CARLOS HENRIQUE FOCESI SAMPAIO \nADV.(A/S) : ALESSIA BARROSO LIMA BRITO CAMPOS CHEVITARESE \nINTDO.(A/S) : PARTIDO POPULAR SOCIALISTA - PPS \nADV.(A/S) : FABRÍCIO DE ALENCASTRO GAERTNER E OUTRO(A/S),"- Acórdão(s) citado(s): (PARLAMENTAR, MANDADO DE SEGURANÇA, INOBSERVÂNCIA, PROCESSO LEGISLATIVO CONSTITUCIONAL) MS 24667 AgR (TP). (""AMICUS CURIAE"", MANDADO DE SEGURANÇA) MS 24414 (TP), RMS 25841 (TP), MS 26552 AgR-AgR (TP). (""AMICUS CURIAE"", RECURSO EXTRAORDINÁRIO) RE 415454 (TP). (DIREITO PÚBLICO SUBJETIVO, PARLAMENTAR, DEVIDO PROCESSO LEGISLATIVO) MS 20257 (TP), MS 24356 (TP), MS 24642 (TP), RDA 191/200. (CABIMENTO, MANDADO DE SEGURANÇA, TRAMITAÇÃO, PROPOSTA DE EMENDA À CONSTITUIÇÃO) MS 20257 (TP), MS 20452 (TP), MS 24356 (TP), MS 24642 (TP), MS 24849 (TP), MS 22503 (TP). (CABIMENTO, MANDADO DE SEGURANÇA, TRAMITAÇÃO, PROJETO DE LEI) MS 24138 (TP). (CONTROLE DE CONSTITUCIONALIDADE, EMENDA CONSTITUCIONAL) ADI 939 (TP). (LEGITIMIDADE ATIVA, MANDADO DE SEGURANÇA, TRAMITAÇÃO, PROPOSTA DE EMENDA À CONSTITUIÇÃO) MS 20452 (TP), RTJ 139/783. (PRUDÊNCIA, SUPREMO TRIBUNAL FEDERAL, CONTROLE PREVENTIVO DE CONSTITUCIONALIDADE) MS 21754 (TP). (CRIAÇÃO, PARTIDO POLÍTICO, ACESSO GRATUITO, RÁDIO, TELEVISÃO) ADI 4430 (TP), ADI 4795 MC (TP). (DIREITO POLÍTICO, CLÁUSULA PÉTREA) ADI 1351 (TP), ADI 1354 (TP), ADI 3685 (TP). (DIREITO DA MINORIA, INVESTIGAÇÃO PARLAMENTAR) MS 24831 (TP). (FIDELIDADE PARTIDÁRIA) MS 26603 (TP), MS 26602 (TP), MS 26604 (TP). (CONTROLE JUDICIAL, RELEVÂNCIA, URGÊNCIA, MEDIDA PROVISÓRIA) ADI 4048 MC (TP). (REEDIÇÃO, MEDIDA PROVISÓRIA REVOGADA, SESSÃO LEGISLATIVA) ADI 3964 MC (TP). (MEDIDA PROVISÓRIA, PARECER, COMISSÃO MISTA) ADI 4029 (TP). (CONTROLE JUDICIAL DE CONSTITUCIONALIDADE, PROJETO NORMATIVO) ADI 466 MC (TP). (ORDEM DE APRECIAÇÃO, VETO PRESIDENCIAL) MS 31816 MC-AgR (TP). (CORREÇÃO, LEGISLADOR, INTERPRETAÇÃO, SUPREMO TRIBUNAL FEDERAL) ADI 3772 (TP). (MANDADO DE SEGURANÇA, SUCEDÂNEO, AÇÃO DIRETA DE INCONSTITUCIONALIDADE) MS 21074 AGR (TP). (APOSENTADORIA, PROFESSOR, FUNÇÕES DE MAGISTÉRIO) ADI 2253 (TP), ADI 152 (TP), ADI 122 (TP). (FUNÇÃO PÚBLICA, CESSAÇÃO DO EXERCÍCIO, MANUTENÇÃO, FORO PRIVILEGIADO) INQ 687 QO (TP). (PROCESSO LEGISLATIVO, DIREITO BRA...","[AGR MS 24667, MS 24414, RMS 25841, AGR AGR MS 26552, RE 415454, MS 20257, MS 24356, MS 24642, MS 20257, MS 20452, MS 24356, MS 24642, MS 24849, MS 22503, MS 24138, ADI 939, MS 20452, MS 21754, ADI 4430, MC ADI 4795, ADI 1351, ADI 1354, ADI 3685, MS 24831, MS 26603, MS 26602, MS 26604, MC ADI 4048, MC ADI 3964, ADI 4029, MC ADI 466, AGR MC MS 31816, ADI 3772, AGR MS 21074, ADI 2253, ADI 152, ADI 122, QO INQ 687, MS 22439, RP 432, ADI 3741, ADI 2797, RCL 467, ADI 2903, AGR RCL 2143, AGR RCL 2617, MC ADI 864, MC ADI 907, MC ADI 1850]",2943,
53710,5e33f097d0a3cf5a858723e4,MS 28160,ACÓRDÃO ELETRÔNICO\r\nDJe-207 DIVULG 17-10-2013 PUBLIC 18-10-2013\r\nRTJ VOL-00227-01 PP-00315,[RTJ 227/315],IMPTE.(S) : AGRO-INDÚSTRIA E COMÉRCIO DE ALIMENTOS FRANBEL LTDA \nADV.(A/S) : VITO SIMON DE MORAIS E OUTRO(A/S) \nADV.(A/S) : CID MARCONI GURGEL DE SOUZA \nIMPDO.(A/S) : PRESIDENTE DA REPÚBLICA \nADV.(A/S) : ADVOGADO-GERAL DA UNIÃO,"- Acórdão(s) citado(s): (PENDÊNCIA, RECURSO ADMINISTRATIVO, EDIÇÃO, DECRETO PRESIDENCIAL, DESAPROPRIAÇÃO POR INTERESSE SOCIAL PARA FINS DE REFORMA AGRÁRIA) MS 24449 (TP), MS 26121 (TP). (NULIDADE, DECORRÊNCIA, ATRASO, LAUDO AGRONÔMICO DE FISCALIZAÇÃO) MS 25534 (TP). (MS, DILAÇÃO PROBATÓRIA) MS 24482 (TP), MS 24487 (TP), MS 24518 (TP), MS 25142 (TP), MS 26357 AgR (TP), MS 25576 AgR (TP), MS 22022 (TP). (MS, IMPUGNAÇÃO, DECRETO PRESIDENCIAL, DESAPROPRIAÇÃO POR INTERESSE SOCIAL PARA FINS DE REFORMA AGRÁRIA) MS 24163 (TP), MS 25391 (TP). (AUSÊNCIA, PREJUÍZO, DECLARAÇÃO DE NULIDADE) MS 24911 (TP). (DESAPROPRIAÇÃO, REFORMA AGRÁRIA, IMÓVEL, IMPLANTAÇÃO, PROJETO TÉCNICO) MS 25391 (TP). - Decisões monocráticas citadas: (MS, INTERESSE DE AGIR) MS 28786 MC, MS 29041 MC. (MOTIVAÇÃO PER RELATIONEM, PRINCÍPIO DA MOTIVAÇÃO) MS 27350 MC. - Veja inciso I do parágrafo único do art. 5º da Norma de Execução nº 35 do Incra de 2004. Número de páginas: 23. Análise: 03/01/2014, IVA.","[MS 24449, MS 26121, MS 25534, MS 24482, MS 24487, MS 24518, MS 25142, AGR MS 26357, AGR MS 25576, MS 22022, MS 24163, MS 25391, MS 24911, MS 25391]",3200,
55686,5e33fc31d0a3cf5a85872b9c,ED PET 3388,ACÓRDÃO ELETRÔNICO\r\nDJe-023 DIVULG 03-02-2014 PUBLIC 04-02-2014\r\nRTJ VOL-00227-01 PP-00057,[RTJ 227/57],EMBTE.(S) : AUGUSTO AFFONSO BOTELHO NETO \nADV.(A/S) : ANTÔNIO MÁRCIO GOMES DAS CHAGAS \nEMBTE.(S) : LAWRENCE MANLY HARTE E OUTRO(A/S) \nADV.(A/S) : LUIZ VALDEMAR ALBRECTH \nEMBTE.(S) : FRANCISCO MOZARILDO DE MELO CAVALCANTI \nADV.(A/S) : ANTONIO GLAUCIUS DE MORAIS \nEMBTE.(S) : COMUNIDADE INDÍGENA SOCÓ E OUTROS \nADV.(A/S) : PAULO MACHADO GUIMARÃES \nEMBTE.(S) : ESTADO DE RORAIMA \nPROC.(A/S)(ES) : PROCURADOR-GERAL DO ESTADO DE RORAIMA \nEMBTE.(S) : MINISTÉRIO PUBLICO FEDERAL \nPROC.(A/S)(ES) : PROCURADOR-GERAL DA REPÚBLICA \nEMBTE.(S) : AÇÃO INTEGRALISTA BRASILEIRA E OUTROS \nADV.(A/S) : CÁRMINO EUDÓXIO SANTOLÉRI \nEMBDO.(A/S) : UNIÃO \nPROC.(A/S)(ES) : ADVOGADO-GERAL DA UNIÃO \nEMBDO.(A/S) : AUGUSTO AFFONSO BOTELHO NETO \nADV.(A/S) : ANTÔNIO MÁRCIO GOMES DAS CHAGAS \nINTDO.(A/S) : FUNDAÇÃO NACIONAL DO ÍNDIO - FUNAI \nPROC.(A/S)(ES) : PROCURADOR-GERAL FEDERAL,"- Acórdão(s) citado(s): (RECURSO, TERCEIRO PREJUDICADO, DEMONSTRAÇÃO, NEXO DE INTERDEPENDÊNCIA) RE 466348 AgR (2ªT), RMS 22307 ED-ED (TP), AI 115775 AGR (1ªT). (DEFICIÊNCIA, FUNDAMENTAÇÃO, RECURSO) AI 490513 AgR-ED (2ªT). (COMPETÊNCIA, PROCESSO, DEMARCAÇÃO, RESERVA INDÍGENA RAPOSA SERRA DO SOL) Rcl 3331 (TP). - Decisões monocráticas citadas: (DEMARCAÇÃO, TERRA INDÍGENA, CONDIÇÕES DE VALIDADE, EFEITO VINCULANTE) Rcl 8070 MC, Rcl 13769, Rcl 15051, Rcl 15668. (FORÇA PERSUASIVA, PRECEDENTE, DIREITO BRASILEIRO) Rcl 4708. - Acórdão(s) citado(s) - outros tribunais: STJ: REsp 1300213. - Veja AC 2009 do STF. Número de páginas: 93. Análise: 13/02/2014, GOD. Revisão: 10/03/2014, SER.","[AGR RE 466348, ED ED RMS 22307, AGR AI 115775, ED AGR AI 490513, RCL 3331]",5141,STJ: REsp 1300213


In [38]:
def get_other_non_two_collon_chars(txt):
    search_pattern = "[Aa]c[óo]rd[ãa]o\s*\(?\s*s?\s*\)?\s+[Cc]itado\s*\(?\s*s?\s*\)?\s*[:;,]\s*(\.(?!\s)*|[^:]*)?"
    #     Acórdão seguido eventualmente de espaços, seguido eventualmente de (s) com eventuais espaços dentro,
    #     seguido de espaços, seguido de Citado, seguido eventualmente de espaços, seguido eventualmente de (s)
    #     com eventuais espaços dentro seguido de eventuais espaços e eventualmente ':', seguido de caracteres
    #     que não sejam ':'. A última sequência (caracteres que não sejam ':') é que o que seve ser capturado.
    dec = re.search((search_pattern), txt, flags=re.IGNORECASE)
    if dec:
        return True
    return False

In [39]:
# padrões indesejados:    
# Lidar com o seguinte padrão: -Acórdãos citados: CORREÇÃO DO IMPOSTO DE RENDA:

df_after[df_after["observacao"].str.contains("-Acórdãos citados: CORREÇÃO DO IMPOSTO DE RENDA:")]

txt = "-Acórdãos citados: CORREÇÃO DO IMPOSTO DE RENDA: AI 178585 AgR, RE 195599, RE 203486. Número de páginas: 32 Análise: 15/03/2007, CEL."
search_pattern = "[Aa]c[óo]rd[ãa]o\s*\(?\s*s?\s*\)?\s+[Cc]itado\s*\(?\s*s?\s*\)?\s*[:;,]\s*(\.(?!\s)*|[^:]*)?"
#     Acórdão seguido eventualmente de espaços, seguido eventualmente de (s) com eventuais espaços dentro,
#     seguido de espaços, seguido de Citado, seguido eventualmente de espaços, seguido eventualmente de (s)
#     com eventuais espaços dentro seguido de eventuais espaços e eventualmente ':', seguido de caracteres
#     que não sejam ':'. A última sequência (caracteres que não sejam ':') é que o que seve ser capturado.
dec = re.search((search_pattern), txt, flags=re.IGNORECASE)
df_after[df_after["observacao"].apply(lambda txt: get_other_non_two_collon_chars(txt)) &
         (df_after["citacoesObs"].str.len() == 0)][["observacao"]]
# parseAcordaosQuotes(txt, "acordaos")

Unnamed: 0,observacao
19,"Votação: unânime. Resultado: desprovimento. Acórdãos citados: RTJ-158/327, RTJ-158/934. Decisão monocrática: RE-233929, AI-269131, AI-271425, AI-272123, RE-338927, RE-360269. Número de páginas: (09). Análise:(CEL). Revisão:(RCO). Inclusão: 01/04/04, (SVF). Alteração: 25/10/2018, PDR."
69,"Acórdão citado: 201462. Número de páginas: (05). Análise:(DMV). Revisão:(FLO/RCO). Inclusão: 22/08/03, (MLR). Alteração: 04/04/2019, HAC."
368,"Acórdão citado: (RTJ 100/1003). Número de páginas: (23). Análise:(DMV). Revisão:(FLO). Inclusão: 02/04/04, (SVF). Alteração: 14/04/04, (NT). Alteração: 13/11/2018, CLS."
397,"Acórdãos citados: RE230156. Número de páginas: (06). Análise:(MML). Revisão:(RCO/AAF). Inclusão: 29/05/01, (SVF). Alteração: 16/01/2018, ALS."
685,"Acórdãos citados : RTJ 107/661; RTJ 120/912; RTJ 125/705. Número de páginas: (05). Análise: (MML). Revisão: (COF). Inclusão: 31/07/01, (SVF). Alteração: 29/01/2018, GIB."
...,...
86276,"- Acórdão(s) citado(s): (OFENSA REFLEXA) RTJ 120/912, RTJ 132/455. Número de páginas: 6. Análise: 22/01/2019, MJC."
86304,"- Acórdão(s) citado(s): (HC, AUSÊNCIA, PERTINÊNCIA, LOCOMOÇÃO FÍSICA, DESCABIMENTO) RTJ 116./523, RTJ 141/159, RTJ 135/593, RTJ 142/896, RTJ 197/587. Número de páginas: 10. Análise: 13/12/2018, BMP."
86375,"- Acórdão(s) citado(s): (OFENSA REFLEXA) RTJ 120/912, RTJ 132/455. (RE, REEXAME DE FATO) RTJ 161/992, RTJ 186/703, RTJ 152/612, RTJ 153/1019, RTJ 158/693. Número de páginas: 8. Análise: 23/01/2019, MJC."
86672,"- Acórdão(s) citado(s): (RE, REEXAME DE FATO E PROVA) RTJ 161/992, RTJ 186/703, RTJ 152/612, RTJ 153/1019, RTJ 158/693. Número de páginas: 6. Análise: 23/01/2019, MJC."


In [40]:
# Decisões que possuem mais de uma citação real
df_after[(df_after["citacoesObs"].str.len() > 0)][["acordaoId", "observacao", "citacoesObs"]]

Unnamed: 0,acordaoId,observacao,citacoesObs
1,CC 7127,"Acórdãos citados: CC 7025 (RTJ 175/908), RE 182089. Número de páginas: (12). Análise:(MML). Revisão:(AAF). Inclusão: 12/06/03, (SVF). Alteração: 04/09/2018, HAC.","[CC 7025, RE 182089]"
3,AGR RE 199722,"Acórdão citado: RE 220397 (RTJ 173/662). Número de páginas: (04). Análise:(DMV). Revisão:(FLO/RCO). Inclusão: 22/08/03, (SVF). Alteração: 31/03/04, (MLR). Alteração: 04/04/2019, HAC.",[RE 220397]
4,AGR AI 294374,"Acórdãos citados: AI 162245 AgR, AI 181489 AgR, RE 209140, RE 249319. Número de páginas: (07). Análise:(MML). Revisão:(AAF). Inclusão: 25/03/03, (MLR). Alteração: 23/08/2018, HAC.","[AGR AI 162245, AGR AI 181489, RE 209140, RE 249319]"
5,AGR AI 401300,"Acórdão citado: AI 260787 AgR. Número de páginas: (06). Análise:(CEL). Revisão:(VAS/RCO). Inclusão: 13/08/03, (MLR). Alteração: 16/10/03, (MLR). Alteração: 23/08/2018, HAC.",[AGR AI 260787]
6,AGR AI 336011,"Acórdão citado: AI 355302 AgR. Número de páginas: (6). Análise:(ANA). Revisão:(COF/AAF). Inclusão: 31/03/03, (SVF). Alteração: 10/12/03, (SVF). Alteração: 15/03/2019, HAC.",[AGR AI 355302]
...,...,...,...
102455,AGR ARE 1154353,"- Acórdão(s) citado(s): (DANO AMBIENTAL, REEXAME, FATO, PROVA) AI 856568 AgR (2ªT), RE 629502 ED (1ªT). Número de páginas: 9. Análise: 20/01/2020, MJC.","[AGR AI 856568, ED RE 629502]"
102456,AGR ARE 1214326,"- Acórdão(s) citado(s): (UNICIDADE, PETIÇÃO, INTERPOSIÇÃO, RECURSO EXTRAORDINÁRIO, RECURSO ESPECIAL) AI 624851 AgR (2ªT). - Decisões monocráticas citadas: (UNICIDADE, PETIÇÃO, INTERPOSIÇÃO, RECURSO EXTRAORDINÁRIO, RECURSO ESPECIAL) ARE 1140555, ARE 1151861, ARE 1210111, ARE 1216337. Número de páginas: 6. Análise: 19/01/2020, MJC.",[AGR AI 624851]
102458,AGR ARE 1230956,"- Acórdão(s) citado(s): (PRESSUPOSTO DE ADMISSIBILIDADE, RECURSO, COMPETÊNCIA, TRIBUNAL DE ORIGEM, APRECIAÇÃO, MATÉRIA INFRACONSTITUCIONAL) RE 598365 RG . (CARÊNCIA, INTERESSE RECURSAL ) RE 612920 AgR (1ªT). Número de páginas: 8. Análise: 19/01/2020, MJC.","[RG RE 598365, AGR RE 612920]"
102465,AGR ED ARE 1152510,"- Acórdão(s) citado(s): (SERVIDOR PÚBLICO, PARCELAMENTO, REMUNERAÇÃO) ADI 657 (1ªT), ARE 1129152 AgR (2ªT), ARE 1130766 AgR (1ªT). (FUNDAMENTAÇÃO, DECISÃO JUDICIAL) AI 791292 QO-RG . Número de páginas: 11. Análise: 19/01/2020, MJC.","[ADI 657, AGR ARE 1129152, AGR ARE 1130766, RG QO AI 791292]"


In [41]:
# Soma do número de citações de todas as decisões
sum(df_after["citacoesObs"].apply(lambda x: len(x)))

330163

### Preparação dos datasets para comparações

In [42]:
df_after = df_after.set_index("acordaoId")
df_before = df_before.set_index("acordaoId")

df_after_i = df_after[df_after.index.isin(df_before.index)]
df_after_i.sort_index(inplace=True)
df_after_i.reset_index(inplace=True)

df_before_i = df_before[df_before.index.isin(df_after.index)]
df_before_i.sort_index(inplace=True)
df_before_i.reset_index(inplace=True)

df_before_i["citacoesObs"] = df_before_i["citacoesObs"].apply(lambda x: sorted(x))
df_after_i["citacoesObs"] = df_after_i["citacoesObs"].apply(lambda x: sorted(x))

# Cópia de decisões citadas no dataset coletada anteriormente
df_after_i["citacoesObs_before_i"] = df_before_i["citacoesObs"]

A value is trying to be set on a copy of a slice from a DataFrame

See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html#returning-a-view-versus-a-copy
  """
A value is trying to be set on a copy of a slice from a DataFrame

See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html#returning-a-view-versus-a-copy
  if __name__ == '__main__':
A value is trying to be set on a copy of a slice from a DataFrame.
Try using .loc[row_indexer,col_indexer] = value instead

See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html#returning-a-view-versus-a-copy
  if sys.path[0] == '':
A value is trying to be set on a copy of a slice from a DataFrame.
Try using .loc[row_indexer,col_indexer] = value instead

See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html#returning-a-view-versus-a-copy
  d

In [45]:
df_after_i.loc[:, "citacoesObs"] = df_after_i.loc[:, "observacao"].apply(lambda txt: sorted(parseAcordaosQuotes(txt, "acordaos")))

A value is trying to be set on a copy of a slice from a DataFrame.
Try using .loc[row_indexer,col_indexer] = value instead

See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html#returning-a-view-versus-a-copy
  self.obj[item] = s


In [None]:
# Creating translation of magazine citations to decision_ids
revistas_to_acordao_id_dict = {}

def translate_revistas_citacoes_to_acordao_id(row, revistas_to_acordao_id_dict): 
    for cit_mag in row["citacoes_revistas"]:
        revistas_to_acordao_id_dict[cit_mag] = row.name


df_after.apply(translate_revistas_citacoes_to_acordao_id,
                                    args=(revistas_to_acordao_id_dict,), axis=1)

In [332]:
def parseAcordaosQuotes(txt, dec_type):
    quotes = []
    # Quando decisões do STF são prefixadas por pela string "STF:" a expressão regular abaixo não funciona.
    # Então remove-se a string sem prejuízo para a detecção das decisões citadas em txt
    txt = re.sub(r"art\.", "art", txt, flags=re.IGNORECASE)
    txt = re.sub("(STF:|\-?\s*(t|p)\w*\s*pleno|CASO\s+LÍDER)", "", txt, flags=re.IGNORECASE)
    # Verificar se é usado o padrão que remove o máximo possível de caracteres após modificar o padrão aqui
    # Em alguns espelhos o padrão que aparece no final acaba aparecendo no começo.
    # Então não é possível remover todo o texto que vem depois.
    txt = re.sub(
        r"((Número\s*de\s*p[aá]ginas|Altera[aç][aã]o|Revis[aã]o|Inclus[aã]o|An[aá]lise|Obs\.|Vota[cç][aã]o|Resultado):)[^\.]*\.", "", txt, flags=re.IGNORECASE
    )
    # Além disso, uma decisão específica começa com a string “Veja” Será feita uma exceção para este caso.    
    veja_pattern = r"(^Veja[^\.]*\.)?(.*)\-?\s*Veja.*"
    while re.search(veja_pattern, txt, flags=re.IGNORECASE):
        txt = re.sub(
            veja_pattern, r"\2", txt, flags=re.IGNORECASE
        )

    # ver posteriormente que tipo de informação é inserida entre '()' nas citações
    txt = re.sub(r"(STJ|TSE|TRE|TST|TRF\s*\-?[\s\w]*)\s*:.+[;\.]\s*", "", txt)

    search_pattern = (
        "[Dd]ecis(?:ão|ões)\s*monocráticas?\s*citada(?:\s*\(?s\)?)?\s*:\s*([^:]*)(?=\.[^:])"
        if dec_type == "decisoes_monocraticas"
        else "[Aa]c[óo]rd[ãa]o\s*\(?\s*s?\s*\)?\s+[Cc]itado\s*\(?\s*s?\s*\)?\s*[:;,]\s*(\.(?!\s)*|[^:]*)?"
    )
    #     Acórdão seguido eventualmente de espaços, seguido eventualmente de (s) com eventuais espaços dentro,
    #     seguido de espaços, seguido de Citado, seguido eventualmente de espaços, seguido eventualmente de (s)
    #     com eventuais espaços dentro seguido de eventuais espaços e eventualmente ':', seguido de caracteres
    #     que não sejam ':'. A última sequência (caracteres que não sejam ':') é que o que seve ser capturado.
    dec = re.search((search_pattern), txt, flags=re.IGNORECASE)

    if dec:
        dec = dec.group(1)
        dec = re.sub(r"[Dd]ecis(?:ão|ões)\s*monocráticas?\s*citada\s*\(?\s*s?\s*\)?\s*", "", dec, flags=re.IGNORECASE)
        if (len(dec) > 2) and (dec[-2] == "."):
            dec = dec[:-2]

        dec = re.sub(r"(\d+)\.(\d+)", r"\1\2", dec)
        dec = re.sub(r"[,;]?[\w\d\s\.\/\-]+\((STJ|TSE|TST|TRE|TRF\s*\-?[\s\w]*)\)", "", dec)
        # remover menções a revistas entre parênteses porque isso significa que o próprio
        # id do acórdão citado já é referenciado
        dec = re.sub("\(([A-Z]+\-?[\s\d]+\/\d+\-?\d*,?\s*)+\)", ",", dec)
        dec = re.sub("\-\s*[A-Z]+\-?[\s\d]+\/\d+\-?\d*", ",", dec)
        # manter citação à decisão e não à revista como no exemplo: 'TJ 169/557 (HC 73801)'
        dec = re.sub(r"(\w+\-?[\s\d]+\/\d+\-?\d*)\s+\(([^\d]{2,}[\s-]+\d+[^\d\)]*)\)", r"\2,", dec)

        # REMOVER CONTEÚDO ENTRE PARÊNTESES AQUI
        while re.search(r"\([^\(\)]+\)", dec):
            dec = re.sub(r"\([^\(\)]+\)", ",", dec)
        
        # VER O EFEITO DO SPLIT NO PARÊNTESES PARA ENTENDER QUE PADRÃO É EXTRAÍDO          
        dec = re.split("[;,.()]", dec)
        for q in dec:
            # SIGNIFICA QUE ACABOU O PADRÃO DE DECISÕES
            if re.search(r"embargos?\sde|(de|em)\sembargos?|RISTF|ESTRANGEIRA|(\-\s*STJ|\s+STJ|STJ\s+\-|TRF)", q, flags=re.IGNORECASE):
                return quotes
            q = q.strip()

            acordaoId_pattern = "([^\d\s]{2,}[\s-]+\d+[^\d\/]*)$"
            m = re.search(acordaoId_pattern, q)
            if m is None:
                n = re.search("([A-Z]+)\-?\s*(\d+\/\d+)", q)
                if (n is not None) and (not q.startswith("-")):
                    n = " ".join(n.groups())
                    if n in revistas_to_acordao_id_dict:
                        quotes.append(revistas_to_acordao_id_dict[n])
                    else:
                        quotes.append(n)

            while m:
                m = m.group()
                q = q.replace(m, "")
                m = m.replace("-", " ")
                m = m.strip().upper()
                m = " ".join(m.split())
                m = normalizeId(m)
                quotes.append(m)
                m = re.search(acordaoId_pattern, q)
    return sorted(set(quotes))

# https://pt.stackoverflow.com/questions/13598/significado-de-em-uma-regex

In [338]:
# Criar metodologia comparativa
# Ver forma de descobrir bons padrões de aprimoramento da extração

# Decisão SS 697-9 não está sendo capturada

In [122]:
# txt = "- Acórdão(s) citado(s): (COMPETÊNCIA, JUSTIÇA DO TRABALHO) AI 670715 AgR-ED (2ªT), RE 716896 AgR (2ªT). Número de páginas: 7. Análise: 11/07/2013, AUR."
txt = "- Acórdão citado: RE 92264. Número de páginas: 6. Análise: 11/12/2009, SEV."
print(txt)
txt = txt.replace("STF:", "")
print(txt)
txt = re.sub(
    r"(Número de páginas)?(Alteração)?(Revisão)?(Inclusão)?(Análise)?", "", txt
)
print(txt)
txt = re.sub(r"(STJ):[^;\.]+", "", txt)
print(txt)
txt = re.sub(r"(TSE):[^;\.]+", "", txt)
print(txt)
search_pattern = "[Aa]c[óo]rd[ãa]o\s*\(?\s*s?\s*\)?\s+[Cc]itado\s*\(?\s*s?\s*\)?\s*:\s*(\.(?!\s)*|[^:]*)?"
re.search((search_pattern), txt).group(1)

- Acórdão citado: RE 92264. Número de páginas: 6. Análise: 11/12/2009, SEV.
- Acórdão citado: RE 92264. Número de páginas: 6. Análise: 11/12/2009, SEV.
- Acórdão citado: RE 92264. : 6. : 11/12/2009, SEV.
- Acórdão citado: RE 92264. : 6. : 11/12/2009, SEV.
- Acórdão citado: RE 92264. : 6. : 11/12/2009, SEV.


'HC 46187 RTJ 114/408 (104722).'

### Benchmark da melhora da extração de citações

In [333]:
# comparar com última extração para checar se está tudo certo
df_after_i.loc[:, "citacoesObs_"] = df_after_i.loc[:, "NEWcitacoesObs"] if "NEWcitacoesObs" in df_after_i.columns else df_after_i.loc[:, "citacoesObs"]
df_after_i.loc[:, "NEWcitacoesObs"] = df_after_i.loc[:, "observacao"].progress_apply(lambda txt:
                                                                            sorted(parseAcordaosQuotes(txt, "acordaos"))
                                                                           )
print("Antes:", sum(df_after_i["citacoesObs"].apply(lambda x: len(x))),
      "\nDepois anterior:", sum(df_after_i["citacoesObs_"].apply(lambda x: len(x))),
      "\nDepois:", sum(df_after_i["NEWcitacoesObs"].apply(lambda x: len(x)))
      )

A value is trying to be set on a copy of a slice from a DataFrame.
Try using .loc[row_indexer,col_indexer] = value instead

See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html#returning-a-view-versus-a-copy
  self.obj[item] = s


HBox(children=(FloatProgress(value=0.0, max=74382.0), HTML(value='')))


Antes: 227919 
Depois anterior: 238306 
Depois: 237242


In [334]:
df_after_i[df_after_i.progress_apply(lambda x: len(x["NEWcitacoesObs"]) != len(x["citacoesObs_"]),
                            axis=1
                           )][["observacao", "citacoesObs_", "NEWcitacoesObs"]]
# df_after_i[df_after_i.progress_apply(lambda x: len(x["NEWcitacoesObs"]) != len(x["citacoesObs_"]),
#                             axis=1
#                            ) &
#            ~(~df_after_i["NEWcitacoesObs"].progress_apply(lambda x: True if re.search(r"S\wMULA|VINCULANTE|SUV|INFORMATIVO|STF|DE\s+|RTJ", ",".join(x)) else False) &
#            df_after_i["citacoesObs_"].progress_apply(lambda x: True if re.search(r"S\wMULA|VINCULANTE|SUV|INFORMATIVO|STF|DE\s+|RTJ", ",".join(x)) else False))
#           ][["observacao", "citacoesObs_", "NEWcitacoesObs"]]

HBox(children=(FloatProgress(value=0.0, max=74382.0), HTML(value='')))




Unnamed: 0,observacao,citacoesObs_,NEWcitacoesObs
24,"- Acórdãos citados: AC 471 AgR (RTJ 192/778), AC 491 AgR (RTJ 192/411), AC 510 AgR, AC 865 AgR, AC 1317 MC-ED, Pet 1859 AgR (RTJ 174/437), Pet 2835 QO (RTJ 191/483), Pet 2961 QO (RTJ 191/123), RE 407099; RTJ 174/437, RTJ 191/123, RTJ 191/483. - Decisão monocrática citada: AC 1449. - Veja Apelação Cível n° 100.015.2005.001342-9. Número de páginas: 22. Análise: 04/06/2007, AAC.","[AGR AC 471, AGR AC 491, AGR AC 510, AGR AC 865, AGR PET 1859, ED MC AC 1317, QO PET 2835, QO PET 2835, QO PET 2961, QO PET 2961, RE 407099, RTJ 174/437]","[AGR AC 471, AGR AC 491, AGR AC 510, AGR AC 865, AGR PET 1859, ED MC AC 1317, QO PET 2835, QO PET 2961, RE 407099, RTJ 174/437]"
43,"- Acórdão(s) citado(s): (CPI, PRINCÍPIO DA SIMETRIA) HC 71039 (1ªT), ACO 730 (TP), ADI 3619 (TP), ACO 730 QO (TP). (PREJUDICIALIDADE, MS, EXTINÇÃO, CPI) MS 23465 (TP). (SEPARAÇÃO DOS PODERES, DELINEAMENTO, CONSTITUIÇÃO DA REPÚBLICA) ADI 3046 (TP). (CPI, SIGILO, DIREITO À INTIMIDADE) MS 23452 (TP). (CPI, DECISÃO, FUNDAMENTAÇÃO) MS 23843 (TP), MS 23964 (TP), MS 24817 (TP), MS 25668 (TP), HC 100341 (TP). (CPI, SIGILO, INFORMAÇÃO) MS 23452 (1ªT), HC 100341 (TP). - Decisão monocrática citada: (CPI, DECISÃO, FUNDAMENTAÇÃO) MS 23669 MC. Número de páginas: 58. Análise: 09/01/2015, JOS. Revisão: 30/04/2015, KBP.","[ACO 730, ADI 3046, ADI 3619, HC 100341, HC 100341, HC 71039, MS 23452, MS 23452, MS 23465, MS 23843, MS 23964, MS 24817, MS 25668, QO ACO 730]","[ACO 730, ADI 3046, ADI 3619, HC 100341, HC 71039, MS 23452, MS 23465, MS 23843, MS 23964, MS 24817, MS 25668, QO ACO 730]"
180,"- Acórdão(s) citado(s): (PRINCÍPIO DA LEGALIDADE, DECISÃO ADMINISTRATIVA, CONCESSÃO, AUMENTO, REMUNERAÇÃO) ADI 728 (TP), ADI 727 (TP), ADI 730 (TP), ADI 681 (TP). (REVOGAÇÃO, LEI, MOMENTO ANTERIOR, AQUISIÇÃO, DIREITO, REAJUSTE) MS 21216 (TP). (CABIMENTO, ADI, DECISÃO ADMINISTRATIVA, AUMENTO, VENCIMENTO, CARÁTER GERAL) ADI 681 (TP). Número de páginas: 11. Análise: 14/04/2016, AMA.","[ADI 681, ADI 681, ADI 727, ADI 728, ADI 730, MS 21216]","[ADI 681, ADI 727, ADI 728, ADI 730, MS 21216]"
194,"- Acórdão(s) citado(s): (CONTROLE DE CONSTITUCIONALIDADE, DOTAÇÃO ORÇAMENTÁRIA PRÉVIA, MATÉRIA INFRACONSTITUCIONAL) ADI 2343 (TP), ADI 3599 (TP), ADI 1292 MC (TP), ADI 1585 (TP). (ANISTIA, AMPLIAÇÃO, SANÇÃO PENAL, SANÇÃO FISCAL, SANÇÃO DISCIPLINAR) Rp 696 (TP). (USURPAÇÃO, COMPETÊNCIA, PODER EXECUTIVO, DESCONSTITUIÇÃO, ATO ADMINISTRATIVO, PODER LEGISLATIVO) ADI 2364 MC (TP). (COMPETÊNCIA EXCLUSIVA, UNIÃO, DEFINIÇÃO, CRIME DE RESPONSABILIDADE) ADI 341 (TP), ADI 2220 (TP), ADI 3279 (TP). (COMPETÊNCIA LEGLISLATIVA, ESTADO-MEMBRO, ANISTIA, SERVIDOR PÚBLICO ESTADUAL) ADI 104 (TP). (CHEFE DO PODER EXECUTIVO, INICIATIVA LEGISLATIVA, ANISTIA, SERVIDOR PÚBLICO) ADI 341 (TP), ADI 1594 (TP), ADI 864 (TP). Número de páginas: 16. Análise: 21/11/2014, RAF. Revisão: 02/03/2015, KAR.","[ADI 104, ADI 1585, ADI 1594, ADI 2220, ADI 2343, ADI 3279, ADI 341, ADI 341, ADI 3599, ADI 864, MC ADI 1292, MC ADI 2364, RP 696]","[ADI 104, ADI 1585, ADI 1594, ADI 2220, ADI 2343, ADI 3279, ADI 341, ADI 3599, ADI 864, MC ADI 1292, MC ADI 2364, RP 696]"
378,"- Acórdão(s) citado(s): (LEGITIMIDADE, CONFEDERAÇÃO SINDICAL, INSTAURAÇÃO, CONTROLE ABSTRATO) ADI 138 (TP), ADI 396 (TP), ADI 1096, ADI 1159 (TP), ADI 1696 (TP), ADI 866 MC (TP), ADI 990 MC (TP), ADI 2349 MC (TP), ADI 1416 MC (TP), ADI 1037 (TP), ADI 1096 (TP). (DEVIDO PROCESSO LEGAL, PROCESSO ADMINISTRATIVO DISCIPLINAR) RMS 22789 (2ªT). (PRINCÍPIO DA AMPLA DEFESA) MS 21254 (TP), RE 165680 (1ªT), RTJ 161/672. (EFICÁCIA HORIZONTAL, DIREITO FUNDAMENTAL) RE 201819 (2ªT). (DEVIDO PROCESSO LEGAL, PROCEDIMENTO ADMINISTRATIVO) RE 140195 (2ªT), RE 191480 (2ªT), RE 199800 (2ªT), RTJ 163/790, RTJ 183/371, RTJ 156/1042. - Decisões monocráticas citadas: (LEGITIMIDADE, CONFEDERAÇÃO SINDICAL, INSTAURAÇÃO, CONTROLE ABSTRATO) ADI 1414. (DEVIDO PROCESSO LEGAL, PROCEDIMENTO ADMINISTRATIVO) RE 172587, AI 306626. - Acórdão(s) citado(s) - outros tribunais: STJ: RMS 14310, RMS 16807, RMS 7449 RDA 97/110, RDA 114/142, RDA 118/99, RT 239/254, TJMG: AC 1.0000.00.165096-9/000(1), TJRS: AC 594184459/1995, MS 596118356/1996, MS 597040724/1997, AC 70003855582/2002, Apelação Cível 70020916920 , TJSP: AC 126353/1990, AC 44929/1998, AC 145965/2002, Agravo de Petição 185.330 , TRF 1ª REGIÃO: REO 91.01.17099-6. - Legislação estrangeira citada: arts. X e XI, da Declaração Universal dos Direitos do Homem; art. 48, n. 2, da Carta dos Direitos Fundamentais da União Europeia; art. 7, n. 1. da Carta Africana dos Direitos Humanos e dos Povos - Carta de Banjul; art. 6º, n. 2 da Convenção Européia dos Direitos Humanos. Número de páginas: 38. Análise: 17/11/2014, JOS.","[ADI 1037, ADI 1096, ADI 1096, ADI 1159, ADI 138, ADI 1696, ADI 396, MC ADI 1416, MC ADI 2349, MC ADI 866, MC ADI 990, MS 21254, RE 140195, RE 165680, RE 191480, RE 199800, RE 201819, RMS 22789, RTJ 156/1042, RTJ 161/672, RTJ 163/790, RTJ 183/371]","[ADI 1037, ADI 1096, ADI 1159, ADI 138, ADI 1696, ADI 396, MC ADI 1416, MC ADI 2349, MC ADI 866, MC ADI 990, MS 21254, RE 140195, RE 165680, RE 191480, RE 199800, RE 201819, RMS 22789, RTJ 156/1042, RTJ 161/672, RTJ 163/790, RTJ 183/371]"
...,...,...,...
74317,"- Acórdão(s) citado(s): (EMBARGOS DE DECLARAÇÃO, REEXAME, MÉRITO) MS 24527 ED (TP), AI 600506 AgR-ED (2ªT), RE 416571 AgR-ED-ED (2ªT), RE 207851 AgR-ED-ED-ED (2ªT), AI 776875 AgR-ED-ED-ED (2ªT), HC 100154 ED (1ªT), AI 855810 RG-ED (TP). (EMBARGOS DE DECLARAÇÃO, EFEITOS INFRINGENTES) ARE 682471 AgR-ED (1ªT), RHC 101886 ED (2ªT). (EMBARGOS DE DECLARAÇÃO, CARÁTER PROTELATÓRIO) AI 776875 AgR-ED-ED-ED (2ªT), HC 100154 ED (1ªT). Número de páginas: 23. Análise: 24/10/2013, JOS. Revisão: 08/11/2013, IVA.","[ED AGR AI 600506, ED AGR ARE 682471, ED ED AGR RE 416571, ED ED ED AGR AI 776875, ED ED ED AGR AI 776875, ED ED ED AGR RE 207851, ED HC 100154, ED HC 100154, ED MS 24527, ED RG AI 855810, ED RHC 101886]","[ED AGR AI 600506, ED AGR ARE 682471, ED ED AGR RE 416571, ED ED ED AGR AI 776875, ED ED ED AGR RE 207851, ED HC 100154, ED MS 24527, ED RG AI 855810, ED RHC 101886]"
74322,"- Acórdão(s) citado(s): (EMBARGOS INFRINGENTES, AÇÃO PENAL ORIGINÁRIA) HC 72465 (1ªT). (DUPLO GRAU DE JURISDIÇÃO, EXCEÇÕES) AP 470 (TP). (EMBARGOS INFRINGENTES, AÇÃO PENAL ORIGINÁRIA, TRIBUNAL INFERIOR) HC 71124 (1ªT), HC 71949 (1ªT), HC 71951 (1ªT), HC 72465 (1ªT), RHC 53947 (2ªT). (EMBARGOS INFRINGENTES, AÇÃO DE CONTROLE CONCENTRADO DE CONSTITUCIONALIDADE) ADI 1591 (1ªT), ADI 1289 EI (TP). (EMBARGOS INFRINGENTES, AÇÃO RESCISÓRIA, ÂMBITO, STF) AR 1472 EI-AgR (TP), AR 1178 EI-QO (TP). (EMBARGOS INFRINGENTES, AUSÊNCIA, QUÓRUM MÍNIMO) AO 1046 ED (TP). (EMBARGOS INFRINGENTES, CABIMENTO, HIPÓTESE) ADI 171 EI, ADI 1591 EI (TP), HC 88247 AgR-AgR (TP), HC 72664 EI-AgR (2ªT), RE 172004 EI-AgR (2ªT), AI 617763 AgR-ED-AgR-ED (2ªT), AI 828792 AgR-EI (1ªT), ADI 29 EI (TP), RCL 377 EI-AGR (TP). (DUPLO GRAU DE JURISDIÇÃO, CONVENÇÃO AMERICANA DE DIREITOS HUMANOS) RHC 79785 (TP). (REGIMENTO INTERNO, ALCANCE, PODER NORMATIVO) ADI 1105 (TP), ADI 2580 (TP), ADI 2970 (TP), MS 28447 (TP), ADI 1503 (TP), ADI 1152(TP). (RECEPÇÃO, CONSTITUIÇÃO FEDERAL DE 1988, REGIMENTO INTERNO DO STF, FORÇA DE LEI) AI 148475 AgR (1ªT), SL 32 AgR (TP), RE 146747 EDv-AgR (TP), Pet 2961 QO (2ªT), RE 433592 AgR-ED-EDv-AgR (TP), RCL 377 EI-AGR, SS 260 QO (TP), RTJ 190/1084, RTJ 147/1010, RTJ 151/278. (REGIMENTO INTERNO DO STF, REVOGAÇÃO TÁCITA) RE 220286 EDv-AgR (TP), RE 146747 EDv-AgR (TP), MS 1637 EI (TP) . (APLICAÇÃO, NORMA MAIS FAVORÁVEL, TRATADO INTERNACIONAL, DIREITOS HUMANOS) HC 96772 (2ªT), HC 90450 (2ªT). (EMBARGOS INFRINGENTES, VALIDADE, NORMA, REGIMENTO INTERNO) HC 71124 (1ªT), ADI 171 EI, ADI 29 EI-AGR (TP). (AGRAVO REGIMENTAL, INDEFERIMENTO LIMINAR, MS) Rp 1299 - RTJ 119/980, MS 23466 AgR (2ªT). (RECEPÇÃO, CONSTITUIÇÃO FEDERAL DE 1988, EMBARGOS INFRINGENTES, REGIMENTO INTERNO DO STF) SS 327, SL 32 AgR (TP), RE 140829 EDv-ED (TP), AP 409 EI, RCL 377 EI-AGR, SS 260 QO (TP). (COMPETÊNCIA, STF, DISPOSIÇÃO, MATÉRIA PROCESSUAL, ÂMBITO, CONSTITUIÇÃO FEDERAL DE 1967) AP 409 EI, RP 700 EI-AGR (TP), RTJ...","[ADI 1105, ADI 1152, ADI 1503, ADI 1591, ADI 2580, ADI 2970, AGR AGR HC 88247, AGR AI 148475, AGR EDV ED AGR RE 433592, AGR EDV RE 146747, AGR EDV RE 146747, AGR EDV RE 220286, AGR EI ADI 29, AGR EI AR 1472, AGR EI HC 72664, AGR EI RCL 377, AGR EI RCL 377, AGR EI RCL 377, AGR EI RE 172004, AGR EI RP 700, AGR MS 23466, AGR SL 32, AGR SL 32, AP 470, ED AGR ED AGR AI 617763, ED AO 1046, ED EDV RE 140829, EI ADI 1289, EI ADI 1591, EI ADI 171, EI ADI 171, EI ADI 29, EI AGR AI 828792, EI AP 409, EI AP 409, EI MS 1637, HC 71124, HC 71124, HC 71949, HC 71951, HC 72465, HC 72465, HC 84662, HC 90450, HC 96772, MS 28447, QO EI AR 1178, QO PET 2961, QO SS 260, QO SS 260, RE 349703, RHC 53947, RHC 79785, RP 1092, RP 1299, RTJ 112/1115, RTJ 147/1010, RTJ 151/278, RTJ 172/159, RTJ 180/262, RTJ 187/933, RTJ 190/1084, RTJ 54/183, RTJ 69/138, RTJ 71/289, RTJ 77/657, SS 327]","[ADI 1105, ADI 1152, ADI 1503, ADI 1591, ADI 2580, ADI 2970, AGR AGR HC 88247, AGR AI 148475, AGR EDV ED AGR RE 433592, AGR EDV RE 146747, AGR EDV RE 220286, AGR EI ADI 29, AGR EI AR 1472, AGR EI HC 72664, AGR EI RCL 377, AGR EI RE 172004, AGR EI RP 700, AGR MS 23466, AGR SL 32, AP 470, ED AGR ED AGR AI 617763, ED AO 1046, ED EDV RE 140829, EI ADI 1289, EI ADI 1591, EI ADI 171, EI ADI 29, EI AGR AI 828792, EI AP 409, EI MS 1637, HC 71124, HC 71949, HC 71951, HC 72465, HC 84662, HC 90450, HC 96772, MS 28447, QO EI AR 1178, QO PET 2961, QO SS 260, RE 349703, RHC 53947, RHC 79785, RP 1092, RP 1299, RTJ 112/1115, RTJ 147/1010, RTJ 151/278, RTJ 172/159, RTJ 180/262, RTJ 187/933, RTJ 190/1084, RTJ 54/183, RTJ 69/138, RTJ 71/289, RTJ 77/657, SS 327]"
74329,"- Acórdão(s) citado(s): (EMBARGOS INFRINGENTES, AÇÃO PENAL ORIGINÁRIA, TRIBUNAL INFERIOR) HC 71124 (1ªT), HC 71949 (1ªT), HC 71951 (1ªT), HC 72465 (1ªT), RHC 53947 (2ªT); RT 571/295. (EMBARGOS INFRINGENTES, AÇÃO DE CONTROLE CONCENTRADO DE CONSTITUCIONALIDADE) ADI 1591 (TP). (EMBARGOS INFRINGENTES, AÇÃO RESCISÓRIA, ÂMBITO, STF) AR 1472 EI-AgR (TP), AR 1178 EI-QO (TP). (DUPLO GRAU DE JURISDIÇÃO, CONVENÇÃO AMERICANA DE DIREITOS HUMANOS) RHC 79785 (TP). (RECEPÇÃO, CONSTITUIÇÃO FEDERAL DE 1988, EMBARGOS INFRINGENTES, REGIMENTO INTERNO, STF) RCL 377 EI-AGR (TP). (EMBARGOS INFRINGENTES, VALIDADE, NORMA, REGIMENTO INTERNO) ADI 29 EI-AGR (TP), ADI 171 EI (TP). (RECEPÇÃO, CONSTITUIÇÃO FEDERAL DE 1988, REGIMENTO INTERNO, STF, FORÇA DE LEI) AI 148475 AgR (1ªT), SL 32 AgR (TP), RE 146747 EDv-AgR (TP), Pet 2961 QO (2ªT), RE 433592 AgR-ED-EDv-AgR (TP), RCL 377 EI-AGR (TP), SS 260 QO (TP). (COMPETÊNCIA, STF, DISPOSIÇÃO, MATÉRIA PROCESSUAL, ÂMBITO, CONSTITUIÇÃO FEDERAL DE 1967) RP 700 IE-AGR(TP). (EMBARGOS INFRINGENTES, AÇÃO DIRETA DE INCONSTITUCIONALIDADE) ADI 1289 EI (TP). (REGIMENTO INTERNO DO STF, REVOGAÇÃO TÁCITA) RE 220286 EDv-AgR (TP), RE 146747 EDv-AgR (TP), MS 1637 EI (TP). (SUPRALEGALIDADE, TRATADO INTERNACIONAL, DIREITOS HUMANOS) RE 349703 (TP). (EMBARGOS INFRINGENTES, VOTOS VENCIDOS) HC 71124 (1ªT). - Decisão monocrática citada: (COMPETÊNCIA, STF, DISPOSIÇÃO, MATÉRIA PROCESSUAL, ÂMBITO, CONSTITUIÇÃO FEDERAL DE 1967) AP 409 EI. - Legislação estrangeira citada: art. 130 da Constituição de Portugal, Constituição de Portugal de 1822, art. 102, 1 da Constituição da Espanha, Constituição da Espanha de 1812, arts. 68 e 68.1 da Constituição da França, art. 134 da Constituição da Itália, arts. 103 e 125 da Constituição da Bélgica, art. 32, 3 da Constituição da Suíça, art. 200 da Constituição da Venezuela, art. 99 e 100 da Constituição do Perú, arts. 29, 174, 175, 186, 199 e art 234 da Constituição da Colômbia de 1991, art. 57, 2º da Lei Orgânica do Poder Judiciário (Lei n. 6,...","[ADI 1591, AGR AI 148475, AGR EDV ED AGR RE 433592, AGR EDV RE 146747, AGR EDV RE 146747, AGR EDV RE 220286, AGR EI ADI 29, AGR EI AR 1472, AGR EI RCL 377, AGR EI RCL 377, AGR IE RP 700, AGR SL 32, EI ADI 1289, EI ADI 171, EI MS 1637, HC 71124, HC 71124, HC 71949, HC 71951, HC 72465, QO EI AR 1178, QO PET 2961, QO SS 260, RE 349703, RHC 53947, RHC 79785, RT 571/295]","[ADI 1591, AGR AI 148475, AGR EDV ED AGR RE 433592, AGR EDV RE 146747, AGR EDV RE 220286, AGR EI ADI 29, AGR EI AR 1472, AGR EI RCL 377, AGR IE RP 700, AGR SL 32, EI ADI 1289, EI ADI 171, EI MS 1637, HC 71124, HC 71949, HC 71951, HC 72465, QO EI AR 1178, QO PET 2961, QO SS 260, RE 349703, RHC 53947, RHC 79785, RT 571/295]"
74332,"- Acórdão(s) citado(s): (AGRAVAMENTO, PENA-BASE, CRIME, FORMAÇÃO DE QUADRILHA) AP 396 (TP), AP 481 (TP). (PRESCRIÇÃO, QUESTÃO PREJUDICIAL, MÉRITO, AÇÃO PENAL) HC 73120 (1ªT), HC 115098 (1ªT), HC 63765 (2ªT), RC 1453 (2ªT). (PROFUNDIDADE, EFEITO DEVOLUTIVO, EMBARGOS INFRINGENTES) RE 89063 (2ªT). (CRITÉRIO, FIXAÇÃO, PENA) HC 101118 (2ªT). (STF, EXAME, DOSIMETRIA DA PENA, INSTÂNCIA DIVERSA) HC 70391 (2ªT), HC 72992 (1ªT), HC 109596 (2ªT), RHC 115213 (1ªT). (SEVERIDADE, SANÇÃO, GRAVIDADE, FATO) HC 70774 (1ªT). (REQUISITO, DECISÃO JUDICIAL, AGRAVAMENTO, PENA-BASE) HC 96590 (2ªT), HC 101118 Extn (2ªT). (BASE EMPÍRICA, AUMENTO DA PENA) RTJ 143/600. (ELEMENTOS ESSENCIAIS, CRIME, FORMAÇÃO DE QUADRILHA) HC 72992 (1ªT), RTJ 102/614, RT 565/406, RT 582/348, RT 600/383, RT 580/328, RT 588/323, RT 615/272. (AUTONOMIA, CRIME, FORMAÇÃO DE QUADRILHA) RTJ 88/468. (FORMAÇÃO DE QUADRILHA, CONCURSO MATERIAL) RTJ 104/104, RTJ 128/325, RT 505/352. - Acórdão(s) citado(s) - outros tribunais: STJ: AP 514, AP 549, REsp 1198829, RSTJ 110/354. TRF4: Apelação Criminal 94.04.05616-2. TJRJ: RT 745/628. - Veja AP 470, AP 470 EDj-décimos terceiros, AP 470 EI, AP 470 EI-décimos-quartos, AP 470 EI-décimos, AP 470 EI-nonos, AP 470 EI-décimos-primeiros, AP 470 EI-quintos, AP 470 EI-décimos-terceiros e AP 470 EI-sétimos, do STF. Número de páginas: 134. Análise: 11/09/2014, GOD.","[AP 396, AP 481, EXTN HC 101118, HC 101118, HC 109596, HC 115098, HC 63765, HC 70391, HC 70774, HC 72992, HC 72992, HC 73120, HC 96590, RC 1453, RE 89063, RHC 115213, RT 505/352, RT 565/406, RT 580/328, RT 582/348, RT 588/323, RT 600/383, RT 615/272, RTJ 102/614, RTJ 104/104, RTJ 128/325, RTJ 143/600, RTJ 88/468]","[AP 396, AP 481, EXTN HC 101118, HC 101118, HC 109596, HC 115098, HC 63765, HC 70391, HC 70774, HC 72992, HC 73120, HC 96590, RC 1453, RE 89063, RHC 115213, RT 505/352, RT 565/406, RT 580/328, RT 582/348, RT 588/323, RT 600/383, RT 615/272, RTJ 102/614, RTJ 104/104, RTJ 128/325, RTJ 143/600, RTJ 88/468]"


In [341]:
# df_after_i.loc[:, "citacoesObs_"] = df_after_i.apply(lambda x: [c for c in x["citacoesObs"] if "VEJA" not in c], axis=1)
# df_after_i.loc[df_after_i["citacoesObs_"].str.len() != df_after_i["NEWcitacoesObs"].str.len(),
#                ["citacoesObs_", "NEWcitacoesObs", "observacao"]
#               ]

txt = "- Acórdão(s) citado(s): (HC, REEXAME, FATO, PROVA) HC 65887 , HC 66381 , HC 68610 (1ªT) - RTJ 136/1221, HC 69780 (1ªT) - RTJ 195/486, HC 70763 (1ªT) - RTJ 165/877, HC 72496 (1ªT) - RTJ 186/237, HC 72992 (1ªT) - RTJ 168/863, HC 73449 (1ªT) - RTJ 163/650, HC 96820 (1ªT), RHC 99388 (2ªT), HC 100067 (1ªT), HC 112507 (2ªT), RHC 131136 AgR (2ªT), HC 60555 (1ªT) - RTJ 110/555, HC 67349 (1ªT) - RTJ 129/1199, RHC 63806 (1ªT) - RTJ 137/198. (FUNDAMENTAÇÃO, DECISÃO JUDICIAL) RE 140370 (1ªT) - RTJ 150/269, AI 152586 AgR , RE 327143 AgR (2ªT), AI 529105 AgR (2ªT), AI 637301 AgR (1ªT), AI 731527 AgR (2ªT), AI 791292 QO-RG , AI 838209 AgR (2ªT), AI 842316 AgR (1ªT), AI 840788 AgR (1ªT), RTJ 170/627. (HC, SUPRESSÃO DE INSTÂNCIA) HC 73390 (2ªT), HC 79551 (1ªT), HC 80747 (1ªT) - RTJ 182/243, HC 81115 (1ªT), HC 83842 (2ªT) - RTJ 192/233, HC 97761 (2ªT). (ALEGAÇÃO, NULIDADE, PRECLUSÃO) HC 53508 (1ªT) - RTJ 76/435, HC 72454 (1ªT), HC 74339 (1ªT), HC 58994 (1ªT) - RTJ 104/540, RT 451/490. (HC, SUCEDÂNEO, REVISÃO CRIMINAL) HC 70457 , HC 98206 (1ªT), HC 98412 (2ªT), RHC 116674 (2ªT), HC 122753 AgR (2ªT), RHC 130270 (1ªT), RHC 128723 AgR (1ªT), RHC 133200 (2ªT), HC 134974 (2ªT), HC 123182 AgR (1ªT), HC 134976 AgR (1ªT), HC 137059 AgR (2ªT). - Acórdão(s) citado(s) - outros tribunais: STJ: HC 130146, RHC 68917 EDcl-AgRg. Número de páginas: 20. Análise: 11/09/2019, JRS."
parseAcordaosQuotes(txt, "acordaos")
# df_after_i.loc[df_after_i["citacoesObs"].str.len() != df_after_i["NEWcitacoesObs"].str.len(),
#                ["citacoesObs_", "NEWcitacoesObs", "observacao"]
#               ]

['HC 65887',
 'HC 66381',
 'HC 68610',
 'HC 69780',
 'HC 70763',
 'HC 72496',
 'HC 72992',
 'HC 73449',
 'HC 96820',
 'RHC 99388',
 'HC 100067',
 'HC 112507',
 'AGR RHC 131136',
 'HC 60555',
 'HC 67349',
 'RHC 63806',
 'RE 140370',
 'AGR AI 152586',
 'AGR RE 327143',
 'AGR AI 529105',
 'AGR AI 637301',
 'AGR AI 731527',
 'RG QO AI 791292',
 'AGR AI 838209',
 'AGR AI 842316',
 'AGR AI 840788',
 'HC 73390',
 'HC 79551',
 'HC 80747',
 'HC 81115',
 'HC 83842',
 'HC 97761',
 'HC 53508',
 'HC 72454',
 'HC 74339',
 'HC 58994',
 'HC 70457',
 'HC 98206',
 'HC 98412',
 'RHC 116674',
 'AGR HC 122753',
 'RHC 130270',
 'AGR RHC 128723',
 'RHC 133200',
 'HC 134974',
 'AGR HC 123182',
 'AGR HC 134976',
 'AGR HC 137059']

In [188]:
# Número de acórdãos com MENOS extrações que coleta anterior ANTES
df_after_i[df_after_i.apply(lambda x: len(x["citacoesObs"]) < len(x["citacoesObs_before_i"]),
                            axis=1
                           )][["citacoesObs", "citacoesObs_before_i", "observacao"]]

Unnamed: 0,citacoesObs,citacoesObs_before_i,observacao
129,"[ADI 139, ADI 182, ADI 234, ADI 430, ADI 864, MC ADI 766]","[ADI 139, ADI 151, ADI 182, ADI 234, ADI 430, ADI 766, ADI 864]","Acórdãos citados: ADI 766 MC (157/460), ADI 864, ADI 151/416), ADI 139 (RTJ 138/14), ADI 182 (RTJ 133/1037), ADI 234 (RTJ 167/363), ADI 430 (RTJ 159/735). Número de páginas: (09). Análise:(MML). Revisão:(CTM/AAF). Inclusão: 07/11/02, (MLR). Alteração: 11/11/02, (MLR). Alteração: 28/05/2018, ALS."
167,"[ADI 425, ADI 805, MC ADI 1070, MC ADI 2079, MC ADI 2417]","[ADI 1070, ADI 2079, ADI 2417, ADI 425, ADI 805, RJT 168]","Acórdãos citados: ADI 425, ADI 805 (RTJ 168/391), ADI 1070 MC (RJT 168/87), ADI 2079 MC (RTJ 174/75), ADI 2417 MC. Veja: Informativo do STF 339. Número de páginas: (11). Análise:(JOY). Revisão:(RCO). Inclusão: 02/12/04, (CFC). Alteração: 07/12/04, (JVC). Alteração 21/02/2019 VRL"
222,"[ADI 1571, HC 77002, HC 81611]","[ADI 1571, HC 77002, HC 81611, RT 796]","Votação: por maioria, vencidos os Mins. Carlos Britto e Ellen Gracie. Resultado: julgada improcedente a Ação e firmada a constitucionalidade do artigo 83, ""caput"", da Lei-9430/1996. Acórdãos citados: ADI-1571 (RTJ-167/53), HC-77002, HC-81611; RTJ-167/53), RT-796/492. Veja: Informativos do STF-286, 326 e 333. Número de páginas: (22). Análise:(PCC). Revisão:(JOY). Inclusão: 25/01/05, (MLR). Alteração: 01/02/05, (MLR)."
250,"[ADI 1523, ADI 1775, AGR ADI 203, MC ADI 2137, MC ADI 647, MC ADI 709, MC ADI 842]","[ADI 1523, ADI 1775, ADI 203, ADI 2137, ADI 528, ADI 647, ADI 709, ADI 842]","Acórdãos citados: ADI 203 AgR (RTJ 131/1001), ADI 647 MC (RTJ 140/36), ADI 709 MC (RTJ 154/401), ADI 842 MC (RTJ 147/545), ADI 1523, ADI 1775 (RTJ 177/669), ADI 2137 MC (RTJ 173/490). Decisão monocrática citada: ADI 528. Veja: informativo do STF 338. Número de páginas: (10). Análise:(JOY). Revisão:(RCO). Inclusão: 07/10/04, (SVF). Alteração: 09/10/04, (JVC), Alteração: 18/02/2019, RAM."
370,[],"[ADI 1727, ADI 2093, ADI 2107, ADI 2195, ADI 740, AO 679, AO 707, AO 724]","Número de páginas: (08). Análise:(PCC). Revisão:(RCO). Inclusão: 18/11/04, (MLR). Alteração: 29/11/04, (NT). Alteração: 19/11/2019, (PDR)."
...,...,...,...
73668,[],"[SE 5778, SEC 4694]","Número de páginas: (9). Análise:(PCC). Inclusão: 09/05/05, (PCC). Alteração: 10/01/06, (SVF). Alteração: 10/12/2019, (PDR)."
73671,"[INFORMATIVO 292, SEC 4694, SEC 6729, SEC 6971]","[SE 3495, SE 3534, SE 4248, SE 4307, SEC 2912, SEC 5378, SEC 5418, SEC 6122]","Acórdãos citados: SEC 4694, SEC 6729, SEC 6971 (Informativo-292). Número de páginas: (10). Análise:(JOY). Revisão:(RCO). Inclusão: 06/07/04, (MLR). Alteração: 07/07/04, (NT). Alteração: 16/04/2019, HAC."
73675,[],"[SE 2582, SE 3495, SE 4248, SE 4605, SEC 6304, SEC 6729]","Votação: unânime. Resultado: indeferida Número de páginas: (07). Análise:(MSA). Revisão:(RCO). Alteração: 19/05/05, (SVF). Alteração: 30/04/2019, NSB."
73680,[],"[SEC 6304, SEC 6729, SEC 7218]","Votação: unânime. Resultado: homologada a sentença estrangeira. - Veja Informativo 370 do STF. Número de páginas: (05). Análise:(RDC). Revisão:(ANA). Inclusão: 04/02/05, (SVF). Alteração: 29/11/05, (CSV)."


In [189]:
# Número de acórdãos com MENOS extrações que coleta anterior DEPOIS
df_after_i[df_after_i.apply(lambda x: len(x["NEWcitacoesObs"]) < len(x["citacoesObs_before_i"]),
                            axis=1
                           )][["NEWcitacoesObs", "citacoesObs_before_i", "observacao"]]

Unnamed: 0,NEWcitacoesObs,citacoesObs_before_i,observacao
129,"[ADI 139, ADI 182, ADI 234, ADI 430, ADI 864, MC ADI 766]","[ADI 139, ADI 151, ADI 182, ADI 234, ADI 430, ADI 766, ADI 864]","Acórdãos citados: ADI 766 MC (157/460), ADI 864, ADI 151/416), ADI 139 (RTJ 138/14), ADI 182 (RTJ 133/1037), ADI 234 (RTJ 167/363), ADI 430 (RTJ 159/735). Número de páginas: (09). Análise:(MML). Revisão:(CTM/AAF). Inclusão: 07/11/02, (MLR). Alteração: 11/11/02, (MLR). Alteração: 28/05/2018, ALS."
167,"[ADI 425, ADI 805, MC ADI 1070, MC ADI 2079, MC ADI 2417]","[ADI 1070, ADI 2079, ADI 2417, ADI 425, ADI 805, RJT 168]","Acórdãos citados: ADI 425, ADI 805 (RTJ 168/391), ADI 1070 MC (RJT 168/87), ADI 2079 MC (RTJ 174/75), ADI 2417 MC. Veja: Informativo do STF 339. Número de páginas: (11). Análise:(JOY). Revisão:(RCO). Inclusão: 02/12/04, (CFC). Alteração: 07/12/04, (JVC). Alteração 21/02/2019 VRL"
222,"[ADI 1571, HC 77002, HC 81611]","[ADI 1571, HC 77002, HC 81611, RT 796]","Votação: por maioria, vencidos os Mins. Carlos Britto e Ellen Gracie. Resultado: julgada improcedente a Ação e firmada a constitucionalidade do artigo 83, ""caput"", da Lei-9430/1996. Acórdãos citados: ADI-1571 (RTJ-167/53), HC-77002, HC-81611; RTJ-167/53), RT-796/492. Veja: Informativos do STF-286, 326 e 333. Número de páginas: (22). Análise:(PCC). Revisão:(JOY). Inclusão: 25/01/05, (MLR). Alteração: 01/02/05, (MLR)."
250,"[ADI 1523, ADI 1775, AGR ADI 203, MC ADI 2137, MC ADI 647, MC ADI 709, MC ADI 842]","[ADI 1523, ADI 1775, ADI 203, ADI 2137, ADI 528, ADI 647, ADI 709, ADI 842]","Acórdãos citados: ADI 203 AgR (RTJ 131/1001), ADI 647 MC (RTJ 140/36), ADI 709 MC (RTJ 154/401), ADI 842 MC (RTJ 147/545), ADI 1523, ADI 1775 (RTJ 177/669), ADI 2137 MC (RTJ 173/490). Decisão monocrática citada: ADI 528. Veja: informativo do STF 338. Número de páginas: (10). Análise:(JOY). Revisão:(RCO). Inclusão: 07/10/04, (SVF). Alteração: 09/10/04, (JVC), Alteração: 18/02/2019, RAM."
370,[],"[ADI 1727, ADI 2093, ADI 2107, ADI 2195, ADI 740, AO 679, AO 707, AO 724]","Número de páginas: (08). Análise:(PCC). Revisão:(RCO). Inclusão: 18/11/04, (MLR). Alteração: 29/11/04, (NT). Alteração: 19/11/2019, (PDR)."
...,...,...,...
73668,[],"[SE 5778, SEC 4694]","Número de páginas: (9). Análise:(PCC). Inclusão: 09/05/05, (PCC). Alteração: 10/01/06, (SVF). Alteração: 10/12/2019, (PDR)."
73671,"[SEC 4694, SEC 6729, SEC 6971]","[SE 3495, SE 3534, SE 4248, SE 4307, SEC 2912, SEC 5378, SEC 5418, SEC 6122]","Acórdãos citados: SEC 4694, SEC 6729, SEC 6971 (Informativo-292). Número de páginas: (10). Análise:(JOY). Revisão:(RCO). Inclusão: 06/07/04, (MLR). Alteração: 07/07/04, (NT). Alteração: 16/04/2019, HAC."
73675,[],"[SE 2582, SE 3495, SE 4248, SE 4605, SEC 6304, SEC 6729]","Votação: unânime. Resultado: indeferida Número de páginas: (07). Análise:(MSA). Revisão:(RCO). Alteração: 19/05/05, (SVF). Alteração: 30/04/2019, NSB."
73680,[],"[SEC 6304, SEC 6729, SEC 7218]","Votação: unânime. Resultado: homologada a sentença estrangeira. - Veja Informativo 370 do STF. Número de páginas: (05). Análise:(RDC). Revisão:(ANA). Inclusão: 04/02/05, (SVF). Alteração: 29/11/05, (CSV)."


In [190]:
# Número de acórdãos com MESMAS extrações que coleta anterior ANTES
df_after_i[df_after_i.apply(lambda x: len(x["citacoesObs"]) == len(x["citacoesObs_before_i"]),
                            axis=1
                           )][["citacoesObs", "citacoesObs_before_i", "observacao"]]

Unnamed: 0,citacoesObs,citacoesObs_before_i,observacao
1,[],[],"Número de páginas: 7. Análise: 11/07/2013, AUR."
4,[],[],"Número de páginas: 5. Análise: 26/05/2016, IMC."
8,[],[],"Número de páginas: 11. Análise: 21/05/2015, AMA."
13,[],[],"Número de páginas: 5. Análise: 11/12/2009, MLM."
18,[],[],"Número de páginas: 6. Análise: 10/05/2016, AMS."
...,...,...,...
74358,[],[],"Número de páginas: 7. Análise: 25/03/2014, TIA."
74367,[],[],"Número de páginas: 5. Análise: 12/01/2017, MJC."
74372,[],[],"Número de páginas: 17. Análise: 08/02/2011, SEV. Revisão: 10/02/2011, KBP."
74373,[],[],"- Legislação estrangeira citada: art. 118º, 1, ""b"", art. 121, I, ""a"", art. 375ª, 1, no art. 205ª, 1, 4, ""a"", e 5, do Código Penal Português e art. 11ª, nº1, alínea ""a"", do Decreto-Lei Português nº 316 de 1997, art. 202 do Código de Processo Penal Português. Número de páginas: 16. Análise: 27/02/2013, IMC. Revisão: 01/03/2013, MMR."


In [193]:
# Número de acórdãos com MESMAS extrações que coleta anterior DEPOIS
df_after_i[df_after_i.apply(lambda x: len(x["NEWcitacoesObs"]) == len(x["citacoesObs_before_i"]),
                            axis=1
                           )][["NEWcitacoesObs", "citacoesObs_before_i", "observacao"]]

Unnamed: 0,NEWcitacoesObs,citacoesObs_before_i,observacao
1,[],[],"Número de páginas: 7. Análise: 11/07/2013, AUR."
4,[],[],"Número de páginas: 5. Análise: 26/05/2016, IMC."
8,[],[],"Número de páginas: 11. Análise: 21/05/2015, AMA."
13,[],[],"Número de páginas: 5. Análise: 11/12/2009, MLM."
18,[],[],"Número de páginas: 6. Análise: 10/05/2016, AMS."
...,...,...,...
74358,[],[],"Número de páginas: 7. Análise: 25/03/2014, TIA."
74367,[],[],"Número de páginas: 5. Análise: 12/01/2017, MJC."
74372,[],[],"Número de páginas: 17. Análise: 08/02/2011, SEV. Revisão: 10/02/2011, KBP."
74373,[],[],"- Legislação estrangeira citada: art. 118º, 1, ""b"", art. 121, I, ""a"", art. 375ª, 1, no art. 205ª, 1, 4, ""a"", e 5, do Código Penal Português e art. 11ª, nº1, alínea ""a"", do Decreto-Lei Português nº 316 de 1997, art. 202 do Código de Processo Penal Português. Número de páginas: 16. Análise: 27/02/2013, IMC. Revisão: 01/03/2013, MMR."


In [320]:
# Número de acórdãos com MAIS extrações que coleta anterior ANTES
df_after_i[df_after_i.apply(lambda x: len(x["citacoesObs"]) > len(x["citacoesObs_before_i"]),
                            axis=1
                           )][["acordaoId", "citacoesObs", "citacoesObs_before_i", "observacao"]]

Unnamed: 0,acordaoId,citacoesObs,citacoesObs_before_i,observacao
0,2ºJULG AGR AI 699063,"[AGR RE 716896, ED AGR AI 670715]",[],"- Acórdão(s) citado(s): (COMPETÊNCIA, JUSTIÇA DO TRABALHO) AI 670715 AgR-ED (2ªT), RE 716896 AgR (2ªT). Número de páginas: 7. Análise: 11/07/2013, AUR."
2,2ºJULG AGR ARE 774137,"[AGR AI 733063, AGR AI 776070, AGR AI 820065, AGR ARE 647186, AGR ARE 649046, AGR ARE 661070, AGR RE 735918]",[],"- Acórdão(s) citado(s): (CONCURSO PÚBLICO, PRETERIÇÃO DE CANDIDATO) AI 776070 AgR (2ªT), ARE 661070 AgR (2ªT), AI 820065 AgR (1ªT), ARE 649046 AgR (1ªT), RE 735918 AgR (2ªT). (PREQUESTIONAMENTO) AI 733063 AgR (2ªT), ARE 647186 AgR (1ªT). Número de páginas: 12. Análise: 04/11/2014, MAR."
3,2ºJULG AGR HC 88759,"[AI 430526, HC 69599, HC 73556, HC 81134]",[],"- Acórdãos citados: HC 69599, HC 73556, HC 81134, AI 430526. Número de páginas: 10. Análise: 01/09/2010, MMR. Revisão: 06/09/2010, ACG."
5,2ºJULG ED ED ED AGR AI 489856,"[ED ED AGR AI 586710, ED HC 80566]",[],"- Acórdãos citados: HC 80566 ED (RTJ 180/974), AI 586710 AgR-ED-ED. Número de páginas: 6. Análise: 26/06/2008, SOF."
6,2ºJULG ED ED ED AGR AI 531494,"[AGR AGR ED RE 281287, AGR RE 475421, ED ED AGR AI 586710]",[],"- Acórdãos citados: RE 281287 ED-AgR-AgR, RE 475421 AgR, AI 586710 AgR-ED-ED. Número de páginas: 6. Análise: 26/06/2008, SOF."
...,...,...,...,...
74375,TERCEIROS DÉCIMOS EI AP 470,"[AP 396, AP 481, EXTN HC 101118, HC 101118, HC 109596, HC 115098, HC 63765, HC 70391, HC 70774, HC 72992, HC 72992, HC 73120, HC 96590, RC 1453, RE 89063, RHC 115213]",[],"- Acórdão(s) citado(s): (PENA-BASE, CRIME, QUADRILHA, COMPARAÇÃO, PENA-BASE, CRIME, CORRELAÇÃO, CORRUPÇÃO POLÍTICA) AP 396 (TP), AP 481 (TP). (PRESCRIÇÃO DA PRETENSÃO PUNITIVA, QUESTÃO PREJUDICIAL, MÉRITO, AÇÃO PENAL) HC 73120 (1ªT), HC 115098 (1ªT), HC 63765 (2ªT), RC 1453 (2ªT). (PROFUNDIDADE, EFEITO DEVOLUTIVO, EMBARGOS INFRINGENTES) RE 89063. (CRITÉRIO, FIXAÇÃO, PENA) HC 101118 (2ªT). (STF, EXAME, DOSIMETRIA DA PENA, DIVERSIDADE, TRIBUNAL) HC 70391 (2ªT), HC 72992 (1ªT), HC 109596 (2ªT), RHC 115213 (1ªT). (SEVERIDADE, SANÇÃO, GRAVIDADE, FATO) HC 70774 (1ªT). (REQUISITO, MOTIVAÇÃO, DECISÃO JUDICIAL, EXACERBAÇÃO, PENA-BASE) HC 96590 (2ªT), HC 101118 Extn (2ªT), RTJ 143/600. (REQUISITOS, CRIME, QUADRILHA) HC 72992 (1ªT), RTJ 102/614, RT 565/406, RT 582/348, RT 600/383, RT 580/328, RT 588/323, RT 615/272. (AUTONOMIA, CRIME DE QUADRILHA) RTJ 88/468. (QUADRILHA, CONCURSO MATERIAL, CRIMES) RTJ 104/104, RTJ 128/325, RT 505/352. - Acórdão(s) citado(s) - outros tribunais: STJ: AP 514, AP 549, REsp 1198829. TRF4: Apelação Criminal 94.04.05616-2. TJRJ: RT 745/628. RSTJ 110/354. - Veja AP 470, AP 470 EI, AP EI-décimos-quartos, AP 470 EI-sétimos, AP 470 EI-nonos, AP 470 EI-décimos-primeiros, AP 470 EI-quintos, AP 470 EI-décimos do STF. Número de páginas: 117. Análise: 24/09/2014, IVA. Revisão: 06/10/2014, JOS."
74376,TERCEIROS ED RE 463624,"[AGR ED AI 709440, AGR RE 601914, AI 733387, ED AGR AI 153147, ED AGR AI 776295, ED AGR AI 825520, ED AGR ARE 679031, ED RE 177599, HC 54513, HC 69438, HC 69987, QO AGR RE 227089]",[],"- Acórdão(s) citado(s): (ED, EFEITOS INFRINGENTES) RE 177599 ED, AI 153147 AgR-ED, RTJ 191/694-695, RTJ 134/1296, RTJ 134/836. (DEVIDO PROCESSO LEGAL) AI 733387 (2ªT), AI 709440 ED-AgR (1ªT), RE 227089 AgR-QO (TP), RE 601914 AgR (2ªT), AI 776295 AgR-ED (1ªT), ARE 679031 AgR-ED (2ªT), RTJ 137/1053, RTJ 158/272. (MOTIVAÇÃO “PER RELATIONEM”) HC 69438 (1ªT), HC 69987 (TP). (MOTIVAÇÃO POR REFERÊNCIA OU POR REMISSÃO) HC 54513, AI 825520 AgR-ED (2ªT). (OFENSA REFLEXA) RTJ 120/912, RTJ 132/455. Número de páginas: 13. Análise: 26/03/2015, MAD."
74377,TERCEIROS ED SEGUNDO AGR CC 7706,"[AGR CC 7699, AGR CC 7730, AGR RCL 11250, AGR RCL 13508, QO CC 7094, RCL 10793, RE 586453]",[],"- Acórdão(s) citado(s): (PREVIDÊNCIA PRIVADA, COMPLEMENTAÇÃO DE APOSENTADORIA, COMPETÊNCIA) RE 586453 (TP). (CONFLITO DE COMPETÊNCIA, NECESSIDADE, MANIFESTAÇÃO, JUÍZO) CC 7094 QO (1ªT), CC 7699 AgR (TP). (RECLAMAÇÃO, AGRAVO, DECISÃO, APLICAÇÃO, REPERCUSSÃO GERAL) Rcl 10793 (TP), Rcl 11250 AgR (TP), Rcl 13508 AgR (TP). (CONFLITO DE COMPETÊNCIA, SUCEDÂNEO, RECURSO) CC 7730 AgR (TP). - Decisão monocrática citada: (CONFLITO DE COMPETÊNCIA) CC 7123 MC. - Acórdão(s) citado(s) - outros tribunais: STJ: CC 110996, CC 48106, REsp 1.413.016, CC 129.502 AgRg, CC 128.051 AgRg. - Veja AI 834551 do STF, Resp 961407 do STJ e RR 114500-77.2005.5.02.0049 do TST. Número de páginas: 56. Análise: 28/05/2015, IMC."
74378,TERCEIROS VIGÉSIMOS EDJ AP 470,"[AGR AI 734689, AGR AI 738982, AGR AI 813692, AGR ARE 657355, AGR ED AGR RE 406432, AGR RE 585932, ED AGR AI 153147, ED AGR AI 825520, ED EXT 662, ED INQ 1070, ED INQ 2424, ED PETA AP 552, ED RE 177599, ED RE 592905, ED RMS 27920, HC 54513, RE 172292, RE 223904]",[],"- Acórdão(s) citado(s): (REVISÃO, CANCELAMENTO, NOTA TAQUIGRÁFICA) RE 406432 AgR-ED-AgR (2ªT), RMS 27920 ED (2ªT), RE 592905 ED (TP), Inq 2424 ED (TP), AP 552 PetA-ED (TP). (CONDIÇÃO, CABIMENTO, EMBARGOS DE DECLARAÇÃO) Inq 1070 ED (TP). (CONTRADIÇÃO, VOTO VENCIDO, VOTO VENCEDOR) Ext 662 ED (TP). (NOTAS TAQUIGRÁFICAS, REVISÃO, CANCELAMENTO) RE 223904 (2ªT). (MOTIVAÇÃO ""PER RELATIONEM"") RE 172292 (2ªT), AI 734689 AgR (2ªT), AI 825520 AgR-ED (2ªT), AI 738982 AgR (2ªT), ARE 657355 AgR (1ªT), AI 813692 AgR (2ªT), RE 585932 AgR (2ªT), HC 54513 (2ªT). (EMBARGOS DE DECLARAÇÃO, EFEITOS INFRINGENTES) AI 153147 AGR-ED (1ªT), RE 177599 ED (1ªT), RTJ 191/694, RTJ 134/1296, RTJ 134/836. - Decisões monocráticas citadas: (MOTIVAÇÃO ""PER RELATIONEM"") MS 28677 MC, MS 28989 MC. - Veja AP 512 do STF. Número de páginas: 69. Análise: 17/01/2014, IVA."


In [191]:
# Número de acórdãos com MAIS extrações que coleta anterior DEPOIS
df_after_i[df_after_i.apply(lambda x: len(x["NEWcitacoesObs"]) > len(x["citacoesObs_before_i"]),
                            axis=1
                           )][["NEWcitacoesObs", "citacoesObs_before_i", "observacao"]]

Unnamed: 0,NEWcitacoesObs,citacoesObs_before_i,observacao
0,"[AGR RE 716896, ED AGR AI 670715]",[],"- Acórdão(s) citado(s): (COMPETÊNCIA, JUSTIÇA DO TRABALHO) AI 670715 AgR-ED (2ªT), RE 716896 AgR (2ªT). Número de páginas: 7. Análise: 11/07/2013, AUR."
2,"[AGR AI 733063, AGR AI 776070, AGR AI 820065, AGR ARE 647186, AGR ARE 649046, AGR ARE 661070, AGR RE 735918]",[],"- Acórdão(s) citado(s): (CONCURSO PÚBLICO, PRETERIÇÃO DE CANDIDATO) AI 776070 AgR (2ªT), ARE 661070 AgR (2ªT), AI 820065 AgR (1ªT), ARE 649046 AgR (1ªT), RE 735918 AgR (2ªT). (PREQUESTIONAMENTO) AI 733063 AgR (2ªT), ARE 647186 AgR (1ªT). Número de páginas: 12. Análise: 04/11/2014, MAR."
3,"[AI 430526, HC 69599, HC 73556, HC 81134]",[],"- Acórdãos citados: HC 69599, HC 73556, HC 81134, AI 430526. Número de páginas: 10. Análise: 01/09/2010, MMR. Revisão: 06/09/2010, ACG."
5,"[ED ED AGR AI 586710, ED HC 80566]",[],"- Acórdãos citados: HC 80566 ED (RTJ 180/974), AI 586710 AgR-ED-ED. Número de páginas: 6. Análise: 26/06/2008, SOF."
6,"[AGR AGR ED RE 281287, AGR RE 475421, ED ED AGR AI 586710]",[],"- Acórdãos citados: RE 281287 ED-AgR-AgR, RE 475421 AgR, AI 586710 AgR-ED-ED. Número de páginas: 6. Análise: 26/06/2008, SOF."
...,...,...,...
74375,"[AP 396, AP 481, EXTN HC 101118, HC 101118, HC 109596, HC 115098, HC 63765, HC 70391, HC 70774, HC 72992, HC 72992, HC 73120, HC 96590, RC 1453, RE 89063, RHC 115213]",[],"- Acórdão(s) citado(s): (PENA-BASE, CRIME, QUADRILHA, COMPARAÇÃO, PENA-BASE, CRIME, CORRELAÇÃO, CORRUPÇÃO POLÍTICA) AP 396 (TP), AP 481 (TP). (PRESCRIÇÃO DA PRETENSÃO PUNITIVA, QUESTÃO PREJUDICIAL, MÉRITO, AÇÃO PENAL) HC 73120 (1ªT), HC 115098 (1ªT), HC 63765 (2ªT), RC 1453 (2ªT). (PROFUNDIDADE, EFEITO DEVOLUTIVO, EMBARGOS INFRINGENTES) RE 89063. (CRITÉRIO, FIXAÇÃO, PENA) HC 101118 (2ªT). (STF, EXAME, DOSIMETRIA DA PENA, DIVERSIDADE, TRIBUNAL) HC 70391 (2ªT), HC 72992 (1ªT), HC 109596 (2ªT), RHC 115213 (1ªT). (SEVERIDADE, SANÇÃO, GRAVIDADE, FATO) HC 70774 (1ªT). (REQUISITO, MOTIVAÇÃO, DECISÃO JUDICIAL, EXACERBAÇÃO, PENA-BASE) HC 96590 (2ªT), HC 101118 Extn (2ªT), RTJ 143/600. (REQUISITOS, CRIME, QUADRILHA) HC 72992 (1ªT), RTJ 102/614, RT 565/406, RT 582/348, RT 600/383, RT 580/328, RT 588/323, RT 615/272. (AUTONOMIA, CRIME DE QUADRILHA) RTJ 88/468. (QUADRILHA, CONCURSO MATERIAL, CRIMES) RTJ 104/104, RTJ 128/325, RT 505/352. - Acórdão(s) citado(s) - outros tribunais: STJ: AP 514, AP 549, REsp 1198829. TRF4: Apelação Criminal 94.04.05616-2. TJRJ: RT 745/628. RSTJ 110/354. - Veja AP 470, AP 470 EI, AP EI-décimos-quartos, AP 470 EI-sétimos, AP 470 EI-nonos, AP 470 EI-décimos-primeiros, AP 470 EI-quintos, AP 470 EI-décimos do STF. Número de páginas: 117. Análise: 24/09/2014, IVA. Revisão: 06/10/2014, JOS."
74376,"[AGR ED AI 709440, AGR RE 601914, AI 733387, ED AGR AI 153147, ED AGR AI 776295, ED AGR AI 825520, ED AGR ARE 679031, ED RE 177599, HC 54513, HC 69438, HC 69987, QO AGR RE 227089]",[],"- Acórdão(s) citado(s): (ED, EFEITOS INFRINGENTES) RE 177599 ED, AI 153147 AgR-ED, RTJ 191/694-695, RTJ 134/1296, RTJ 134/836. (DEVIDO PROCESSO LEGAL) AI 733387 (2ªT), AI 709440 ED-AgR (1ªT), RE 227089 AgR-QO (TP), RE 601914 AgR (2ªT), AI 776295 AgR-ED (1ªT), ARE 679031 AgR-ED (2ªT), RTJ 137/1053, RTJ 158/272. (MOTIVAÇÃO “PER RELATIONEM”) HC 69438 (1ªT), HC 69987 (TP). (MOTIVAÇÃO POR REFERÊNCIA OU POR REMISSÃO) HC 54513, AI 825520 AgR-ED (2ªT). (OFENSA REFLEXA) RTJ 120/912, RTJ 132/455. Número de páginas: 13. Análise: 26/03/2015, MAD."
74377,"[AGR CC 7699, AGR CC 7730, AGR RCL 11250, AGR RCL 13508, QO CC 7094, RCL 10793, RE 586453]",[],"- Acórdão(s) citado(s): (PREVIDÊNCIA PRIVADA, COMPLEMENTAÇÃO DE APOSENTADORIA, COMPETÊNCIA) RE 586453 (TP). (CONFLITO DE COMPETÊNCIA, NECESSIDADE, MANIFESTAÇÃO, JUÍZO) CC 7094 QO (1ªT), CC 7699 AgR (TP). (RECLAMAÇÃO, AGRAVO, DECISÃO, APLICAÇÃO, REPERCUSSÃO GERAL) Rcl 10793 (TP), Rcl 11250 AgR (TP), Rcl 13508 AgR (TP). (CONFLITO DE COMPETÊNCIA, SUCEDÂNEO, RECURSO) CC 7730 AgR (TP). - Decisão monocrática citada: (CONFLITO DE COMPETÊNCIA) CC 7123 MC. - Acórdão(s) citado(s) - outros tribunais: STJ: CC 110996, CC 48106, REsp 1.413.016, CC 129.502 AgRg, CC 128.051 AgRg. - Veja AI 834551 do STF, Resp 961407 do STJ e RR 114500-77.2005.5.02.0049 do TST. Número de páginas: 56. Análise: 28/05/2015, IMC."
74378,"[AGR AI 734689, AGR AI 738982, AGR AI 813692, AGR ARE 657355, AGR ED AGR RE 406432, AGR RE 585932, ED AGR AI 153147, ED AGR AI 825520, ED EXT 662, ED INQ 1070, ED INQ 2424, ED PETA AP 552, ED RE 177599, ED RE 592905, ED RMS 27920, HC 54513, RE 172292, RE 223904]",[],"- Acórdão(s) citado(s): (REVISÃO, CANCELAMENTO, NOTA TAQUIGRÁFICA) RE 406432 AgR-ED-AgR (2ªT), RMS 27920 ED (2ªT), RE 592905 ED (TP), Inq 2424 ED (TP), AP 552 PetA-ED (TP). (CONDIÇÃO, CABIMENTO, EMBARGOS DE DECLARAÇÃO) Inq 1070 ED (TP). (CONTRADIÇÃO, VOTO VENCIDO, VOTO VENCEDOR) Ext 662 ED (TP). (NOTAS TAQUIGRÁFICAS, REVISÃO, CANCELAMENTO) RE 223904 (2ªT). (MOTIVAÇÃO ""PER RELATIONEM"") RE 172292 (2ªT), AI 734689 AgR (2ªT), AI 825520 AgR-ED (2ªT), AI 738982 AgR (2ªT), ARE 657355 AgR (1ªT), AI 813692 AgR (2ªT), RE 585932 AgR (2ªT), HC 54513 (2ªT). (EMBARGOS DE DECLARAÇÃO, EFEITOS INFRINGENTES) AI 153147 AGR-ED (1ªT), RE 177599 ED (1ªT), RTJ 191/694, RTJ 134/1296, RTJ 134/836. - Decisões monocráticas citadas: (MOTIVAÇÃO ""PER RELATIONEM"") MS 28677 MC, MS 28989 MC. - Veja AP 512 do STF. Número de páginas: 69. Análise: 17/01/2014, IVA."


In [194]:
# Número de acórdãos com MAIS extrações que análise original
df_after_i[(df_after_i["citacoesObs"].str.len() != 0) &
           (df_after_i["citacoesObs"].str.len() < df_after_i["NEWcitacoesObs"].str.len())
          ][["citacoesObs", "NEWcitacoesObs", "observacao"]]

Unnamed: 0,citacoesObs,NEWcitacoesObs,observacao


In [321]:
# Número de acórdãos com MENOS extrações que análise original
df_after_i[(df_after_i["citacoesObs"].str.len() != 0) &
           (df_after_i["citacoesObs"].str.len() > df_after_i["NEWcitacoesObs"].str.len()) &
           ~(~df_after_i["NEWcitacoesObs"].progress_apply(lambda x: True if re.search(r"S\wMULA|VINCULANTE|SUV|INFORMATIVO|STF|DE\s+|RTJ", ",".join(x)) else False) &
           df_after_i["citacoesObs"].progress_apply(lambda x: True if re.search(r"S\wMULA|VINCULANTE|SUV|INFORMATIVO|STF|DE\s+|RTJ", ",".join(x)) else False))
          ][["acordaoId", "citacoesObs", "NEWcitacoesObs", "observacao"]]

HBox(children=(FloatProgress(value=0.0, max=74382.0), HTML(value='')))




HBox(children=(FloatProgress(value=0.0, max=74382.0), HTML(value='')))




Unnamed: 0,acordaoId,citacoesObs,NEWcitacoesObs,observacao
315,ADI 1919,"[AGR ADI 203, RMS STJ 11824]",[AGR ADI 203],"Acórdãos citados: ADI 203 AgR (RTJ 131/1001); STJ RMS 11824. Número de páginas: (22). Análise:(MML). Revisão:(). Inclusão: 28/11/03, (MLR). Alteração: 09/12/03, (MLR). Alteração: 24/10/2018, HAC."
758,ADI 3106,"[CITADA ESTRANGEIRA LEGISLAÇÃO MC ADI 2667, MC ADI 2024]",[MC ADI 2024],"- Acórdãos citados: ADI 2024 MC - Tribunal Pleno, ADI 2667 MC - Legislação estrangeira citada: art. 10 da Constituição de Weimar. Número de páginas: 70. Análise: 01/10/2010, MMR. Revisão: 14/10/2010, ACG."
766,ADI 3128,"[8 º N O V I T A M R O F N I , ADC 1, ADC 3, ADI 1141, ADI 1430, ADI 159, ADI 2110, ADI 2111, ADI 2777, ADI 2874, ADI 790, ADI 939, AGR RE 250590, AGR SS 775, AGR SS 819, EDV ED RE 72509, MC ADI 1303, MC ADI 1402, MC ADI 1430, MC ADI 1441, MC ADI 2010, MC ADI 2087, MC ADI 223, MC ADI 939, MS 1447, RE 105137, RE 105137, RE 105322, RE 116683, RE 146733, RE 158577, RE 163094, RE 163204, RE 163989, RE 166772, RE 199753, RE 225602, RE 226855, RE 298694, RE 325822, RE 70009, RE 77131, RE 92232, RE 94020, RE 99955, RP 1451]","[ADC 1, ADC 3, ADI 1141, ADI 1430, ADI 159, ADI 2110, ADI 2111, ADI 2777, ADI 2874, ADI 790, ADI 939, AGR RE 250590, AGR SS 775, AGR SS 819, EDV ED RE 72509, MC ADI 1303, MC ADI 1402, MC ADI 1430, MC ADI 1441, MC ADI 2010, MC ADI 2087, MC ADI 223, MC ADI 939, MS 1447, RE 105137, RE 105137, RE 105322, RE 116683, RE 146733, RE 158577, RE 163094, RE 163204, RE 163989, RE 166772, RE 199753, RE 225602, RE 226855, RE 298694, RE 325822, RE 70009, RE 77131, RE 92232, RE 94020, RE 99955, RP 1451]","- Acórdãos citados: ADC 1 (RTJ 156/721), ADC 3 (RTJ 187/3), ADI 159 (RTJ 147/376), ADI 223 MC (RTJ 132/571), SS 775 AgR (Informativo nº-8), ADI 790 (RTJ 147/921), SS 819 AgR, ADI 939 (RTJ 151/755), ADI 939 MC, ADI 1141, ADI 1303 MC (RTJ 174/743), ADI 1402 MC, ADI 1430, ADI 1430 MC (RTJ 164/98), ADI 1441 MC (RTJ 166/890), MS 1447, Rp 1451 (RTJ 127/789), ADI 2010 MC (RTJ 181/73), ADI 2087 MC (RTJ 189/68), ADI 2110, ADI 2111, ADI 2777, ADI 2874 (RTJ 189/200), RE 70009 (RTJ 83/74), RE 72509 ED-Edv, RE 77131 (RTJ 72/155), RE 92232 (RTJ 97/842),RE 94020 (RTJ 104/269), RE 99955 (RTJ 116/1065), RE 105137 (RTJ 15/379), RE 105137 (RTJ 119/783), RE 105322 (RTJ 118/709), RE 116683 (RTJ 137/398), RE 146733 (RTJ 143/684), RE 158577 (RTJ 149/654), RE 163094 (RTJ 148/932), RE 163204 (RTJ 166/267), RE 163989 (RTJ 151/646), RE 166772 (RTJ 156/666), RE 199753, RE 225602 (RTJ 178/428), RE 226855 (RTJ 174/916), RE 250590 AgR, RE 298694, RE 325822 (RTJ 190/333); RTJ 134/1112, RTJ 143/724, RTJ 156/451, RTJ 166/267, RTJ 166/893, RTJ 178/428, RTJ 181/73. -VEJA Informativos 349 e 357 do STF; Estatuto do Servidor Público de 1952; Exposição de motivos da Proposta de Emenda n° 41/03, itens 64, 65, 66, 67, 68, 69, 70, 71; art. 28 da Declaração dos Direitos do Homem e do Cidadão; Acórdão n° 173/2001 do Tribunal Constitucional Português; Acórdão n° 39/84 do Tribunal Constitucional português; ""Acórdãos do Tribunal Constitucional"", vol. 3/95-131, 117-118, 1984, Imprensa Nacional, Lisboa. - Legislação estrangeira citada: art. 2° da Lei Constitucional Francesa de 14/8/1884. Número de páginas: 327. Análise: 15/05/2009, MMR. Revisão: 27/05/2009, JBM. Alteração: 20/08/2009, TBS."
1028,ADI 395,[RESP STJ 431760],[],"Acórdão citado: STJ - REsp 431760. Número de páginas: 20 Análise: 05/09/2007, ACL. Revisão: 28/09/2007, RCO."
2606,AGR AI 263218,[STJ DO AGR 127337],[],"Acórdão citado: AGR 127337 do STJ. Número de páginas: (05). Análise:(FLO). Revisão:(RCO/AAF). Inclusão: 18/09/01, (MLR). Alteração: 26/02/2018, JRM."
...,...,...,...,...
70540,RE 305186,"[RE 149466, RE 158430, RESP STJ 89015]","[RE 149466, RE 158430]","Acórdãos citados: RE 149466 (RTJ 147/1021), RE 158430; STJ-RESP 89015. Número de páginas: (9). Análise: (VAS). Revisão: (RCO/AAF). Inclusão: 28/05/03, (SVF). Alteração: 19/11/03, (SVF). Alteração: 25/07/2018, JLS."
70647,RE 338840,"[EXÉRCITO DO DISCIPLINAR REGULAMENTO DO E 45, HC 70648]",[HC 70648],"Votação: unânime. Resultado: conhecido e provido. Acórdão citado: HC-70648 (RTJ-153/931). Obs.: - Arts. 39, 44 e 45 do Regulamento Disciplinar do Exército. Número de páginas: (06). Análise:(ANA). Revisão:(RCO). Inclusão: 12/04/04, (MLR). Alteração: 08/11/2018, PDR."
70987,RE 442683,"[ADI 1476, ADI 231, ADI 245, ADI 248, ADI 3030, ADI 368, ADI 837, ADI 97, CITADAS ESTRANGEIRAS DECISÕES RE 32823, MC ADI 806, MC ADI 837, MS 22357, RE 197917, RE 79343]","[ADI 1476, ADI 231, ADI 245, ADI 248, ADI 3030, ADI 368, ADI 837, ADI 97, MC ADI 806, MC ADI 837, MS 22357, RE 197917, RE 79343]","- Acórdãos citados: ADI 97 (RTJ 151/664), ADI 231 (RTJ 144/24), ADI 245 (RTJ 143/391), ADI 248 (RTJ 152/341), ADI 368 (RTJ 186/15), ADI 806 MC (RTJ 157/801), ADI 837 (RTJ 170/11), ADI 837 MC (RTJ 149/419), ADI 1476, ADI 3030, MS 22357 (RTJ 192/620), RE 79343 (RTJ 82/791), RE 197917, RE 32823 - Decisões estrangeiras citadas: Caso Madison v. Marbury, 1803, Caso Stevall v. Denno e Gedeão, Caso Linkletter v. Walker, 1965, da Suprema Corte Americana. Número de páginas: 26. Análise: 16/05/2006, JOY."
71349,RE 567985,"[ADI 1232, ADI 1232, ADI 223, ADPF 132, AGR MC RCL 4427, AGR RCL 2303, AGR RCL 3963, RCL 2323, RE 363889]","[ADI 1232, ADI 223, ADPF 132, AGR MC RCL 4427, AGR RCL 2303, AGR RCL 3963, RCL 2323, RE 363889]","- Acórdão(s) citado(s): (RECLAMAÇÃO, AUTORIDADE DA DECISÃO, ADI 1.232) Rcl 2323 (TP), Rcl 2303 AgR (TP), Rcl 4427 MC-AgR (TP). (PRINCÍPIO DA DIGNIDADE DA PESSOA HUMANA, CRÍTICA) RE 363889 (TP). (PRINCÍPIO DA DIGNIDADE DA PESSOA HUMANA, AUTONOMIA INDIVIDUAL) ADPF 132 (TP). (INCONSTITUCIONALIDADE, NORMA, CASO CONCRETO) Rcl 3963 AgR (TP), ADI 223 (TP). (CONSTITUCIONALIDADE, REQUISITOS, CONCESSÃO, BENEFÍCIO ASSISTENCIAL, LOAS) ADI 1232 (TP). - Decisões monocráticas citadas: (INCONSTITUCIONALIDADE, NORMA, CASO CONCRETO) Rcl 4366 MC, Rcl 4133, Rcl 4422 MC, RE 564347. (RECLAMAÇÃO, AUTORIDADE DA DECISÃO, ADI 1.232) Rcl 4145, Rcl 3805, Rcl 4280, Rcl 4374 MC. - Veja ADC 16, Rcl 4374 e RE 580963 do STF. Número de páginas: 107. Análise: 04/12/2013, GOD. Revisão: 10/03/2014, SER."


In [198]:
# Número de acórdãos com MESMAS extrações que análise original
df_after_i[(df_after_i["citacoesObs"].str.len() != 0) &
           (df_after_i["citacoesObs"].str.len() == df_after_i["NEWcitacoesObs"].str.len())
          ][["citacoesObs", "NEWcitacoesObs", "observacao"]]

Unnamed: 0,citacoesObs,NEWcitacoesObs,observacao
0,"[AGR RE 716896, ED AGR AI 670715]","[AGR RE 716896, ED AGR AI 670715]","- Acórdão(s) citado(s): (COMPETÊNCIA, JUSTIÇA DO TRABALHO) AI 670715 AgR-ED (2ªT), RE 716896 AgR (2ªT). Número de páginas: 7. Análise: 11/07/2013, AUR."
2,"[AGR AI 733063, AGR AI 776070, AGR AI 820065, AGR ARE 647186, AGR ARE 649046, AGR ARE 661070, AGR RE 735918]","[AGR AI 733063, AGR AI 776070, AGR AI 820065, AGR ARE 647186, AGR ARE 649046, AGR ARE 661070, AGR RE 735918]","- Acórdão(s) citado(s): (CONCURSO PÚBLICO, PRETERIÇÃO DE CANDIDATO) AI 776070 AgR (2ªT), ARE 661070 AgR (2ªT), AI 820065 AgR (1ªT), ARE 649046 AgR (1ªT), RE 735918 AgR (2ªT). (PREQUESTIONAMENTO) AI 733063 AgR (2ªT), ARE 647186 AgR (1ªT). Número de páginas: 12. Análise: 04/11/2014, MAR."
3,"[AI 430526, HC 69599, HC 73556, HC 81134]","[AI 430526, HC 69599, HC 73556, HC 81134]","- Acórdãos citados: HC 69599, HC 73556, HC 81134, AI 430526. Número de páginas: 10. Análise: 01/09/2010, MMR. Revisão: 06/09/2010, ACG."
5,"[ED ED AGR AI 586710, ED HC 80566]","[ED ED AGR AI 586710, ED HC 80566]","- Acórdãos citados: HC 80566 ED (RTJ 180/974), AI 586710 AgR-ED-ED. Número de páginas: 6. Análise: 26/06/2008, SOF."
6,"[AGR AGR ED RE 281287, AGR RE 475421, ED ED AGR AI 586710]","[AGR AGR ED RE 281287, AGR RE 475421, ED ED AGR AI 586710]","- Acórdãos citados: RE 281287 ED-AgR-AgR, RE 475421 AgR, AI 586710 AgR-ED-ED. Número de páginas: 6. Análise: 26/06/2008, SOF."
...,...,...,...
74376,"[AGR ED AI 709440, AGR RE 601914, AI 733387, ED AGR AI 153147, ED AGR AI 776295, ED AGR AI 825520, ED AGR ARE 679031, ED RE 177599, HC 54513, HC 69438, HC 69987, QO AGR RE 227089]","[AGR ED AI 709440, AGR RE 601914, AI 733387, ED AGR AI 153147, ED AGR AI 776295, ED AGR AI 825520, ED AGR ARE 679031, ED RE 177599, HC 54513, HC 69438, HC 69987, QO AGR RE 227089]","- Acórdão(s) citado(s): (ED, EFEITOS INFRINGENTES) RE 177599 ED, AI 153147 AgR-ED, RTJ 191/694-695, RTJ 134/1296, RTJ 134/836. (DEVIDO PROCESSO LEGAL) AI 733387 (2ªT), AI 709440 ED-AgR (1ªT), RE 227089 AgR-QO (TP), RE 601914 AgR (2ªT), AI 776295 AgR-ED (1ªT), ARE 679031 AgR-ED (2ªT), RTJ 137/1053, RTJ 158/272. (MOTIVAÇÃO “PER RELATIONEM”) HC 69438 (1ªT), HC 69987 (TP). (MOTIVAÇÃO POR REFERÊNCIA OU POR REMISSÃO) HC 54513, AI 825520 AgR-ED (2ªT). (OFENSA REFLEXA) RTJ 120/912, RTJ 132/455. Número de páginas: 13. Análise: 26/03/2015, MAD."
74377,"[AGR CC 7699, AGR CC 7730, AGR RCL 11250, AGR RCL 13508, QO CC 7094, RCL 10793, RE 586453]","[AGR CC 7699, AGR CC 7730, AGR RCL 11250, AGR RCL 13508, QO CC 7094, RCL 10793, RE 586453]","- Acórdão(s) citado(s): (PREVIDÊNCIA PRIVADA, COMPLEMENTAÇÃO DE APOSENTADORIA, COMPETÊNCIA) RE 586453 (TP). (CONFLITO DE COMPETÊNCIA, NECESSIDADE, MANIFESTAÇÃO, JUÍZO) CC 7094 QO (1ªT), CC 7699 AgR (TP). (RECLAMAÇÃO, AGRAVO, DECISÃO, APLICAÇÃO, REPERCUSSÃO GERAL) Rcl 10793 (TP), Rcl 11250 AgR (TP), Rcl 13508 AgR (TP). (CONFLITO DE COMPETÊNCIA, SUCEDÂNEO, RECURSO) CC 7730 AgR (TP). - Decisão monocrática citada: (CONFLITO DE COMPETÊNCIA) CC 7123 MC. - Acórdão(s) citado(s) - outros tribunais: STJ: CC 110996, CC 48106, REsp 1.413.016, CC 129.502 AgRg, CC 128.051 AgRg. - Veja AI 834551 do STF, Resp 961407 do STJ e RR 114500-77.2005.5.02.0049 do TST. Número de páginas: 56. Análise: 28/05/2015, IMC."
74378,"[AGR AI 734689, AGR AI 738982, AGR AI 813692, AGR ARE 657355, AGR ED AGR RE 406432, AGR RE 585932, ED AGR AI 153147, ED AGR AI 825520, ED EXT 662, ED INQ 1070, ED INQ 2424, ED PETA AP 552, ED RE 177599, ED RE 592905, ED RMS 27920, HC 54513, RE 172292, RE 223904]","[AGR AI 734689, AGR AI 738982, AGR AI 813692, AGR ARE 657355, AGR ED AGR RE 406432, AGR RE 585932, ED AGR AI 153147, ED AGR AI 825520, ED EXT 662, ED INQ 1070, ED INQ 2424, ED PETA AP 552, ED RE 177599, ED RE 592905, ED RMS 27920, HC 54513, RE 172292, RE 223904]","- Acórdão(s) citado(s): (REVISÃO, CANCELAMENTO, NOTA TAQUIGRÁFICA) RE 406432 AgR-ED-AgR (2ªT), RMS 27920 ED (2ªT), RE 592905 ED (TP), Inq 2424 ED (TP), AP 552 PetA-ED (TP). (CONDIÇÃO, CABIMENTO, EMBARGOS DE DECLARAÇÃO) Inq 1070 ED (TP). (CONTRADIÇÃO, VOTO VENCIDO, VOTO VENCEDOR) Ext 662 ED (TP). (NOTAS TAQUIGRÁFICAS, REVISÃO, CANCELAMENTO) RE 223904 (2ªT). (MOTIVAÇÃO ""PER RELATIONEM"") RE 172292 (2ªT), AI 734689 AgR (2ªT), AI 825520 AgR-ED (2ªT), AI 738982 AgR (2ªT), ARE 657355 AgR (1ªT), AI 813692 AgR (2ªT), RE 585932 AgR (2ªT), HC 54513 (2ªT). (EMBARGOS DE DECLARAÇÃO, EFEITOS INFRINGENTES) AI 153147 AGR-ED (1ªT), RE 177599 ED (1ªT), RTJ 191/694, RTJ 134/1296, RTJ 134/836. - Decisões monocráticas citadas: (MOTIVAÇÃO ""PER RELATIONEM"") MS 28677 MC, MS 28989 MC. - Veja AP 512 do STF. Número de páginas: 69. Análise: 17/01/2014, IVA."
74379,"[AP 246, AP 261, ED QO PET 765, INQ 234, INQ 745, QO PET 765]","[AP 246, AP 261, ED QO PET 765, INQ 234, INQ 745, QO PET 765]","Acórdãos citados: Inq 234, AP 246 (RTJ 84/355), AP 261 (RTJ 102/465), Inq 745, Pet 765 QO, Pet 765 QO-ED (RTJ 156/445), RTJ 57/474, RTJ 61/1, RTJ 71/691, RTJ 91/755. Número de páginas: (15). Análise:(COF). Revisão:(AAF). Inclusão: 12/04/02, (SVF). Alteração: 17/04/2018, JRM."


In [319]:
### Checar ids estranhos
set().union(*df_after_i["NEWcitacoesObs"].apply(lambda ids: set(re.sub("\s+\d+.*$", "", id) for id in ids)).values)

{'2',
 '7',
 '8',
 '9',
 'AC',
 'AC AC ED AGR RE',
 'ACI',
 'ACO',
 'ACORA',
 'AD',
 'ADC',
 'ADCMC',
 'ADCQO',
 'ADI',
 'ADI ESTA A APENSADAS FORAM ADI',
 'ADIM',
 'ADIMC',
 'ADIN',
 'ADINMC',
 'ADIQO',
 'ADMIC',
 'ADO',
 'ADPF',
 'AG',
 'AGAED',
 'AGAEDE',
 'AGCRA',
 'AGCRAE DOS OBJETIVO FOI AGCRA',
 'AGCRQO',
 'AGED',
 'AGQO',
 'AGR',
 'AGR A AI',
 'AGR AC',
 'AGR ACO',
 'AGR ADC',
 'AGR ADI',
 'AGR ADPF',
 'AGR AG',
 'AGR AG AR',
 'AGR AGR ADI',
 'AGR AGR AGR ADI',
 'AGR AGR AGR AGR AGR AI',
 'AGR AGR AGR AGR AI',
 'AGR AGR AGR AI',
 'AGR AGR AGR RCL',
 'AGR AGR AGR RE',
 'AGR AGR AGR SS',
 'AGR AGR AI',
 'AGR AGR AO',
 'AGR AGR AR',
 'AGR AGR ARE',
 'AGR AGR CR',
 'AGR AGR ED AGR ARE',
 'AGR AGR ED AGR RE',
 'AGR AGR ED AI',
 'AGR AGR ED MS',
 'AGR AGR ED RE',
 'AGR AGR EDV ED ED ED AGR AI',
 'AGR AGR EDV ED ED RE',
 'AGR AGR EDV RE',
 'AGR AGR HC',
 'AGR AGR MC MS',
 'AGR AGR MC RCL',
 'AGR AGR MC RMS',
 'AGR AGR MI',
 'AGR AGR MS',
 'AGR AGR PET',
 'AGR AGR RCL',
 'AGR AGR RE',


In [315]:
df_after_i[df_after_i["NEWcitacoesObs"].apply(lambda x: True if re.search('EM PROFERIDO', ",".join(x)) else False)][["observacao", "NEWcitacoesObs"]]

Unnamed: 0,observacao,NEWcitacoesObs
41356,"-Acórdãos citados: O AI 395285 AgR e o RE 439515 AgR são ""no sentido de ser considerado extemporâneo o recurso extraordinário protocolizado antes da publicação do acórdão proferido em embargos infringentes, sem posterior ratificação"". Número de páginas: 14 Análise: 25/09/2007, CEL. Revisão: 26/09/2007, CEL.","[INFRINGENTES EMBARGOS EM PROFERIDO ACÓRDÃO DO PUBLICAÇÃO DA ANTES PROTOCOLIZADO EXTRAORDINÁRIO RECURSO O EXTEMPORÂNEO CONSIDERADO SER DE SENTIDO ""NO SÃO AGR RE 439515, O E AGR AI 395285]"


In [278]:
df_after_i[df_after_i["NEWcitacoesObs"].apply(lambda ids: "".join(set(re.sub("\s+\d+.*$", "", id) for id in ids))).str.contains("9")]

Unnamed: 0,acordaoId,_id,publicacao,citacoes_revistas,partesTexto,observacao,citacoesObs,index,observacao_lab,citacoesObs_before_i,citacoesObs_,NEWcitacoesObs
37527,AGR RE 238690,5e32b1cbd0a3cf19aa5bbb3b,DJ 21-03-2003 PP-00067 EMENT VOL-02103-02 PP-00342,[],AGTE.(S) : VAN LEER EMBALAGENS INDUSTRIAIS DO BRASIL LTDA \nADVDO.(A/S) : LUIZ PAULO ROMANO \nAGDO.(A/S) : UNIÃO \nADVDA. : PFN - ELYADIR FERREIRA BORGES,"Acórdãos citados: (TRF) argüição de inconstitucionalidade nº 83449. Número de páginas: (05). Análise:(VAS). Revisão:(ANA). Inclusão: 15/03/04, (MLR). Alteração: 16/03/04, (NT). Alteração: 21/09/2018, CLS.",[9 4 4 3 8 º N E D A D I L A N O I C U T I T S N O C N I E D O Ã Ç I Ü G R A ],6807,,[RE 140612],[9 4 4 3 8 º N ],[9 4 4 3 8 º N ]


In [199]:
# Decisões ainda não detectadas
df_after_i[df_after_i["observacao"].str.contains("[Cc]it") &
         (df_after_i["NEWcitacoesObs"].str.len() == 0)][["acordaoId", "observacao"]].head(40)

Unnamed: 0,acordaoId,observacao
198,ADI 1454,"Número de páginas: 41 -Acórdão citado: ADI 1155. Análise: 16/08/2007, JBM."
498,ADI 2503,"Acpordãos citados: ADI 766, ADI 2061, ADI 2115. Número de páginas: (7). Análise:(COF). Revisão:(AAF). Inclusão: 30/04/02, (SVF). Alteração: 03/05/02, (SVF). Alteração: 23/04/2018, CLS."
693,ADI 2939,"Ácórdãos citados: ADI 1690 MC (RTJ 170/75), ADI 1854 (RTJ 177/697). Número de páginas: (09). Análise:(JOY). Revisão:(RCO). Inclusão: 31/05/04, (SVF). Alteração: 01/06/04, (NT). Alteração: 18/02/2019, LRC."
695,ADI 2944,"- Acõrdçãos citados: ADI 13 - Tribunal Pleno, ADI 104 - Tribunal Pleno, Rp 164 - Tribunal Pleno, ADI 186 - Tribunal Pleno, Pleno, Rp 195 - Tribunal Pleno, ADI 368 - Tribunal Pleno, ADI 483 MC - Tribunal Pleno, ADI 507 - Tribunal Pleno, ADI 665 - Tribunal Pleno, ADI 850 MC - Tribunal Pleno, ADI 951 - Tribunal Pleno, ADI 1050 MC - Tribunal Pleno, ADI 1230 - Tribunal Pleno, ADI 1594 - Tribunal Pleno, ADI 1611 MC - Tribunal Pleno, ADI 1854 - Tribunal Pleno, ADI 2079 - Tribunal Pleno, ADI 2145 MC - Tribunal Pleno, ADI 2170 - Tribunal Pleno, ADI 2364 MC, ADI 2433 MC - Tribunal Pleno, ADI 2569 - Tribunal Pleno, ADI 3114 - Tribunal Pleno. Número de páginas: 26. Análise: 29/09/2011, KBP. Revisão: 07/10/2011, MMR."
829,ADI 3277,"-Aórdãos citados: ADI 2847 (RTJ 192/575), ADI 2948 (RTJ 194/160), ADI 2995, ADI 2996, ADI 3063, ADI 3147, ADI 3148, ADI 3189, ADI 3259, ADI 3293. Número de páginas: 20 Análise: 06/06/2007, JBM."
1201,ADI 80,"Número de páginas: 57 -Acórdão citado: RE 106007. Análise: 14/08/2007, JBM."
1293,AGR AC 196,"Decisões monocráticas citadas: Pet 2140, Pet 2592, Pet 2713, Pet 2800. Número de páginas: (07). Análise:(CEL). Revisão:(ANA). Inclusão: 22/06/04, (MLR). Alteração: 11/06/2019, MTH."
1297,AGR AC 2006,"- Decisão monocrática citada: RE 573098. Número de páginas: 9. Análise: 18/02/2009, RHP."
1311,AGR AC 2211,"- Acórdãos citados: RTJ 116/428, RTJ 127/4, RTJ 140/756, RTJ 172/419, RTJ 176/653, RTJ 191/123. - Decisões monocráticas citadas: Pet 914, Pet 965, Pet 1841, Pet 1865. Número de páginas: 10. Análise: 17/07/2009, CLM. Revisão: 31/07/2009, JBM."
1339,AGR AC 2751,"- Decisões monocráticas citadas: Rcl 2179 MC, Pet 2592 MC. Número de páginas: 6. Análise: 15/03/2011, SEV. Revisão: 24/03/2011, ACG."


In [337]:
for index, row in df_after_i.iterrows():
    db["acordaos"].update_one({"acordaoId": row["acordaoId"]}, {"$set": {"citacoesObs": row["NEWcitacoesObs"]}})

# db["acordaos"].update_one({"acordaoId": "RE 305186"}, {"$set": {"citacoesObs": df_after_i[df_after_i["acordaoId"] == "RE 305186"]["NEWcitacoesObs"].values[0]}})
# df_after_i[df_after_i["acordaoId"] == "RE 305186"]["NEWcitacoesObs"].values[0]