# Conexão com o JUSBR 

Este notebook demonstra como autenticar e obter um token de acesso para o portal JUSBR usando a classe `JUSBR_Scraper`.


In [1]:
import juscraper as jus
import json

## Autenticação manual via gov.br

1. Acesse https://www.jus.br
2. Faça login usando o gov.br
3. Entre na página https://portaldeservicos.pdpj.jus.br/consulta (ou clique no botão 'Consultar processo', que aparece após o login)
4. Na nova página, abra a aba Network do navegador (F12 ou 'Inspecionar elemento')
5. Atualize a página (F5 ou ctrl+R ou no botão atualizar)
6. Nas requisições que vão aparecer, procure a requisição que tem nome 'token'. Clique nela.
7. Na tela ao lado, clique em 'Resposta'.
8. Selecione e copie o campo 'access_token' que aparece lá.


In [2]:
import os
from dotenv import load_dotenv
load_dotenv()

access_token = os.environ.get("access_token")
if access_token is None:
    access_token = input("Digite o token JWT: ")

In [3]:
jusbr = jus.scraper("jusbr")
jusbr.auth(token=access_token)

Token JWT decodificado com sucesso!


## Baixando metadados dos processos

Baixando uma lista de casos:

In [6]:
processos = ['10092161720238260016', '00039417120248260048']

resultados = jusbr.cpopg(processos)

In [7]:
resultados

Unnamed: 0,processo,numeroProcesso,idCodexTribunal,detalhes
0,10092161720238260016,1009216-17.2023.8.26.0016,0,"[{'nivelSigilo': 0, 'siglaTribunal': 'TJSP', '..."
1,39417120248260048,0003941-71.2024.8.26.0048,0,"[{'nivelSigilo': 0, 'siglaTribunal': 'TJSP', '..."


In [8]:
result_list = resultados['detalhes'].iloc[0]

print(json.dumps(result_list, indent=2, ensure_ascii=False))

[
  {
    "nivelSigilo": 0,
    "siglaTribunal": "TJSP",
    "numeroProcesso": "1009216-17.2023.8.26.0016",
    "tramitacaoAtual": {
      "instancia": "PRIMEIRO_GRAU",
      "grau": {
        "sigla": "G1",
        "nome": "1° Grau",
        "numero": 1
      },
      "valorAcao": 38500.0,
      "classe": [
        {
          "codigo": 241,
          "descricao": "Petição Cível"
        }
      ],
      "distribuicao": [
        {
          "dataHora": "2023-04-26T11:51:25",
          "orgaoJulgador": [
            {
              "id": 10608,
              "nome": "02 VARA JUIZADO ESPECIAL CIVEL DE CENTRAL"
            }
          ]
        }
      ],
      "movimentos": [
        {
          "dataHora": "2025-03-12T16:36:12",
          "descricao": "Arquivado Definitivamente"
        },
        {
          "dataHora": "2025-03-12T16:08:14",
          "descricao": "Baixa Definitiva"
        },
        {
          "dataHora": "2025-03-12T16:08:12",
          "descricao": "Expedição d

Se quiser visualizar o texto do caso:

## Baixando autos dos processos

In [None]:
df_docs = jusbr.download_documents(resultados)

print(df_docs.shape)
df_docs.head(3)

Unnamed: 0,numero_processo,sequencia,dataHoraJuntada,idCodex,idOrigem,nome,nivelSigilo,tipo,hrefBinario,hrefTexto,arquivo,texto
0,1009216-17.2023.8.26.0016,28,2024-12-02T19:51:05,23219022228,PG5JM_336374331_0,Sentenas.pdf,PUBLICO,"{'codigo': 550, 'nome': 'Sentença', 'idCodex':...",/processos/1009216-17.2023.8.26.0016/documento...,/processos/1009216-17.2023.8.26.0016/documento...,"{'tipo': 'text/richtext', 'quantidadePaginas':...",\nTRIBUNAL DE JUSTIÇA DO ESTADO DE SÃO PAULO\n...
1,1009216-17.2023.8.26.0016,24,2024-04-24T11:54:33,22210997949,PG5JM_306567040_0,Ato_Ordinatrio.pdf,PUBLICO,"{'codigo': 14575, 'nome': 'Ato Ordinatório', '...",/processos/1009216-17.2023.8.26.0016/documento...,/processos/1009216-17.2023.8.26.0016/documento...,"{'tipo': 'text/richtext', 'quantidadePaginas':...",\nTRIBUNAL DE JUSTIÇA DO ESTADO DE SÃO PAULO\n...
2,1009216-17.2023.8.26.0016,10,2023-05-25T14:31:12,16542603918,PG5JM_262181327_0,Ato_Ordinatrio.pdf,PUBLICO,"{'codigo': 14575, 'nome': 'Ato Ordinatório', '...",/processos/1009216-17.2023.8.26.0016/documento...,/processos/1009216-17.2023.8.26.0016/documento...,"{'tipo': 'text/richtext', 'quantidadePaginas':...",\nTRIBUNAL DE JUSTIÇA DO ESTADO DE SÃO PAULO\n...
3,0003941-71.2024.8.26.0048,38,2024-12-17T12:04:12,23333814633,PG5JUN_241365982_0,Sentenas.pdf,PUBLICO,"{'codigo': 550, 'nome': 'Sentença', 'idCodex':...",/processos/0003941-71.2024.8.26.0048/documento...,/processos/0003941-71.2024.8.26.0048/documento...,"{'tipo': 'text/richtext', 'quantidadePaginas':...",\nTRIBUNAL DE JUSTIÇA DO ESTADO DE SÃO PAULO\n...
4,0003941-71.2024.8.26.0048,31,2024-11-01T15:36:41,22826852284,PG5JUN_237522801_0,Ato_Ordinatrio.pdf,PUBLICO,"{'codigo': 14575, 'nome': 'Ato Ordinatório', '...",/processos/0003941-71.2024.8.26.0048/documento...,/processos/0003941-71.2024.8.26.0048/documento...,"{'tipo': 'text/richtext', 'quantidadePaginas':...",\nTRIBUNAL DE JUSTIÇA DO ESTADO DE SÃO PAULO\n...
5,0003941-71.2024.8.26.0048,19,2024-09-09T09:20:10,22293789966,PG5JUN_232551508_0,Deciso.pdf,PUBLICO,"{'codigo': 404, 'nome': 'Decisão', 'idCodex': ...",/processos/0003941-71.2024.8.26.0048/documento...,/processos/0003941-71.2024.8.26.0048/documento...,"{'tipo': 'text/richtext', 'quantidadePaginas':...",\nTRIBUNAL DE JUSTIÇA DO ESTADO DE SÃO PAULO\n...


In [None]:
print(df_docs['texto'][0][:200])

## Baixando uma lista grande de processos

Se a lista de processos é muito grande, pode ser uma boa prática baixar um processo por vez e salvar os resultados em um arquivo parquet, por exemplo.

No script abaixo, criamos uma pasta dentro da pasta atual, chamada jusbr/cpopg/. Ali dentro, para cada processo, criamos uma pasta com o número do processo e salvamos 2 arquivos: 1 com os metadados daquele processo e 1 com os textos dos documentos. A chave para juntar as duas bases é o número do processo.

In [None]:
import os
import pandas as pd
from tqdm import tqdm
from joblib import Parallel, delayed

processos = ['10092161720238260016', '00039417120248260048', '10226951920238260003']

resultados = jusbr.cpopg(processos)


In [None]:

def download_document(proc_no, jusbr, verbose=True):
    if verbose:
        print(f"Baixando documentos do processo {proc_no}\n")
    
    resultado = jusbr.cpopg([proc_no])
    row = resultado.iloc[0]
    processo = row['processo']
    row_df = pd.DataFrame([row])
    # cria a pasta
    process_path = os.path.join('jusbr/cpopg', processo)
    os.makedirs(process_path, exist_ok=True)
    
    # baixa documentos do processo
    if verbose:
        print(f"Baixando autos do processo {proc_no}\n")
    
    df_docs = jusbr.download_documents(row_df)
    #df_docs = pd.DataFrame()
    # salva documentos
    df_docs.to_parquet(os.path.join(process_path, 'documents.parquet'), index=False)
    # salva metadata
    row_df.to_parquet(os.path.join(process_path, 'metadata.parquet'), index=False)


Parallel(n_jobs=20)(
    delayed(download_document)(proc_no, jusbr)
    for proc_no in processos
)
