# Raspador do CNJ (Conselho Nacional de Justiça)

Este notebook demonstra o uso do raspador para buscar comunicados processuais do CNJ.

**Fonte:** [comunica.pje.jus.br](https://comunica.pje.jus.br/)

**Tipo de dados:** Comunicações processuais (citações, intimações, etc.)

## Importação

In [None]:
import raspe

## Uso Básico

O raspador do CNJ utiliza o parâmetro `pesquisa` para buscas textuais.

In [None]:
# Busca simples por um termo
scraper = raspe.cnj()
dados = scraper.raspar(pesquisa="resolução", paginas=range(1, 6))

print(f"Total de comunicados encontrados: {len(dados)}")
dados.head()

## Parâmetros Disponíveis

| Parâmetro | Tipo | Descrição |
|-----------|------|------------|
| `pesquisa` | str | Termo de busca textual |
| `data_inicio` | str | Data inicial (formato ISO: YYYY-MM-DD) |
| `data_fim` | str | Data final (formato ISO: YYYY-MM-DD) |
| `paginas` | range | Intervalo de páginas a raspar |

## Colunas Retornadas

O raspador do CNJ retorna uma estrutura flexível baseada na API JSON. As colunas podem variar, mas geralmente incluem informações sobre:
- Número do processo
- Tipo de comunicação
- Data de disponibilização
- Órgão julgador
- Partes envolvidas

## Uso Avançado

In [None]:
# Filtrar por intervalo de datas
# Formatos aceitos: YYYY-MM-DD, DD/MM/YYYY, YYYYMMDD
dados_periodo = scraper.raspar(
    pesquisa="citação",
    data_inicio="2024-01-01",
    data_fim="2024-06-30",
    paginas=range(1, 6)
)

print(f"Comunicados no período: {len(dados_periodo)} registros")
dados_periodo.head()

In [None]:
# Limitar quantidade de páginas (útil para testes rápidos)
dados_limitado = scraper.raspar(pesquisa="intimação", paginas=range(1, 6))

print(f"Comunicados (5 páginas): {len(dados_limitado)} registros")
dados_limitado.head()

In [None]:
# Buscar múltiplos termos
termos = ["mandado", "edital", "sentença"]
dados_multiplos = scraper.raspar(pesquisa=termos, paginas=range(1, 3))

# A coluna 'termo_busca' indica qual termo gerou cada resultado
print(f"Total de comunicados: {len(dados_multiplos)}")
dados_multiplos.groupby('termo_busca').size()

In [None]:
# Verificar colunas disponíveis
print("Colunas disponíveis:")
print(dados.columns.tolist())

## Exportação dos Dados

In [None]:
# Exportar para Excel
# dados.to_excel("cnj_resultados.xlsx", index=False)

# Exportar para CSV
# dados.to_csv("cnj_resultados.csv", index=False)