# Raspador da Presidência da República

Este notebook demonstra o uso do raspador para buscar legislação federal no portal da Presidência da República.

**Fonte:** [legislacao.presidencia.gov.br](https://legislacao.presidencia.gov.br/)

**Tipo de dados:** Legislação federal (leis, decretos, medidas provisórias, etc.)

## Importação

In [1]:
import raspe

In [2]:
# Cria o scraper
scraper = raspe.presidencia()

## Uso Básico

O raspador da Presidência utiliza o parâmetro `pesquisa` para realizar buscas.

In [3]:
# Busca simples por um termo
dados = scraper.raspar(pesquisa="meio ambiente", paginas=range(1, 6))

print(f"Total de registros encontrados: {len(dados)}")
dados.head()

2025-12-19 11:24:23,293 - PRESIDENCIA - INFO - Iniciando raspagem com parâmetros {'pesquisa': 'meio ambiente', 'paginas': range(1, 6)}
2025-12-19 11:24:23,293 - PRESIDENCIA - DEBUG - Definindo consulta
2025-12-19 11:24:23,293 - PRESIDENCIA - DEBUG - {'termo': 'meio ambiente', 'ordenacao': 'maior_data', 'posicao': '0'}
2025-12-19 11:24:23,294 - PRESIDENCIA - DEBUG - Definindo n_pags
2025-12-19 11:24:23,294 - PRESIDENCIA - DEBUG - Enviando requisição inicial com retry automático
2025-12-19 11:24:25,207 - PRESIDENCIA - DEBUG - Encontrando n_pags (status: 200)
2025-12-19 11:24:25,217 - PRESIDENCIA - DEBUG - Found h4 text: '16.018 resultados encontrados'
2025-12-19 11:24:25,218 - PRESIDENCIA - DEBUG - Extracted number of results: 16018
2025-12-19 11:24:25,218 - PRESIDENCIA - DEBUG - Calculated pages: 1602
2025-12-19 11:24:25,218 - PRESIDENCIA - DEBUG - Encontradas 1602 páginas
2025-12-19 11:24:25,218 - PRESIDENCIA - DEBUG - Definindo paginas
2025-12-19 11:24:25,219 - PRESIDENCIA - DEBUG - C

Total de registros encontrados: 50


Unnamed: 0,nome,link,ficha,revogacao,descricao,termo_busca
0,Decreto nº 12.772 de 05 de dezembro de 2025,https://www.planalto.gov.br/ccivil_03/_ato2023...,https://legislacao.presidencia.gov.br/atos?tip...,Não consta revogação expressa,Institui a Política Nacional de Acesso ao Sist...,meio ambiente
1,Decreto nº 12.771 de 05 de dezembro de 2025,https://www.planalto.gov.br/ccivil_03/_ato2023...,https://legislacao.presidencia.gov.br/atos?tip...,Não consta revogação expressa,Institui a Estratégia Nacional de Contratações...,meio ambiente
2,Decreto nº 12.770 de 05 de dezembro de 2025,https://www.planalto.gov.br/ccivil_03/_ato2023...,https://legislacao.presidencia.gov.br/atos?tip...,Não consta revogação expressa,"Altera o Decreto nº 11.341, de 1º de janeiro d...",meio ambiente
3,Decreto nº 12.769 de 05 de dezembro de 2025,https://www.planalto.gov.br/ccivil_03/_ato2023...,https://www.planalto.gov.br/ccivil_03/_ato2023...,Não consta revogação expressa,Aprova a Estrutura Regimental e o Quadro Demon...,meio ambiente
4,Decreto nº 12.768 de 05 de dezembro de 2025,https://www.planalto.gov.br/ccivil_03/_ato2023...,https://legislacao.presidencia.gov.br/atos?tip...,Não consta revogação expressa,Dispõe sobre o Comitê Técnico Consultivo Perma...,meio ambiente


## Parâmetros Disponíveis

| Parâmetro | Tipo | Descrição |
|-----------|------|------------|
| `pesquisa` | str | Termo de busca (obrigatório) |
| `paginas` | range | Intervalo de páginas a raspar (opcional) |

## Colunas Retornadas

| Coluna | Descrição |
|--------|------------|
| `nome` | Nome/título da legislação |
| `link` | Link para o texto completo |
| `ficha` | Link para a ficha da legislação |
| `revogacao` | Status de revogação |
| `descricao` | Ementa/descrição da legislação |

## Uso Avançado

In [4]:
# Limitar a quantidade de páginas (útil para testes)
dados_limitado = scraper.raspar(pesquisa="educação", paginas=range(1, 3))

print(f"Total de registros (2 páginas): {len(dados_limitado)}")
dados_limitado.head()

2025-12-19 11:24:41,116 - PRESIDENCIA - INFO - Iniciando raspagem com parâmetros {'pesquisa': 'educação', 'paginas': range(1, 3)}
2025-12-19 11:24:41,116 - PRESIDENCIA - DEBUG - Definindo consulta
2025-12-19 11:24:41,116 - PRESIDENCIA - DEBUG - {'termo': 'educação', 'ordenacao': 'maior_data', 'posicao': '0'}
2025-12-19 11:24:41,117 - PRESIDENCIA - DEBUG - Definindo n_pags
2025-12-19 11:24:41,117 - PRESIDENCIA - DEBUG - Enviando requisição inicial com retry automático
2025-12-19 11:24:41,685 - PRESIDENCIA - DEBUG - Encontrando n_pags (status: 200)
2025-12-19 11:24:41,698 - PRESIDENCIA - DEBUG - Found h4 text: '12.181 resultados encontrados'
2025-12-19 11:24:41,699 - PRESIDENCIA - DEBUG - Extracted number of results: 12181
2025-12-19 11:24:41,699 - PRESIDENCIA - DEBUG - Calculated pages: 1219
2025-12-19 11:24:41,699 - PRESIDENCIA - DEBUG - Encontradas 1219 páginas
2025-12-19 11:24:41,700 - PRESIDENCIA - DEBUG - Definindo paginas
2025-12-19 11:24:41,700 - PRESIDENCIA - DEBUG - Criando dir

Total de registros (2 páginas): 20


Unnamed: 0,nome,link,ficha,revogacao,descricao,termo_busca
0,Decreto nº 12.726 de 18 de novembro de 2025,https://www.planalto.gov.br/ccivil_03/_ato2023...,https://legislacao.presidencia.gov.br/atos?tip...,Não consta revogação expressa,"Altera o Decreto nº 11.337, de 1º de janeiro d...",educação
1,Decreto nº 12.725 de 18 de novembro de 2025,https://www.planalto.gov.br/ccivil_03/_ato2023...,https://legislacao.presidencia.gov.br/atos?tip...,Não consta revogação expressa,"Aprova a Política Nacional de Defesa, a Estrat...",educação
2,Decreto nº 12.716 de 12 de novembro de 2025,https://www.planalto.gov.br/ccivil_03/_ato2023...,https://legislacao.presidencia.gov.br/atos?tip...,Não consta revogação expressa,"Altera o Decreto nº 7.646, de 21 de dezembro d...",educação
3,Lei nº 15.258 de 12 de novembro de 2025,https://www.planalto.gov.br/ccivil_03/_ato2023...,https://legislacao.presidencia.gov.br/atos?tip...,Não consta revogação expressa,Institui o mês de novembro como o Mês Nacional...,educação
4,Lei nº 15.255 de 10 de novembro de 2025,https://www.planalto.gov.br/ccivil_03/_ato2023...,https://legislacao.presidencia.gov.br/atos?tip...,Não consta revogação expressa,"Altera a Lei nº 10.880, de 9 de junho de 2004,...",educação


In [5]:
# Buscar múltiplos termos de uma vez
termos = ["saúde pública", "reforma tributária"]
dados_multiplos = scraper.raspar(pesquisa=termos, paginas=range(1, 3))

# A coluna 'termo_busca' indica qual termo gerou cada resultado
print(f"Total de registros: {len(dados_multiplos)}")
dados_multiplos.groupby('termo_busca').size()

2025-12-19 11:24:46,908 - PRESIDENCIA - INFO - Iniciando raspagem com parâmetros {'pesquisa': ['saúde pública', 'reforma tributária'], 'paginas': range(1, 3)}
2025-12-19 11:24:46,909 - PRESIDENCIA - INFO - Iniciando raspagem para pesquisa=saúde pública
2025-12-19 11:24:46,909 - PRESIDENCIA - DEBUG - Definindo consulta
2025-12-19 11:24:46,909 - PRESIDENCIA - DEBUG - {'termo': 'saúde pública', 'ordenacao': 'maior_data', 'posicao': '0'}
2025-12-19 11:24:46,910 - PRESIDENCIA - DEBUG - Definindo n_pags
2025-12-19 11:24:46,910 - PRESIDENCIA - DEBUG - Enviando requisição inicial com retry automático
2025-12-19 11:24:47,472 - PRESIDENCIA - DEBUG - Encontrando n_pags (status: 200)
2025-12-19 11:24:47,484 - PRESIDENCIA - DEBUG - Found h4 text: '24.965 resultados encontrados'
2025-12-19 11:24:47,484 - PRESIDENCIA - DEBUG - Extracted number of results: 24965
2025-12-19 11:24:47,484 - PRESIDENCIA - DEBUG - Calculated pages: 2497
2025-12-19 11:24:47,484 - PRESIDENCIA - DEBUG - Encontradas 2497 págin

Total de registros: 40


termo_busca
reforma tributária    20
saúde pública         20
dtype: int64

## Exportação dos Dados

In [6]:
# Exportar para Excel
# dados.to_excel("presidencia_resultados.xlsx", index=False)

# Exportar para CSV
# dados.to_csv("presidencia_resultados.csv", index=False)