# Raspador do IPEA

Este notebook demonstra o uso do raspador para buscar publicações do Instituto de Pesquisa Econômica Aplicada (IPEA).

**Fonte:** [ipea.gov.br](https://www.ipea.gov.br/portal/coluna-5/central-de-conteudo/busca-publicacoes)

**Tipo de dados:** Publicações acadêmicas, estudos econômicos, notas técnicas

## Importação

In [1]:
import raspe

## Uso Básico

O raspador do IPEA utiliza o parâmetro `pesquisa` para buscar publicações.

In [2]:
# Busca simples por um termo
scraper = raspe.ipea()
dados = scraper.raspar(pesquisa="desigualdade", paginas=range(1, 6))

print(f"Total de publicações encontradas: {len(dados)}")
dados.head()

2025-12-19 11:36:51,703 - IPEA - INFO - Iniciando raspagem com parâmetros {'pesquisa': 'desigualdade', 'paginas': range(1, 6)}
2025-12-19 11:36:51,704 - IPEA - DEBUG - Definindo consulta
2025-12-19 11:36:51,704 - IPEA - DEBUG - {'palavra_chave': 'desigualdade', 'tipo': '', 'assunto': '', 'autor': '', 'timeperiods': 'all', 'data-inicial': '', 'data-final': '', 'pagina': '1'}
2025-12-19 11:36:51,705 - IPEA - DEBUG - Definindo n_pags
2025-12-19 11:36:51,705 - IPEA - DEBUG - Enviando requisição inicial com retry automático
2025-12-19 11:37:05,305 - IPEA - DEBUG - Encontrando n_pags (status: 200)
2025-12-19 11:37:05,599 - IPEA - DEBUG - Found h4 text: '2262'
2025-12-19 11:37:05,599 - IPEA - DEBUG - Extracted number of results: 2262
2025-12-19 11:37:05,600 - IPEA - DEBUG - Calculated pages: 227
2025-12-19 11:37:05,600 - IPEA - DEBUG - Encontradas 227 páginas
2025-12-19 11:37:05,601 - IPEA - DEBUG - Definindo paginas
2025-12-19 11:37:05,602 - IPEA - DEBUG - Criando diretório de download em /t

Total de publicações encontradas: 50


Unnamed: 0,titulo,link,autores,data,assuntos,termo_busca
0,Financiamento do SUS e emendas parlamentares :...,https://www.ipea.gov.br/portal/publicacao-item...,"Cavalcanti, Filipe Matheus Silva;",30-Jul-2025,"Temas:\nSaúde,",desigualdade
1,Apoio à PNDU : segurança pública,https://www.ipea.gov.br/portal/publicacao-item...,,Jul-2025,Temas:\nAdministração Pública. Governo. Estado...,desigualdade
2,Ineficiências e iniquidades do imposto de rend...,https://www.ipea.gov.br/portal/publicacao-item...,"Gobetti, Sérgio Wulff;",Jul-2025,"Temas:\nSistema Monetário. Finanças. Bancos,",desigualdade
3,Os Consórcios públicos e o desenvolvimento das...,https://www.ipea.gov.br/portal/publicacao-item...,Instituto de Pesquisa Econômica Aplicada (Ipea);,Jul-2025,"Temas:\nAdministração Pública. Governo. Estado,",desigualdade
4,Evolução da participação das emendas parlament...,https://www.ipea.gov.br/portal/publicacao-item...,"Pinheiro, Marina Brito; Mesquita, Ana Cleusa S...",25-Jun-2025,"Temas:\nAdministração Pública. Governo. Estado,",desigualdade


## Parâmetros Disponíveis

| Parâmetro | Tipo | Descrição |
|-----------|------|------------|
| `pesquisa` | str | Palavra-chave para busca (obrigatório) |
| `paginas` | range | Intervalo de páginas a raspar |

## Colunas Retornadas

| Coluna | Descrição |
|--------|------------|
| `titulo` | Título da publicação |
| `link` | Link para a publicação completa |
| `autores` | Autores da publicação |
| `data` | Data de publicação |
| `assuntos` | Assuntos/temas relacionados |

## Uso Avançado

In [3]:
# Limitar quantidade de páginas
dados_limitado = scraper.raspar(pesquisa="inflação", paginas=range(1, 5))

print(f"Publicações (5 páginas): {len(dados_limitado)} registros")
dados_limitado.head()

2025-12-19 11:38:20,636 - IPEA - INFO - Iniciando raspagem com parâmetros {'pesquisa': 'inflação', 'paginas': range(1, 5)}
2025-12-19 11:38:20,636 - IPEA - DEBUG - Definindo consulta
2025-12-19 11:38:20,636 - IPEA - DEBUG - {'palavra_chave': 'inflação', 'tipo': '', 'assunto': '', 'autor': '', 'timeperiods': 'all', 'data-inicial': '', 'data-final': '', 'pagina': '1'}
2025-12-19 11:38:20,637 - IPEA - DEBUG - Definindo n_pags
2025-12-19 11:38:20,637 - IPEA - DEBUG - Enviando requisição inicial com retry automático
2025-12-19 11:38:35,837 - IPEA - DEBUG - Encontrando n_pags (status: 200)
2025-12-19 11:38:36,125 - IPEA - DEBUG - Found h4 text: '1100'
2025-12-19 11:38:36,125 - IPEA - DEBUG - Extracted number of results: 1100
2025-12-19 11:38:36,126 - IPEA - DEBUG - Calculated pages: 110
2025-12-19 11:38:36,126 - IPEA - DEBUG - Encontradas 110 páginas
2025-12-19 11:38:36,126 - IPEA - DEBUG - Definindo paginas
2025-12-19 11:38:36,126 - IPEA - DEBUG - Criando diretório de download em /tmp/tmpit

Publicações (5 páginas): 40 registros


Unnamed: 0,titulo,link,autores,data,assuntos,termo_busca
0,Perspectivas para a taxa de câmbio,https://www.ipea.gov.br/portal/publicacao-item...,,Mar-2025,"Temas:\nEconomia. Desenvolvimento Econômico, \...",inflação
1,"Indicadores de indústria, comércio e serviços",https://www.ipea.gov.br/portal/publicacao-item...,,Mar-2025,"Temas:\nEconomia. Desenvolvimento Econômico, \...",inflação
2,Inflação por faixa de renda – janeiro de 2025,https://www.ipea.gov.br/portal/publicacao-item...,,Mar-2025,"Temas:\nEconomia. Desenvolvimento Econômico, \...",inflação
3,Panorama da economia mundial,https://www.ipea.gov.br/portal/publicacao-item...,,Mar-2025,"Temas:\nEconomia. Desenvolvimento Econômico, \...",inflação
4,Visão geral da conjuntura,https://www.ipea.gov.br/portal/publicacao-item...,,Mar-2025,"Temas:\nEconomia. Desenvolvimento Econômico, \...",inflação


In [4]:
# Buscar múltiplos termos
termos = ["política fiscal", "taxa de juros", "crescimento econômico"]
dados_multiplos = scraper.raspar(pesquisa=termos, paginas=range(1, 3))

# A coluna 'termo_busca' indica qual termo gerou cada resultado
print(f"Total de publicações: {len(dados_multiplos)}")
dados_multiplos.groupby('termo_busca').size()

2025-12-19 11:39:29,073 - IPEA - INFO - Iniciando raspagem com parâmetros {'pesquisa': ['política fiscal', 'taxa de juros', 'crescimento econômico'], 'paginas': range(1, 3)}
2025-12-19 11:39:29,074 - IPEA - INFO - Iniciando raspagem para pesquisa=política fiscal
2025-12-19 11:39:29,074 - IPEA - DEBUG - Definindo consulta
2025-12-19 11:39:29,075 - IPEA - DEBUG - {'palavra_chave': 'política fiscal', 'tipo': '', 'assunto': '', 'autor': '', 'timeperiods': 'all', 'data-inicial': '', 'data-final': '', 'pagina': '1'}
2025-12-19 11:39:29,075 - IPEA - DEBUG - Definindo n_pags
2025-12-19 11:39:29,075 - IPEA - DEBUG - Enviando requisição inicial com retry automático
2025-12-19 11:39:42,850 - IPEA - DEBUG - Encontrando n_pags (status: 200)
2025-12-19 11:39:43,136 - IPEA - DEBUG - Found h4 text: '426'
2025-12-19 11:39:43,137 - IPEA - DEBUG - Extracted number of results: 426
2025-12-19 11:39:43,137 - IPEA - DEBUG - Calculated pages: 43
2025-12-19 11:39:43,137 - IPEA - DEBUG - Encontradas 43 páginas


Total de publicações: 60


termo_busca
crescimento econômico    20
política fiscal          20
taxa de juros            20
dtype: int64

In [5]:
# Analisar autores mais frequentes
dados.head(10)[['titulo', 'autores', 'data']]

Unnamed: 0,titulo,autores,data
0,Financiamento do SUS e emendas parlamentares :...,"Cavalcanti, Filipe Matheus Silva;",30-Jul-2025
1,Apoio à PNDU : segurança pública,,Jul-2025
2,Ineficiências e iniquidades do imposto de rend...,"Gobetti, Sérgio Wulff;",Jul-2025
3,Os Consórcios públicos e o desenvolvimento das...,Instituto de Pesquisa Econômica Aplicada (Ipea);,Jul-2025
4,Evolução da participação das emendas parlament...,"Pinheiro, Marina Brito; Mesquita, Ana Cleusa S...",25-Jun-2025
5,Oferta e demanda de bens e serviços públicos l...,"Constantino Cronemberger Mendes; Vasconcellos,...",Jun-2025
6,Diagnóstico e avaliação de governança dos Fund...,"Vasconcellos, Ronaldo Ramos; Portugal, Rodrigo...",Jun-2025
7,Uma Análise sobre a intermediação financeira n...,Márcio Bruno Ribeiro;,Jun-2025
8,Facilitating transition between social assista...,"Andrade, Marina; Burattini, Beatriz; Pellerano...",Jun-2025
9,Análises situacionais e retrospectivas : artic...,,Jun-2025


## Exportação dos Dados

In [6]:
# Exportar para Excel
# dados.to_excel("ipea_resultados.xlsx", index=False)

# Exportar para CSV
# dados.to_csv("ipea_resultados.csv", index=False)