Crawler

Classe utilitária para realizar requisições HTTP com:

Persistência automática de cookies
Parsing automático de HTML
Manipulação do DOM usando linkedom
Cliente HTTP baseado em got

Instalação

bun add @wargas/crawler

ou usando npm:

npm install @wargas/crawler

Uso básico

import { Crawler } from "@wargas/crawler";

const crawler = Crawler.factory();

await crawler.client.get("https://example.com");

console.log(crawler.html);

console.log(
    crawler.document.querySelector("title")?.textContent
);

Cookies persistentes

Os cookies são armazenados automaticamente no arquivo:

cookies.json

Isso permite manter sessão entre execuções.

Limpar cookies

await crawler.removeAllCookies();

Acessando o DOM

Como o HTML é convertido automaticamente usando linkedom, é possível utilizar APIs similares ao navegador:

const links = crawler.document.querySelectorAll("a");

for (const link of links) {
    console.log(link.getAttribute("href"));
}

Configurações atuais

A instância do got é criada com:

followRedirect: false

Ou seja:

redirects não são seguidos automaticamente
cookies são persistidos
HTML é parseado automaticamente após cada resposta

Possíveis melhorias

Suporte a proxy
Retry automático
Timeout configurável
User-Agent customizado
Suporte a certificados digitais
Suporte a HTTP2
Métodos helper (get, post, login, etc.)
Cache de páginas

Licença

MIT

Name		Name	Last commit message	Last commit date
Latest commit History 10 Commits
.gitignore		.gitignore
README.md		README.md
bun.lock		bun.lock
cookies.json		cookies.json
index.d.ts		index.d.ts
index.test.ts		index.test.ts
index.ts		index.ts
package.json		package.json
tsconfig.json		tsconfig.json

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Crawler

Instalação

Uso básico

Cookies persistentes

Limpar cookies

Acessando o DOM

Configurações atuais

Possíveis melhorias

Licença

About

Uh oh!

Releases

Packages

Uh oh!

Contributors

Uh oh!

Languages

Folders and files

Latest commit

History

Repository files navigation

Crawler

Instalação

Uso básico

Cookies persistentes

Limpar cookies

Acessando o DOM

Configurações atuais

Possíveis melhorias

Licença

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Contributors

Uh oh!

Languages

Packages