js-crawler

A short and simple web crawler written in Python, that uses Webkit and executes Javascript.

How to use

crawler = Crawler(gui=True,                                                 # To see the crawler in action
                  is_link_interesting=lambda url, text: 'download' in url)  # Follow every link containing
                                                                            #  "download" in the url
crawler.crawl('http://firefox.com')
crawler.close()

Name		Name	Last commit message	Last commit date
Latest commit History 5 Commits
.gitignore		.gitignore
README.md		README.md
crawler.py		crawler.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

js-crawler

How to use

About

Releases

Packages

Languages

invernizzi/js-crawler

Folders and files

Latest commit

History

Repository files navigation

js-crawler

How to use

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages