erlang_web_crawler

продолжение истории https://github.com/onokhov/crawler/blob/master/README.md

example of usage:

Eshell V8.1  (abort with ^G)
1> с(crawler).
{ok,crawler}
2> crawler:crawler("https://glav.su/forum/", 10).

постановка задачи

Реализовать web-crawler, рекурсивно скачивающий сайт (идущий по ссылкам вглубь). Crawler должен скачать документ по указанному URL и продолжить закачку по ссылкам, находящимся в документе.

Crawler должен поддерживать дозакачку.
Crawler должен грузить только текстовые документы - html, css, js (игнорировать картинки, видео, и пр.)
Crawler должен грузить документы только одного домена (игнорировать сторонние ссылки)
Crawler должен быть многопоточным (какие именно части параллелить - полностью ваше решение)

Name		Name	Last commit message	Last commit date
Latest commit History 15 Commits
README.md		README.md
crawler.erl		crawler.erl

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

erlang_web_crawler

постановка задачи

About

Releases

Packages

Languages

onokhov/erlang_web_crawler

Folders and files

Latest commit

History

Repository files navigation

erlang_web_crawler

постановка задачи

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages