Skip to content

Latest commit

 

History

History
18 lines (18 loc) · 1.55 KB

README.md

File metadata and controls

18 lines (18 loc) · 1.55 KB

SiteMap_ForkJoinPool

ForkJoinPool Java
SiteMap_ForkJoinPool - приложение, которое в многопоточном режиме формирует карту заданного сайта (список ссылок), и запиcывает её в файл.
Ссылки на дочерние страницы располагаются в файле с отступами на одну табуляцию относительно родительских.

Что использовалось

*Java - SDK 11
*Maven - сборка проекта
*ForkJoinPool - многопоточный обход ("Разделяй и властвуй")
*Jsoup - легкий парсинг HTML-страниц
*FileWriter - класс с удобными методами для записи информации в файл\

Что умеет программа

  • парсит сайт, извлекая только ссылки
  • разделяет на потоки для быстрого обхода всех ссылок
  • создает иерархию на дочерние ссылки относительно родительских
  • записывает в файл полученные ссылки

Пример результата записи в файл

forkjoin