web-crawler

Crawl site concurrently, extract page url, first title, first paragraph, image and link urls.
Save result to report.csv.

Contributing

git clone https://github.com/wrelin/web-crawler
cd web-crawle

go mod tidy
go build

./web-crawler <site_url> <max_concurrent_thread> <max_pages_to_crawl>

go test ./...

Name		Name	Last commit message	Last commit date
Latest commit History 11 Commits
internal		internal
.gitignore		.gitignore
README.md		README.md
demo.gif		demo.gif
go.mod		go.mod
go.sum		go.sum
main.go		main.go