GitHub

Как работает?

Запускать из директории parse_js/parse_js/spiders команду:

scrapy crawl pages -a query=<запрос> -a output_filename=<имя_файла>

По запросу <запрос> будут загружены все страницы поисковой выдачи сайта (https://searchcode.com/) и записаны в файл <имя_файла>.

Запускать далее:

scrapy crawl code -a input_filename=<имя_файла> -a output_directory=<имя_директории>

Переходит по каждой ссылке в файле <имя_файла>, и по каждому скрипту из поисковой выдачи. Заходит в raw view каждого скрипта и записывает все скрипты в директорию <имя_директории>.

Name		Name	Last commit message	Last commit date
Latest commit History 2 Commits
parse_js		parse_js
README.md		README.md

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

About

Releases

Packages

Languages

ThousandMonkeysTypewriter/parser

Folders and files

Latest commit

History

Repository files navigation

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages