Skip to content

ThousandMonkeysTypewriter/parser

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

2 Commits
 
 
 
 

Repository files navigation

Как работает?

  1. Запускать из директории parse_js/parse_js/spiders команду:

scrapy crawl pages -a query=<запрос> -a output_filename=<имя_файла>

По запросу <запрос> будут загружены все страницы поисковой выдачи сайта (https://searchcode.com/) и записаны в файл <имя_файла>.

  1. Запускать далее:

scrapy crawl code -a input_filename=<имя_файла> -a output_directory=<имя_директории>

Переходит по каждой ссылке в файле <имя_файла>, и по каждому скрипту из поисковой выдачи. Заходит в raw view каждого скрипта и записывает все скрипты в директорию <имя_директории>.

About

No description, website, or topics provided.

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages