Skip to content

Commit

Permalink
feat: --no-limit-domain
Browse files Browse the repository at this point in the history
  • Loading branch information
popstas committed Apr 18, 2020
1 parent 4903598 commit b765ce7
Show file tree
Hide file tree
Showing 3 changed files with 4 additions and 1 deletion.
1 change: 1 addition & 0 deletions README.md
Original file line number Diff line number Diff line change
Expand Up @@ -53,6 +53,7 @@ Options:
-c, --concurrenty Threads number
-f, --fields <json> JSON with custom fields
--no-skip-static Scan static files
--no-limit-domain Scan not only current domain
--docs-extensions Docs extensions (comma-separated) that will be add to table, default:doc,docx,xls,xlsx,pdf,rar,zip
--follow-xml-sitemap Follow sitemap.xml
--max-requests <num> Limit max pages scan (default: 0)
Expand Down
2 changes: 2 additions & 0 deletions src/index.js
Original file line number Diff line number Diff line change
Expand Up @@ -16,6 +16,7 @@ program
.option('-c, --concurrenty', 'Threads number', 2)
.option('-f, --fields <json>', 'JSON with custom fields', JSON.parse)
.option('--no-skip-static', `Scan static files`)
.option('--no-limit-domain', `Scan not only current domain`)
.option('--docs-extensions', `Docs extensions (comma-separated) that will be add to table, default:doc,docx,xls,xlsx,pdf,rar,zip`, list)
.option('--follow-xml-sitemap', `Follow sitemap.xml`)
.option('--max-requests <num>', `Limit max pages scan`, 0)
Expand Down Expand Up @@ -49,6 +50,7 @@ async function start() {
maxConcurrency: 2, // параллельно открываемые вкладки
skip_static: program.scipStatic, // не пропускать подгрузку браузером статики (картинки, css, js)
followSitemapXml: program.followXmlSitemap, // чтобы найти больше страниц
limitDomain: program.limitDomain, // не пропускать подгрузку браузером статики (картинки, css, js)
maxRequest: program.maxRequests, // для тестов
headless: program.headless, // на десктопе открывает браузер визуально
docsExtensions: program.docsExtensions, // расширения, которые будут добавлены в таблицу
Expand Down
2 changes: 1 addition & 1 deletion src/scrap-site.js
Original file line number Diff line number Diff line change
Expand Up @@ -102,7 +102,7 @@ module.exports = async (baseUrl, options = {}) => {
});

const defaultOptions = {
allowedDomains: [domain], // закомментить, если надо не только этот домен (лучше дописать)
allowedDomains: options.limitDomain ? [domain] : undefined, // закомментить, если надо не только этот домен (лучше дописать)
skipRequestedRedirect: true, // все редиректы помечаются как посещённые
depthPriority: false, // без этой опции сканирует криво, многое не видит
args: ['--no-sandbox'], // puppeteer freezes without it
Expand Down

0 comments on commit b765ce7

Please sign in to comment.