Optimalizace Web-Scrapping robota #11

thonzyk · 2018-04-15T08:44:36Z

1) optimalizovat metodu scrap_text()
- zabírá cca 1/2 celkového času
2) paralelizovat načítání HTML od dalšího zpracování
- zřejmě zvlášť "sypat" raw HTML do fronty a paralelně je zpracovávat
- důvodem je většinou rychlejší načtení HTML, než další zpracování
- zpracování nebude muset pokaždé čekat

thonzyk added the Priority: Low Do not hurry with this one label Apr 15, 2018

thonzyk added this to the Web scraping milestone Apr 15, 2018

thonzyk self-assigned this Apr 15, 2018

thonzyk added the Type: Performance Improving code efficiency label Apr 15, 2018

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Optimalizace Web-Scrapping robota #11

Optimalizace Web-Scrapping robota #11

thonzyk commented Apr 15, 2018

Optimalizace Web-Scrapping robota #11

Optimalizace Web-Scrapping robota #11

Comments

thonzyk commented Apr 15, 2018