Kompletní sešity se scrapováním, čištěním a analýzou dat pro texty Anety Martínkové a Michala Kašpárka o populární hudbě na iROZHLAS.cz.
Zdroje dat:
Práce s repozitářem:
-
Sešity č. 000 až 099 stahují a čistí data. NEMÁTE DŮVOD JE SPOUŠTĚT, pročištěná data jsou obsahem repozitáře.
-
Sešity č. 100 až 899 slouží nezávazné exploraci. Ne všechny výpočty v nich jsou správné, ne všechno bude fungovat.
-
Sešity č. 900 až 999 jsou naněkolikrát kontrolovanými podklady článků na iROZHLAS.cz.