- uvod
- o tom, co to je data mining + algoritmy
- prozkoumani dostupnych API
- popis vybrane sluzby?
- popis a zduvodneni ziskavani data setu
- úvod o dolování z dat
- příklady sociálních sítí
- zdůvodnění, proč jsem si vybral GitHub
- popis knihoven a API GitHubu
- popis datasetu - dolovaných dat, popis získávané veličiny, možná i popis ghamineru
- experimenty se získaným datasetem
- popis výsledné aplikace
- závěr
- to, že jsem to nejdřív testoval ve Weka
- grafy z Weka (korelace atp.)
- rozbor chybně klasifikovaných
- podrobnější popis GradientBoostingRegressor
- http://arxiv.org/pdf/1309.0238v1.pdf