Skip to content

Latest commit

 

History

History
29 lines (23 loc) · 739 Bytes

DIP.md

File metadata and controls

29 lines (23 loc) · 739 Bytes

Obsah DIP

Kapitoly

  1. uvod
  2. o tom, co to je data mining + algoritmy
  3. prozkoumani dostupnych API
  4. popis vybrane sluzby?
  5. popis a zduvodneni ziskavani data setu

Co musím zmínit

  • úvod o dolování z dat
  • příklady sociálních sítí
  • zdůvodnění, proč jsem si vybral GitHub
  • popis knihoven a API GitHubu
  • popis datasetu - dolovaných dat, popis získávané veličiny, možná i popis ghamineru
  • experimenty se získaným datasetem
  • popis výsledné aplikace
  • závěr

Nápady, co tam musím strčit

  • to, že jsem to nejdřív testoval ve Weka
  • grafy z Weka (korelace atp.)
  • rozbor chybně klasifikovaných
  • podrobnější popis GradientBoostingRegressor
  • http://arxiv.org/pdf/1309.0238v1.pdf