Diplomsko delo: Analiza spletnih novic s tehnikami prikaza pojavitev besed in besednih zvez
- Prikaz pojavitvenih frekvenc besed in besednih zvez
Poganjamo datoteko Timeline.py. Na dnu datoteke sta primera uporabe za 1-grame in 2-grame. V datoteki N_grams.py je po včasih potebno popraviti slovar lemma_dict, zaradi napačne lematizacije besed.
- Sopojavitvena matrika za prikaz z circos diagrami
Poganjamo Circos_moving_widow.py. Na dnu datoteke primer uporabe.
- Seznam besed, ki se največkrat sopojavljajo z imeni (mera Pointwise mutual information)
Poganjamo Pmi.py. Na dnu datoteke primer uporabe.