Skip to content

Latest commit

 

History

History
14 lines (8 loc) · 637 Bytes

README.md

File metadata and controls

14 lines (8 loc) · 637 Bytes

Analiza-spletnih-novic-

Diplomsko delo: Analiza spletnih novic s tehnikami prikaza pojavitev besed in besednih zvez

  • Prikaz pojavitvenih frekvenc besed in besednih zvez

Poganjamo datoteko Timeline.py. Na dnu datoteke sta primera uporabe za 1-grame in 2-grame. V datoteki N_grams.py je po včasih potebno popraviti slovar lemma_dict, zaradi napačne lematizacije besed.

  • Sopojavitvena matrika za prikaz z circos diagrami

Poganjamo Circos_moving_widow.py. Na dnu datoteke primer uporabe.

  • Seznam besed, ki se največkrat sopojavljajo z imeni (mera Pointwise mutual information)

Poganjamo Pmi.py. Na dnu datoteke primer uporabe.