Programmide jooksutamiseks on vaja teeke Gensim ja EstNLTK 1.4. Kõik programmid kasutavad meetode moodulist closest_relations. Wn_w2v_comparison_3 ja wn_w2v_comparison_4 kasutavad ka meetodeid moodulist wn_w2v_comparison.
Katsete väljunid failides wn_vordlus_1.zip, wn_vordlus_2_1.zip, wn_vordlus_2_2.zip, wn_vordlus_3.zip. EstWNis sisalduvad sagedussõnastiku sõnad on failis wn_olemas_sagedad.txt. Kirjakeelekontrolliks on kasutusel EstWN 2.3.3 lemmad failis estwn-et-2.3.2_lemmad.txt ja EstWNist puudunud sagedussõnastiku lemmad failis wn_puuduvad_sagedad.txt.
Word2veci mudel lemmas.sg.s200.w2v.bin entu.keeleressursid.ee lehel.
python wn_w2v_comparison.py tee/lemmas.sg.s200.w2v.bin --targetword_files wn_olemas_sagedad.txt --spellcheck_files estwn-et-2.3.2_lemmad.txt wn_puuduvad_sagedad.txt
python wn_w2v_comparison.py tee/lemmas.sg.s200.w2v.bin --targetword_files wn_olemas_sagedad.txt --spellcheck_files estwn-et-2.3.2_lemmad.txt wn_puuduvad_sagedad.txt --ignored_relations "taksonoomilised õed" --hyper_max 2
Katse 2.2 puhul --hyper_max 1
python wn_w2v_comparison_3.py tee/lemmas.sg.s200.w2v.bin --targetword_files wn_olemas_sagedad.txt --spellcheck_files estwn-et-2.3.2_lemmad.txt wn_puuduvad_sagedad.txt
python wn_w2v_comparison_4.py tee/lemmas.sg.s200.w2v.bin --targetword_files wn_olemas_sagedad.txt --spellcheck_files estwn-et-2.3.2_lemmad.txt wn_puuduvad_sagedad.txt
python overlapping_relations.py wn_olemas_sagedad.txt
Väljund failis korduvad_suhted.csv.
python hypernym_extraction.py wn_olemas_sagedad.txt
Väljund failis seotud_taksonoomilised_oed.csv.