apt_project

Project

Potrebno je skinuti WordNet sa: http://www.nltk.org/nltk_data/packages/corpora/wordnet.zip i staviti ga u folder: /data/nltk/corpora/wordnet/
skinuti http://www-nlp.stanford.edu/data/glove.6B.50d.txt.gz otpakirati u folder apt/features/karlo na pocetak fajla dodati liniju: 400000 50 (broj rijeci, dimenzija)
jagar, kod mene je dosta sporo sa drugim corpusima ali ako ti se da isprobavat onda isprobaj neke vece corpuse na https://github.com/3Top/word2vec-api#where-to-get-a-pretrained-models pod 'Where to get a pretrained model', s tim da ako zavrsava na .bin treba stavit 'binary=True' u zadnjoj liniji word2vec.py
- u txt fajlove treba vjerojatno uvijek na pocetak dodat ovu liniju iz 2)

Name		Name	Last commit message	Last commit date
Latest commit History 127 Commits
Rezultati		Rezultati
Rezultati2		Rezultati2
Rezultati3		Rezultati3
Rezultati4		Rezultati4
Rezultati5		Rezultati5
Rezultati6		Rezultati6
Rezultati7		Rezultati7
Rezultati8		Rezultati8
Rezultati9		Rezultati9
apt		apt
data		data
tar2014latex		tar2014latex
.gitignore		.gitignore
.gitignore~		.gitignore~
LICENSE		LICENSE
README.md		README.md
TODO.txt		TODO.txt

Provide feedback