Skip to content

Latest commit

 

History

History
12 lines (9 loc) · 809 Bytes

README.md

File metadata and controls

12 lines (9 loc) · 809 Bytes

morfologik-wo-brev

Korzystając z Morfologika jako stemmera Solr należy być świadomym, że w swoim słowniku zawiera również skróty. Niesie to ze sobą efekt, który nie zawsze jest pożądany. Dla przykładu, wyszukując frazę „office pl” otrzymujemy tokeny [office, pl, plac].

Repozytorium zawiera przerobiony słownik morfologika pozbawiony skrótów. Więcej na temat jego tworzenia można przeczytać na moim blogu.

Instalacja

  1. Pliki *.dist oraz *.info przenosimy do katalogu <INSTALL_DIR>/solr/server/resources

  2. Definicja filtra w analzatorze wygląda następująco:

<filter class="solr.MorfologikFilterFactory" dictionary="polish-wo-brev.dict" />