# Models: Vectors, POS Tagger, Dependency Parser, NER

This notebook demonstrates the usage of Polish models that we developed for spaCy. 

At the moment of writing this, our last pull request was not yet accepted to spaCy master branch.
You can install spaCy from our pull request branch to reproduce our results:
```
pip install https://github.com/spacy-pl/spaCy/archive/pl-release/lemmatizer-tagmap-and-tests.zip
```
and make sure to also install a model that contains Polish POS Tagger (necessary for lemmatization to work correctly):
```
pip install https://storage.googleapis.com/spacy-pl-public-models/pl_model-1.0.0.tar.gz
```

In [1]:
import spacy

In [2]:
nlp = spacy.load('pl_model')

In [3]:
doc = nlp("Polacy nie gęsi, iż swój język mają.")
# source: https://pl.wikiquote.org/wiki/A_niechaj_narodowie_w%C5%BCdy_postronni_znaj%C4%85

## POS Tagger and Dependency Parser

Currently, POS Tagger and Dependency Parser perform at the level of accuracy similar to corresponding models for other languages in spaCy,
and a few percent worse than the state-of-the-art models for Polish.

In [4]:
spacy.displacy.render(doc, style='dep', options={'compact': True, 'distance': 120})

## Named Entity Recognition

As for the Named Entity Recognizer, there is a challenge of dataset selection for Polish language:
- NKJP corpus has only 5 tags, and large portion of dataset is incorrectly labeled
- PWr corpus is well-labeled using 58 tags, but is significantly smaller than NKJP

The NER shipped in `pl_model==0.3.0` is trained on PWr with number of tags reduced to 19.
While results are mostly correct, it's F-score of 39% is disappointing and there is still room for improvement. 
In particulat, we are planning to experiment more with tag merging vs dropping tags, to reduce number of tags even further.

In [5]:
doc = nlp("""
Światowe Forum Ekonomiczne (ang. World Economic Forum, WEF) – szwajcarska fundacja non-profit znana z organizacji corocznej konferencji w Davos.

Konferencja w Davos jest spotkaniem prezesów najbogatszych światowych korporacji, przywódców politycznych (prezydentów, premierów i innych) oraz wybranych intelektualistów i dziennikarzy. Bierze w nim udział około 2000 osób. W roku 2013 konferencja odbyła się w dniach 23–27 stycznia[1].

Oprócz konferencji w Davos fundacja organizuje również spotkania regionalne oraz publikuje raporty.

WEF zostało założone w 1971 r. przez Klausa W. Schwaba, niemieckiego profesora biznesu.

Według zwolenników, WEF jest odpowiednim miejscem dla dialogu i debaty na temat głównych społecznych i ekonomicznych problemów planety, ponieważ wśród uczestników obecni są przedstawiciele największych ekonomicznych organizacji i najbardziej wpływowych organizacji politycznych, a także intelektualistów, co sprzyja odpowiedniej atmosferze do prowadzenia szerokiej i otwartej debaty.

Według krytyków WEF, jest to tylko forum biznesu, na którym najbogatsze przedsiębiorstwa mogą łatwo negocjować umowy między sobą, a także wywierać nacisk na najbardziej wpływowych polityków świata. Zdaniem krytyków, celem tych spotkań jest bardziej zysk niż rozwiązywanie ekonomicznych problemów, takich jak bieda. Uważa się, że WEF jest zdominowane przez korporacje i ma wpływ na globalne podejmowanie decyzji, więc jest postrzegany przez krytyków jako niewybierany, niedemokratyczny, elitarny, poufny światowy Senat. Do 2001 roku głównymi zarządami podejmującymi decyzje w WEF były Forum Zarządu Dyrektorów i Rada Zarządu Dyrektorów.

Z tych powodów, w trakcie spotkań WEF (szczególnie od czasu Corocznych Spotkań WEF w styczniu 2000) przeciwnicy regularnie organizują protesty. Akty ograniczania praw obywatelskich podczas protestów są odbierane przez krytyków jako dowód współpracy między władzami lokalnymi a WEF przeciwko prawom człowieka.
""")  # source: https://pl.wikipedia.org/wiki/%C5%9Awiatowe_Forum_Ekonomiczne

In [6]:
spacy.displacy.render(doc, style='ent')