# Pierwsze kroki ze spaCy
Na początku zaimportujmy moduł spacy i sprawdźmy jego wersję.

In [1]:
import spacy
spacy.__version__

'2.2.4'

## Podstawowe operacje na tekście

Utwórzmy obiekt umożliwiający przetwarzanie języka angielskiego.

In [2]:
from spacy.lang.en import English

In [3]:
nlp = English()
doc = nlp("Apple is looking at buying U.K. startup for $1 billion")

Jakie segmenty zostały wydzielone w powyższym tekście?

In [4]:
for token in doc:
    print(token.text, token.pos_)

Apple 
is 
looking 
at 
buying 
U.K. 
startup 
for 
$ 
1 
billion 


Sprawdźmy działanie indeksowania segmenty.

In [5]:
doc[1:3]

is looking

## Analiza z wykorzystaniem modelu statystycznego

spaCy dostarcza również modeli statystycznych, umożliwiających wykorzystanie kontekstowej informacji w analizie języka naturalnego. Przetestujmy działanie modelu języka angielskiego.

In [6]:
nlp = spacy.load("en_core_web_sm")
doc = nlp("Apple is looking at buying U.K. startup for $1 billion")

Obecnie dostaniemy więcej informacji: znaczniki morfosyntaktyczne opisujące poszczególne segmenty w tekście.

In [7]:
for token in doc:
    print(token.text, token.pos_)

Apple PROPN
is AUX
looking VERB
at ADP
buying VERB
U.K. PROPN
startup NOUN
for ADP
$ SYM
1 NUM
billion NUM


Możemy również zidentyfikować jednostki nazewnicze występujące w tym tekście.

In [8]:
for ent in doc.ents:
    print(ent.text, ent.label_)

Apple ORG
U.K. GPE
$1 billion MONEY


A także ładnie je zwizualizować.

In [9]:
from spacy import displacy
displacy.render(doc, style="ent", jupyter=True)