Installation via ligne de commande  
pip install -U spaCy  
python -m spacy download fr  
python -m spacy download fr_core_news_md

# Initialisation de SPACY en Français

In [2]:
import spacy
from spacy import displacy
nlp = spacy.load('fr')

In [3]:
doc = nlp('Demain je travaille à la maison')
for token in doc:
    print(token.text)

Demain
je
travaille
à
la
maison


## Récupération des éléments/mots et informations via la classe Token

In [5]:
doc = nlp("Demain je travaille à la maison.")
for token in doc:
    print("{0}\t{1}\t{2}\t{3}\t{4}\t{5}\t{6}\t{7}\t{8}\t{9}\t{10}".format(
        token.text,
        token.idx,
        token.lemma_,
        token.is_punct,
        token.is_space,
        token.is_alpha,
        token.shape_,
        token.pos_,
        token.tag_,
        token.ent_type_,
        token.dep
    ))

Demain	0	Demain	False	False	True	Xxxxx	PROPN	PROPN___		397
je	7	il	False	False	True	xx	PRON	PRON__Number=Sing|Person=1		426
travaille	10	travailler	False	False	True	xxxx	VERB	VERB__Mood=Ind|Number=Sing|Person=1|Tense=Pres|VerbForm=Fin		8206900633647566924
à	20	à	False	False	True	x	ADP	ADP___		8110129090154140942
la	22	le	False	False	True	xx	DET	DET__Definite=Def|Gender=Fem|Number=Sing|PronType=Art		412
maison	25	maison	False	False	True	xxxx	NOUN	NOUN__Gender=Fem|Number=Sing		432
.	31	.	True	False	False	.	PUNCT	PUNCT___		442


## Maintenant récupérons les phrases

In [9]:
doc = nlp("Demain je travaille à la maison. Je vais pouvoir faire du NLP")
for sent in doc.sents:
    print(sent)

Demain je travaille à la maison.
Je vais pouvoir faire du NLP


## Découpage grammatical de phrase / Part-Of-Speech-Tagging (POS-Tagging)

In [18]:
doc = nlp("Demain je travaille à la maison.")
for token in doc:
    print(token.text, " -> ", token.tag_)

Demain  ->  PROPN___
je  ->  PRON__Number=Sing|Person=1
travaille  ->  VERB__Mood=Ind|Number=Sing|Person=1|Tense=Pres|VerbForm=Fin
à  ->  ADP___
la  ->  DET__Definite=Def|Gender=Fem|Number=Sing|PronType=Art
maison  ->  NOUN__Gender=Fem|Number=Sing
.  ->  PUNCT___


## NER

Détection des entités avec le modèle Fr pré-entrainé

In [8]:
doc = nlp("Demain je travaille en France chez Tableau")
for ent in doc.ents:
    print(ent.text, ent.label_)

France LOC
Tableau ORG


### Détection des phrases nominales (sans verbe)

In [62]:
doc = nlp("Terrible désillusion pour la championne du monde")
for chunk in doc.noun_chunks:
    print(chunk.text, " --> ", chunk.label_)

Terrible désillusion pour la championne du monde  -->  NP


### Dépendances dans une phrase

In [63]:
doc = nlp('Demain je travaille en France chez Tableau')
for token in doc:
    print("{0}/{1} <--{2}-- {3}/{4}".format(
                                        token.text, 
                                        token.tag_, 
                                        token.dep_, 
                                        token.head.text, 
                                        token.head.tag_))

Demain/PROPN___ <--advmod-- travaille/VERB__Mood=Ind|Number=Sing|Person=1|Tense=Pres|VerbForm=Fin
je/PRON__Number=Sing|Person=1 <--nsubj-- travaille/VERB__Mood=Ind|Number=Sing|Person=1|Tense=Pres|VerbForm=Fin
travaille/VERB__Mood=Ind|Number=Sing|Person=1|Tense=Pres|VerbForm=Fin <--ROOT-- travaille/VERB__Mood=Ind|Number=Sing|Person=1|Tense=Pres|VerbForm=Fin
en/ADP___ <--case-- France/PROPN__Gender=Fem|Number=Sing
France/PROPN__Gender=Fem|Number=Sing <--obl-- travaille/VERB__Mood=Ind|Number=Sing|Person=1|Tense=Pres|VerbForm=Fin
chez/ADP___ <--case-- Tableau/NOUN__Gender=Masc|Number=Sing
Tableau/NOUN__Gender=Masc|Number=Sing <--obl-- travaille/VERB__Mood=Ind|Number=Sing|Person=1|Tense=Pres|VerbForm=Fin


### Ca sera plus visuel comme cela ...

In [67]:
displacy.render(doc, style='dep', jupyter=True, options={'distance': 130})