Installation via ligne de commande  
pip install -U spaCy  
python -m spacy download fr  
python -m spacy download fr_core_news_md

# Initialisation de SPACY en Français

In [29]:
import spacy
from spacy import displacy
nlp = spacy.load('fr')

In [36]:
doc = nlp('Demain je travaille à la maison')
for token in doc:
    print(token.text)

Demain
je
travaille
à
la
maison
en
France


## Récupération des éléments/mots et informations via la classe Token

In [71]:
doc = nlp("Demain je travaille à la maison.")
for token in doc:
    print("{0}\t{1}\t{2}\t{3}\t{4}\t{5}\t{6}\t{7}\t{8}".format(
        token.text,
        token.idx,
        token.lemma_,
        token.is_punct,
        token.is_space,
        token.shape_,
        token.pos_,
        token.tag_,
        token.ent_type_
    ))

Demain	0	Demain	False	False	Xxxxx	PROPN	PROPN___	
je	7	il	False	False	xx	PRON	PRON__Number=Sing|Person=1	
travaille	10	travailler	False	False	xxxx	VERB	VERB__Mood=Ind|Number=Sing|Person=1|Tense=Pres|VerbForm=Fin	
à	20	à	False	False	x	ADP	ADP___	
la	22	le	False	False	xx	DET	DET__Definite=Def|Gender=Fem|Number=Sing|PronType=Art	
maison	25	maison	False	False	xxxx	NOUN	NOUN__Gender=Fem|Number=Sing	
.	31	.	True	False	.	PUNCT	PUNCT___	


## Maintenant récupérons les phrases

In [9]:
doc = nlp("Demain je travaille à la maison. Je vais pouvoir faire du NLP")
for sent in doc.sents:
    print(sent)

Demain je travaille à la maison.
Je vais pouvoir faire du NLP


## Découpage grammatical de phrase / Part-Of-Speech-Tagging (POS-Tagging)

In [18]:
doc = nlp("Demain je travaille à la maison.")
for token in doc:
    print(token.text, " -> ", token.tag_)

Demain  ->  PROPN___
je  ->  PRON__Number=Sing|Person=1
travaille  ->  VERB__Mood=Ind|Number=Sing|Person=1|Tense=Pres|VerbForm=Fin
à  ->  ADP___
la  ->  DET__Definite=Def|Gender=Fem|Number=Sing|PronType=Art
maison  ->  NOUN__Gender=Fem|Number=Sing
.  ->  PUNCT___


## NER

Détection des entités avec le modèle Fr pré-entrainé

In [69]:
doc = nlp("Demain je travaille en France chez Tableau")
for ent in doc.ents:
    print(ent.text, ent.label_)

AttributeError: 'spacy.tokens.span.Span' object has no attribute 'type_'

In [47]:
from nltk.chunk import conlltags2tree
 
iob_tagged = [
    (
        token.text, 
        token.tag_, 
        "{0}-{1}".format(token.ent_iob_, token.ent_type_) if token.ent_iob_ != 'O' else token.ent_iob_
    ) for token in doc
]

print(iob_tagged)
 
# In case you like the nltk.Tree format
print(conlltags2tree(iob_tagged))

[('Demain', 'PROPN___', 'O'), ('je', 'PRON__Number=Sing|Person=1', 'O'), ('travaille', 'VERB__Mood=Ind|Number=Sing|Person=1|Tense=Pres|VerbForm=Fin', 'O'), ('en', 'ADP___', 'O'), ('France', 'PROPN__Gender=Fem|Number=Sing', 'B-LOC'), ('chez', 'ADP___', 'O'), ('Tableau', 'NOUN__Gender=Masc|Number=Sing', 'B-ORG')]
(S
  Demain/PROPN___
  je/PRON__Number=Sing|Person=1
  travaille/VERB__Mood=Ind|Number=Sing|Person=1|Tense=Pres|VerbForm=Fin
  en/ADP___
  (LOC France/PROPN__Gender=Fem|Number=Sing)
  chez/ADP___
  (ORG Tableau/NOUN__Gender=Masc|Number=Sing))


### Détection des phrases nominales (sans verbe)

In [62]:
doc = nlp("Terrible désillusion pour la championne du monde")
for chunk in doc.noun_chunks:
    print(chunk.text, " --> ", chunk.label_)

Terrible désillusion pour la championne du monde  -->  NP


### Dépendances dans une phrase

In [63]:
doc = nlp('Demain je travaille en France chez Tableau')
for token in doc:
    print("{0}/{1} <--{2}-- {3}/{4}".format(
                                        token.text, 
                                        token.tag_, 
                                        token.dep_, 
                                        token.head.text, 
                                        token.head.tag_))

Demain/PROPN___ <--advmod-- travaille/VERB__Mood=Ind|Number=Sing|Person=1|Tense=Pres|VerbForm=Fin
je/PRON__Number=Sing|Person=1 <--nsubj-- travaille/VERB__Mood=Ind|Number=Sing|Person=1|Tense=Pres|VerbForm=Fin
travaille/VERB__Mood=Ind|Number=Sing|Person=1|Tense=Pres|VerbForm=Fin <--ROOT-- travaille/VERB__Mood=Ind|Number=Sing|Person=1|Tense=Pres|VerbForm=Fin
en/ADP___ <--case-- France/PROPN__Gender=Fem|Number=Sing
France/PROPN__Gender=Fem|Number=Sing <--obl-- travaille/VERB__Mood=Ind|Number=Sing|Person=1|Tense=Pres|VerbForm=Fin
chez/ADP___ <--case-- Tableau/NOUN__Gender=Masc|Number=Sing
Tableau/NOUN__Gender=Masc|Number=Sing <--obl-- travaille/VERB__Mood=Ind|Number=Sing|Person=1|Tense=Pres|VerbForm=Fin


Ca sera plus visuel comme cela ...

In [67]:
displacy.render(doc, style='dep', jupyter=True, options={'distance': 130})