# WordNet

**WordNet :** base de données lexicales pour l’anglais.

NLTK fournit une interface d’interrogation.

## Les Synsets de WordNet

Liste de *Synsets* pour un terme donné.

**Synsets** : ensembles de synonymes pour chaque acception.

Souvent, un seul *Synset*.

In [None]:
import nltk
from nltk.corpus import wordnet
syn = wordnet.synsets('duck')
print(syn)

Pour chaque *Synset* d’un terme, on peut obtenir :
- sa définition
- des exemples d’utilisation
- son étiquette grammaticale (*n*, *a*, *r* ou *v*)
- la liste de ses hyponymes et de ses hyperonymes
- ses lemmes

In [None]:
definition = syn[0].definition()
examples = syn[4].examples()
tag = syn[0].pos()
hypernyms = syn[0].hypernyms()
hyponyms = syn[0].hyponyms()
lemmas = syn[7].lemmas()

### Rechercher les synonymes

Les lemmes d’un *Synset* se concevant comme des synonymes, l’une des finalités envisageables serait par exemple d’en obtenir la liste pour une certaine catégorie grammaticale :

In [None]:
def get_synonyms(word, pos=None):
    """Lists all possible synonyms of a word, except the word itself.
    
    Keyword arguments:
    word -- the word to look up
    pos -- POS-tagging
    """
    synonyms = set()
    synsets = wordnet.synsets(word, pos=pos)
    for synset in synsets:
        [synonyms.add(lemma.name()) for lemma in synset.lemmas()]
    synonyms.remove(word)
    return synonyms

synonyms = get_synonyms('duck', 'v')

### Rechercher les antonymes

À l’inverse, on peut aussi bien lister les antonymes d’un *Synset* particulier :

In [None]:
def get_antonyms(synset):
    """Lists the antonyms of all the possible synonyms of a
    particular Synset.
    
    Keyword argument:
    synset -- the given synset
    """
    antonyms = set()
    for lemma in synset.lemmas():
        [antonyms.add(antonym.name()) for antonym in lemma.antonyms()]   
    return antonyms

kind = wordnet.synset('kind.a.01')
antonyms = get_antonyms(kind)