C'est une étape très importante dans le processus du recherche d'informations (RI). Elle consiste à déterminer etextraire les termes représentatifs du contenu d’undocument, qui couvrent au mieux leur contenu sémantique.
<<Processus de l’approche linguistique:>>
• Extraction des termes - Tokenisation
• Suppression des mots vides
• Stemming – Radicalisation
• Lemmatisation