# Notebook 4 - Apprentissage supervisé

CSI4506 Intelligence Artificielle  
Automne 2020  
Preparé par Julian Templeton, Caroline Barrière et Joel Muteba

***INTRODUCTION***:

La tâche de classification supervisée abordée dans ce notebook est la **détection de polarité**, qui est une activité possible dans la tendance très populaire de *Opinion Mining* dans l’IA.  Beaucoup d’entreprises veulent savoir s’il y a des commentaires positifs ou négatifs à leur sujet.  Les commentaires peuvent être sur les hôtels, restaurants, films, service à la clientèle de toute sorte, etc.

Ce notebook vous permettra de mieux comprendre une ***configuration expérimentale*** pour l’apprentissage automatique/machine supervisé, la notion d’ensemble ou de données d'entraînement, de test, d'évaluation, etc.  Le notebook introduit également la notion d’évaluation comparative.  Pour dire si une méthode est bonne ou non, nous la comparons souvent à une approche de *base*.

Ce notebook utilise un package d’apprentissage automatique vraiment agréable et populaire appelé **scikit-learn** (http://scikit-learn.org/stable/).  Il contient de nombreux algorithmes d’apprentissage automatique pré-codés que vous pouvez appeler.  Pour utiliser ce package, vous devez le télécharger. Vous aurez également besoin de télécharger **Pandas** qui est un excellent outil pour manipuler les données à utiliser dans les algorithmes d’apprentissage automatique et **Numpy** qui est souvent utilisé par les librairies d’apprentissage automatique.  À l’invite de commandes, tapez ***pip install numpy***, ***pip install sklearn*** et ***pip install pandas*** pour télécharger les packages.

Dans ce notebook, nous utiliserons l’algorithme d’apprentissage automatique Naive Bayes pour la détection de polarité d’un grand ensemble de données (dataset) de revue de film, mais nous explorerons d’autres algorithmes ML (ML pour Machine Learning ou apprentissage automatique) inclus dans scikit-learn dans les futurs notebook.

Vous devrez télécharger l'ensemble de données (dataset) de revue de films à partir du Google Drive partagé suivant:
https://drive.google.com/file/d/1w1TsJB-gmIkZ28d1j7sf1sqcPmHXw352/view

Les revues de film auront la mention Fresh (frais, donc positif) ou Rotten (pourri, donc négatif). Nous allons utiliser cet ensemble de données (dataset) dans tout le notebook alors soyez sûr de le placer dans le même répertoire que ce notebook. Il contient 480000 commentaires avec la moitié d’entre eux étant Rotten (pourri) et l’autre moitié étant Fresh (frais). Nous n’utiliserons qu’un sous-ensemble de ceux-ci en raison du temps de calcul important de l’apprenant de base.


***Devoir***:  

Parcourez le notebook en exécutant chaque cellule, une à la fois.  
Recherchez **(TO DO)** pour les tâches que vous devez effectuer. Ne modifiez pas le code en dehors des questions auxquelles on vous demande de répondre, sauf si spécifié. Une fois que vous avez terminé, signez le notebook (à la fin du notebook) et soumettez-le.  

*Le notebook sera marqué le 20.  
Chaque **(TO DO)** a un certain nombre de points qui lui sont associés.*
***

**1. Détection de polarité**  

Dans la détection de polarité, nous utilisons deux classes : positive et négative.  C’est différent de l’analyse des sentiments par exemple, dans laquelle les classes pourraient être (triste, heureux, anxieux, en colère, etc.).  Il est également plus restreint que le *rating* (notation) dans lequel nous aimerions attribuer une valeur (de 0 à 5 par exemple) pour évaluer un service particulier.  Ainsi, la tâche de détection de polarité vise à attribuer soit *positif* ou *négatif* à une instruction.

**2. Domaine d'application:  Revue des films**  

La détection de polarité pourrait être utilisée sur les revues de quoi que ce soit.  Dans ce notebook, nous souhaitons appliquer la détection de polarité dans le domaine des films.  Les critiques/revues de films donnent une critique accompagnée d’un score pour les films qu’ils passent en revue. Le site Rotten Tomatoes est un site Web qui recueille les critiques de films et les cotes accompagnées. Les cotes peuvent être classés comme « Rotten » pour un faible score de revue ou « Fresh » pour un score de revue plus élevé. Nous utiliserons l'ensemble de données *rt_reviews.csv* que vous avez téléchargé précédemment pour effectuer la détection de polarité.

La première chose à faire est de configurer ou former les ensembles d'entrainement et de test pour nos modèles. Nous allons construire ces ensembles en important les données de l'ensemble de données (dataset) à l’aide de pandas, puis utiliser le "dataframe" (type de données pandas) avec la fonction "train_test_split" de sckikit learn qui séparera les données en ensemble d'entrainement (training set) et ensemble de test (test set). Ceux-ci seront utilisés ultérieurement par les modèles qui seront créés/utilisés.

Nous **NE DEVONS PAS** utiliser l'ensemble de test pour construire notre modèle. L’ensemble de test a pour but de tester le modèle après que nous l’ayons entrainé avec l’ensemble d'entrainement.

In [1]:
# Import the libraries that we will use to help create the train and test sets
import pandas as pd
import numpy as np
from sklearn.model_selection import train_test_split

# Import the dataset, need to use the ISO-8859-1 encoding due to some invalid UTF-8 characters
df = pd.read_csv("rt_reviews.csv", encoding="ISO-8859-1")

La première étape après le chargement des données est d'y jeter un coup d’oeil rapide. Pandas offre les deux fonctions utiles df.head() et df.tail() qui vous permettent de visualiser le haut et le bas de votre dataframe (cadre de données).

In [2]:
df.head(5) # Show the first five reviews of the dataset to understand the dataframe's structure

Unnamed: 0,Freshness,Review
0,fresh,"Manakamana doesn't answer any questions, yet ..."
1,fresh,Wilfully offensive and powered by a chest-thu...
2,rotten,It would be difficult to imagine material mor...
3,rotten,Despite the gusto its star brings to the role...
4,rotten,If there was a good idea at the core of this ...


In [3]:
# Randomly select 10000 fresh examples from the dataframe
dfFresh = df[df["Freshness"] == "fresh"].sample(n=10000, random_state=8)
# Randomly select 10000 rotten examples from the dataframe
dfRotten = df[df["Freshness"] == "rotten"].sample(n=10000, random_state=5)
# Combine the results to make a small random subset of reviews to use
dfPartial = dfFresh.append(dfRotten)

In [4]:
# Split the data such that 90% is used for training and 10% is used for testing (separating the review
# from the freshness scores that we will use as the labels)
# Recall that we do not use this test set when building the model, only the training set
# We use the parameter stratify to split the training and testing data equally to create
# a balanced dataset
train_reviews, test_reviews, train_tags, test_tags = train_test_split(dfPartial["Review"],
                                                                      dfPartial["Freshness"],
                                                                      test_size=0.1, 
                                                                      random_state=3,
                                                                      stratify=dfPartial["Freshness"])
train_tags = train_tags.to_numpy()
train_reviews = train_reviews.to_numpy()
# Testing set (what we will use to test the trained model)
test_tags = test_tags.to_numpy()
test_reviews = test_reviews.to_numpy()

**3. Utilisation des ressources disponibles**  

Pour la détection de la polarité, certains chercheurs ont établi des listes de mots positifs et négatifs.  Ceux utilisés dans ce notebook ont été téléchargés à partir d' [ici](https://www.cs.uic.edu/~liub/FBS/sentiment-analysis.html) (un site Web sur Opinion Mining par le célèbre chercheur Bing Liu) et stockés localement.  Les fichiers *positive-words.txt* et *negative-words.txt* se trouvent dans le module Jupyter Notebook dans Brightspace.  Assurez-vous de placer ces fichiers dans le même répertoire que votre carnet.

In [5]:
# Read the positive words
# to fix encoding problems, you might need to replace the line below
# with open("positive-words.txt", encoding = "ISO-8859-1") as f: 

with open("positive-words.txt") as f:
    posWords = f.readlines()
posWords = [p[0:len(p)-1] for p in posWords if p[0].isalpha()] 

# print the first 50 words
print(posWords[:50])

['a+', 'abound', 'abounds', 'abundance', 'abundant', 'accessable', 'accessible', 'acclaim', 'acclaimed', 'acclamation', 'accolade', 'accolades', 'accommodative', 'accomodative', 'accomplish', 'accomplished', 'accomplishment', 'accomplishments', 'accurate', 'accurately', 'achievable', 'achievement', 'achievements', 'achievible', 'acumen', 'adaptable', 'adaptive', 'adequate', 'adjustable', 'admirable', 'admirably', 'admiration', 'admire', 'admirer', 'admiring', 'admiringly', 'adorable', 'adore', 'adored', 'adorer', 'adoring', 'adoringly', 'adroit', 'adroitly', 'adulate', 'adulation', 'adulatory', 'advanced', 'advantage', 'advantageous']


In [6]:
# Read the negative words
# to fix encoding problems, you might need to replace the line below
# with open("negative-words.txt", encoding = "ISO-8859-1") as f: 

with open("negative-words.txt") as f:
    negWords = f.readlines()
negWords = [p[0:len(p)-1] for p in negWords if p[0].isalpha()] 

# Print the first 50 negative words
print(negWords[:50])

['abnormal', 'abolish', 'abominable', 'abominably', 'abominate', 'abomination', 'abort', 'aborted', 'aborts', 'abrade', 'abrasive', 'abrupt', 'abruptly', 'abscond', 'absence', 'absent-minded', 'absentee', 'absurd', 'absurdity', 'absurdly', 'absurdness', 'abuse', 'abused', 'abuses', 'abusive', 'abysmal', 'abysmally', 'abyss', 'accidental', 'accost', 'accursed', 'accusation', 'accusations', 'accuse', 'accuses', 'accusing', 'accusingly', 'acerbate', 'acerbic', 'acerbically', 'ache', 'ached', 'aches', 'achey', 'aching', 'acrid', 'acridly', 'acridness', 'acrimonious', 'acrimoniously']


**4. Approche de base**  

Avant d’évaluer les performances d’une approche d’apprentissage supervisée, nous pouvons commencer par établir une approche de base très simple.  Il est toujours bon de commencer simple.  Une approche de base nous permet de mesurer si la complexité supplémentaire des différents modèles que nous développons en vaut la peine ou non.

L’ *algorithme de base* que nous allons utiliser compte simplement le nombre de mots positifs et négatifs dans la revue (critique) et donne la catégorie correspondant au plus grand nombre de mots (ce sera positif s'il y a plus de mots positifs et négatif dans le cas où il y a plus de mots négatifs).  Cette approche n’apprend rien.  Elle utilise simplement un *raisonnement* particulier (stratégie au moment du test).  Vous pourriez être surpris de savoir combien de *start-ups d'IA* dans le domaine d’Opinion Mining, utilisent ce genre d’approche simple.  

In [7]:
# First let's define methods to count positive and negative words

def countPos(text):
    count = 0
    for t in text.split():
        if t in posWords:
            count += 1
    return count

def countNeg(text):
    count = 0
    for t in text.split():
        if t in negWords:
            count += 1
    return count

In [8]:
# Simple counting algorithm as baseline approach to polarity detection
def baselinePolarity(review):
    numPos = countPos(review)
    numNeg = countNeg(review)
    if numPos > numNeg:
        return "fresh"   
    else:
        return "rotten"   

In [9]:
# Test the baseline method
print("Testing baselinePolarity with the review:", train_reviews[0])
print("baselinePolarity result:", baselinePolarity(train_reviews[0]))
print("Actual result:", train_tags[0])
print(" ")
print("Testing baselinePolarity with the review:", train_reviews[1])
print("baselinePolarity result:", baselinePolarity(train_reviews[1]))
print("Actual result:", train_tags[1])

Testing baselinePolarity with the review:  "Captain Marvel" ultimately feels more obligatory than inspired, a movie that basically gets the job done and little more.
baselinePolarity result: rotten
Actual result: fresh
 
Testing baselinePolarity with the review:  As the coffee-fueled Phil lurches further and further over the edge of soccer coach impropriety, you can sense Ferrell struggling to break through the lame script
baselinePolarity result: rotten
Actual result: rotten


**5. Évaluation de l'approche de base**  

Nous avons vu en classe qu’il existe différentes façons d’évaluer un algorithme. Dans le cas de la classification, une méthode d’évaluation commune consiste simplement à calculer le *nombre de mauvais choix*. De même, il est possible de calculer la *justesse* (accuracy) d’un modèle qui est le nombre total de prédictions correctes divisé par le nombre total de prédictions effectuées. Nous allons explorer la *justesse* (accuracy) dans les notebooks ultérieurs.    

Pour tester notre *algorithme de base* nous utiliserons l’ensemble de test, défini plus tôt et calculerons le nombre de prédictions erronées.

In [10]:
# Function takes a one dimensional array of reviews and a one dimensional array of
# tags as input and prints the number of incorrect assignments when running the baseline approach
# on the reviews.
# Let's establish the polarity for each review
def incorrectReviews(reviews, tags):
    nbWrong = 0
    count = 0
    for i in range(len(reviews)):
        polarity = baselinePolarity(reviews[i])
        if (count < 10):
            print(reviews[i] + " -- Prediction: " + polarity + ". Actually: " + tags[i] + " \n")
            count += 1
        if (polarity != tags[i]):
            nbWrong += 1

    print('There are %s wrong predictions out of %s total predictions' %(nbWrong, len(tags)))    

In [11]:
# This may take a minute to run
incorrectReviews(test_reviews, test_tags)

 tries to be both a comedy and an action film, but only succeeds as a comedy. It's extremely funny, with Hill and Tatum displaying a disturbing amount of chemistry. -- Prediction: rotten. Actually: fresh 

 The result is like a two-stage booster rocket, propelled by a tricky structure, deft style and original scenario before settling into the sort of orbit any fanboy could recognize and appreciate. -- Prediction: fresh. Actually: fresh 

 Cursed feels like a series of curveballs designed to confuse the audience into thinking they're watching anything other than bad dialogue. -- Prediction: rotten. Actually: rotten 

 The Wrestler transcends professional wrestling as Requiem for a Heavyweight transcends boxing ... [it] raises the broken figure of the Ram to the level of a tragic hero... -- Prediction: rotten. Actually: fresh 

 Where the brilliance of Strange Weather lies - in great part through Hunter's stunningly human and subtly searing performance - is in its constant grappling with

**(TO DO) Q1 - 1 point**  

Regardez les dix extrants ci-dessus qui fournissent des prédictions en utilisant l’approche de base pour les revues spécifiées ainsi que leur classe de revue réelle.

À partir de la sortie, donner les probabilités antérieures/prior (pas de code nécessaire) pour chaque classe en fonction de la sortie donnée par l’approche de base et en fonction de la classe de revue réelle.

***Réponses ici***  
Pour les prédictions de l'approche de base:     
P(fresh) =   $\frac{3}{10}$   

P(rotten) =  $\frac{7}{10}$    

En fonction des valeurs (classes) réelles:     
P(fresh) =   $\frac{7}{10}$ 

P(rotten) =  $\frac{3}{10}$ 

#### 6. Méthode d'apprentissage supervisé

Nous allons maintenant entraîner un modèle d’apprentissage supervisé pour la détection de la polarité.

***6.1 Données d'entraînements***  

Dans l’apprentissage supervisé, nous avons besoin de données d'entraînement. Ces données d'entraînement doivent être *différentes* mais *représentatives* des données de test éventuelles. Au début du notebook, nous avons défini les données d'entraînement et les données de test comme un sous-ensemble de l’ensemble de données (20000 lignes tirées de 480000). Nous l’avons fait en raison du temps de calcul important de l’approche de base utilisée dans ce notebook. En réalité, nous aurions  voulu utiliser l’ensemble de données et nous assurer que nous avons entraîné notre modèle avec un ensemble d'entrainement assez grand. Cela permettrait de nous assurer que nous avons suffisamment appris afin de bien effectuer nos prédictions sur de nouvelles données.

Habituellement, un ensemble d'entraînement doit être aussi grand et varié que possible. Les ensembles d'entraînement sont très précieux, mais ils sont coûteux à obtenir, car ils nécessitent un marquage (annotation humaine: positif et négatif par exemple) pour les générer et les données elles-mêmes peuvent avoir besoin d’être "nettoyées". Encore une fois, l’ensemble d'entraînement est utilisé pour entraîner le modèle et l’ensemble de tests est utilisé pour tester la performance du modèle entraîné sur de nouveaux exemples.

In [12]:
# Looking at the shapes of the train and test datasets that we will be using
print(train_reviews.shape)
print(test_reviews.shape)

(18000,)
(2000,)


***6.2 Prétraitement des données d'entrées*** 

Ce package d’apprentissage automatique, *scikit-learn*, est quelque peu particulier dans la façon dont les données doivent être mises en forme pour être utilisées par les algorithmes d'entraînement. Donc, nous devons effectuer un certain prétraitement sur les phrases ci-dessus.  Heureusement *scikit-learn* fournit quelques fonctions prédéfinis pour faire du prétraitement de texte. 

Nous transformons facilement chaque phrase en une liste d’index en dictionnaire. Le dictionnaire est construit à partir des mots dans les phrases. Les clés du dictionnaire sont les mots, et la valeur est un index.

In [13]:
from sklearn.feature_extraction.text import CountVectorizer

# The CountVectorizer builds a dictionary of all words (count_vect.vocabulary_), 
# and generates a matrix (train_counts), to represent each sentence
# as a set of indices into the dictionary. The words in the dictionary are the words found in train_reviews.

count_vect = CountVectorizer()
train_counts = count_vect.fit_transform(train_reviews)

Pour comprendre ce que fait le code ci-dessus, nous allons d’abord imprimer le vocabulaire recueilli à partir des phrases dans train_reviews.  

In [14]:
# print the vocabulary (dictionary of words)
print(count_vect.vocabulary_)



Par exemple, nous pouvons interpréter la sortie ci-dessus comme:

'coffee':4558  to mean that the word 'coffee' has been assigned index 4558  
'highly':11255 to mean that the word 'highly' has been assigned index 11255

Imprimons alors la valeur de *train_counts*

In [15]:
# print the content of the training examples in terms of frequency of words (each word represented by its index)
print(train_counts)

  (0, 3623)	1
  (0, 14707)	1
  (0, 25034)	1
  (0, 8860)	1
  (0, 15601)	2
  (0, 16476)	1
  (0, 24064)	1
  (0, 12399)	1
  (0, 15713)	1
  (0, 24072)	1
  (0, 2106)	1
  (0, 10032)	1
  (0, 24075)	1
  (0, 12952)	1
  (0, 7046)	1
  (0, 1102)	1
  (0, 14044)	1
  (1, 24075)	3
  (1, 1102)	1
  (1, 1528)	1
  (1, 4558)	1
  (1, 9696)	1
  (1, 17725)	1
  (1, 14323)	1
  (1, 9761)	2
  :	:
  (17999, 12027)	1
  (17999, 12725)	1
  (17999, 3399)	1
  (17999, 10033)	1
  (17999, 13119)	2
  (17999, 24150)	1
  (17999, 2172)	1
  (17999, 26653)	1
  (17999, 1067)	1
  (17999, 21544)	1
  (17999, 26404)	1
  (17999, 12990)	1
  (17999, 15873)	1
  (17999, 14484)	1
  (17999, 3979)	1
  (17999, 26183)	1
  (17999, 12651)	1
  (17999, 24036)	1
  (17999, 8232)	1
  (17999, 16520)	1
  (17999, 22763)	1
  (17999, 5538)	1
  (17999, 10334)	1
  (17999, 16625)	1
  (17999, 7857)	1


Vous pouvez interpréter chacune des lignes ci-dessus comme:  

(0, 14044) 1  -- la phrase 0 (dans train_reviews) contient une fois le mot 14044 (index du mot dans count_vect.vocabulary qui est le mot 'little')  

(17999, 13119) 2  -- la phrase 17999 (dans train_reviews) contient deux fois le mot 13119 (index du mot dans count_vect.vocabulary qui est le mot 'just')  

Donc le train_counts contient pour chaque phrase, le BOW (bac of words, sac de mots) associé mais dans la forme d'une liste d'index (chaque index correspond à un mot).

***6.3 Apprentissage Naive Bayes***

Avec les données prétraitées, nous sommes prêts à tester l’algorithme Naive Bayes fourni par scikit-learn.  Cet algorithme exigeait que les données d'entraînement soient représentées en termes de *train counts* et c’est pourquoi nous avons fait le prétraitement ci-dessus.

Il est aussi facile d’effectuer l'*entraînement (fit)*, comme vous le voyez ci-dessous, pour entraîner le modèle.  Mais vous savez ou devez savoir ce qui s'y passe!!!  Il crée des probabilités antérieures pour les classes (fraîches, pourries) et les probabilités postérieures de mots (caractéristiques) par classe (p. ex. P(terrible|frais) (P(awful|fresh)) ou P(terrible|pourri) (P(awful|rotten)). Toutes ces probabilités sont utilisées dans le théorème de Bayes.  

**(TO DO) Q2 - 2 points**  

Avant d'entraîner le modèle, quelles sont les probabilités antérieures des classes fresh et rotten en utilisant l’ensemble de formation ci-dessus?

In [22]:
# Find the prior probabilities for the fresh and rotten classes in the train set (train_tags) and the test set (test_tags)
# that we will be using.
# You must calculate it from the train and test sets, then print the calculated result
# Print the prior probabilities as: <TRAIN_OR_TEST>: P(class) = value
fresh_train = 0
fresh_test = 0
rotten_train = 0
rotten_test = 0

for x in range(len(train_tags)):
    if train_tags[x] == "fresh":
        fresh_train+=1
    else:
        rotten_train+=1
        
for x in range(len(test_tags)):
    if test_tags[x] == "fresh":
        fresh_test+=1
    else:
        rotten_test+=1
        
        

print("<Train>: P(Fresh) = ", fresh_train/len(train_tags))
print("<Train>: P(rotten)= ", rotten_train/len(train_tags))
print("<Test>: P(Fresh) = ", fresh_test/len(test_tags))
print("<Test>: P(rotten)= ", rotten_test/len(test_tags))

TypeError: only integer scalar arrays can be converted to a scalar index

In [None]:
# Test of a naive bayes algorithm, the "fit" is the training
from sklearn.naive_bayes import MultinomialNB

# Training the model
clf = MultinomialNB().fit(train_counts, train_tags)   

***6.4 Evaluation de Naive Bayes***

Examinons d’abord la performance du modèle sur l’ensemble d’entraînement, sur lequel il a appris.  Pour appliquer le modèle de classification (prédiction), nous utilisons la méthode *predict* ci-dessous.

In [None]:
# Testing on training set
predicted = clf.predict(train_counts)
# Print the first ten predictions
for doc, category in zip(train_reviews[:10], predicted[:10]):   # zip allows to go through two lists simultaneously
    print('%r => %s\n' % (doc, category))
correct = 0
for tag, pred in zip(train_tags, predicted):   # zip allows to go through two lists simultaneously
    if (tag == pred):
        correct += 1
print("Correctly classified %s total training examples out of %s examples" %(correct, train_tags.size))

Sans surprise, sur l’ensemble d'entraînement, nous obtenons la bonne prédiction sur la plupart des exemples....  Mais nous devrions tester sur un **ensemble de test** réel, à savoir test_reviews et test_tags.

**(TO DO) Q3 - 4 points**  

Testez le modèle entraîné sur l’ensemble de test.  Écrivez le code ci-dessous pour le faire. Avant de tester, chaque ensemble de test doit être transformé par les étapes de prétraitement de sorte que leur format soit compatible avec l’apprenant (le modèle entraîné).

In [None]:
# Pre-process test set test_reviews
# Note, we use transform and NOT fit_transform since this we do not want to re-fit the vecotrizer
# that we used to train the model
test_reviews_counts = count_vect.transform(...)
# Predict the results
...
# Print the first ten predictions
...
# Print the total correctly classified instances out of the total instances
...

***6.5 Plus d'évaluation!***


**(TO DO) Q4 - 2 points**   

Une mesure d’**évaluation commune** dans l’apprentissage automatique est le **Rappel**. Le Rappel est le nombre de prédictions correctes pour une classe d’intérêt (appelée les vrais positifs) divisé par le nombre total d’instances qui sont effectivement étiquetées comme étant dans cette classe d’intérêt (vrais positifs + faux négatifs).  Par exemple, si l’ensemble de test contient 5 exemples frais et que l’algorithme n’en a trouvé que 2, le rappel pour la classe fraîche est de 2/5.  Écrivez une petite méthode ci-dessous qui calculera le rappel d’une classe.  Il recevra trois paramètres :
1. L'ensemble d'étiquettage correct (Ex: (fresh, rotten, fresh)), 
2. Les prédictions (Ex: (fresh, fresh, rotten)), et
3. La classe d'intérêt (Ex: fresh).  

La méthode doit retourner le *Rappel* (Recall) de la classe (Ex: 50%).

In [None]:
# Number wrong
# CANNOT USE ANY FUNCTIONS FROM LIBRARIES TO DIRECTLY GET THE RECALL
def recall(actualTags, predictions, classOfInterest):
    ...

**(TO DO) Q5 - 2 points**   

Utilisez la méthode de rappel (recall) pour calculer le rappel sur l’ensemble d’essai (les deux classes) pour l’apprenant Naive Bayes.  Imprimez ces rappels.   

Conseil : Vous pouvez tester si le rappel() fonctionne correctement en testant l’exemple ci-dessus

In [None]:
# Recall
...

**(TO DO) Q6 - 2 points**   

Une autre mesure d’**évaluation commune** dans l’apprentissage automatique s’appelle **Precision**. La précision est le nombre de prédictions correctes pour une classe d’intérêt (True Positives ou Vrais Positifs) divisé par le nombre total de fois où cette classe d’intérêt a été prédite (True Positives (Vrais Positifs) + False Positives (Faux Positifs)). Par exemple, si l’ensemble de test contient 3 exemples frais et 1 exemple pourri et que l’algorithme a correctement étiqueté deux d’entre eux comme frais, incorrectement étiqueté l’un d’eux comme pourri, et incorrectement étiqueté l’un d’eux comme frais, alors la précision pour la classe fraîche est 2/3.  Écrivez une petite méthode ci-dessous qui calculera la précision d’une classe.  Il recevra trois paramètres : 


1. L'ensemble d'étiquettage correct (Ex: (fresh, rotten, fresh)), 
2. Les prédictions (Ex: (fresh, fresh, rotten)), et
3. La classe d'intérêt (Ex: fresh).  

La méthode doit retourner la *Précision* de la classe (Ex: 50%).

In [None]:
# CANNOT USE ANY FUNCTIONS FROM LIBRARIES TO DIRECTLY GET THE PRECISION
def precision(actualTags, predictions, classOfInterest):
    ...

**(TO DO) Q7 - 2 points**   
Utilisez la méthode de précision pour calculer la précision sur l’ensemble de test (les deux classes) pour l’apprenant Naive Bayes.  Imprimez ces valeurs de précision.  

Conseil : Vous pouvez tester si la précision() fonctionne correctement en testant avec l’exemple ci-dessus

In [None]:
# Precision
...

#### 7. Discussion     
Une étape importante dans l'expérimentation du processus d’apprentissage automatique est d’analyser et de discuter les résultats après une expérience. Dans cette section, vous répondrez à quatre questions différentes pour fournir un aperçu des résultats obtenus à partir des expériences ci-dessus.

**(TO DO) Q8 (a) - 1 point**      
L’approche Naïve Bayes est-elle plus performante que l’approche de base, si oui, à quel point?  

Réponse de Q8 (a) ici   
...

**(TO DO) Q8 (b) - 2 points**

Si nous utilisions les données d'entraînement sur l’approche de base, comment théorisez-vous ou pensez-vous que ces résultats se compareraient à ceux des données de test (mieux, pire, peut-être les deux)? Expliquez comment la comparaison des prédictions de données d'entraînement et des tests du modèle de base peut ou non (selon votre réponse précédente) se comparer aux résultats obtenus à partir de l’algorithme Naive Bayes.

Réponse ici pour Q8 (b)    
...

**(TO DO) Q8 (c) - 1 point**      

Présentez et discutez des résultats globaux obtenus à l’aide de ce notebook ci-dessous (tels que les comparaisons de précision et de rappel entre les étiquettes (tags) de film).  

Réponse ici pour Q8 (c)    
...

**(TO DO) Q8 (d) - 1 point**      

Donnez deux suggestions pour aider l'approche Naive Bayes dans le contexte de notre expérimentation de détection de polarité pour les critiques/revues de films.

Réponse ici pour Q8 (d)

...

**Optionnel - Pas de points pour cette suggestion** 

Pour votre propre intérêt, créez une copie locale du notebook et refaitez les questions à l’aide de l’ensemble de données complet et les mêmes ensembles d'entraînement et de test. En outre, vous pouvez jouer avec différents algorithmes pour obtenir une meilleure compréhension de la bibliothèque sklearn. Nous allons explorer d’autres algorithmes dans les deux prochains notebook.

***SIGNATURE:***
Mon nom est --------------------------.
Mon numéro d'étudiant est -----------------.
Je certifie être l'auteur de ce devoir.