# <center> TD : Révisions 1 - Correction

**Rappel** : L’instruction `randint(a,b)`  accessible grâce à la bibliothèque `random` retourne un entier aléatoire de l’intervalle `[a, b]`.

## Exercice 1 : Variance

Étant donné un ensemble de valeurs $X = \{x_1,\dots,x_n\}$, la *variance* de $X$  permet de déterminer  si les valeurs de $X$ sont très dispersées (variance importante) ou non. 

Elle se calcule de la manière suivante :

\begin{equation*}
	\sum_{j = 1}^n (E(X) -x_j)^2
\end{equation*}
où $E(X)$ est la moyenne des valeurs $x_1,\dots,x_n$.

On souhaite calculer la variance d'un ensemble de valeurs. Cet ensemble sera représenté sous la forme d'un tableau de nombres flottants.

## Question 1
Définir la fonction `moyenne` prenant en paramètre un tableau
de nombres et retournant la moyenne des nombres de ce tableau.

In [None]:
##################
#   Correction   #
##################

def moyenne(tab):
    somme = 0
    j = 0
    while j < len(tab):
        somme += tab[j]
        j += 1
    return somme / len(tab)

## Question 2 
Quelle est la complexité asymptotique de la fonction moyenne ?
Justifier.

**CORRECTION :**

La fonction a une complexité linéaire en la taille du tableau car elle parcourt une fois et une seule le tableau et exécute un nombre borné d'opérations élémentaires à pour chaque valeur contenue dans le tableau.

## Question 3 
Voici le code de la fonction `variance` :

In [None]:
def variance(tab):
    var = 0
    j = 0
    while j < len(tab):
        var += (moyenne(tab) - tab[j]) ** 2
        j += 1
    return var

*Remarque* : `x ** 2` correspond à $x^2$ en python.

Quelle est la complexité asymptotique de cet algorithme ? Justifier.

**CORRECTION :**

Cette fonction a une complexité quadratique puisque la fonction `moyenne` est appelée `n` fois.

### Question 4 
- Peut-on améliorer la complexité ? 
- Peut-on éviter de calculer plusieurs fois la même chose ?
<BR>
    
- Proposer une nouvelle fonction `variance2` calculant la variance de manière plus efficace.
- Quelle est la complexité asymptotique de la fonction variance2 ? Justifiez.

In [None]:
##################
#   Correction   #
##################

def variance2(tab):
    var = 0
    j = 0
    moy = moyenne(tab)
    while j < len(tab):
        var += (moy - tab[j]) ** 2
        j += 1
    return var

**CORRECTION :**

Cette fonction a une complexité linéaire.

### Question 5 
Copier les trois fonctions `moyenne`, `variance` et `variance2` dans un fichier intitulé `statistique.py` situé dans le répertoire courant. 

Dans ce même répertoire, écrire dans un fichier `exercice1.py` un programme 
- qui créée un tableau de $10\,000$ nombres entiers aléatoires entre 0 et 100 inclus
- qui mesure ensuite  et affiche les temps d’exécution en millisecondes nécessaires pour calculer l’écart-type (c'est-à-dire la racine carrée de la variance) des nombres du tableau avec la fonction `variance`, puis avec la fonction `variance2`.

*Indication* : la racine carrée est obtenue frâce à la fonction `sqrt` de la bibliothèque `math`.

In [None]:
##################
#   Correction   #
##################

from time import time
from random import randint
from math import sqrt
# ligne à ajouter quand les fonction sont dans le fichier statistique.py
from statistique import variance, variance2

tab = []
i = 0
while i < 10000:
    tab.append(randint(0,100))
    i += 1
    
tic = time()
ec = sqrt(variance(tab))
tac = time()
temps=round(1000 * (tac-tic),2)
print("Calcul avec la fonction variance ", ec , " en ", temps, "ms")
      
tic = time()
ec = sqrt(variance2(tab))
tac = time()
temps2 = round(1000 * (tac-tic),2)
print("Calcul avec la fonction variance2 ", ec, " en ", temps2, "ms")

## Exercice 2 : Analyse d’humeur

L’analyse (d’humeur) de texte consiste à déterminer si un texte est plutôt joyeux, triste ou neutre.

Pour cela, on dispose de deux listes de mots représentées par deux tableaux **triés dans l’ordre alphabétique** : `joyeux` et `tristes`. Le premier contient un ensemble de mots considérés comme joyeux et le deuxième un ensemble de mots considérés comme tristes.

Voici un exemple de tableaux :

In [None]:
joyeux = ["beau", "cool", "gai", "génial", "heureuse", "heureux"]
tristes = ["déprime", "horrible", "marre", "nul", "nulle", "pleurer"]

Pour déterminer l’humeur d’un texte, on compte le nombre de mots joyeux et le nombre de mots tristes du texte. 

Un texte est considéré comme *joyeux* s’il contient deux fois plus de mots joyeux que de mots tristes ou s’il contient 20 mots joyeux de plus que de mots tristes. 

À l’inverse, un texte est considéré comme triste s’il contient deux fois plus de mots tristes que de mots joyeux ou s’il contient 20 mots tristes de plus que de mots joyeux. 

Dans les autres cas, le texte est considéré comme neutre.

**Exemple.**  Le texte : *"Il a beau pleurer et il a beau en avoir marre, rien ne change... C’est horrible, quelle déprime !"* contient deux mots joyeux (deux fois le mot beau) et quatre mots
tristes (pleurer, marre, horrible et déprime). Il est donc considéré comme triste car il contient deux fois plus de mots tristes que de mots joyeux.

Dans la suite, un texte est représenté par une chaîne de caractères sans ponctuation et sans majuscule ; les mots sont séparés par un seul espace. Par exemple, le texte précédent est représenté par la chaîne de caractères :

```
"il a beau pleurer et il a beau en avoir marre rien ne change c'est horrible quelle déprime"
```

### Question 1  
- Définir la fonction `decoupe_mots` prenant en paramètre une
chaîne de caractères (non vide) correspondant à un texte et découpant ce texte en mots. 

La fonction renverra cet suite de mots sous la forme d’un tableau de mots. Avec la phrase précédente, la fonction renverra le tableau :
```
["il", "a", "beau", "pleurer", "et", "il", "a", "beau", "en",
"avoir", "marre", "rien", "ne", "change", "c'est", "horrible",
"quelle", "déprime"]
```
*Attention* : Seule l'utilisation des fonctions `len` et `append` est autorisée, l'utilisation de la fonction `split` est interdite.

In [None]:
##################
#   Correction   #
##################

def decoupe_mots(ch):
    tab = []
    s = ""
    j = 0
    while j < len(ch):
        if ch[j] == " ":
            tab.append(s)
            s = ""
        else:
            s += ch[j]
        j += 1
    tab.append(s)
    return tab

### Question 2

Définir la fonction `recherche` prenant en paramètres un mot et
un **tableau de mots trié** et retournant 
- `1` si le mot apparaît dans le tableau, 
- et `0` sinon.

*Attention* : On veillera à faire une recherche **efficace** du mot dans le tableau de mots trié.

In [None]:
##################
#   Correction   #
##################

def recherche(tab, mot):
    debut = 0
    fin = len(tab)-1
    pasTrouve=0
    while debut <= fin and pasTrouve==0:
        milieu = (debut + fin)//2
        if tab[milieu] == mot:
            pasTrouve=1
        elif tab[milieu] > mot:
            fin = milieu - 1
        else:
            debut = milieu + 1
    return pasTrouve

### Question 3 
Quelle est la complexité de cette fonction `recherche` ?

**CORRECTION :**

La fonction `recherche` a une complexité logarithmique si l'exploration du tableau pour chercher chaque mot est faite par dichotomie, et linéaire sinon (quand l'exploration du tableau à chaque itération est séquentielle).

### Question 4 

Définir la fonction `compte_mots` prenant en paramètres un tableau de mots et un tableau de mots trié et retournant le nombre de mots du premier tableau contenus dans le deuxième tableau.

Par exemple, si l’on appelle la fonction `compte_mots` avec comme premier tableau le tableau de mots correspondant à la phrase 

*il a beau pleurer et il a beau en avoir marre rien ne change c’est horrible quelle déprime* 

et comme deuxième tableau 
- le tableau `tristes`, la fonction doit alors renvoyer la valeur 4 car il y a 4 mots `tristes`; 
- le tableau `joyeux`, la fonction doit alors renvoyer la
valeur 2 car le mot beau apparaît 2 fois dans le 1er tableau.

In [None]:
##################
#   Correction   #
##################

def compte_mots(phrase_tab, liste_triee):
    i = 0
    nb_mots = 0
    while i < len(phrase_tab):
        nb_mots += recherche(liste_triee, phrase_tab[i])
        i += 1
    return nb_mots

def compte_mots2(phrase_tab, liste_triee):
    for mot in phrase_tab:
        nb_mots += recherche(liste_triee, mot)
    return nb_mots

### Question 5 

Quelle est la complexité de la fonction `compte_mots` ?

**CORRECTION :**

La fonction a une complexité de $\mathcal{O}(n \log(n))$ si la recherche est faite par dichotomie (ou quadratique - c'est-à-dire en $\mathcal{O}(n^2)$ - si la recherche est faite  séquentiellement) où $n$ est le maximum des longueurs des deux tableaux.

Si l'onveut être plus précis, la complexité est en $\mathcal{O}(n \log(m))$ si la recherche est faite par dichotomie (ou en $\mathcal{O}(n*m)$ - si la recherche est faite  séquentiellement) où $n$ est la longueur du tableau non trié et $m$ celle du tableau trié.

### Question 6 
Définir la fonction `humeur` prenant en paramètres une chaîne de caractères correspondant à un texte ainsi que deux tableaux : un tableau contenant la liste des mots joyeux et l’autre la liste des mots tristes. 

La fonction devra renvoyer 
- `-1` si le texte passé en paramètre est analysé comme triste, 
- `0` s’il est analysé comme neutre 
- et `1` s’il est analysé comme joyeux.

In [None]:
##################
#   Correction   #
##################

def humeur(phrase, joyeux, tristes):
    liste_mots = decoupe_mots(phrase)
    nb_joyeux = compte_mots(liste_mots,joyeux)
    nb_tristes = compte_mots(liste_mots,tristes)

    if nb_joyeux >= 2 * nb_tristes or nb_joyeux >= nb_tristes + 20:
        resultat = 1
    elif nb_tristes >= 2 * nb_joyeux or nb_tristes >= nb_joyeux + 20:
        resultat = -1
    else:
        resultat = 0
    return resultat

### Question 7 

On a maintenant un ensemble de textes stockés dans un tableau (chaque case du tableau contient une chaîne de caractères correspondant à un texte). 

- Définir la fonction `happy_end` prenant en paramètre un tel tableau et qui (au choix) :
    - soit supprime tous les textes neutres et tristes du tableau pour ne garder que les textes joyeux ;
    - soit renvoie un tableau ne contenant que les textes joyeux.
    
Dans tous les cas, on veillera à l'efficacité de la fonction `happy_end`.

In [None]:
##################
#   Correction   #
##################

def happy_end(liste_textes, joyeux, tristes):
    """
    retourne un nouveau tableau avec les textes joyeux
    """
    i = 0
    textes_joyeux=[]
    while i < len(liste_textes):
        if humeur(liste_textes[i],joyeux, tristes) == 1:
            textes_joyeux.append(liste_texte[i])
        i += 1
    return textes_joyeux    
        
def happy_end2(liste_textes, joyeux, tristes):
    """
    supprime de liste_textes les textes tristes ou neutres 
    sans utiliser pop(i) pour avoir une complexité linéaire
    """
    i = 0
    j = 0
    while i < len(liste_textes):
        if humeur(liste_textes[i],joyeux, tristes) == 1:
            liste_textes[j] = liste_textes[i]
        j+= 1
        i+= 1
    supprimer = len(liste_textes) - j
    i = 0
    while i < supprimer:
        liste_textes.pop()
        i += 1