## TP04 : Listes - Tableaux à une dimension - Dictionnaires

- Éléments de cours sur les dictionnaires :  https://capytale2.ac-paris.fr/web/c-auth/list?returnto=/web/code/e5c5-155659  

## Objectif 1 : comptage des occurrences dans une liste ou un tableau

### Exercice 1 construction de tableaux

En informatique, on appelle **tableau** une structure de données linéaire, de taille fixe et  contenant des éléments de même type, et dans laquelle on accède aux valeurs, pour les lire ou les modifier, à l'aide de la position de ces valeurs dans le tableau.  
   
En Python, la structure de tableau sera implémentée par des listes Python, la distinction entre tableau et liste sera donc formelle, et on parlera de tableau plutôt que de liste, pour exprimer que la taille de la liste est **fixe** (définie au moment de la création du tableau et non modifiée par la suite) et que la liste est **homogène**, c'est-à-dire que tous ses éléments sont de même type.   

Le vocabulaire, lorsque l'on parle de tableaux sera aussi légèrement différent :  
* la **taille** d'un tableau `T` désignera son nombre d'élément. En Python la taille d'un tableau `T` sera donnée par `len(T)` ;  
* on parlera des **cellules** d'un tableau pour désigner les emplacements des différentes valeurs. En Python, les cellulles d'un tableau `T` de taille $n$ seront les emplacements en mémoire référencés par `T[0]`, `T[1]`, ..., `T[len(T) -1]`.   

Pour prendre en compte que lorsque l'on parle d'un tableau on veut désigner une sructure de données de taille fixe et dont les valeurs sont toutes de même type, la construction d'un tableau sera de façon privilégiée à partir de la donnée de la taille du tableau et d'une valeur ayant le type voulu pour les valeurs dans le tableau, à l'aide de l'opération de multiplication d'une liste à un élément par un entier strictement positif.   

Les opérations sur les tableaux se limiteront à :  
* créer un tableau de taille donnée, dont toutes les cellules contiennent la même valeur, dont le type fixera le type des valeurs dans le tableau ;
* accéder aux valeurs dans le tableau, à l'aide de leur indice de position, pour lire ces valeurs ou les modifier ;  
* parcourir le tableau, à l'aide d'un parcours par les indices.

**Q1** Définir une variable entière `n` égale à 10, puis construire un tableau `T` de taille $n$ constitué de $n$ valeurs toutes égales à 0 (ici l'entier zéro).

***Q1 : proposition de réponse***

In [1]:
n = 10
T = [0] * n

* Vérification / tests

In [2]:
T

**Q2** Définir une fonction `tableau_alea` de paramètres `n` et `p`, renvoyant un tableau de $n$ entiers, tirés au hasard entre $0$ et $p$ ($p\geqslant 0$).

***Q2 : proposition de réponse***

Pour se conformer à la notion de tableau, on commencera par construire un tableau de taille $n$, dont les éléments sont tous égaux à l'entier zéro (pour se conformer au type voulu pour les valeurs dans le tableau), puis on parcourra le tableau pour remplacer les zéros par des entiers tirés aléatoirement

In [3]:
from random import randint

def tableau_alea(n, p):
    tab = [0] * n
    for i in range(len(tab)):
        tab[i] = randint(0, p)
    return tab

* Vérification / tests

In [4]:
tableau_alea(10, 5)

### Exercice 2

**On ne considère dans cet exercice que des tableaux d'entiers dont les valeurs sont dans l'intervalle $[\![0 \,;10]\!]$, sauf pour la question 3, où l'on généralise la méthode à des tableaux d'entiers positifs**

**Q1** Définir une fonction `compte2(T)`, qui renvoie le nombre d'***occurrences*** (nombre d'apparitions) de la valeur 2 dans un tableau `T` (on utilisera un compteur).

***Q1 : proposition de réponse***

In [5]:
def compte2(T):
    cpt = 0
    for val in T:
        if val == 2:
            cpt += 1
    return cpt

* Vérification / tests

In [6]:
T = [4, 2, 2, 0, 2]
res = compte2(T)
print(T, res)

[4, 2, 2, 0, 2] 3


In [7]:
T = [4, 1, 1, 0, 3]
res = compte2(T)
print(T, res)

[4, 1, 1, 0, 3] 0


In [8]:
T = tableau_alea(10, 5)
res = compte2(T)
print(T, res)

[3, 2, 1, 3, 0, 3, 5, 5, 3, 0] 1


**Q2** On souhaite définir une fonction `compte_occurrences0_10`, de paramètre `T`, et renvoyant, sous la forme d'un tableau à 11 éléments, le nombre d'occurrences de chaque entier de l'intervalle d'entiers $[\![0 \,;10]\!]$ dans le tableau `T`.
* <u>indications</u> : on définira une liste de compteurs, `Tcompteurs`, de 11 éléments initialisés à 0. Pour tout $k$ compris entre 0 et 10, la cellule `Tcompteurs[k]` servira de compteur pour les occurrences de la valeur $k$ dans le tableau `T`.

On écrira la fonction `compte_occurrences0_10` en respectant le squelette suivant :

In [9]:
def compte_occurrences0_10(T):
    Tcompteurs = ... # <--- créer ici un tableau de 11 valeurs égales à zéro 
    ...             # <--- mettre en place ici le parcours du tableau T par les valeurs ou par les indices
                    # <--- si la valeur lue est égale à k (0<=k<=100), 
                    #      alors on incrémente la valeur de Tcompteurs[k] de 1
    return ...   # <--- renvoyer la liste des compteurs Lcompteurs

Recopier et compléter ci-dessous le squelette de la fonction `compte_occurrences0_10` :

***Q2 : proposition de réponse***

In [10]:
def compte_occurrences0_10(T):
    Tcompteurs = [0] * 11 #  un tableau 11 valeurs égales à zéro 
    for val in T:         # parcours du tableau T par les valeurs
        Tcompteurs[val] += 1 # on ajoute 1 au compteur, Tcompteurs[val], des occurrences de la valeur lue, val
    return Tcompteurs   # on renvoie le tableau des compteurs Tcompteurs

ou bien

In [11]:
def compte_occurrences0_10(T):
    Tcompteurs = 11 * [0]
    for k in range(len(T)):
        valeur_lue = T[k]
        Tcompteurs[valeur_lue] = Tcompteurs[valeur_lue] + 1 
    return Tcompteurs

* Vérification / tests

In [12]:
T = [4, 2, 2, 0, 2]
res = compte_occurrences0_10(T)
print(T)
print(res)

[4, 2, 2, 0, 2]
[1, 0, 3, 0, 1, 0, 0, 0, 0, 0, 0]


On lit dans le tableau renvoyé, que la valeur 0 est présente 1 fois dans le tableau `T`, la valeur 2 est présente 3 fois, la valeur 4 une fois, tandis que les entiers 1, 3, 5, 6, 7, 8, 9 et 10 sont absents du tableau `T`.

In [13]:
T = [0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 10, 9, 8, 7, 6, 5, 4, 3, 2, 1, 0]
res = compte_occurrences0_10(T)
print(T)
print(res)

[0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 10, 9, 8, 7, 6, 5, 4, 3, 2, 1, 0]
[2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2]


On lit dans le tableau renvoyé, que tous les entiers de $[\![0 \,;10]\!]$ sont présents deux fois dans le tableau `T`.

In [14]:
T = tableau_alea(30, 10)
occurrences = compte_occurrences0_10(T)

print(T)
for i in range(11):
    print("L'entier", i, "est présent", occurrences[i], "fois dans le tableau T.")

[3, 2, 9, 0, 9, 2, 7, 8, 8, 1, 4, 4, 9, 2, 2, 1, 1, 9, 5, 9, 7, 3, 0, 10, 6, 2, 1, 6, 7, 1]
L'entier 0 est présent 2 fois dans le tableau T.
L'entier 1 est présent 5 fois dans le tableau T.
L'entier 2 est présent 5 fois dans le tableau T.
L'entier 3 est présent 2 fois dans le tableau T.
L'entier 4 est présent 2 fois dans le tableau T.
L'entier 5 est présent 1 fois dans le tableau T.
L'entier 6 est présent 2 fois dans le tableau T.
L'entier 7 est présent 3 fois dans le tableau T.
L'entier 8 est présent 2 fois dans le tableau T.
L'entier 9 est présent 5 fois dans le tableau T.
L'entier 10 est présent 1 fois dans le tableau T.


**Q3** Reprendre le code de la fonction `compte_occurrences0_10` et y apporter les modifications minimales afin de définir une fonction `compte_occurrences(L)` qui, lorsque `L` est une liste non vide d'entiers positifs, la fonction renvoie le maximum, $M$, des valeurs de `L` et un tableau `Tocc` tel que `Tocc[k]` donne, pour tout entier $k$ de $[\![0 \,;M]\!]$, le nombre d'occcurrences de $k$ dans `L`.

***Q3 : proposition de réponse***

In [15]:
def compte_occurrences(L):
    ## recherche du maximum de L
    vmax = L[0]
    for i in range(len(L)):
        if L[i] > vmax:
            vmax = L[i]
    ## initialisation du tableau des compteurs
    Tcompteurs = (vmax + 1) * [0]
    ## comptage des occurrences
    for val in L:         # parcours du tableau T par les valeurs
        Tcompteurs[val] += 1 # on ajoute 1 au compteur, Tcompteurs[val], des occurrences de la valeur lue, val
    return Tcompteurs   # on renvoie le tableau des compteurs Tcompteurs

* Vérification / tests

In [16]:
L = [0, 1, 999, 1, 1, 999, 1]
res = compte_occurrences(L)
print(L)
print(res)

[0, 1, 999, 1, 1, 999, 1]
[1, 4, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0

On lit dans le tableau renvoyé, que la valeur 0 est présente 1 fois dans On lit dans le tableau renvoyé, que la valeur 0 est présente 1 fois dans le tableau `T`, la valeur 1 est présente 4 fois, la valeur 99 deux fois, tandis que les autres entiers de $[\![0 \,;999]\!]$ sont absents de la liste `L`., la valeur 1 est présente 4 fois, la valeur 99 deux fois, tandis que les autres entiers de $[\![0 \,;999]\!]$ sont absents de la liste `L`.

In [17]:
T = tableau_alea(30, 5)
occurrences = compte_occurrences(T)

print(T)
for i in range(max(T) + 1):
    print("L'entier", i, "est présent", occurrences[i], "fois dans le tableau T.")

[3, 0, 3, 3, 0, 4, 4, 4, 1, 0, 4, 0, 1, 3, 2, 5, 4, 2, 4, 1, 4, 4, 4, 2, 0, 4, 5, 3, 4, 2]
L'entier 0 est présent 5 fois dans le tableau T.
L'entier 1 est présent 3 fois dans le tableau T.
L'entier 2 est présent 4 fois dans le tableau T.
L'entier 3 est présent 5 fois dans le tableau T.
L'entier 4 est présent 11 fois dans le tableau T.
L'entier 5 est présent 2 fois dans le tableau T.


## Exercice 3 Comptage des occurrences à l'aide d'un dictionnaire

La méthode précédente pour compter les occurrences des valeurs présentes dans un tableau ou dans une liste, présente l'inconvénient de nécessiter que les valeurs soient entières et positives.  
De plus, on construit un tableau des occurrences qui contient potentiellement un grand nombre de cellules inutiles : par exemple, pour la liste `L = [0, 1, 999, 1, 1, 999, 1]`, on construit un tableau des occurrences de taille 1000.

La structure de dictionnaire permet de proposer une méthode de comptage des occurrences, dans laquelle la contrainte sur les valeurs est que celles-ci soient de type non mutable (`int`, `float`, `bool`, ou tuples de valeurs de l'un de ces trois types)

On considère une liste `L`, pour laquelle on veut construire un dictionnaire, `doccL` dont les clés sont les valeurs distinctes de la liste `L`.

On rappelle que l'on crée un dictionnaire vide `d` par l'instruction `d = {}` ou `d = dict()`.

On rappelle que l'instruction `d[c] = v` :
* ajoute la clé `c` au dictionnaire `d` et lui associe la valeur `v`, si la clé `c` n'existait pas déjà dans `d` ; 
ou bien
* change la valeur associée à la clé `c` en la remplaçant par `v`, si clé `c` existait déjà dans `d`.

On considère pour ce qui suit la liste

In [18]:
L = [0, 1, 999, 1, 1, 999, 1]

**Q1** Construire, à l'aide d'un parcours de `L` par les valeurs, un dictionnaire `doccL` dont les clés sont les valeurs de la liste `L`, associées chacune à la valeur 0.

***Q1 : proposition de solution***

In [19]:
doccL = dict()
for c in L:
    doccL[c] = 0

* Vérification /test :

In [20]:
doccL

**Q2** À l'aide d'un parcours de `L` par les valeurs, actualiser, au fil du parcours, les valeurs associés aux clés dans le dictionnaire `doccL`, de sorte qu'à la fin du parcours, chaque clé soit associée au nombre d'occurrence de cette clé parmi les valeurs de `L`.

***Q2 : proposition de solution***

In [21]:
for c in L:
    doccL[c] += 1

* Vérification /test :

In [22]:
doccL

**Q3** Définir une fonction `dic_occurrences(L)`, prenant en entrée une liste `L` et renvoyant un dictionnaire dont les clés sont les valeurs distinctes présentes dans `L`, associées à leur nombre d'occurrences (apparitions) dans `L`.  
***Il s'agit de généraliser ce qui a été fait aux questions 1 et 2 pour la liste L prise en exemple.***

***Q3 : proposition de solution***

In [23]:
def dic_occurrences(L):
    doccL = dict()
    for c in L:
        doccL[c] = 0
    for c in L:
        doccL[c] += 1
    return doccL

* Vérification /test :

In [24]:
dic_occurrences([0, 1, 999, 1, 1, 999, 1])

In [25]:
T = tableau_alea(10, 5)
print(T)
print(dic_occurrences(T))

[4, 4, 3, 1, 2, 0, 3, 0, 0, 2]
{4: 2, 3: 2, 1: 1, 2: 2, 0: 3}


In [26]:
T = ['a', 'b', 'a', 'b', 'b', 'b', 'b', 'a', 'b', 'a', 'b', 'a']
print(T)
print(dic_occurrences(T))

['a', 'b', 'a', 'b', 'b', 'b', 'b', 'a', 'b', 'a', 'b', 'a']
{'a': 5, 'b': 7}


**Q1** Construire, à l'aide d'un parcours de `L` par les valeurs, un dictionnaire `doccL` dont les clés sont les valeurs de la liste `L`, associées chacune à la valeur 0.

***Q1 : proposition de solution***

In [27]:
doccL = dict()
for c in L:
    doccL[c] = 0

* Vérification /test :

In [28]:
doccL

## Objectif 2 : recherche des valeurs les plus proches dans un tableau

### Exercice 4

**Q1** Définir une fonction `distanceTx`, prenant en argument un tableau d'entiers ou de flottants, `T`, et une valeur $x$, entière ou flottante, et renvoyant la plus petite distance d'un élément du tableau à $x$.  
L'utilisation de la fonction `abs` est autorisée, mais pas celle de la fonction `min`.

***Q1 : proposition de réponse***

On adapte l'algorithme de recherche du minimum d'une liste $L$.

In [29]:
def distanceTx(T, x):
    distmin = abs(T[0] - x) # initialisation de la distance minimale de x à une valeur de T
    for i in range(1, len(T)):
        if abs(T[i] - x) < distmin:
            distmin = abs(T[i] - x)
    return distmin 

* Vérification / tests

In [30]:
T = [0, 12, 3, 7]
res = distanceTx(T, 2)
print(T, res)

[0, 12, 3, 7] 1


In [31]:
T = [0, 12, 3, 7]
res = distanceTx(T, 112)
print(T, res)

[0, 12, 3, 7] 100


**Q1 [Analyse de complexité] :** Calculer le nombre de comparaisons effectuées en fonction du nombre $n$ d'éléments dans le tableau T.

* ***Q1 [Analyse de complexité] : proposition de réponse***

On effectue une comparaison pour chaque valeurs dans le tableau, à l'exception de la première.  Le nombre de comparaisons est donc égal à $n-1$.

**Q2** Définir une fonction `distmin_0`, prenant en argument un tableau `T`, comportant au moins deux éléments, et renvoyant la position $j_{\rm min}$ du premier élément de `T`, situé à un position $j>0$, et qui réalise le minimum de la distance de la valeur `T[j]` à la valeur `T[0]`.

Exemple : `distmin_0([2, 4, 5, 1, 0, 1])` doit renvoyer 3 (car la valeur 1, en position 3, est à la distance 1 de la valeur 2 située en position 0).

***Q2 : proposition de réponse***

On adapte la fonction précédente, en s'inspirant aussi de l'algorithme de recherche de la position de la première occurrence du minimum d'une liste $L$.

In [32]:
def distmin_0(T):
    dmin, jmin = abs(T[1] - T[0]), 1 # initialisation de la distance minimale de T[0] à une valeur T[i] de T
                                     # et de la position i=imin de l'élément réalisant ce minimum
    for j in range(2, len(T)):
        if abs(T[j] - T[0]) < dmin:
            dmin, jmin = abs(T[j] - T[0]), j
    return jmin 

* Vérification / tests

In [33]:
distmin_0([2, 4, 5, 1, 0, 1])

**Q3** Définir une fonction `distmin_i`, prenant en argument un tableau `T`, comportant au moins deux éléments et un indice $i$, et renvoyant la position $j_{\rm min}$ du premier élément de `T`, situé à une position $j$ autre que $i$  et  réalisant le minimum de la distance de la valeur `T[j]` à la valeur en position $i$ dans `T`.

Exemple : `distmin_i([2, 4, 5, 1, 0, 1], 2)` doit renvoyer 1, car la valeur 4, en position 1, réalise le minimum (égal à 1) de la distance à la valeur 5, située en position 2. `distmin_i([2, 4, 5, 1, 0, 1], 3)` doit renvoyer 5, car la valeur 1, en position 5, réalise le minimum (égal à 0) de la distance à la valeur 51, située en position 3.

**Q3** **[Analyse de complexité] :** Calculer le nombre de comparaisons effectuées lors d'un appel à la fonction `distmin_ij`, en fonction du nombre $n$ d'éléments dans le tableau T.

***Q3 : proposition de réponse***

On adapte la fonction précédente, en testant toutes les positions dans le tableau `T`, sauf la position $i$.   
Il faut choisir une position $j_0\neq i$ pour initialiser la valeur `dmin`. on peut choisir arbitrairement la position $j_0=0$, sauf si $i=0$.  
On propose trois solutions pour le choix de cette valeur $j_0$.

* initialisation de `dmin` avec la distance à la valeur en position 0 si $i\neq0$ et la valeur en position $1$ si $i=0$.

In [34]:
def distmin_i(T, i):
    # initialisation de la distance minimale de T[i] à une valeur T[j] de T
    # et de la position jmin de l'élément réalisant ce minimum
    if i == 0:
        dmin, jmin = abs(T[0] - T[1]), 1
    else:
        dmin, jmin = abs(T[i] - T[0]), 0
    # recherche de la distance minimum entre un élément T[j], j ≠ i, et T[i]
    for j in range(1, len(T)):
        if j != i and abs(T[j] - T[i]) < dmin:
            dmin, jmin = abs(T[j] - T[i]), j
    return jmin

### tests ###
distmin_i([1, 1, 1, 1, 1, 1], 0), distmin_i([2, 4, 5, 1, 0, 1], 0), \
distmin_i([2, 4, 5, 1, 0, 1], 2), distmin_i([2, 4, 5, 1, 0, 1], 3)

* initialisation de `dmin` avec la distance à la valeur en position 0 si $i\neq0$ et appel à la fonction `distmin_0` si $i=0$.

In [35]:
def distmin_i(T, i):
    if i == 0:
        return distmin_0(T)
    ## le code suivant est exécuté si i ≠ 0
    dmin, jmin = abs(T[i] - T[0]), 0
    # recherche de la distance minimum entre un élément T[j], j ≠ i, et T[i]
    for j in range(1, len(T)):
        if j != i and abs(T[j] - T[i]) < dmin:
            dmin, jmin = abs(T[j] - T[i]), j
    return jmin

### tests ###
distmin_i([1, 1, 1, 1, 1, 1], 0), distmin_i([2, 4, 5, 1, 0, 1], 0), \
distmin_i([2, 4, 5, 1, 0, 1], 2), distmin_i([2, 4, 5, 1, 0, 1], 3)

* initialisation de `dmin` avec la distance à la valeur en position $j_0 = (i + 1) \, \% \, {\rm len(T)}$ (si $i={\rm len(T)}-1$ alors $j_0=0$)) et parcourt du tableau `T` à l'aide des valeurs $j = (i + k) \, \% \, {\rm len(T)}$ pour $k$ variant de $2$ à `len(T) - 1` (ce qui assure que $j\notin \{i, j_0\}$).

In [36]:
def distmin_i(T, i):
    n = len(T)
    jmin = (i + 1) % n
    dmin = abs(T[jmin] - T[i])
    # recherche de la distance minimum entre un élément T[j], j ≠ i, et T[i]
    for k in range(2, len(T)):
        j = (i + k) % n
        if abs(T[j] - T[i]) < dmin:
            dmin, jmin = abs(T[j] - T[i]), j
    return jmin

### tests ###
distmin_i([1, 1, 1, 1, 1, 1], 0), distmin_i([2, 4, 5, 1, 0, 1], 0), \
distmin_i([2, 4, 5, 1, 0, 1], 2), distmin_i([2, 4, 5, 1, 0, 1], 3)

On a utilisé que, par exemple, si `T` est de taille (longueur) $n=6$, et $i=2$, alors $j = (i + k) \, \% \, {\rm len(T)}= (2 + k) \, \% \, 6% $ pour $k$ variant de $2$ à `len(T) - 1` $5$, prend les valeurs $4\, \% \, 6, 5\, \% \, 6, 6\, \% \, 6, 7\, \% \, 6$ *i.e.* $4, 5, 0, 1$.  
On initialise alors `dmin` à la valeur `abs(T[3] - T[2])`, puis on compare `dmin`, éventuellement en actualisant sa valeur, successivement, à `abs(T[4] - T[2])`, `abs(T[5] - T[2])`, `abs(T[0] - T[2])` et `abs(T[1] - T[2])`.

***Q3 [Analyse de complexité] : proposition de réponse*** 

Dans la première version de la fonction, on effectue une comparaison pour examiner si $i$ est égal à $0$ ou non, puis, on effectue
 une boucle `for` d'indice $j$, comportant $n-1$ itérations dans chacune desquelles deux comparaisons sont effectuées, sauf pour $j=i$ où, en raison de l'***évaluation paresseuse des booléens ( * )***, seule une seule comparaison est effectuée.  
 Ainsi au total, $1+ 2(n - 2) + 1=2n-2=2(n-1)$ comparaisons sont effectuées.   
 
 Dans la dernière version, au prix de calculs de modulos, on effectue seulement une comparaison pour chacune des $n-2$ itérations d'indice $k$, ainsi, au total, $n-2$ comparaisons sont effectuées.

*( * ) Note :* l'expression ***évaluation paresseuse des booléens*** renvoie au fait que dans l'évaluation d'une expression booléenne comportant des opérateurs, qui s'évalue de gauche à droite, en respectant les priorités de calcul, éventuellement marquées par des parenthèses, l'évaluation s'interrompt dès lors que la valeur finale peut être déterminée.  
Ainsi, pour déterminer la valeur d'une expression `j != i and abs(T[j] - T[i])`, si `j != i` est évaluée à `False`, alors la valeur de l'expression `abs(T[j] - T[i])` ne sera pas calculée, car il est assuré que l'expression complète devra être évaluée à `False`.

**Q4** Définir une fonction `distmin_ij`, prenant en argument un tableau `T` et renvoyant un couple `(i1min, i2min)` correspondant aux positions de deux éléments de `T` réalisant la plus petite distance entre deux éléments de `T`, distincts par leur position.  
**La fonction utilisera une (seule) boucle `for` et fera appel à la fonction définie en question 3.**

Proposer trois tests.  

**Q4** **[Analyse de complexité] :** Calculer le nombre de comparaisons effectuées lors d'un appel à la fonction `distmin_ij`, en fonction du nombre $n$ d'éléments dans le tableau T.

**Q4** ***proposition de réponse***

L'algorithme utilisé ici consiste à chercher la distance minimale parmi toutes les distances renvoyées par la fonction
`distmin_i` pour $i$ variant de $0$ à $n-1$.

In [37]:
def distmin_ij(T):
    i1min, i2min = 0, distmin_i(T, 0)
    dmin_ij = abs(T[i1min] - T[i2min])
    for i in range(1, len(T)):
        jmin = distmin_i(T, i) # <--- on veille à ne pas effectuer plusieurs fois cet appel à distmin_i
        dmin_i = abs(T[jmin] - T[i])
        if dmin_i < dmin_ij:
            i1min, i2min = i, jmin
            dmin_ij = dmin_i
    return i1min, i2min

* tests

In [38]:
T = [1, 1, 1, 1, 1]
i1min, i2min = distmin_ij(T)
print(T)
print(i1min, i2min, "dmin =", abs(T[i1min] - T[i2min]))

[1, 1, 1, 1, 1]
0 1 dmin = 0


In [39]:
T = [2, 2, 5, 1, 0, 1]
i1min, i2min = distmin_ij(T)
print(T)
print(i1min, i2min, "dmin =", abs(T[i1min] - T[i2min]))

[2, 2, 5, 1, 0, 1]
0 1 dmin = 0


In [40]:
T = [2, 4, 5, 1, 0, 1]
i1min, i2min = distmin_ij(T)
print(T)
print(i1min, i2min, "dmin =", abs(T[i1min] - T[i2min]))

[2, 4, 5, 1, 0, 1]
3 5 dmin = 0


**Q4** **[Analyse de complexité] :** ***proposition de réponse***

Avec l'implémentation précédente, pour chacune des $n$ valeurs de $i$, on effectue un appel à la fonction `distmin_i`, chacun causant $n-2$ comparaisons, si on utilise la dernière version de la fonction en question **3**.  
Par ailleurs, pour déterminer le minimum des distances minimales obtenues pour chaque valeur de $i$, on effectue $n-1$ comparaisons.  
Ainsi au total, on aura effectuée $n\times (n -2) + (n-1)=n^2-n-1$ comparaisons.

**Q5** Définir une fonction `distminij`, prenant en argument un tableau `T` et renvoyant un couple `(pos1min, pos2min)` correspondant aux positions de deux éléments de `T` réalisant la plus petite distance entre deux éléments de `T`, distincts par leur position.  

**La fonction utilisera deux boucles imbriquées d'indices respectifs $i$ et $j$ - on n'utilisera pas cette fois les fonctions définies précédemment.**

Proposer trois tests.  

**Q5** **[Analyse de complexité] :** Calculer le nombre de comparaisons effectuées en fonction du nombre $n$ d'éléments dans le tableau `T`.

***Q5 : proposition de réponse***

On généralise ici l'algorithme de recherche de la position du minimum d'une liste L.

In [41]:
def distminij(T):
    ## initialisation de la distance minimale entre deux éléments situés à des positions distinctes dans T
    ## la distance minimale est initialisée à la distance entre les éléments en positions 0 et 1.
    dmin, pos1min, pos2min = abs(T[0] - T[1]), 0, 1
    ## on teste toutes les couples (i, j) de positions distinctes pour examiner si la distance entre
    ## T[i] et T[j] est inférieure strictement au minimum déjà trouvé
    for i in range(len(T)):
        for j in range(len(T)):
            if i != j and abs(T[i] - T[j]) < dmin:
                dmin, pos1min, pos2min = abs(T[i] - T[j]), i, j
    return pos1min, pos2min 

In [42]:
T = [1, 1, 1, 1, 1]
i1min, i2min = distminij(T)
print(T)
print(i1min, i2min, "dmin =", abs(T[i1min] - T[i2min]))

[1, 1, 1, 1, 1]
0 1 dmin = 0


In [43]:
T = [2, 2, 5, 1, 0, 1]
i1min, i2min = distminij(T)
print(T)
print(i1min, i2min, "dmin =", abs(T[i1min] - T[i2min]))

[2, 2, 5, 1, 0, 1]
0 1 dmin = 0


In [44]:
T = [2, 4, 5, 1, 0, 1]
i1min, i2min = distminij(T)
print(T)
print(i1min, i2min, "dmin =", abs(T[i1min] - T[i2min]))

[2, 4, 5, 1, 0, 1]
3 5 dmin = 0


***Q5 [Analyse de complexité] : proposition de réponse***

Avec l'implémentation précédente, pour chacune des $n$ valeurs de $i$, on effectue $n$ tests pour déterminer si $i\neq j$, et on effectue pour les $n-1$ valeurs de $j$ différentes de $i$, une comparaison de `abs(T[i] - T[j])` avec `dmin`, soit au total $n\times n + n\times (n-1)=2n^2-n$ comparaisons.  

On peut minimiser le nombre de comparaisons en ne testant que les couples $(i, j)$ tels que $ i < j$ (utilisant là le fait que `abs(T[i] - T[j]) = abs(T[j] - T[i])`, et donc que, pour $i\neq j$, le test avec le couple $(i,j)$ est équivalent au test avec le couple $(j,i)$).  
L'implémentation est alors la suivante :

In [45]:
def distminij2(T):
    ## initialisation de la distance minimale entre deux éléments situés à des positions distinctes dans T
    ## la distance minimale est initialisée à la distance entre les éléments en positions 0 et 1.
    dmin, pos1min, pos2min = abs(T[0] - T[1]), 0, 1
    ## on teste toutes les couples (i, j) de positions distinctes pour examiner si la distance entre
    ## T[i] et T[j] est inférieure strictement au minimum déjà trouvé
    for i in range(len(T)):
        for j in range(i + 1, len(T)):
            if abs(T[i] - T[j]) < dmin:
                dmin, pos1min, pos2min = abs(T[i] - T[j]), i, j
    return pos1min, pos2min 

Avec cette dernière implémentation, pour chacune des $n$ valeurs de $i$, on effectue pour chacune des $n-i-1$ valeurs de $j$ supérieures strictement à $i$ une comparaison de `abs(T[i] - T[j])` avec `dmin`, soit au total $\sum_{i=0}^{n-1} n-i-1=(n-1) + (n-2)+\ldots + 2+1+0=\frac{(n-1)n}{2}=\frac{1}{2}(n^2-n)$ comparaisons.  
***On a ainsi divisé par 4, environ, le nombre de comparaisons.***

### On suppose maintenant que le tableau `T` est trié

**Q6** Si on suppose que le tableau à traiter est trié (*i.e.* les valeurs dans le tableau sont rangées dans l'ordre croissant) proposer un algorithme usuel demandant un nombre de comparaisons moins important que la méthode de la question **5**.<br/>
On demontrera préalablement que le minimum de distance entre deux valeurs du tableau `T` est nécessairement atteint entre deux éléments contingus du tableau.

**Q6**.  
**[Analyse de complexité] :** 
Calculer le nombre de comparaisons effectuées en fonction du nombre $n$ d'éléments dans le tableau `T` avec l'algorithme que vous aurez proposé.

***Q6 : proposition de réponse***

Si le minimum de distance est  nul, et qu'il est réalisé entre deux positions distinctes, $i_1$ et $i_2>i_1$, alors, ${\rm T}[i_1] = {\rm T}[i_2]$ et pour tout $i$ compris entre $i_1$ et $i_2$, parce que le tableau est trié, on a ${\rm T}[i_1] = {\rm T}[i]= {\rm T}[i_2]$, en particulier pour $i=i_1+1$, ce qui établi le résultat.<br/>
Si le minimum de distance est  non nul, alors toutes les valeurs du tableau sont distinctes, et si le minimum est réalisé entre deux positions distinctes, $i_1$ et $i_2$, non contigues, alors, on a $i_1 + 1< i_2$ et pour $i=i_1+1$ :
$$
{\rm T}[i_2] - {\rm T}[i_1] = \left({\rm T}[i_2] - {\rm T}[i_1+1]\right) + \left({\rm T}[i_1+1] - {\rm T}[i_1]\right)
$$
où les trois différences sont strictement positives car le tableau `T` est trié et ne contient pas de valeurs égales.<br/>
On en déduit alors que $\left|{\rm T}[i_1+1] - {\rm T}[i_1]\right|<\left|{\rm T}[i_2] - {\rm T}[i_1]\right|$, ce qui contredit que la distance minimale est réalisée par la différence $\left|{\rm T}[i_2] - {\rm T}[i_1]\right|$.<br/>
On a ainsi établi le résultat pour un tableau dont les valeurs sont deux à deux distinctes.

En conséquence du résultat établi la distance minimale entre deux éléments du tableau `T` peut-être recherchée en cherchant le minimum de distance entre deux valeurs adjacentes de `T`.<br/>
D'où la proposition d'implémentation suivante :

In [46]:
def distmintrie(T):
    pos1min, pos2min = 0, 1
    dmin = T[1] - T[0]
    for i in range(2, len(T)):
        if T[i] - T[i - 1] < dmin:
            pos1min, pos2min = i - 1, i
    return pos1min, pos2min

***Q6 [Analyse de complexité] :*** 

Dans l'algorithme implémenté, on effectue une comparaison par itération, soit $n-2$ comparaisons.

## Objectif 3 : recherche de la seconde valeur la plus grande dans une liste ou un tableau

On reprend ici le problème traité à l'**exercice 9 du TP03**, dans lequel on cherchait les positions et les valeurs des deux plus grandes valeurs dans une liste `L`.

On cherche ici, en utilisant des dictionnaires, à résoudre ce problème en effectuant un nombre de comparaisons moins important.  
On rappelle que, dans l'implémentation de l'**exercice 9 du TP03**, le nombre de comparaisons à effectuer était, pour $n$ grand, équivalent à $2n$ où $n$ était le nombre d'élements de la liste.

L'algorithme mis en œuvre ici consiste à *mettre en compétition* les valeurs dans liste sous la forme d'un tournoi dans lequel chacune des valeurs dans liste en *affronte* une autre, dans des matches où la valeur la plus grande est déclarée *vainqueur*.  

On considère des *rounds* successifs, dans chacun desquels chaque valeur en position paire affronte sa suivante (en position impaire). 
À l'issue d'un round, la liste est remplacée par la liste des vainqueurs du round précédent.  
Si la liste comporte un nombre impair d'éléments, la dernière valeur est automatiquement qualifiée pour le tour suivant.

À la fin du tournoi, la liste ne contient plus qu'un élément.

**Q1** Traitement d'un exemple

On considère la liste suivante, de longueur 20.

In [47]:
L0 = [21, 36, 61, 86, 1, 88, 33, 92, 59, 7, 55, 49, 42, 3, 80, 96, 54, 72, 93, 78]

**Q1.a** Donner la liste `L1` des vainqueurs des matches à l'issue du premier round.  
On demande ici d'écrire *à la main* la liste `L1` en extension.

***Q1.a. : proposition de réponse***

In [48]:
L1 = [36, 86, 88, 92, 59, 55, 42, 96, 72, 93]

In [49]:
len(L1)

**Q1.b** On cherche à écrire une boucle permettant d'obtenir la liste `L1` à partir de la liste `L0`.  
On écrira une boucle `for` d'indice $i$, telle que les valeurs $2i$ et $2i+1$ donne les positions dans `L1` des deux opposants dans chaque confrontation de deux valeurs :   
* la liste `L1` sera initialisée à la liste vide.  
* à la première itération, les valeurs `L0[0]` et `L0[1]` s'affronteront et le vainqueur sera ajouté à la liste `L1`, à la seconde itération, les valeurs `L0[2]` et `L0[3]` s'affronteront et le vainqueur sera ajouté à la liste `L1`, *etc.*  
* en fin de boucle `for`, si la liste `L0` comporte un nombre impair d'éléments, le dernier élément de `L0`, qui n'a pas d'opposant, sera ajouté à la liste `L1`.

***Q1.b. : proposition de réponse***

In [50]:
n = len(L0)
L1 = []
for i in range(n // 2):
    if L0[2 * i] >= L0[2 * i + 1]:
        L1.append(L0[2 * i])
    else:
        L1.append(L0[2 * i + 1])
if n % 2 == 1: # si la liste L0 comporte un nombre impair d'éléments
    L1.append(L0[-1])  # on ajoute à L1 le deriner élément de L0, qui n'a pas d'opposant

In [51]:
L1

**Q1.c** Déterminer le nombre, $r_L$, de rounds nécessaires jusqu'à obtenir une liste à un élément, à partir d'une liste $L$ comportant $n_L=20$ éléments.  
Démontrer que si $n_L \leqslant 2^m$, où $m\geqslant 0$, alors $r_L\leqslant m$.<br/>
En déduire un majorant de $r_L$ en fonction de $M=\lceil \log_2(n_L)\rceil$ (partie entière supérieure de $n_L$) qui est le plus petit entier supérieur ou égal à $\log_2(n_L)$.   
Justifier que cet élément unique de la liste obtenue après $r_L$ rounds, est nécessairement la plus grande valeur de la liste d'origine, $L$.

***Q1.c. : proposition de réponse***

Si la liste d'origine comporte $n_L$ éléments, la liste des vainqueurs, à l'issue du premier round, a pour longueur $n_L // 2$ si $n_L$ est pair et $n_L // 2 + 1$ si $n_L$ est impair.<br/>
Si $n_L=1$, alors alors à l'issue du round, la liste des vainqueurs contient encore un élément (le même).<br/>
Il en est de même à l'issue de chaque round.<br/>

Ainsi, pour une liste d'origine comportant $n=20$ éléments, les listes des vainqueurs, ont, successivement, 10, 5, 3, 2 et enfin un élément, au terme de $n_r=5$ rounds.

***De façon générale, si $n_L$ est supérieur strictement à 1***, que $n_L$ soit pair, de la forme $2p$, ou impair, de la forme $2p+1$, alors, si $n>1$, la longueur des listes des vainqueurs, décroît strictement à chaque itération, puisque l'on retire $p>0$ éléments à chaque itération.   
***Et si $n_L=1$***, alors le nombre d'éléments de la liste des vainqueurs à l'issue d'une itération supplémentaire est toujours de 1, en raison de la règle appliquée pour les listes de longueur impaire (on ajoute à la liste des vainqueurs, le dernier élément de la liste d'origine).

Si la liste $L$ comporte $n_L$ éléments, $1\leqslant n_L\leqslant 2^m$ éléments (initialisation), alors on démontre par récurrence, à l'aide des deux remarques ci-avant (pour démontrer l'hérédité), qu'à l'issue de l'itération numéro $i$, $1\leqslant i\leqslant m$, la liste obtenue est de longueur inférieure ou égale à $\frac{2^{m}}{2^i}=2^{m-i}$, si la liste à l'issue de l'itération d'indice $i-1$ comporte au moins deux éléments, ou égale à 1, si la liste à l'issue de l'itération d'indice $i-1$ comporte un élément.  
On peut donc écrire qu'à l'issue de l'itération numéro $i$, $1\leqslant i\leqslant m$, la liste des vainqueurs est de longueur inférieure ou égale à $2^{m-i}$.<br/>
Ainsi, on est assuré qu'à l'issue de $r_{\rm max}=m$ rounds, la liste des vainqueurs est de longueur $2^0=1$.

Considérons la partie entière supérieure de $\log_2(n_L)$, qui est l'unique entier $M_L$ tel que :
$$
\left(M_L - 1 < \log_2(n_L) \leqslant M_L \right) \Longleftrightarrow
\left(M_L - 1 < \frac{\log(n_L)}{\log 2} \leqslant  M_L  \right) \Longleftrightarrow
\left((M_L - 1). \log 2 < \log(n_L) \leqslant  m_L  . \log 2\right)$$
$$\Longleftrightarrow
\log \left(2^{M_L-1}\right) < \log(n_L) \leqslant \log \left(2^{M_L}\right)  \Longleftrightarrow
2^{M_L-1} < n_L \leqslant 2^{M_L}
$$
    Ainsi, $M_L= \lceil \log_2(n_L)\rceil$ est le plus petit entier $M$ tel que $n_L\leqslant 2^{M}$, et donc, en vertu de la démonstration par récurrence qui précède, à l'issue de $M_L$ itérations, il est assuré que la liste de vainqueurs est de longueur 1.

**Le nombre maximal de rounds nécessaires à obtenir une liste de longueur 1 est donc majoré par $M_L= \lceil \log_2(n_L)\rceil$**.

Pour une liste à 20 éléments :

In [52]:
from math import ceil, log

rmax = ceil(log(20, 2))
print(rmax)

5


On démontre par récurrence que le maximum de la liste `L` d'origine est nécessairement élément de la liste des vainqueurs du round numéro $i$.  
En effet (initialisation), si pour $i=0$, on convient que la liste des vainqueurs est la liste `L` d'origine, le maximum de `L` appartient à liste $L_i=L_0=L$.  
Et si à l'issue du round numéro $i$ ($0\leqslant i< r_L$, le maximum de `L` appartient à la liste de vainqueurs obtenue, notée $L_i$, alors (hérédité) le maximum de `L` appartient encore à $L_{i+1}$, car le maximum appartenait à $L_i$ et a nécessairement remporté l'affrontement qui l'opposait à une autre valeur.

**Q1.d** Donner les listes obtenues à l'issue de chacun des rounds, numéro 2, 3, ..., $n_{L0}$.

***Q1.d. : proposition de réponse***

In [53]:
## à l'issue du round n°1, les vainqueurs sont donnés par
L1 = [36, 86, 88, 92, 59, 55, 42, 96, 72, 93]
## à l'issue du round n°2, les vainqueurs sont donnés par
L2 = [86, 92, 59, 96, 93] 
## à l'issue du round n°3, les vainqueurs sont donnés par
L3 = [92, 96, 93]  
## à l'issue du round n°4, les vainqueurs sont donnés par
L4 = [96, 93]   
## à l'issue du round n°5, le vainqueur est donné par
L5 = [96] 

**Q2** Généralisation

**Q2.a**  Écrire une fonction `traitement_liste`, prenant en argument une liste `L` à traiter et ranvoyant une liste, `listes_vainqueurs`, contenant initialement la liste à traiter, et à laquelle on ajoute, à l'aide d'une boucle `for`, au fil des différents rounds, les listes de vainqueurs, obtenues, chacune, à l'aide de l'algorithme écrit en question **1.b**.  
La boucle `for` principale effectuera un nombre d'itérations égal au majorant déterminé à la question **1.c**  
*Note :* on pourra ultérieurement remplacer cette boucle `for` par une boucle `while`.

***Q2.a : proposition de réponse***

In [54]:
from math import floor, log

def traitement_liste(L):
    listes_vainqueurs = [L]
    rmax = floor(log(20, 2)) + 1
    for k in range(rmax):
        Lprec = listes_vainqueurs[-1] ## Lprec est la liste des vainqueurs obtenue au round précédent
        Laux = []                     ## Laux est la liste des vainqueurs lors du round d'indice k
        for i in range(len(Lprec) // 2):
            if Lprec[2 * i] >= Lprec[2 * i + 1]:
                Laux.append(Lprec[2 * i])
            else:
                Laux.append(Lprec[2 * i + 1])
        if len(Lprec) % 2 == 1:
            Laux.append(Lprec[-1])
        listes_vainqueurs.append(Laux) ## on ajoute à la liste listes_vainqueurs la liste des vainqueurs
    return listes_vainqueurs

**Q2.b** Tester la fonction `traitement_liste` avec la liste `L0` déjà étudiée

In [55]:
Lex1 = [21, 36, 61, 86, 1, 88, 33, 92, 59, 7, 55, 49, 42, 3, 80, 96, 54, 72, 93, 78] # Liste L0 précédente

et la liste suivante, comportant 32 éléments

In [56]:
Lex2 = [4, 1, 11, 16, 18, 3, 10, 0, 3, 17, 13, 16, 7, 8, 3, 20, \
        8, 10, 3, 18, 19, 12, 17, 7, 3, 19, 19, 5, 9, 15, 2, 15]

***Q2.b : proposition de réponse***

In [57]:
Lex1 = [21, 36, 61, 86, 1, 88, 33, 92, 59, 7, 55, 49, 42, 3, 80, 96, 54, 72, 93, 78] # Liste L0 précédente
res = traitement_liste(Lex1)
print(res)

[[21, 36, 61, 86, 1, 88, 33, 92, 59, 7, 55, 49, 42, 3, 80, 96, 54, 72, 93, 78], [36, 86, 88, 92, 59, 55, 42, 96, 72, 93], [86, 92, 59, 96, 93], [92, 96, 93], [96, 93], [96]]


In [58]:
Lex2 = [19, 4, 16, 4, 5, 16, 10, 6, 14, 15, 11, 0, 16, 18, 11]
res = traitement_liste(Lex2)
print(res)

[[19, 4, 16, 4, 5, 16, 10, 6, 14, 15, 11, 0, 16, 18, 11], [19, 16, 16, 10, 15, 11, 18, 11], [19, 16, 15, 18], [19, 18], [19], [19]]


In [59]:
Lex3 = [4, 1, 11, 16, 18, 3, 10, 0, 3, 17, 13, 16, 20, 8, 23, 7, \
        8, 10, 3, 18, 19, 12, 17, 7, 3, 19, 19, 5, 9, 15, 2, 15]
res = traitement_liste(Lex3)
print(res)

[[4, 1, 11, 16, 18, 3, 10, 0, 3, 17, 13, 16, 20, 8, 23, 7, 8, 10, 3, 18, 19, 12, 17, 7, 3, 19, 19, 5, 9, 15, 2, 15], [4, 16, 18, 10, 17, 16, 20, 23, 10, 18, 19, 17, 19, 19, 15, 15], [16, 18, 17, 23, 18, 19, 19, 15], [18, 23, 19, 19], [23, 19], [23]]


**Q3**

**On cherche maintenant à obtenir le second maximum de la liste `L` à traiter c'est-à-dire la deuxième plus grande valeur de `L`, éventuellement égale au maximum de `L`** (il s'agit encore du maximum de la liste `L`, privée de son maximum (si le maximum de `L` est présent en plusieur exemplaire, on aura là retiré un seul exemplaire du maximum).  
Par exemple, le second maximum de la liste `[2, 1, 3]` est 2, et le second maximum de la liste `[2, 3, 1, 3]` est 3.

**Q3.a** Étude des trois derniers exemples

Dans les trois derniers exemples, donner le second maximum de la liste traitée.

***Q3.a : proposition de réponse***

Si on s'autorise le recours à la fonction `max` et à la méthode `.remove` (mais la question était à traiter *à la main*, par examen des listes-exemples)

In [60]:
help(max)

Help on built-in function max in module builtins:

max(...)
    max(iterable, *[, default=obj, key=func]) -> value
    max(arg1, arg2, *args, *[, key=func]) -> value
    
    With a single iterable argument, return its biggest item. The
    default keyword-only argument specifies an object to return if
    the provided iterable is empty.
    With two or more arguments, return the largest argument.



In [61]:
help(list.remove)

Help on method_descriptor:

remove(self, value, /)
    Remove first occurrence of value.
    
    Raises ValueError if the value is not present.



In [62]:
L = Lex1.copy()
maxL = max(L)
L.remove(maxL)
second_maximumL = max(L)
print(maxL, second_maximumL)

96 93


In [63]:
L = Lex2.copy()
maxL = max(L)
L.remove(maxL)
second_maximumL = max(L)
print(maxL, second_maximumL)

19 18


In [64]:
L = Lex3.copy()
maxL = max(L)
L.remove(maxL)
second_maximumL = max(L)
print(maxL, second_maximumL)

23 20


**Q3.b** On aura remarqué que le second maximum n'est pas nécessairement la seconde valeur parmi la liste des vainqueurs de l'avant-dernier round.  
Montrer que le second maximum est, en revanche, nécessairement, parmi les vaincus des affrontements gagnés par le maximum de la liste à traiter.  
En déduire un algorithme pour obtenir le second maximum d'une liste `L` au terme des affrontements en tournoi.

***Q3.b : proposition de réponse***

Le second maximum gagne nécessairement tous ses affrontements, sauf lors d'un affrontement avec le maximum de la liste `L` à traiter.  
Si on suppose que le second maximum de `L` n'affronte jamais le maximum de la liste `L`, alors le second maximum gagne tous ses affrontements et c'est donc le maximum de `L`, ce qui aboutit à une contradiction.  
On en conclut, par l'absurde, que le second maximum est nécessairement parmi la liste des vaincus par le maximum de `L`.

On en déduit que le second maximum peut être obtenu en cherchant le maximum parmi la liste des vaincus des affrontements dont l'un des opposants est le maximum de la liste `L`.

**Q3.c** Afin de dresser la liste des vaincus par le maximum de la liste `L`, on peut prélimairement déterminer le maximum de la liste `L`, et initialiser à la liste vide la liste des vaincus par le maximum.  
On pourra ensuite, au fil des itérations, ajouter à cette liste les vaincus par le maximum, et, à la fin du tournoi, chercher le maximum parmi la liste des vaincus.  
**Afin de gérer les listes dans lesquelles le maximum est présent plusieurs fois,** on n'enregistrera pas les valeurs elles-mêmes, ni les valeurs gagnantes des affrontements elles-mêmes, mais leurs positions dans la liste `L` d'origine.  
Ainsi, les listes manipulées seront des listes de positions au sein de la liste d'origine `L` et non des listes de valeurs de la liste d'origine `L`. 

* Par exemple, pour la liste

In [65]:
Lex4 = [6, 10, 7, 8, 10, 9]

- Le maximum de la liste `Lex4` sera repéré par la position $i_{\rm max}=1$ (position de la première occurrence, ${\rm L} [1]=10$, du maximum $10$).<br/>  

On initialisera la liste des positions des vainqueurs d'indice zéro à la liste $[0, 1, 2, 3, 4, 5]$ (liste des positions de toutes les valeurs de `Lex4`, ${\rm L} [0]=6$, ${\rm L} [1]=10$, ${\rm L} [2]=7$, ${\rm L} [3]=8$, ${\rm L} [4]=10$, et ${\rm L} [5]=9$, au sein de `Lex4`).<br/>
* La liste des positions des vainqueurs du premier round sera la liste de positions `[1, 3, 4]` (positions au sein de `Lex4` des valeurs ${\rm L} [1]=10, {\rm L} [3]=8$ et ${\rm L} [4]=10$).<br/>
La liste positions des vaincus par le maximum sera, à ce stade, ${\rm Lposvaincusmax}=[0]$ (liste de positions, au sein de `Lex4`, du premier vaincu par le maximum ${\rm L} [0]=6$.<br/>
* La liste des positions des vainqueurs du deuxième round sera la liste de positions `[1, 4]` (positions au sein de `Lex4` des valeurs ${\rm L} [1]=10$ et ${\rm L} [4]=10$).<br/>
La liste positions des vaincus par le maximum sera, à ce stade, ${\rm Lposvaincusmax}=[0, 3]$ (liste de positions, au sein de `Lex4`, des deux vaincus par le maximum, soit ${\rm L} [0]=6$ et ${\rm L} [3]=8$.<br/>
* La liste des positions des vainqueurs du troisième round sera la liste de positions `[1]` (positions au sein de `Lex4` de la valeur ${\rm L} [1]=10$.<br/>
La liste positions des vaincus par le maximum sera, à ce stade, ${\rm Lposvaincusmax}=[0, 3, 4]$ (liste de positions, au sein de `Lex4`, des vaincus par le maximum, soit ${\rm L} [0]=6$, ${\rm L} [3]=8$  et ${\rm L} [4]=10$.<br/>

Lorsque le l'algorithme termine, le maximum de la liste `Lex4` est la valeur dont la position dans `Lex4` est $i_{\rm max}=1$, et le second maximum de liste `Lex4` s'obtient en cherchant, parmi la liste ${\rm Lposvaincusmax}=[i_1, i_2, \ldots, i_q]$ le plus petit indice $i_0\in [\,[i_1]\,i_q]$ tel que 
$${\rm L}[i_0] = \max \left(
{\rm L}[i_1],
{\rm L}[i_2],
\ldots,
{\rm L}[i_q]\right)$$.


***Consignes***

 * Écrire une fonction `secondmax1(L)` renvoyant le maximum et le second maximum d'une liste `L` (on adaptera la fonction `traitement_liste` et n'autorisera pas de recourir à la fonction `max`).  
On stockera les listes des positions dans `Lex4` des vainqueurs de chaque round dans une liste `listes_positions_vainqueurs`.<br/>
On suivra le squelette de fonction suivant :

In [66]:
from math import floor, log

def secondmax1(L):
    ## détermination de la position de la première occurrence du maximum de la liste L
    ...
    ## initialisation de la liste positions des vaincus par le maximum
    Lposvaincusmax = []
    ## initialisations pour l'organisation des différents rounds
    listes_positions_vainqueurs = [ [...] ]
    rmax = ...
    ## organisation des différents rounds
    for k in range(rmax):
        Lprec = ... ## Lprec est la liste des positions des vainqueurs
                                                ## obtenue au round précédent
        Laux = []                     ## Laux est la liste des vainqueurs lors du round d'indice k
        for i in range(...):
            position_opposant1, position_opposant2 = ...
            if L[position_opposant1] >= L[position_opposant2]:
                indice_vainqueur, indice_vaincu = ...
            else:
                indice_vainqueur, indice_vaincu = ...
            Laux.append(...)
            ## enregistrement de la position du vaincu si le vainqueur est L[imaxL]
            if indice_vainqueur == imaxL:
                Lposvaincusmax.append(...)
        if len(Lprec) % 2 == 1:
            Laux.append(...)
        listes_positions_vainqueurs.append(Laux) ## on ajoute à la liste listes_vainqueurs
                                                 ## la liste des positions des vainqueurs
    ## recherche la position du second maximum à partir de la liste Lposvaincusmax
    imax2L = Lposvaincusmax[...]
    for j in range(1, len(Lposvaincusmax)):
        indice_vaincu = ...
        if L[indice_vaincu] > L[imax2L]:
            imax2L = Lposvaincusmax[...]
    return L[imaxL], L[imax2L]

* On comparera le nombre de comparaisons nécessaires, au total, pour obtenir la valeur du second maximum.

***Q3.b : proposition de réponse***

In [67]:
from math import floor, log

def secondmax1(L):
    ## détermination de la position de la première occurrence du maximum de la liste L
    imaxL = 0
    for i in range(1, len(L)):
        if L[i] > L[imaxL]:
            imaxL = i
    ## initialisation de la liste positions des vaincus par le maximum
    Lposvaincusmax = []
    ## initialisations pour l'organisation des différents rounds
    listes_positions_vainqueurs = [ [i for i in range(len(L))] ]
    rmax = ceil(log(20, 2))
    ## organisation des différents rounds
    for k in range(rmax):
        Lprec = listes_positions_vainqueurs[-1] ## Lprec est la liste des positions des vainqueurs
                                                ## obtenue au round précédent
        Laux = []                     ## Laux est la liste des vainqueurs lors du round d'indice k
        for i in range(len(Lprec) // 2):
            position_opposant1, position_opposant2 = Lprec[2 * i], Lprec[2 * i + 1]
            if L[position_opposant1] >= L[position_opposant2]:
                indice_vainqueur, indice_vaincu = position_opposant1, position_opposant2
            else:
                indice_vainqueur, indice_vaincu = position_opposant2, position_opposant1
            Laux.append(indice_vainqueur)
            ## enregistrement de la position du vaincu si le vainqueur est L[imaxL]
            if indice_vainqueur == imaxL:
                Lposvaincusmax.append(indice_vaincu)
        if len(Lprec) % 2 == 1:
            Laux.append(Lprec[-1])
        listes_positions_vainqueurs.append(Laux) ## on ajoute à la liste listes_vainqueurs
                                                 ## la liste des positions des vainqueurs
    ## recherche la position du second maximum à partir de la liste Lposvaincusmax
    imax2L = Lposvaincusmax[0]
    for j in range(1, len(Lposvaincusmax)):
        indice_vaincu = Lposvaincusmax[j]
        if L[indice_vaincu] > L[imax2L]:
            imax2L = Lposvaincusmax[j]
    return L[imaxL], L[imax2L]

* tests

In [68]:
Lex = Lex1
print(Lex)
res1 = traitement_liste(Lex)
print(res1)
res2 = secondmax1(Lex)
print(res2)

[21, 36, 61, 86, 1, 88, 33, 92, 59, 7, 55, 49, 42, 3, 80, 96, 54, 72, 93, 78]
[[21, 36, 61, 86, 1, 88, 33, 92, 59, 7, 55, 49, 42, 3, 80, 96, 54, 72, 93, 78], [36, 86, 88, 92, 59, 55, 42, 96, 72, 93], [86, 92, 59, 96, 93], [92, 96, 93], [96, 93], [96]]
(96, 93)


In [69]:
Lex = Lex2
print(Lex)
res1 = traitement_liste(Lex)
print(res1)
res2 = secondmax1(Lex)
print(res2)

[19, 4, 16, 4, 5, 16, 10, 6, 14, 15, 11, 0, 16, 18, 11]
[[19, 4, 16, 4, 5, 16, 10, 6, 14, 15, 11, 0, 16, 18, 11], [19, 16, 16, 10, 15, 11, 18, 11], [19, 16, 15, 18], [19, 18], [19], [19]]
(19, 18)


In [70]:
Lex = Lex3
print(Lex)
res1 = traitement_liste(Lex)
print(res1)
res2 = secondmax1(Lex)
print(res2)

[4, 1, 11, 16, 18, 3, 10, 0, 3, 17, 13, 16, 20, 8, 23, 7, 8, 10, 3, 18, 19, 12, 17, 7, 3, 19, 19, 5, 9, 15, 2, 15]
[[4, 1, 11, 16, 18, 3, 10, 0, 3, 17, 13, 16, 20, 8, 23, 7, 8, 10, 3, 18, 19, 12, 17, 7, 3, 19, 19, 5, 9, 15, 2, 15], [4, 16, 18, 10, 17, 16, 20, 23, 10, 18, 19, 17, 19, 19, 15, 15], [16, 18, 17, 23, 18, 19, 19, 15], [18, 23, 19, 19], [23, 19], [23]]
(23, 20)


* Nombre maximum de comparaisons

On note $n$ la longueur de la liste à traiter.<br/>
Pour déterminer la position de la première occurrence du maximum de la liste `L`, il faut $n-1$ comparaisons.<br/>
Au round d'indice $k$, $0\leqslant k< r_{\rm max}$, $2 \times (n_k // 2)$ comparaisons sont effectuées, où $n_k$ est la longueur de la listes des vainqueurs du round précédent (pour déterminer quel est le vainqueur et pour examiner si le vainqueur est le maximum retenu pour la liste d'origine), plus une pour déterminer si $n_k=\rm len(Lprec)$ est pair ou impair.<br/>
On rappelle que l'on a majoré $r_{\rm rmax}$ par $M_L$ où $M_L = \lceil \log_2(n_L) \rceil$ est le plus petit entier $M$ tel que $n\leqslant 2^{M}$, et majoré les longueurs $n_k$ par $2^{M_L-k}$.<br/>

Au total, au maximum, on effectue donc
$$\sum_{k=0}^{M_L-1} 2(n_{k} // 2) + 1
\leqslant \sum_{k=0}^{M_L-1} 2.\frac{2^{M_L-k}}{2} + 1
= \sum_{k=0}^{M_L-1} 2^{M_L-k} + 1
$$ comparaisons.

En effectuant le changement d'indice $k'=M_L-k$, le nombre maximum de comparaisons est donc
$$
\sum_{k'=1}^{M_L} 2^{k'} + 1= 2.\frac{1-2^{M_L}}{1-2} + M_L= 2.(2^{M_L} - 1) + M_L.
$$

Enfin, comme le nombre de valeurs vaincues est égale au nombre de rounds, $r_L$, lui-même majoré par $M_L$, le nombre de comparaisons pour déterminer le maximum de la liste des vaincus par le maximum est égal à $r_L-1$, et, au pire, à $M_L-1$.

Au total, le nombre de comparaisons est donc majoré par
$$
(n_L-1) + (2.(2^{M_L} - 1) + M_L) + M_L-1.
$$

Comme, au pire $n_L=2^{M_L}$, au pire, le nombre de comparaisons est majoré par $3n_L+2M_L-4=3n_L + 2.\lceil \log_2(n_L)\rceil - 4$, équivalent pour $n_L$ grand à $3n_L$.<br/>
***On peut donc constater que l'on n'a pas diminué, mais même multiplié par $\frac{3}{2}$, asymptotiquement, le nombre de comparaisons par rapport à la méthode du TP03 où l'on cherchait le second maximum parmi la liste privé d'une occurrence de son maximum et dans laquelle le nombre de comparaisons était égal à $2n_L-2$.***

**Q4** **Diminution du nombre de comparaisons effectuées par utilisation d'un dictionnaire**.

On propose ici un algorithme dans lequel on recourt à un dictionnaire.  
On ne recherche pas ici préliminairement le maximum de la liste `L` à traiter, aussi stocke-t-on les listes des vaincus pour chaque valeur vainqueur, en y ajoutant, à toutes les itérations, les nouveaux vaincus.  

On définit ainsi un dictionnaire, `Dlistesvaincus`, dont les clés sont tous les indices de positions des valeurs dans `L` et on associe à chaque indice, initialement, une liste vide, et on maintient une liste des positions des vainqueurs à l'issue de chaque round, `Lposvainqueurs`, initialisée à la liste de tous les indices de positions des valeurs dans `L`.<br/>

Le tournoi se déroule alors comme suit :  
* on organise chaque round en parcourant la liste `Lposvainqueurs`, pour organiser les différents affrontements ; 
* avant chaque round, on initialise la liste des vainqueurs pour ce round, `Lposvainqueursaux`, à une liste vide ;
* à l'issue de chaque affrontement, on ajoute la position `i_vainqueur` du vainqueur dans la liste `L` à la liste `Lposvainqueursaux` et la position `i_vaincu`du vaincu dans la liste `L` à la liste de vaincus `Dlistesvaincus[i_vainqueur]` et on supprime du dictionnaire la clé `i_vaincu` et la liste de vaincus associée ;  
* si la liste `Lposvainqueurs` est de longueur 1, la liste `Lposaux` est prise égale à `Lposvainqueurs` et le dictionnaire n'est pas modifié ;
* à la fin de l'algorithme, la liste `Lposvainqueurs` est de longueur 1 et contient la position du maximum de `L`, et le dictionnaire ne contient plus que la liste des vaincus par le maximum. La position du second maximum est à chercher comme précédemment parmi les positions dans cette liste.

On demande d'implémenter l'algorithme en complétant le squelette de fonction suivant :

In [71]:
from math import floor, log

def secondmax2(L):
    ## initialisation de la liste Lposvainqueurs
    Lposvainqueurs = [...]
    ## initialisation du dictionnaire des listes de vaincus
    Dlistesvaincus = dict()
    for position in Lposvainqueurs:
        ...
    ## détermination du nombre de rounds nécessaires
    rmax = ...
    ## organisation des différents rounds
    for k in range(rmax):
        Lposvainqueursaux = []
        for i in range(len(Lposvainqueurs) // 2):
            position_opposant1, position_opposant2 = Lposvainqueurs[2 * i], Lposvainqueurs[2 * i + 1]
            if L[position_opposant1] >= L[position_opposant2]:
                indice_vainqueur, indice_vaincu = position_opposant1, position_opposant2
            else:
                indice_vainqueur, indice_vaincu = position_opposant2, position_opposant1
            Lposvainqueursaux.append(indice_vainqueur)
            ## enregistrement de la position du vaincu dans le dictionnaire des vaincus par la valeur
            ## d'indice indice_vainqueur
            Dlistesvaincus[...].append(...)
            ## suppression de la clé de valeur indice_vaincu et de la liste associée dans le dictionnaire
            del Dlistesvaincus[...]
        if len(Lposvainqueurs) % 2 == 1:
            Lposvainqueursaux.append(Lposvainqueurs[-1])
        ## Actualisation de la liste Lposvainqueurs pour le round suivant
        Lposvainqueurs = ...
    ## à ce stade (la boucle for a terminé), la position retenue du maximum de la liste L est l'unique valeur
    ## dans la liste Lposvainqueurs
    imaxL = Lposvainqueurs[0] # <-- position retenue pour le maximum de L
    ## la liste positions des valeurs vaincues par le maximum est
    Lposvaincusmax = Dlistesvaincus[imaxL]
    ## recherche la position du second maximum, imax2L, à partir de la liste Lposvaincusmax
    ## (qui est l'unique liste restant dans le dictionnaire !)
    imax2L = Lposvaincusmax[0]
    for j in range(1, len(Lposvaincusmax)):
        indice_vaincu = Lposvaincusmax[j]
        if L[indice_vaincu] > L[imax2L]:
            imax2L = Lposvaincusmax[j]
    return L[imaxL], L[imax2L]

Terminer en majorant le nombre de comparaisons effectuées.  Conclure.

***Q4 : proposition de réponse***

In [72]:
from math import floor, log

def secondmax2(L):
    ## initialisation de la liste Lposvainqueurs
    Lposvainqueurs = [i for i in range(len(L))]
    ## initialisation du dictionnaire des listes de vaincus
    Dlistesvaincus = dict()
    for position in Lposvainqueurs:
        Dlistesvaincus[position] = []
    ## détermination du nombre de rounds nécessaires
    rmax = ceil(log(20, 2))
    ## organisation des différents rounds
    for k in range(rmax):
        Lposvainqueursaux = []
        for i in range(len(Lposvainqueurs) // 2):
            position_opposant1, position_opposant2 = Lposvainqueurs[2 * i], Lposvainqueurs[2 * i + 1]
            if L[position_opposant1] >= L[position_opposant2]:
                indice_vainqueur, indice_vaincu = position_opposant1, position_opposant2
            else:
                indice_vainqueur, indice_vaincu = position_opposant2, position_opposant1
            Lposvainqueursaux.append(indice_vainqueur)
            ## enregistrement de la position du vaincu dans le dictionnaire des vaincus par la valeur
            ## d'indice indice_vainqueur
            Dlistesvaincus[indice_vainqueur].append(indice_vaincu)
            ## suppression de la clé de valeur indice_vaincu et de la liste associée dans le dictionnaire
            del Dlistesvaincus[indice_vaincu]
        if len(Lposvainqueurs) % 2 == 1:
            Lposvainqueursaux.append(Lposvainqueurs[-1])
        ## Actualisation de la liste Lposvainqueurs pour le round suivant
        Lposvainqueurs = Lposvainqueursaux
    ## à ce stade (la boucle for a terminé), la position retenue du maximum de la liste L est l'unique valeur
    ## dans la liste Lposvainqueurs
    imaxL = Lposvainqueurs[0] # <-- position retenue pour le maximum de L
    ## la liste positions des valeurs vaincues par le maximum est
    Lposvaincusmax = Dlistesvaincus[imaxL]
    ## recherche la position du second maximum, imax2L, à partir de la liste Lposvaincusmax
    ## (qui est l'unique liste restant dans le dictionnaire !)
    imax2L = Lposvaincusmax[0]
    for j in range(1, len(Lposvaincusmax)):
        indice_vaincu = Lposvaincusmax[j]
        if L[indice_vaincu] > L[imax2L]:
            imax2L = Lposvaincusmax[j]
    return L[imaxL], L[imax2L]

* tests

In [73]:
Lex = Lex1
print(Lex)
res1 = traitement_liste(Lex)
print(res1)
res2 = secondmax2(Lex)
print(res2)

[21, 36, 61, 86, 1, 88, 33, 92, 59, 7, 55, 49, 42, 3, 80, 96, 54, 72, 93, 78]
[[21, 36, 61, 86, 1, 88, 33, 92, 59, 7, 55, 49, 42, 3, 80, 96, 54, 72, 93, 78], [36, 86, 88, 92, 59, 55, 42, 96, 72, 93], [86, 92, 59, 96, 93], [92, 96, 93], [96, 93], [96]]
(96, 93)


In [74]:
Lex = Lex2
print(Lex)
res1 = traitement_liste(Lex)
print(res1)
res2 = secondmax2(Lex)
print(res2)

[19, 4, 16, 4, 5, 16, 10, 6, 14, 15, 11, 0, 16, 18, 11]
[[19, 4, 16, 4, 5, 16, 10, 6, 14, 15, 11, 0, 16, 18, 11], [19, 16, 16, 10, 15, 11, 18, 11], [19, 16, 15, 18], [19, 18], [19], [19]]
(19, 18)


In [75]:
Lex = Lex3
print(Lex)
res1 = traitement_liste(Lex)
print(res1)
res2 = secondmax2(Lex)
print(res2)

[4, 1, 11, 16, 18, 3, 10, 0, 3, 17, 13, 16, 20, 8, 23, 7, 8, 10, 3, 18, 19, 12, 17, 7, 3, 19, 19, 5, 9, 15, 2, 15]
[[4, 1, 11, 16, 18, 3, 10, 0, 3, 17, 13, 16, 20, 8, 23, 7, 8, 10, 3, 18, 19, 12, 17, 7, 3, 19, 19, 5, 9, 15, 2, 15], [4, 16, 18, 10, 17, 16, 20, 23, 10, 18, 19, 17, 19, 19, 15, 15], [16, 18, 17, 23, 18, 19, 19, 15], [18, 23, 19, 19], [23, 19], [23]]
(23, 20)


* Nombre maximum de comparaisons

On note $n$ la longueur de la liste à traiter.<br/>
Au round d'indice $k$, $0\leqslant k< r_{\rm max}$, $(n_k // 2)$ comparaisons sont effectuées, où $n_k$ est la longueur de la listes des vainqueurs du round précédent (pour déterminer quel est le vainqueur), plus une pour déterminer si $n_k=\rm len(Lprec)$ est pair ou impair.<br/>
Comme précédemment, on obtient cette fois qu'au total, au maximum, on effectue
$$\sum_{k=0}^{M_L-1} n_{k} // 2 + 1
\leqslant \sum_{k=0}^{M_L-1} \frac{2^{M_L-k}}{2} + 1
= \sum_{k=0}^{M_L-1} 2^{M_L-1-k} + 1
$$ comparaisons.

En effectuant le changement d'indice $k'=M_L-1-k$, le nombre maximum de comparaisons est donc
$$
\sum_{k'=0}^{M_L-1} 2^{k'} + 1= \frac{1-2^{M_L}}{1-2} + M_L= 2^{M_L} - 1 + M_L.
$$

Comme précédemment, le nombre de comparaisons pour déterminer le maximum de la liste des vaincus par le maximum est égal, au pire, à $M_L-1$.

Au total, le nombre de comparaisons est donc majoré cette fois par
$$
2^{M_L} - 1 + M_L + M_L-1.
$$

Comme, au pire $n_L=2^{M_L}$, au pire, le nombre de comparaisons est majoré par $n_L+2M_L-2=n_L + 2.\lceil \log_2(n_L)\rceil - 2$, équivalent pour $n_L$ grand à $n_L$.<br/>
***On peut donc constater que l'on a diminué, et même divisé par 2, asymptotiquement, le nombre de comparaisons par rapport à la méthode du TP03, en divisant par deux l'équivalent du nombre de comparaisons.***