In [None]:

import glob
glob.glob(path + '\\**\\' + 'Results.csv')

## Listes, tuples et dictionnaires

Nos variables, pour l'instant, sont un peu limitées. Supposons maintenant que je veuille entrer la taille de nombreuses particules ou les notes de chaque élève du dernier TD. Comment peut-on faire ? La solution réside dans de nouveaux types de données, les listes (`list`), tuples (`tuples`) et les dictionnaires (`dict`).

### Les listes

Elles sont des __collections d'objets ordonnés__, des nombres, des chaînes de caractère, ou même ... d'autres listes ! On les repère facilement par la présence de crochets `[` et `]` qui entourent les éléments de la liste, __qui sont séparés par des virgules (attention donc aux habitués de MATLAB !)__ :

In [None]:
grades_list = [18,11,7,12,13,6,10,9,11,14,16,10,11,9,13,17,12]
song_word_list = ['a', 'gadou', 'dou', 'dou', 'pousse', 'la', 'banane']
complex_list = ['a', 33, [22,76], 'dix-huit']

#### Indexation

Pour l'instant, nos listes ne sont pas très utiles, car nous ne savons pas comment extraire un élément de celles-ci ! Pour cela, on va _indexer_ la liste en question. L'indice de chaque objet est son 'numéro d'ordre' dans la liste, le premier élément ayant pour indice 0. Indexer un tableau s'effectue en appelant la variable puis en mettant l'indice souhaité entre crochets, ce qui donne : 

In [None]:
third_grade = grades_list[2]
third_word = song_word_list[2]
print(third_grade)
print(third_word)

Pour connaître le nombre d'éléments d'une liste, on peut utiliser la fonction native de Python [`len`](https://docs.python.org/3/library/functions.html#len). Pratique pour vérifier que vous n'avez pas oublié les notes d'un étudiant :-). Encore plus fort, vous pouvez sommer tous les éléments d'une liste avec la fonction [`sum`](https://docs.python.org/3/library/functions.html#sum). Comme cela, vous pouvez rapidement calculer la moyenne de vos élèves. Vous vous douterez bien que cela ne foncitonne qu'avec des types d'objets similaires dans la liste. En plus, tristesse, la fonction `sum` ne fonctionne pas pour les listes de chaînes de caractères ... on devra procéder autrement :

In [None]:
number_of_students = len(grades_list)
average_grade = sum(grades_list)/number_of_students
print(average_grade)
sum(song_word_list)

Pour des longues listes, il n'est jamais très difficile d'extraire le dernier élément de celle-ci, mais cela est un petit peu fastidieux. Les programmeurs de Python étant particulièrement paresseux, ils ont mis en place un raccourci pour demander les derniers éléments d'une liste _via des indices négatifs_ ! Cela donne en pratique : 

grades_list     | 8  | 11 | 7  | 12 | 13 | 6  | 10 | ... | 11 | 9  | 13 | 17 | 12 |
---------------:|---:|---:|---:|---:|---:|---:|---:|----:|---:|---:|---:|---:|---:|
indices positifs| 0  | 1  | 2  | 3  | 4  | 5  | 6  | ... | 12 | 13 | 14 | 15 | 16 |
indices négatifs|-17 |-16 |-15 |-14 |-13 |-12 |-11 | ... | -5 | -4 | -3 | -2 | -1 |

On peut alors tout à fait demander : 

In [None]:
grades_list[-2]

Supposons maintenant que ma classe de TD était divisée en deux groupes d'étudiants (par exemple, les étudiants 0 à 8 dans un groupe, et les autres de 9 à 16), et que je veux connaître rapidement la moyenne de chaque sous-groupe. On peut demander à Python de nous retourner des sous-parties de notre tableau initial en l'indexant avec une _coupe_ [(un `slice`)](https://stackoverflow.com/questions/509211/understanding-slicing) `a:b` avec `a` l'indice de départ (inclus) et `b` l'indice final (__exclus__). 

_Notes_ : 

* On peut omettre l'indice `a` s'il correspond au premier élément de la liste initiale.
* De même, on peut omettre l'indice `b` si on veut renvoyer les éléments jusqu'au dernier de la liste initiale.
* Renvoyer une sous-liste qui commence à `a`, finit à `b-1` et prend un élément parmi `n` dans cet intervalle est également possible. Pour cela, on va l'indexer par `a:b:n` !
* Il est tout à fait possible de renvoyer un sous-tableau avec des indices négatifs ! Il faudra dans ce cas faire attention à préciser que `n` vaut -1, ou n'importe quel entier négatif, à vrai dire...

In [None]:
group_1_avg = sum(grades_list[:8])/len(grades_list[:8])
group_2_avg = sum(grades_list[9:])/len(grades_list[9:])
print(group_1_avg)
print(group_2_avg)

#### Opérations

Pour les habitués de MATLAB, les listes ne fonctionnent pas tout à fait comme les vecteurs, car si on essaie, par exemple, d'additionner des listes ou de les multiplier par un entier, voire un réel, on n'obtient pas le résultat escompté.:

In [None]:
my_list = [3,2,5,1,6]
print(my_list + 7) # Breaks down 
print(my_list*3)   # ?!?
print(my_list*1.5)

Si vous voulez retrouver le résultat escompté, vous devrez transformer les listes en _tableaux_ NumPy (`numpy.array()`). Vous en verrez plus sur ce module dans le [Tutoriel sur NumPy](./xxxxxx). Ces _tableaux_ sont très similaires aux listes, à part pour les opérations de base :-). On exécutera donc le code suivant : 

In [19]:
import numpy 
my_array = numpy.array([3,2,5,1,6])
print(my_array + 7)
print(my_array*3)
print(my_array + 1.5)

[10  9 12  8 13]
[ 9  6 15  3 18]
[4.5 3.5 6.5 2.5 7.5]


### Les tuples

Les _tuples_ sont également des collections pas trop regardantes sur leur contenu. On les crée en utilisant des parenthèses simples `(` et `)` et, une fois de plus, on sépare les éléments contenus dans le tuple par des virgules : 

In [None]:
my_tuple = (13, 'toto', [1,2,3,4,5], ('abra', 'cadabra'), len(grades_list), sum)
my_other_tuple = (1,2,3,4,5,6,7,8)
print(len(my_tuple))
print(sum(my_other_tuple))
print(sum(my_tuple))

À nouveau, `sum` ne va pas très bien fonctionner sur les tuples qui contiennent des objets différents, mais on peut toujours leur demander leur taille avec la fonction `len`, et on peut les indexer comme des listes avec des indices positifs, négatifs ou des _slices_ plus compliqués du type `a:b:n`. Pour l'instant, la différence entre un tuple et une liste n'est pas très claire, car il semblerait que les listes sont juste plus flexibles_ que ces derniers. Nous verrons plus tard que les listes permettent de faire des choses qui ne sont pas permises par les tuples. 

Note : à l'instar des listes qui peuvent contenir d'autres listes, les tuples peuvent eux-mêmes contenir des tuples, ce n'est pas interdit.

### Les dictionnaires

Revenons à notre classe d'étudiants. Pour l'instant, nous n'avons pas beaucoup d'empathie pour nos élèves qui ne sont que des numéros, ce qui n'est pas très pratique pour les identifier. Il serait pratique d'associer un nom à la note, voire à plusieurs notes de l'élève ! Pour cela, on peut utiliser des _dictionnaires_. Examinons l'exemple suivant : 

In [None]:
my_grades = {'Mathilde':8 , 'Lyes':11, 'Yacine':7, 'Xavier':12, 'Antoine':13, 'Paul':6, 'Roberto':10, 'Siddartha':9, 'Bruno':11, 'Elin':14, 'Artyom':16, 'Benjamin':10, 'Gary':11, 'Yanyan':9, 'Marco':13, 'Akaki':17, 'Diego':12}
my_grades['Elin']

On a ici créé un dictionnaire en utilisant des accolades `{` et `}` et créé des paires entre des _clés_ (par exemple, `'Elin'`) et une _valeur_ (par exemple, 14) séparées par deux points `:`. Ces paires sont séparées, comme les éléments d'une liste ou d'un tuple, par des virgules `,` . On peut ensuite indexer le dictionnaire non plus par un nombre, mais via les clés du dictionnaire. Il faut savoir ici qu'on ne peut pas mettre deux fois la même clé dans un dictionnaire: ce qui peut poser problème dans notre cas si on a deux étudiants ayant le même prénom. 

Il est en fait plus malin de construire le dictionnaire 'dans l'autre sens', pour éviter les doublons au niveau des clés, et également pour calculer plus facilement la moyenne de la classe : 

In [None]:
my_classroom = {'Students ' : ['Mathilde', 'Lyes', 'Yacine', 'Xavier', 'Antoine', 'Paul', 'Roberto', 'Siddartha', 'Bruno', 'Elin', 'Artyom', 'Benjamin', 'Gary', 'Yanyan', 'Marco', 'Akaki', 'Diego'],
                'Grades'    : grades_list}
sum(my_classroom['Grades'])/len(my_classroom['Grades'])

__Mini-quiz__ : 

* Que se passe-t-il si vous essayer d'indexer des chaînes de caractères ?
* Est-ce que je peux convertir un tuple en list, et inversement ? Comment faire ?
* Est-il possible de de renvoyer des coupes de dictionnaires avec plusieurs éléments ? 
* Que se passe-t-il si j'essaie d'ajouter deux listes ? Et deux tuples ? Et deux dictionnaires ?

In [None]:
# Exercez-vous !

--------------------------------------------

## Manipuler efficacement nos variables avec leurs méthodes associées

### Chaînes de caractères 

Les chaînes de caractères, les listes, les tuples et les dictionnaires sont des types de variables plus sophistiqués que des simples nombres entiers ou flottants. Ils possèdent des "propriétés" qui vont nous rendre la vie bien pratique. 

Prenons un exemple concret avec une chaîne de caractères nommée `date_str` qui est en fait une date au format YYYY/mm/dd. Je voudrais obtenir l'année, le mois et le jour correspondant à cette chaîne de caractères. L'objet `date_str` contient en lui-même des "fonctions" (appelées _méthodes_) qui agissent sur l'objet en lui-même et renvoient diverses choses qui pourront nous intéresser. L'une d'entre elles s'appelle `split` et elle est particulièrement intéressante, car elle permet de découper ma chaîne de caractères à chaque fois qu'on 'tombe' sur un caractère bien particulier. La méthode _split_ renvoie donc une _liste_ à partir d'une chaîne de caractères. 

On appelle une méthode d'un objet avec un point `.`, ce qui donne au final : 

In [None]:
date_str = '2022/12/23'

elements = date_str.split('/')
year = int(elements[0])
month = int(elements[1])
day = int(elements[2])
day

On pourrait également avoir envie de mettre une chaîne de caractères en majuscules, afin de crier votre message sur les toits. Pour cela, on peut utiliser la méthode `upper()` qui est 'disponible' pour les chaînes de caractère : 

In [None]:
quiet_str = 'a soft murmur ... everything is so quiet here !'
quiet_str.upper()

De manière assez surprenante, la méthode `upper` ne prend aucun argument, mais comme elle 'fonctionne' comme une fonction, il faut bien veiller à l'appeler avec des parenthèses. 

La liste complète des _méthodes_ associées aux chaînes de caractère est visible, par exemple [sur ce site](https://www.w3schools.com/python/python_ref_string.asp).

### Listes

Il est assez facile de modifier les listes grâce aux méthodes qui leurs sont dédiées. Si vous avez malencontreusement oublié une note dans votre liste, vous pouvez très facilement l'ajouter avec la méthode `append()`. Au contraire, si vous en avez une en trop, vous pouvez supprimer des éléments via :
* `pop()`, qui supprime un élément à une position indiquée
* `remove()`, qui supprime la valeur indiquée, si elle est présente dans la liste. 

Essayez par exemple remplacer dans `grades_list`, le 16 qu'a obtenu Artyom par un 17, on lui avait oublié un point !

In [None]:
grades_list = [18,11,7,12,13,6,10,9,11,14,16,10,11,9,13,17,12]

_Note_ : certaines de ces méthodes modifient la liste, sans même qu'on ait besoin de ré-affecter le résultat. Ces méthodes ne 'renvoient rien' ... C'est obscur ? Voyez l'exemple suivant : 

In [None]:
grades_list.pop() 
grades_list

La méthode `pop` a _modifié en 'interne'_ l'objet `grades_list` sans qu'on écrive :

In [None]:
smaller_list = grades_list.pop()

D'ailleurs, vous constaterez que smaller_list contient en fait la valeur qui a été extraite de la liste. Pratique, non ? 

Les méthodes qui s'appliquent aux listes [sont disponibles ici](https://www.w3schools.com/python/python_ref_list.asp). Elles permettent notamment d'inverser et de trier celles-ci. 

[3, 2, 5, 6, 7, 3, 2, 5, 6, 7, 3, 2, 5, 6, 7]


# MISSING TUTORIAL NUMPY

In [None]:
import numpy
my_array = numpy.array([3,2,5,6,7])
print(numpy.array([3,2,5,6,7]) + 5)
print(numpy)


### Tuples

C'est ici que nous comprenons la puissance des listes par rapport aux tuples. Les tuples ne sont pas modifiables _à la volée_ (on appelle cette notion la [_mutabilité_](https://towardsdatascience.com/an-overview-of-mutability-in-python-objects-8efce55fd08f)). Par conséquent, ils possèdent très peu de méthodes par rapport aux listes: 
* `count()` : qui renvoie le nombre de fois qu'un élément indiqué est présent dans le tuple
* `index()` : qui renvoie la première position à laquelle l'élément indiqué est présent dans le tuple

In [None]:
my_str = 'toto'
my_tuple = (13, [1,2,3,4,5], ('abra', 'cadabra'), 'toto', len(grades_list), sum, ('toto, toto'), my_str)
print(my_tuple.index('toto'))
print(my_tuple.count('toto'))
my_tuple[3] = 'tata'

### Dictionnaires 

Les dictionnaires, enfin, possèdent quelques atouts dans leur manche, qui permettent par exemple d'extraire toutes les _clés_, ou toutes les _valeurs_ du dictionnaire (la liste complète est disponible [ici](https://www.w3schools.com/python/python_ref_dictionary.asp)). Voyez plutôt : 

In [None]:
my_student_grades = {'Mathilde':8 , 'Lyes':11, 'Yacine':7, 'Xavier':12, 'Antoine':13, 'Paul':6, 'Roberto':10, 'Siddartha':9, 'Bruno':11, 'Elin':14, 'Artyom':16, 'Benjamin':10, 'Gary':11, 'Yanyan':9, 'Marco':13, 'Akaki':17, 'Diego':12}

print(my_student_grades.keys()) # Lists all the student names

grades = my_student_grades.values() # Lists all the student grades 
print(sum(grades)/len(grades))

my_student_grades.pop('Paul')
print(my_student_grades.keys()) # Lists the updated student names 

__Mini-quiz__ : 

* Triez la liste des notes par ordre décroissant et renvoyez le nom du meilleur élève et du moins bon élève. 
* Essayez également de trier la liste des noms d'élèves par ordre alphabétique. 

In [None]:
# Exercez-vous !

----------------------------------

## Python et la mutabilité

### Un peu de sorcellerie...

Examinons l'exemple suivant. Nous allons créer une liste `my_list` contenant des éléments, et 'copier' cette liste et nommer le résultat `the_same_list`. Rien de plus simple, _a priori_ ! Modifions maintenant un objet de `my_list`, après avoir créé `the_same_list`, et examinons le code suivant : 

In [None]:
my_list = ['hey', 'oh', 'lets', 'go']
the_same_list = my_list
my_list[3] = 'take five'
the_same_list # should not be modified, right ?

_Sorcellerie !_ diront les personnes familières de MATLAB, C ou Fortran. Pour comprendre ce que nous avons fait ici, il faut comprendre le sens de la déclaration `the_same_list = my_list`. Écrire cette ligne revient à dire que les deux noms de variable pointent vers un même objet dans la mémoire de l'ordinateur, ou identifiant, accessible en utilisant la fonction native de Python [id](https://docs.python.org/fr/3.6/library/functions.html#func-id). L'`id` est en fait l'adresse mémoire de l'objet en question, donc deux variables à `id` identiques sont en fait une seule et même 'chose' !

Les `list` et les `dict` sont des objets dits _mutables_: on peut les modifier à loisir sans que leur `id` ne change. C'est pour cela que quand j'ai travaillé sur `my_list`, les changements ont été répercutés sur `the_same_list` ! Essayons maintenant de faire la même chose pour un entier : 

In [None]:
my_int = 5
my_other_int = my_int
my_int = 6 # A solid improvement on previous value
print('Is ' + str(my_int) + ' equal to ' + str(my_other_int) + ' ?') 

Cette fois-ci, cela ne fonctionne pas, les changements opérés sur `my_int` n'ont pas été répercutés sur `my_other_int`. Derrière tout cela, il faut comprendre qu'on ne peut pas réellement modifier les `int`, `str`, `float`, `tuple` une fois qu'ils sont créés. Ils ne sont donc pas _mutables_. En écrivant la ligne `my_int = 6`, on crée en fait une nouvelle variable à une nouvelle adresse, alors que `my_other_int` reste inchangé. On peut s'en convaincre en demandant à Python d'afficher les identifiants des objets en question : 

In [None]:
my_int = 5
my_other_int = my_int
print('Ids are : ' + str(id(my_int)) + ' and ' + str(id(my_other_int)))
my_int = 6
print('Ids are : ' + str(id(my_int)) + ' and ' + str(id(my_other_int)))

### Actions a distance sur les variables

Revenons notre groupe de TD. Vous l'aurez peut-être remarqué, la méthode `.keys()` nous a renvoyé un drôle d'objet de type `dict_keys`. C'est une classe comme une autre, comme `str` ou `list`. On peut d'ailleurs la convertir en liste. Essayons de retirer un élément de notre dictionnaire (par exemple, un étudiant trop brillant), et examinons l'impact sur la moyenne 

In [None]:
my_student_grades = {'Mathilde':8 , 'Lyes':11, 'Yacine':7, 'Xavier':12, 'Antoine':13, 'Paul':6, 'Roberto':10, 'Siddartha':9, 'Bruno':11, 'Elin':14, 'Artyom':16, 'Benjamin':10, 'Gary':11, 'Yanyan':9, 'Marco':13, 'Akaki':17, 'Diego':12}
grades = my_student_grades.values()
names = my_student_grades.keys()

print(names)
print('Average grade is : ' + str(sum(grades)/len(grades)))

my_student_grades.pop('Akaki')

print(names)
print('Average grade is now : ' + str(sum(grades)/len(grades)))

_A priori_, je n'ai pas touché aux variables `grades` et `names`, et pourtant elles ont bel et bien été modifiées lorsque j'ai retiré un élément de mon dictionnaire ! Ces actions sont rendues possibles car les objets de type `dict_keys` et `dict_values` (pour `.values()`) sont _mutables_ et dynamiquement liés au contenu du dictionnaire `my_student_grades`. Cet effet peut être très pratique, mais peut également occasionner des gros maux de tête lorsque des variables sont modifiées 'comme par enchantement', ou à l'inverse ne sont pas modifiées du tout dans des codes plus compliqués !

### Dupliquer des objets mutables : la copie

#### Copie simple (de _surface_)

Nous avons vu que faire `list_b = list_a` avec des listes en Python ne duplique pas vraiment le contenu de la liste en question (ou du dictionnaire en question). Parfois,  même si parfois il est intéressant de le faire. Comment s'en sortir ? Pour cela, on utilise la méthode `copy()` présente pour les objets _mutables_. On peut se convaincre qu'on a bien deux objets distincts en examinant leur identifiant : 

In [None]:
x = {'toto' : 77}
y = x.copy()
print('Id match : ' + str(id(x)) + ' = ' + str(id(y)) + ' ?')
print('Value match : ' + str(x == y))

u = [3,4,5]
v = u.copy()
print('Id match : ' + str(id(u)) + ' = ' + str(id(v)) + ' ?')
print('Value match : ' + str(u == v))

Les deux variables sont bien _identiques_ dans leur contenu, mais elles correspondent à deux identifiants (ou adresses mémoires) distincts. On peut alors modifier l'un sans que ces changements soient répercutés sur l'autre variable... Ou est-ce bien le cas ? 

#### Copie en profondeur

Pour comprendre encore plus en détail comment la méthode `copy()` fonctionne, essayons maintenant un cas plus retors, d'une liste contenant elle-même d'autres listes. Créons une variable `my_list`, que nous allons placer dans une liste de listes nommée adroitement `list_of_lists` et faisons une copie de `list_of_lists` avec la méthode `copy()`. Nos deux listes de listes sont distinctes ... mais que se passe-t-il si je modifie `my_list` une fois mes deux objets créés ? 

In [None]:
my_list = [2,3,4]
list_of_lists = [[2,6,4], [5,6,3], my_list]
the_same_list_of_lists = list_of_lists.copy() # This is starting to get a bit odd ...
my_list.append('HACKED')
print('ID : ' + str(id(list_of_lists))         + ' -> ' + str(list_of_lists))
print('ID : ' + str(id(the_same_list_of_lists)) + ' -> ' + str(the_same_list_of_lists))

Ici, en utilisant la méthode `copy()`, on a créé un nouvel objet `the_same_list_of_lists` distinct du premier, mais les deux _pointent_ vers d'autres objets, dont notamment `my _list` qui est identique aux deux listes de listes ! On peut s'en rendre compte en regardant les `id` des éléments de nos deux listes de listes :  

In [None]:
id(list_of_lists[1]), id(the_same_list_of_lists[1]) # They are the same !

Notre méthode `copy()` ne copie qu'en _surface_ le contenu des variables les plus complexes. Pour dupliquer complètement une variable complexe en obligeant chacun des sous-éléments a être également des copies _distinctes_ des objets initiaux ...

![image](./resources/deeper.jpg)

Cela n'est pas possible avec les fonctions Python de base, mais le module [copy](https://docs.python.org/3/library/copy.html#copy.deepcopy) permet d'effectuer une telle opération de copie _en profondeur_ via l'utilisation de la fonction `deepcopy()`.

__Mini-quiz__ (difficile !) : 

* Dans le code ci-dessous, pensez-vous que `old_avg_grades` et `new_avg_grades` seront identiques ? Essayez d'interpréter le résultat, notamment en comparant le code à celui de la section [précédente](###-Actions-a-distance-sur-les-variables) !

In [None]:
my_student_grades = {'Mathilde':8 , 'Lyes':11, 'Yacine':7, 'Xavier':12, 'Antoine':13, 'Paul':6, 'Roberto':10, 'Siddartha':9, 'Bruno':11, 'Elin':14, 'Artyom':16, 'Benjamin':10, 'Gary':11, 'Yanyan':9, 'Marco':13, 'Akaki':17, 'Diego':12}
grades = list(my_student_grades.values()) 
old_avg_grades = sum(grades)/len(grades)
my_student_grades.pop('Akaki')
new_avg_grades = sum(grades)/len(grades)

* Je voudrais faire une copie complètement indépendante d'une liste initiale, qui ne contient que des `tuple` et des chaînes de caractères (`str`). Est-il nécessaire de faire une copie _en profondeur_ de ma liste initiale ?