# Principales structures de données

Nous avons vu au cours précédent qu'il est possible de stocker des données dans des variables. Toutefois nous nous sommes restreint à des types de données simples, qui permettent de stocker une seule valeur : pour rappel les type  `int`, `float`, `bool`, `str`. 

Nous allons maintenant nous intéresser à des types de données, dit *composites*, qui permettent de regrouper de manière structurée des ensembles des valeurs. Nous allons présenter les *listes*, les *tuples*, et les *dictionnaires*. Au même titre que les types simples, les types composites font partie de la bibliothèque de base de Python.

## Les Listes

### Généralités

Une liste est une collection d’éléments séparés par des virgules, l’ensemble étant enfermé dans des crochets.

In [219]:
l = [1, 3, "lapin", 56.8, True, "vache"] # creation d'une liste
print(l) # affichage de la liste
print(type(l)) # affichage du type de l'objet "l"

[1, 3, 'lapin', 56.8, True, 'vache']
<class 'list'>


Comme on peut le constater dans ce premier exemple, les éléments individuels qui constituent une liste peuvent être de types différents : ici entiers, réels, booléens ou chaînes de caractères. 

Un élément d'une liste peut être de n'importe quel type, y compris de type liste, dictionnaire, etc... :

In [220]:
l2 = [1,[4, 3, 5, [4,"arbre"]], 3] # le second élément de l2 est une liste
print(l2)

[1, [4, 3, 5, [4, 'arbre']], 3]


Chaque élément d'une liste a un index, ainsi un élément de la liste est accessible grace à son index. *Attention les indices commencent à 0 !* :

In [221]:
print(l[0], l[1], l[5], sep = " ; ")
print(l[-1], l[-4]) # selection du 1er et 4e element de la liste en partant de la fin
print(l2[1][1]) # selection d'un element a l'interieur de la sous-liste de l2

1 ; 3 ; vache
vache lapin
3


On peut remarquer que la synthaxe qui permet d'accéder aux éléments d'une liste est identique à celle qui permet d'accéder à un caractère d'une chaîne de caractères.

Il y a toutefois une différence : on peut modifier un élément d'une liste mais on ne peut pas modifier un caractère d'une chaîne de caractères :

In [222]:
l[2] = 666 
print(l) # l'élément d'indice 2 de "l" est bien modifiée

[1, 3, 666, 56.8, True, 'vache']


In [223]:
s = "Bonne nouvelle"
s[4] = "r" # renvoie une erreur : on en peut moodifier une chaine de caracteres

TypeError: 'str' object does not support item assignment

On a accès à la longueur d'une liste, et on peut supprimer un élément d'une liste avec `del`. On peut aussi tester si une un élément appartient à une liste avec `in` :

In [224]:
l = [1, 3, "lapin", 56.8, True, "vache"] ; print(l)
print(len(l)) #longueur de la liste
print(len(l2))
del(l[3]) ; print(l) # supprimer  l'élément à l'indice 3 de la liste
print("lapin" in l) # "lapin" est bien dans la liste

[1, 3, 'lapin', 56.8, True, 'vache']
6
3
[1, 3, 'lapin', True, 'vache']
True


On peut également concaténer des listes grace à l'opérateur "`+`" :

In [225]:
l3 =  l2 + l
print(l3)

[1, [4, 3, 5, [4, 'arbre']], 3, 1, 3, 'lapin', True, 'vache']


### Les slices

En Python, les "slices" permettent d'accéder aux éléments d'une liste de manière rapide et élégante. En voici quelques exemples :

In [7]:
l = [1, 3, "lapin", 56.8, True, "vache"] ; print(l)
print(l[:]) # la liste tout entière
print(l[1:6:2]) # les éléments d'indices 1, 3, 5
print(l[2:]) # tous les éléments à partir de l'indice 2
print(l[:-1]) # tous les éléments avant le derniers (le dernier exclu)
print(l[1:4]) # selection d'une sous-liste avec un slice
print(l[::2]) # les éléments d'index pairs
print(l[1::2]) # les éléments d'index pairs
l[::2] = [6,8,9] ; print(l) # cela marche aussi pour remplacer les valeurs des éléments de la liste
print(l[-1:0:-1]) # plus subtile

[1, 3, 'lapin', 56.8, True, 'vache']
[1, 3, 'lapin', 56.8, True, 'vache']
[3, 56.8, 'vache']
['lapin', 56.8, True, 'vache']
[1, 3, 'lapin', 56.8, True]
[3, 'lapin', 56.8]
[1, 'lapin', True]
[3, 56.8, 'vache']
[6, 3, 8, 56.8, 9, 'vache']
['vache', 9, 56.8, 8, 3]


La synthaxe générale pour un "slice" est la suivante :

<center>`l[start:stop:step]`</center>

avec
* `start` (defaut = 0) : indice de début du slice
* `stop` (defaut = `len(l)`) : indice de fin du slice
* `step` (defaut = 1) : pas entre chaque indice du slice

Tous les cas ci-dessus découlent de la forme générale : 
* lorsque qu'un des 3 paramètres n'est pas spécifié il prend sa valeur par défaut
* lorsqu'il n'y a qu'un seul "`:`", alors on a `start` et `stop` de part et d'autre de "`:`", et `step` vaut 1

Nous retrouverons les slices lorsque nous travaillerons avec les modules `numpy` et `pandas`. Les slices sont abondamment utilisés en data science, pour manipuler les bases de données.

### Créer des listes d'entiers

La combinaison `list(range(...))` permet de créer des listes d'entiers. Les arguments pour `range` sont similaires aux argument pour les slices. 

Se souvenir qu'avec `range` comme avec les slices, l'interval est toujours fermé du coté de `start`, et ouvert du coté de `stop` :

In [227]:
start, stop, step = 10, 30, 2
print(list(range(start, stop, step)))
print(list(range(5, 12)))
print(list(range(10,3,-1)))

[10, 12, 14, 16, 18, 20, 22, 24, 26, 28]
[5, 6, 7, 8, 9, 10, 11]
[10, 9, 8, 7, 6, 5, 4]


L'opérateur "`*`" permet de créer des listes où les éléments sont répétés :

In [228]:
print([0] * 10)
print(list(range(4)) * 3)

[0, 0, 0, 0, 0, 0, 0, 0, 0, 0]
[0, 1, 2, 3, 0, 1, 2, 3, 0, 1, 2, 3]


### Des méthodes pour les listes

En Python, une liste est un objet. A ce titre une liste dispose de différentes méthodes :

In [229]:
nombres = [17, 38, 10, 25, 72]
nombres.sort() # trier la liste
print(nombres)

nombres.append(12) # ajouter un élément à la fin de la liste
print(nombres)

nombres.reverse() # inverser l'ordre des éléments
print(nombres)

print(nombres.index(17)) # retrouver l'index d'un élément

nombres.remove(38) # effacer un élément
print(nombres)

[10, 17, 25, 38, 72]
[10, 17, 25, 38, 72, 12]
[12, 72, 38, 25, 17, 10]
4
[12, 72, 25, 17, 10]


On voit que les méthodes ci-dessus ont une synthaxe particulière que l'on peut résumer de la manière suivante :
<center>`objet.methode(arguments_de_la_methode)`</center>

La synthaxe est donc différente des fonctions que l'on a rencontré jusqu'à maintenant (comme `print`, `type`, `range`) qui avait la forme : 
<center>`fonction(arguments_de_la_fonction)`</center>

Cette distinction se retrouve dans la manipulation de tous les objets Python. Les objets disposent de méthodes (les méthodes sont différentes selon les objets), auxquelles on fait appel comme ci-dessus. Lorsqu'une méthode ou une fonction n'a pas d'argument, on l'appelle tout de même avec des `()`.

### Listes et boucles

On a vu précédemment comment utiliser des boucles avec la fonction `range`. On peut utiliser une telle boucle pour parcourir les éléments d'une liste :

In [230]:
liste = ["football","tennis","ski","escrime", 67.8]
for j in range(len(liste)):
    print(liste[j])

football
tennis
ski
escrime
67.8


L'itérateur utiliser dans la boucle *for* est alors un entier. En fait, on peut aussi utiliser les éléments de la liste directement comme itérateur :

In [231]:
for item in liste :
    print(item)

football
tennis
ski
escrime
67.8


### Accéder à l'aide

La commande :

In [232]:
help(list)

Help on class list in module builtins:

class list(object)
 |  list() -> new empty list
 |  list(iterable) -> new list initialized from iterable's items
 |  
 |  Methods defined here:
 |  
 |  __add__(self, value, /)
 |      Return self+value.
 |  
 |  __contains__(self, key, /)
 |      Return key in self.
 |  
 |  __delitem__(self, key, /)
 |      Delete self[key].
 |  
 |  __eq__(self, value, /)
 |      Return self==value.
 |  
 |  __ge__(self, value, /)
 |      Return self>=value.
 |  
 |  __getattribute__(self, name, /)
 |      Return getattr(self, name).
 |  
 |  __getitem__(...)
 |      x.__getitem__(y) <==> x[y]
 |  
 |  __gt__(self, value, /)
 |      Return self>value.
 |  
 |  __iadd__(self, value, /)
 |      Implement self+=value.
 |  
 |  __imul__(self, value, /)
 |      Implement self*=value.
 |  
 |  __init__(self, /, *args, **kwargs)
 |      Initialize self.  See help(type(self)) for accurate signature.
 |  
 |  __iter__(self, /)
 |      Implement iter(self).
 |  
 |  __l

permet d'accéder à l'aide Python concernant les objets *list*. On y trouve toutes les méthodes de la classe *list*.

## Les Tuples

Comme les listes, les tuples sont des collections ordonnées d'éléments. On les crée de la manière suivante :

In [233]:
t1 = ("mer", 345, 6.7, 3, "ocean") # parenthèses ici au lieu de crochets pour les listes
t2 = ("calamard",) # noter la virgule lorsque le tuple n'a qu'un seul élément

print(t1)
print(type(t1))
print(t2)

('mer', 345, 6.7, 3, 'ocean')
<class 'tuple'>
('calamard',)


La grande différence entre les listes et les tuples est que les tuples sont non modifiables.

Ainsi, toutes les opérations que l'on a vu pour les listes et qui ne modifient pas le contenu de la liste sont aussi disponibles pour les tuples : *slice*, *len*, *print*, *itération dans une boucle for*, *création de tuple d'entiers*, ...

Exemples :

In [234]:
print(t1[1:3]) # slice de tuple
len(t1) # longueur d'un tuple
print(t1.index(345)) # retrouver l'index d'un élément
tuple(range(10,20)) # tuple d'entier
print(t1[1:3] + ("mouette", "sable")) # concaténation de tuples

(345, 6.7)
1
(345, 6.7, 'mouette', 'sable')


Remarque : pour créer un tuple d'entiers, on utilise non plus `list()` mais `tuple()`.

En revanche, toutes les méthodes qui modifient l'objet ne sont pas disponibles pour le tuple : *sort*, *append*, *reverse*, *remove*. On ne peut pas non plus modifier une valeur dans le tuple :

In [235]:
t1[2] = 8 # aboutit a un erreur

TypeError: 'tuple' object does not support item assignment

Comme pour les listes, on peut accéder à l'aide logicielle concernant les tuples. Pour une fonction, un type, etc.. l'aide s'obtient en tapant : `help(nom_de_la_fonction)`

In [236]:
help(tuple)

Help on class tuple in module builtins:

class tuple(object)
 |  tuple() -> empty tuple
 |  tuple(iterable) -> tuple initialized from iterable's items
 |  
 |  If the argument is a tuple, the return value is the same object.
 |  
 |  Methods defined here:
 |  
 |  __add__(self, value, /)
 |      Return self+value.
 |  
 |  __contains__(self, key, /)
 |      Return key in self.
 |  
 |  __eq__(self, value, /)
 |      Return self==value.
 |  
 |  __ge__(self, value, /)
 |      Return self>=value.
 |  
 |  __getattribute__(self, name, /)
 |      Return getattr(self, name).
 |  
 |  __getitem__(self, key, /)
 |      Return self[key].
 |  
 |  __getnewargs__(...)
 |  
 |  __gt__(self, value, /)
 |      Return self>value.
 |  
 |  __hash__(self, /)
 |      Return hash(self).
 |  
 |  __iter__(self, /)
 |      Implement iter(self).
 |  
 |  __le__(self, value, /)
 |      Return self<=value.
 |  
 |  __len__(self, /)
 |      Return len(self).
 |  
 |  __lt__(self, value, /)
 |      Return self

On voit que l'on a moins de méthodes que pour les listes.

Le fait qu'un tuple ne puisse pas être modifié (on dit qu'il est "non mutable") a des avantages dans certaines situations. Cela permet aussi de minimiser les risques d'erreur dus à des modifications non souhaitées.

## Les Dictionnaires

## Généralités

Dans un tuple ou une liste, les éléments sont indicés par des entiers. Il y a donc un ordre sur les éléments, induit par l'ordre qui porte sur les indices. Nous allons maintenant étudier une struture de données pour laquelle les éléments ne sont pas ordonnés : il s'agit du *dictionnaire*.

Dans un dictionnaire, chaque élément est associé à une clé, qui peut être un nombre, une chaîne de caractère, ou même un tuple.

Voici comment on crée un dictionnaire :

In [237]:
d1 = {0:"riri" , 1:"fifi", 2:"loulou"} # création du dictionnaire d1
print(d1)
d2 = {"difficile" : "hard", 
      "facile" : "easy", 
      "interessant" : "interesting"} # on peut revenir à la ligne si on le souhaite
print(d2)
print(type(d1))

{0: 'riri', 1: 'fifi', 2: 'loulou'}
{'difficile': 'hard', 'facile': 'easy', 'interessant': 'interesting'}
<class 'dict'>


Le dictionnaire se repère donc grâce à ses accolades `{}`. C'est une structure de données que l'on peut modifier après création, comme les listes. On peut donc y ajouter un élément :

In [238]:
d1 = {0:"riri" , 1:"fifi", 2:"loulou"} ; print(d1)
d1[187] = "zaza" ; print(d1) # ajouter un élément
del(d1[0]) ; print(d1) # retirer un élément
print(0 in d1 , 2 in d1) # tester si une clé est dans le dictionnaire

d2["difficile"] = "NA" ; print(d2)

{0: 'riri', 1: 'fifi', 2: 'loulou'}
{0: 'riri', 1: 'fifi', 2: 'loulou', 187: 'zaza'}
{1: 'fifi', 2: 'loulou', 187: 'zaza'}
False True
{'difficile': 'NA', 'facile': 'easy', 'interessant': 'interesting'}


Remarques : 
* on ne peut pas faire de slice avec les dictionnaires, car les indices ne sont pas ordonnés.
* le fait que les indices d'un dictionnaire ne soient pas ordonnés permet d'ajouter ou de supprimer des éléments plus facilement qu'avec les listes (ci-dessus si `d1` était une liste, on ne pourrait pas ajouter un élément d'indice "187", mais seulement un élément d'indice "3"). Ainsi, les dictionnaires sont adéquats pour traiter des ensembles non ordonnés (penser par exemple à une base clients où chaque client à un identifiant)

## Méthodes des dictionnaires

Voyons quelles sont les méthodes disponibles pour un dictionnaire :

In [239]:
help(dict) # le type dictionnaire est 'dict' en python

Help on class dict in module builtins:

class dict(object)
 |  dict() -> new empty dictionary
 |  dict(mapping) -> new dictionary initialized from a mapping object's
 |      (key, value) pairs
 |  dict(iterable) -> new dictionary initialized as if via:
 |      d = {}
 |      for k, v in iterable:
 |          d[k] = v
 |  dict(**kwargs) -> new dictionary initialized with the name=value pairs
 |      in the keyword argument list.  For example:  dict(one=1, two=2)
 |  
 |  Methods defined here:
 |  
 |  __contains__(self, key, /)
 |      True if D has a key k, else False.
 |  
 |  __delitem__(self, key, /)
 |      Delete self[key].
 |  
 |  __eq__(self, value, /)
 |      Return self==value.
 |  
 |  __ge__(self, value, /)
 |      Return self>=value.
 |  
 |  __getattribute__(self, name, /)
 |      Return getattr(self, name).
 |  
 |  __getitem__(...)
 |      x.__getitem__(y) <==> x[y]
 |  
 |  __gt__(self, value, /)
 |      Return self>value.
 |  
 |  __init__(self, /, *args, **kwargs)
 |

On a donc *clear*, *copy*, *get*, *items*, *keys*, *pop*, *popitem*, *setdefault*, *update*, *values*, etc.. Les méthodes qui commencent par "`__`" ne sont en générales pas destinées à l'utilisateur mais sont des méthodes utilisées en interne par Python.

In [240]:
print(d2.keys()) # renvoie l'ensemble des clés du dictionnaire
print(d2.values()) # renvoie l'ensemble des valeurs du dictionnaire
print(d2.items()) # renvoie l'ensemble des couple clé-valeur
d2.clear() ; print(d2)

dict_keys(['difficile', 'facile', 'interessant'])
dict_values(['NA', 'easy', 'interesting'])
dict_items([('difficile', 'NA'), ('facile', 'easy'), ('interessant', 'interesting')])
{}


Notons que les valeurs retournées par les méthodes *keys*, *values* et *items* sont des objets de type ensemble (*set*). On peut les transformer en listes ou en tuples grâce aux fonctions *list()* ou *tuple()*.

La méthode *get* permet de tester la présence d'une clé dans un dictionnaire. On voit en effet que le code suivant donne une erreur, lorsque l'on interroge le dictoinnaire sur le clé "99". Il est nécessaire d'éviter les erreurs car une erreur interrompt l'éxécution d'un scRipt et rend donc un programme inutile. 

La méthode *get* permet de spécifier une valeur pas défaut, à retourner en cas de non existence de la clé. Le recours à *get* permet donc d'éviter les erreurs.

In [241]:
d1 = {0:"riri" , 1:"fifi", 2:"loulou"} ; print(d1)
print(d1[0])
print(d1[99])

{0: 'riri', 1: 'fifi', 2: 'loulou'}
riri


KeyError: 99

In [242]:
print(d1.get(0, "vide"))
print(d1.get(99, "vide"))

riri
vide


## Parcours d'un dictionnaires avec une boucles

On peut utiliser une boucle *for* pour traiter successivement les éléments contenus dans un dictionnaire. Par défaut, l'itération se fait sur la clé du dictionnaire :

In [243]:
d1 = {0:"riri" , 1:"fifi", 2:"loulou"} ; print(d1)

for cle in d1 :
    print(cle, ":", d1[cle])

{0: 'riri', 1: 'fifi', 2: 'loulou'}
0 : riri
1 : fifi
2 : loulou


Il est aussi possible d'itérer sur les clés et les valeurs simultanément. Pour cela, il faut utiliser la méthodes *items* qui permet de transformer le dictionnaire en un ensemble de couples (clé, valeur) (tuples à 2 éléments) :

In [244]:
for cle, value in d1.items() :
    print(cle, ":", value)

0 : riri
1 : fifi
2 : loulou


Cette seconde méthode est souvent à privilégier car elle est plus lisible et plus performante.

**Exercices** :

1. Soient les listes suivantes :

  `t1 = [31, 28, 31, 30, 31, 30, 31, 31, 30, 31, 30, 31]`

  `t2 = ['Janvier', 'Février', 'Mars', 'Avril', 'Mai', 'Juin',
'Juillet', 'Août', 'Septembre', 'Octobre', 'Novembre', 'Décembre']`

  Écrivez un petit programme qui crée une nouvelle liste t3. Celle-ci devra contenir tous les éléments des deux listes en les alternant, de telle manière que chaque nom de mois soit suivi du nombre de jours correspondant :
  
  `['Janvier',31,'Février',28,'Mars',31, etc...]`
<br><br>
2. Écrivez un programme qui classe les éléments d'une liste (composée uniquement d'éléments numériques) en ordre croissant. Par exemple, la liste [32, 5, 12, 8, 3, 75, 2, 15] devrait aboutir à [2, 3, 5, 8, 12, 15, 32, 75]
<br><br>
3. Etant donnée une chaîne de caractère (par exemple "c'est les vacances !"), écrire un programme qui génère un dictionnaire où chaque caractère distinct de la chaîne constitue une clé et la valeur assoociée est le nombre d'occurrences du caractère dans la chaîne.

Beaucoup d'autres exercices sont disponibles dans le [livre de Swinnen](https://inforef.be/swi/python.htm).

In [245]:
# Exo 1.

t1 = [31, 28, 31, 30, 31, 30, 31, 31, 30, 31, 30, 31]
t2 = ['Janvier', 'Février', 'Mars', 'Avril', 'Mai', 'Juin',
'Juillet', 'Août', 'Septembre', 'Octobre', 'Novembre', 'Décembre']


In [246]:
# Exo 2.

liste = [32, 5, 12, 8, 3, 75, 2, 15]


In [247]:
# Exo 3.

chaine = "c'est les vacances !"


# Les Fonctions

Dans tout langage de programmation les fonctions sont des éléments clés. En tant que developpeur vous serez amenés à utiliser des fonctions écrites par d'autres personnes, mais aussi à créer vos propres fonctions. 

Nous avons d'ors et déjà rencontré quelques fonctions depuis le début de ce cours : par exemple *print()*, *del()*, *range()*, *type()*. Les méthodes sont également des fonctions, bien que la synthaxe pour leur faire appel soit différente des fonctions sus-citées.

Créer une fonction permet d'enregistrer un morceau de code qui éxécute une certaine tache. L'avantage est qu'une fois enregistré, ce morceau de code peut être facilement réutilisé (on dit que l'on *fait appel à une fonction*).

Cette stratégie de conception de morceaux de code réutilisables a plusieurs avantages :
* elle permet de construire un code concis et clair : bien souvent, on est amené à effectuer une tache de nombreuses fois. Et si l'on a une fonction pour cela il suffit de faire appel à la fonction.
* elle permet de décomposer un code en morceaux : c'est important car cela permet d'avoir une bonne organisation de son code. Plus un projet de programmation est est de taille importante, plus il est nécessaire de veiller à la bonne organisation du code. Et pour cela rien n'est mieux que de bien décomposer (on dit aussi *factoriser*) son code. Sur des projets d'envergure, le rôle de l'architecte du projet est de définir l'*architecture* du code.

## Construire et utiliser une fonction

La synthaxe pour définir une fonction en Python est la suivante :

```
def nom_de_la_fonction(arguments1, argument2, ...):
    <bloc d instructions>
```

Une fonction peut compter 0, 1, ou plusieurs arguments. De plus, ces arguments peuvent être de types divers. 

### Un premier exemple

Prenons en exemple la fonction suivante :

In [248]:
def affiche_table_multiplication(n): # définition de la fonction
    print("Table de multiplication de",n,":")
    for i in range(11):
        print(i,"*",n,"=",i*n)
        
affiche_table_multiplication(9) # utilisation de la fonction

Table de multiplication de 9 :
0 * 9 = 0
1 * 9 = 9
2 * 9 = 18
3 * 9 = 27
4 * 9 = 36
5 * 9 = 45
6 * 9 = 54
7 * 9 = 63
8 * 9 = 72
9 * 9 = 81
10 * 9 = 90


La fonction définie ci-dessus à pour nom `affiche_table_multiplication` et a un seul argument : `n`. Comme pour les boucles et les *if*, *else*..., le bloc d'instruction del a fonction doit être indenté de 4 espaces.

Une fois définie, on peut se servir d'une fonction à n'importe quel endroit dans le code. Une fonction définie par l'utilisateur se comporte donc comme les fonctions `print`, `type`... que nous avons rencontrées.

On peut donc appeler la fonction `affiche_table_multiplication` n'importe où dans le code : y compris à l'intérieur d'une autre fonction, dans une boucle etc... :

In [249]:
def affiche_ttes_les_tables_multiplication():
    for i in range(1,11,1):
        affiche_table_multiplication(i)

In [250]:
affiche_ttes_les_tables_multiplication()

Table de multiplication de 1 :
0 * 1 = 0
1 * 1 = 1
2 * 1 = 2
3 * 1 = 3
4 * 1 = 4
5 * 1 = 5
6 * 1 = 6
7 * 1 = 7
8 * 1 = 8
9 * 1 = 9
10 * 1 = 10
Table de multiplication de 2 :
0 * 2 = 0
1 * 2 = 2
2 * 2 = 4
3 * 2 = 6
4 * 2 = 8
5 * 2 = 10
6 * 2 = 12
7 * 2 = 14
8 * 2 = 16
9 * 2 = 18
10 * 2 = 20
Table de multiplication de 3 :
0 * 3 = 0
1 * 3 = 3
2 * 3 = 6
3 * 3 = 9
4 * 3 = 12
5 * 3 = 15
6 * 3 = 18
7 * 3 = 21
8 * 3 = 24
9 * 3 = 27
10 * 3 = 30
Table de multiplication de 4 :
0 * 4 = 0
1 * 4 = 4
2 * 4 = 8
3 * 4 = 12
4 * 4 = 16
5 * 4 = 20
6 * 4 = 24
7 * 4 = 28
8 * 4 = 32
9 * 4 = 36
10 * 4 = 40
Table de multiplication de 5 :
0 * 5 = 0
1 * 5 = 5
2 * 5 = 10
3 * 5 = 15
4 * 5 = 20
5 * 5 = 25
6 * 5 = 30
7 * 5 = 35
8 * 5 = 40
9 * 5 = 45
10 * 5 = 50
Table de multiplication de 6 :
0 * 6 = 0
1 * 6 = 6
2 * 6 = 12
3 * 6 = 18
4 * 6 = 24
5 * 6 = 30
6 * 6 = 36
7 * 6 = 42
8 * 6 = 48
9 * 6 = 54
10 * 6 = 60
Table de multiplication de 7 :
0 * 7 = 0
1 * 7 = 7
2 * 7 = 14
3 * 7 = 21
4 * 7 = 28
5 * 7 = 35
6 * 7 = 42
7 

On voit ici un exemple de factorisation du code. Pour afficher toutes les tables de multiplication jusqu'à 10, on aurait pu faire une double boucle :

In [251]:
for i in range(1,11):
    print("Table de multiplication de", i,":")
    for j in range(11):
        print(j,"*",i,"=",i*j)

Table de multiplication de 1 :
0 * 1 = 0
1 * 1 = 1
2 * 1 = 2
3 * 1 = 3
4 * 1 = 4
5 * 1 = 5
6 * 1 = 6
7 * 1 = 7
8 * 1 = 8
9 * 1 = 9
10 * 1 = 10
Table de multiplication de 2 :
0 * 2 = 0
1 * 2 = 2
2 * 2 = 4
3 * 2 = 6
4 * 2 = 8
5 * 2 = 10
6 * 2 = 12
7 * 2 = 14
8 * 2 = 16
9 * 2 = 18
10 * 2 = 20
Table de multiplication de 3 :
0 * 3 = 0
1 * 3 = 3
2 * 3 = 6
3 * 3 = 9
4 * 3 = 12
5 * 3 = 15
6 * 3 = 18
7 * 3 = 21
8 * 3 = 24
9 * 3 = 27
10 * 3 = 30
Table de multiplication de 4 :
0 * 4 = 0
1 * 4 = 4
2 * 4 = 8
3 * 4 = 12
4 * 4 = 16
5 * 4 = 20
6 * 4 = 24
7 * 4 = 28
8 * 4 = 32
9 * 4 = 36
10 * 4 = 40
Table de multiplication de 5 :
0 * 5 = 0
1 * 5 = 5
2 * 5 = 10
3 * 5 = 15
4 * 5 = 20
5 * 5 = 25
6 * 5 = 30
7 * 5 = 35
8 * 5 = 40
9 * 5 = 45
10 * 5 = 50
Table de multiplication de 6 :
0 * 6 = 0
1 * 6 = 6
2 * 6 = 12
3 * 6 = 18
4 * 6 = 24
5 * 6 = 30
6 * 6 = 36
7 * 6 = 42
8 * 6 = 48
9 * 6 = 54
10 * 6 = 60
Table de multiplication de 7 :
0 * 7 = 0
1 * 7 = 7
2 * 7 = 14
3 * 7 = 21
4 * 7 = 28
5 * 7 = 35
6 * 7 = 42
7 

Même dans cette exemple très simple, on gagne en clarté en utilisant la version factorisée du code. Pour des projets plus importants, on comprend donc qu'il est indispensable de factoriser le code.

### Arguments multiples, valeur retournée et variable locale

In [252]:
def seuil_liste(liste, x_max):
    for i in range(len(liste)) :
        liste[i] = min(liste[i], x_max)
    return(liste)

l1 = list(range(10)) ; print(l1)
l2 = seuil_liste(l1, 5.4) ; print(l2)

[0, 1, 2, 3, 4, 5, 6, 7, 8, 9]
[0, 1, 2, 3, 4, 5, 5.4, 5.4, 5.4, 5.4]


La fonction `seuil_liste` a 2 arguments :
* `liste` : une liste (de valeurs numériques sinon la fonction produit une erreur)
* `x_max` : une variable de type numérique

Elle renvoie une liste où chaque élément est le minimum entre sa valeur précédente dans `l1` et `x_max`.

`return` permet d'indiquer quelle est la valeur renvoyée par la fonction. La présence de `return` dans une fonction n'est pas obligatoire : on a construit au paragraphe précédent des fonctions sans valeur renvoyée. 

Dans notre exemple, la valeur renvoyé par `seuil_liste` est allouée à la variable `l2`.

La notion de *variable locale* est importante lorsque l'on étudie les fonction. La règle à retenir est que toutes les variables qui sont créées à l'intérieur d'une fonction sont des *variables locales*, c'est à dire qu'elles n'existent que dans le corps de la fonction et sont supprimées dès lors que la fonction a fini de s'exécuter.

Ainsi, dans notre exemple, `liste`, `x_max` et `i` sont des variables locales.

## Modules de fonctions

### Importer et utiliser les fonctions d'un modules

La bibliothèque de base de Python contient quelques fonctions essentielles. Nous en avons déjà rencontré plusieurs : `str()`, `list()`, `range()` par exemple.

Mais l'éventail des fonctions disponibles en Python va bien au delà des fonctions de base. La majorité des fonctions Python sont enregistrées dans des *modules* de fonction.

Un *module* de fonctions contient un ensemble de fonctions qui sont rattachées à une même fonctionnalité. Par exemple, le module `random` de Python contient un ensemple de fonctions destinées à générer de l'aléa (les *modules* Python sont l'équivalent des *packages* *R*).

Pour utiliser les fonctions d'un module, il est nécessaire d'importer le module. Pour ce faire, on a recours à la commande `import` :

In [253]:
import random # importer le module random
help(random) # aide pour le module random

Help on module random:

NAME
    random - Random variable generators.

MODULE REFERENCE
    https://docs.python.org/3.6/library/random
    
    The following documentation is automatically generated from the Python
    source files.  It may be incomplete, incorrect or include features that
    are considered implementation detail and may vary between Python
    implementations.  When in doubt, consult the module reference at the
    location listed above.

DESCRIPTION
        integers
        --------
               uniform within range
    
        sequences
        ---------
               pick random element
               pick random sample
               pick weighted random sample
               generate random permutation
    
        distributions on the real line:
        ------------------------------
               uniform
               triangular
               normal (Gaussian)
               lognormal
               negative exponential
               gamma
             

La commande `help(random)` permet de visualiser l'ensemble des fonctions enregistrées dans le module *random*. 

Les documentations des modules Python sont également disponibles sur internet, un simple recherche "documentation python ..." permet de les retrouver. Par exemple pour le module random : [https://docs.python.org/3.0/library/random.html](https://docs.python.org/3.0/library/random.html)

On peut utiliser les fonctions d'un module de la façon suivante :

In [254]:
nb_aleatoire = random.randrange(10) # appel à la fonction randrange du module random
print(nb_aleatoire)

4


Ici, la fonction `randrange` du module `random` permet de générer un entier aléatoire compris entre 0 et 9 (inclu).

Pour l'utiliser, il faut commencer par signaler que l'on souhaite utiliser une fonction du module `random`, puis préciser que l'on souhaite utiliser la fonction `randrange`.

On peut aussi choisir d'importer un module sous un autre nom que son nom d'origine :

In [255]:
import random as rd # le préfixe des fonctions du module random sera alors "rd"
nb_aleatoire = rd.randrange(10)
print(nb_aleatoire)

4


Il est aussi possible d'importer l'ensemble des fonctions d'un module de manière à pouvoir les utiliser sans utiliser de préfixe (attention alors aux collisions entre les noms de fonctions de différentes origines) :

In [256]:
from random import *
nb_aleatoire = randrange(10)
print(nb_aleatoire)

8


Enfin, il est possible que l'on n'ait pas besoin d'importer l'ensemble des fonction du module random, on peut alors spécifier une ou plusieurs fonctions à importer :

In [257]:
from random import randrange, random
# on importe seulement les fonctions randrange et random du module random
nb_aleatoire1 = randrange(10)
nb_aleatoire2 = random()
print(nb_aleatoire1, nb_aleatoire2, sep=" , ")

0 , 0.4872241737756908


### Les principaux modules de fonctions pour la data science

Il y a quelques modules indispensables pour faire de la data science avec Python :
* *pandas* : ce module permet de faire énormément d'opérations en termes de manipulation de données : lecture, visualisation, merge, concaténation, slice, etc.. Le fonctionnement du module tourne autour de la notion de dataframe ; une structure de données que l'on retrouve dans le langage *R*, et dont *pandas* s'est inspiré. [Documentation officielle Pandas](https://pandas.pydata.org/pandas-docs/stable/)
* *numpy* : ce module met à disposition une structure de données appelée *array*, qui permet de manipuler des tableaux de dimension quelconque. Il est également essentiel pour faire des opérations d'algèbre linéaire sur les données. Enfin, *numpy* et *pandas* sont complémentaires pour fournir un ensemble complet de fonctions destinées à la gestion de données.
* *matplotlib* : *matplotlib* offre de nombreuses fonctions pour créer des graphiques et faire de la visualisation de données.
* *sklearn* : ce module est essentiel car il contient des implémentations de beaucoup de méthodes statistiques classiques : GLM (Modèle linéaire généralisé), Forêt aléatoire par exemple. Mais aussi beaucoup d'autres fonctions utilent en data science, par exemple pour les méthodes de validation croisée. [Documentation de sklearn](http://scikit-learn.org/stable/index.html)
* *xgboost* : La méthode du gradient boosting est programmée dans xgboost. Différents "booster" sont disponibles : arbres binaires, modèles linéaires,.. [Documentation de xgboost](http://xgboost.readthedocs.io/en/latest/python/python_intro.html)

**Exercices** :

<ol start="4">
<li> Programmer la fonction factorielle : $n! = 1*2*...*(n-1)*n$, par un méthode non récursive, puis une méthode récursive.</li><br>
Plus difficiles :
<li> Ecrire une fonction qui permet de trier les éléments d'une liste par ordre croissant : par une méthode classique, puis avec une méthode récursive (algorithme Quick sort)  </li>
<li> Une personne doit monter un escalier de $n$ marches. Elle peut faire des pas de 1, 2 ou 3 marches. Ecrire une fonction qui calcule le nombre de chemins possibles que peut prendre le personne pour arriver en haut des marches.</li>
<li> Ecrire une fonction qui affiche, pour un entier n donné, l'ensemble des dispositions valides pour n paires de parenthèses.<br>
Exemple : pour n = 3,<br>
Output : `((())), (()()), (())(), ()(()), ()()()`</li>
</ol>

In [None]:
# Exo 4.

In [3]:
# Exo 5.

In [4]:
# Exo 6.

In [5]:
# Exo 7.