<a href="https://colab.research.google.com/github/mohamedmhe/data-science-for-construction-edx-course-notebooks/blob/fr/Week%201%20-%20Python%20Fundamentals/fr_05_Library_functions.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# Introduction

Les langages de programmation modernes se caractérisent par une vaste bibliothèque de fonctions standard. Cela signifie que nous pouvons utiliser des fonctions standard, bien testées et optimisées
pour accomplir des tâches communes plutôt que d'écrire les nôtres. Cela rend nos programmes plus courts et de meilleure qualité, et dans la plupart des cas plus rapides.



## Objectifs

- Introduire l'utilisation des fonctions standard de la bibliothèque
- Importation et utilisation des modules
- Introduction aux espaces de noms
- Mise en forme des flotteurs pour l'impression

# The standard library

You have already used some standard library types and functions. In previous activities we have used built-in types like `string` and `float`, and the function `abs` for absolute value. We have made use of the standard library function `print` to display to the screen.

Python has a large standard library. To organise it, most functionality is arranged into 'modules', with each module providing a range of related functions. Before you program a function, check if there is a library function that can perform the task. The Python standard library is documented at https://docs.python.org/3/library/.
Search engines are a good way to find library functions, e.g. entering "Is there a Python function to compute the hyperbolic tangent of a complex number" into a search engine will take you to the function `cmath.tanh`. Try this link: http://bfy.tw/7aMc.

--------------------
# La bibliothèque standard

Vous avez déjà utilisé certains types de bibliothèques et fonctions standard. Dans les activités précédentes, nous avons utilisé des types intégrés comme `string` et `float`, et la fonction `abs` pour la valeur absolue. Nous avons utilisé la fonction de bibliothèque standard `print` pour l'affichage à l'écran.

Python dispose d'une grande bibliothèque standard. Pour l'organiser, la plupart des fonctionnalités sont organisées en "modules", chaque module fournissant une série de fonctions connexes. Avant de programmer une fonction, vérifiez s'il existe une fonction de bibliothèque qui peut exécuter la tâche. La bibliothèque standard de Python est documentée sur https://docs.python.org/3/library/.
Les moteurs de recherche sont un bon moyen de trouver des fonctions de bibliothèque. Par exemple, en entrant "existe-t-il une fonction Python pour calculer la tangente hyperbolique d'un nombre complexe" dans un moteur de recherche, vous arriverez à la fonction `cmath.tanh`. Essayez ce lien : http://bfy.tw/7aMc.

# Autres bibliothèques

Les outils standard de la bibliothèque sont d'usage général et seront disponibles dans tout environnement Python.
Les outils spécialisés sont généralement mis à disposition dans d'autres bibliothèques (modules). Il existe un grand nombre de bibliothèques Python disponibles pour les problèmes spécialisés. Nous avons déjà utilisé certaines parties
de NumPy (http://www.numpy.org/), qui est une bibliothèque spécialisée dans le calcul numérique. 
Elle offre à peu près les mêmes fonctionnalités que MATLAB. 

La façon la plus simple d'installer une bibliothèque non standard est d'utiliser la commande `pip`. En ligne de commande, la bibliothèque NumPy est installée à l'aide de

    pip install numpy
    
et de l'intérieur un ordinateur portable Jupyter utiliser :

    !pip install numpy

NumPy est si couramment utilisé qu'il est probablement déjà installé sur les ordinateurs que vous utiliserez.
Vous verrez `pip` être utilisé dans certains ordinateurs portables ultérieurs pour installer des outils à usage spécifique.

Lors du développement de programmes en dehors des exercices d'apprentissage,
s'il n'existe pas de module de bibliothèque standard pour un problème que vous essayez de résoudre, 
recherchez en ligne un module avant de mettre en œuvre le vôtre.

# Utiliser les fonctions de la bibliothèque : exemple de `math`.

Pour utiliser une fonction d'un module, nous devons la rendre disponible dans notre programme. 
C'est ce qu'on appelle l'importation. Nous l'avons fait dans des cahiers précédents avec le module `math`, mais sans explication. Le processus est expliqué ci-dessous.

Le module `math` (https://docs.python.org/3/library/math.html) fournit un large éventail de fonctions mathématiques. Par exemple, pour calculer la racine carrée d'un nombre, nous le faisons :

In [1]:
import math

x = 2.0
x = math.sqrt(x)
print(x)

1.4142135623730951


En disséquant le bloc de code ci-dessus, la ligne 
```python
import math 
```
met le module de math à disposition dans notre programme. C'est un bon style de mettre toutes les déclarations `import` en haut d'un fichier (ou en haut d'une cellule quand on utilise un notebook Jupyter). 

L'appel de fonction
```python
x = math.sqrt(x)
```    
dit "utilisez la fonction `sqrt` du module `math` pour calculer la racine carrée".

En préfixant `sqrt` par `math`, nous utilisons un *espace de nommage* (qui dans ce cas est `math`).
Cela indique clairement quelle fonction `sqrt` nous voulons utiliser - il peut y avoir plus d'une fonction `sqrt` disponible.

> Le préfixe "math" indique la fonction "sqrt" que nous voulons utiliser. Ce
peut sembler pédant, mais en pratique, il existe souvent différents algorithmes pour effectuer la même opération ou une opération similaire. Ils peuvent varier en vitesse et en précision. Dans certaines applications, nous pouvons avoir besoin d'une méthode précise (mais lente) pour calculer la racine carrée, tandis que dans d'autres, nous pouvons avoir besoin de vitesse avec un compromis sur la précision. Mais, si deux fonctions portent le même nom et ne sont pas distinguées par un espace nom, nous avons un *collision de noms*.

> Dans un grand programme, deux développeurs peuvent choisir le même nom pour deux fonctions qui effectuent des tâches similaires mais légèrement différentes. Si ces fonctions se trouvent dans des modules différents, il n'y aura pas de conflit de noms puisque le nom du module fournit un "espace de noms" - un préfixe qui permet de distinguer les deux fonctions. Les espaces de noms sont extrêmement utiles pour les programmes à plusieurs auteurs. Une faiblesse des anciens langages, comme le C et le Fortran, est qu'ils ne supportent pas les espaces de noms. La plupart des langages modernes supportent les espaces de noms.  

Nous pouvons importer des fonctions spécifiques à partir d'un module, par exemple en n'important que la fonction `sqrt` :

In [2]:
from math import sqrt

x = 2.0
x = sqrt(x)
print(x)

1.4142135623730951


De cette façon, nous n'importons (mettons à disposition) que la fonction `sqrt` du module `math` (le module `math` a un grand nombre de fonctions).

Nous pouvons même choisir de renommer les fonctions que nous importons :

In [3]:
from math import sqrt as some_math_function 

x = 2.0
x = some_math_function(x)
print(x)

1.4142135623730951


Le renommage des fonctions à l'importation peut être utile pour garder le code court, et nous verrons plus loin qu'il peut être utile pour passer d'une fonction à l'autre.
Cependant, le choix du nom ci-dessus est une très mauvaise pratique - le nom '`some_math_function`' n'est pas descriptif.
L'exemple ci-dessous est plus judicieux.

Supposons que nous programmons une fonction qui calcule les racines d'une fonction quadratique en utilisant la formule quadratique :ion using the quadratic formula:

In [None]:
from math import sqrt as square_root

def compute_roots(a, b, c):
    "Calculer les racines du polynôme f(x) = ax^2 + bx + c"
    
    root0 = (-b + square_root(b*b - 4*a*c))/(2*a)
    root1 = (-b - square_root(b*b - 4*a*c))/(2*a)
    
    return root0, root1

# Calculer les racines de f = 4x^2 + 10x + 1
root0, root1 = compute_roots(4, 10, 1)
print(root0, root1)

-0.10435607626104004 -2.3956439237389597


Ce qui précède est correct tant que le polynôme a de vraies racines. Cependant, la fonction `math.sqrt` est 
donnera une erreur (techniquement, elle "soulèvera une exception") si un argument négatif lui est transmis. Ceci pour empêcher les programmeurs naïfs de faire des erreurs stupides.

Nous connaissons les nombres complexes, c'est pourquoi nous voulons calculer des racines complexes. Le module Python `cmath` fournit des fonctions pour les nombres complexes. Si nous devions utiliser `cmath.sqrt` pour calculer la racine carrée, notre fonction prendrait en charge les racines complexes. Nous le faisons en important les fonctions de `cmath.sqrt` en tant que `square_root` :

In [None]:
# Utiliser la fonction de cmath comme racine carrée pour calculer la racine carrée
# (ceci remplacera la fonction sqrt précédemment importée)
from cmath import sqrt as square_root

# Calculer les racines (les racines seront complexes dans ce cas)
root0, root1 = compute_roots(40, 10, 1)
print(root0, root1)

# Calculer les racines (les racines seront réelles dans ce cas, mais cmath.sqrt renvoie toujours un type complexe)
root0, root1 = compute_roots(4, 10, 1)
print(root0, root1)

(-0.125+0.09682458365518543j) (-0.125-0.09682458365518543j)
(-0.10435607626104004+0j) (-2.3956439237389597+0j)


La fonction fonctionne maintenant pour tous les cas car `square_root` utilise maintenant `cmath.sqrt`. Notez que `cmath.sqrt` renvoie toujours un type de nombre complexe, même lorsque la partie complexe est zéro.

# Fonctions et formatage des chaînes de caractères (String functions and string formatting)

Une fonction standard que nous utilisons depuis le début est '`print`'. Cette fonction transforme les arguments en une chaîne de caractères et affiche cette chaîne à l'écran. Jusqu'à présent, nous n'avons imprimé que des variables simples et nous nous sommes surtout appuyés sur les conversions par défaut en une chaîne de caractères pour l'impression à l'écran (l'exception était l'impression de la représentation en virgule flottante de 0,1, où nous devions spécifier le nombre de chiffres significatifs pour voir la représentation inexacte en binaire).

## Formatage

Nous pouvons contrôler la façon dont les chaînes sont formatées et affichées. Vous trouverez ci-dessous un exemple d'insertion d'une variable chaîne et d'une variable nombre dans une chaîne de caractères :

In [None]:
# Format a string with name and age
name = "Amber"
age = 19
text_string = "My name is {} and I am {} years old.".format(name, age)

# Print to screen 
print(text_string)

# Short-cut for printing without assignment
name = "Ashley"
age = 21
print("My name is {} and I am {} years old.".format(name, age))

My name is Amber and I am 19 years old.
My name is Ashley and I am 21 years old.


Pour les nombres à virgule flottante, nous voulons souvent contrôler le formatage, et en particulier le nombre de chiffres significatifs affichés. Prenons l'exemple de l'affichage de $\pi$ : 

In [None]:
# Import math module to get access to math.pi
import math

# Default formatting
print("The value of π using the default formatting is: {}".format(math.pi))

# Control number of significant figures in formatting
print("The value of π to 5 significant figures is: {:.5}".format(math.pi))
print("The value of π to 8 significant figures is: {:.8}".format(math.pi))
print("The value of π to 20 significant figures and using scientific notation is: {:.20e}".format(math.pi))

The value of π using the default formatting is: 3.141592653589793
The value of π to 5 significant figures is: 3.1416
The value of π to 8 significant figures is: 3.1415927
The value of π to 20 significant figures and using scientific notation is: 3.14159265358979311600e+00


Il existe de nombreuses autres manières de contrôler le formatage des flotteurs - faites une recherche en ligne si vous souhaitez formater un flotteur d'une manière particulière.  

# Exemple de module : traitement parallèle

Les modules standard peuvent simplifier des problèmes très techniques. Le traitement parallèle en est un exemple.

La majorité des processeurs - des téléphones aux supercalculateurs - sont maintenant dotés de plusieurs cœurs, chaque cœur effectuant des calculs. Pour tirer profit de ces cœurs multiples, nous devons calculer en *parallèle*.
Un programme "standard" exécute les tâches dans l'ordre, et dans ce cas, un seul cœur sera utilisé et les autres
restent inactifs. Pour obtenir les meilleures performances du matériel, nous devons calculer en parallèle. C'est-à-dire que nous effectuons plusieurs tâches en même temps. 

Le traitement parallèle est un sujet énorme en soi, mais nous pouvons l'aborder ici car nous disposons de bibliothèques standard
qui le rendent facile à utiliser. La gestion de tâches parallèles à un niveau peu élevé est extrêmement technique, mais les bibliothèques standard peuvent la rendre facile. Nous utiliserons le module `multiprocessing`, et l'utiliserons pour trier des listes de nombres simultanément.

Nous commençons par examiner comment générer une liste d'entiers aléatoires en utilisant le module `random`. Le code suivant 
crée une liste (plus sur les listes dans le cahier suivant) de 10 entiers aléatoires dans la gamme de 0 à 100 (sans compter 100) :

In [None]:
import random
x = random.sample(range(0, 100), 10)
print(x)

[30, 9, 78, 59, 85, 81, 67, 97, 11, 91]


Pour créer une liste triée, nous avons utilisé la fonction intégrée `sorted`: 

In [None]:
y = sorted(x)
print(y)

[9, 11, 30, 59, 67, 78, 81, 85, 91, 97]


Maintenant, si nous devons trier plusieurs listes différentes, nous pourrions trier les listes l'une après l'autre, ou 
nous pourrions trier plusieurs listes en même temps (en parallèle). Notre système d'exploitation gérera alors l'envoi 
de la tâche de tri à différents cœurs de processeur. Avant de voir comment faire, nous mettons en œuvre une fonction pour effectuer le tri :

In [None]:
import multiprocessing
import random

def mysort(N):
    "Create a list of random numbers of length N, and return a sorted list"

    # Create random list 
    x = random.sample(range(0, N), N) 

    # Print process identifier (just out of interest)
    print("Process id: {}".format(multiprocessing.current_process()))
    
    # Return sorted list of numbers
    return sorted(x)

Pour créer les listes triées, nous utilisons trois processus (threads) :

In [None]:
N = 20000
with multiprocessing.Pool(processes=3) as p:
    p.map(mysort, [N, N, N])  # Call function mysort three times

Process id: <ForkProcess(ForkPoolWorker-3, started daemon)>
Process id: <ForkProcess(ForkPoolWorker-2, started daemon)>
Process id: <ForkProcess(ForkPoolWorker-1, started daemon)>


Nous constatons que trois processus différents ont permis de résoudre notre problème - un pour chaque tâche de tri.

Nous utilisons un traitement parallèle pour accélérer les calculs. Chronométrons nos calculs en utilisant des nombres différents
de processus pour voir comment elle affecte les performances. 
Pour effectuer le chronométrage, nous encapsulons d'abord notre problème dans une fonction :

In [None]:
def parallel_sort(N, num_proc):
    "Create three lists of random numbers (each of length N) using num_proc processes"
    with multiprocessing.Pool(processes=num_proc) as p:
        p.map(mysort, [N, N, N])

En utilisant la commande magique '[`%time`](Notebook%20tips.ipynb#Simple-timing)', nous chronométrons le tri en utilisant un seul processus (un processus trie les listes l'une après l'autre) :

In [None]:
N = 500000
%time parallel_sort(N, 1)    

Process id: <ForkProcess(ForkPoolWorker-4, started daemon)>
Process id: <ForkProcess(ForkPoolWorker-4, started daemon)>
Process id: <ForkProcess(ForkPoolWorker-4, started daemon)>
CPU times: user 56.6 ms, sys: 34 ms, total: 90.6 ms
Wall time: 1.82 s


Nous voyons dans "`Process id`" que le même processus a fonctionné sur les trois listes.

Nous essayons maintenant avec un maximum de 4 processus (il n'y a que trois listes à trier, donc seulement trois seront utilisées) :

In [None]:
%time parallel_sort(N, 4)    

Process id: <ForkProcess(ForkPoolWorker-5, started daemon)>
Process id: <ForkProcess(ForkPoolWorker-6, started daemon)>
Process id: <ForkProcess(ForkPoolWorker-8, started daemon)>
CPU times: user 46.9 ms, sys: 46.8 ms, total: 93.7 ms
Wall time: 832 ms


Nous voyons dans `Process id` que trois processus différents ont fonctionné sur les listes. L'exécution parallèle devrait être plus rapide (cela dépendra du matériel).

# Exercises

Complete now the [05 Exercises](Exercises/05%20Exercises.ipynb) notebook.