# Introduction

Dans ce notebook qui accompagne le cours d'introduction, vous verrez quelques illustrations directes des concepts vu en cours (codage de l'information, mémoire, _threads_, processeurs et coeurs, ...).

## Partie 1. Codage de l'information

**Question.** En Python, quel est le résultat de l'opération `1.2 - 1.0` ? Comment cela s'explique-t-il ?

In [1]:
1.2 - 1.0

0.19999999999999996

**Question.** Quelle place occuperont en mémoire les données associées au tenseur Python suivant ? Vérifiez à l'aide de `x.nbytes`.

In [2]:
import numpy as np
x = np.ones((1000, 1000), dtype=np.float32)

x.nbytes

4000000

In [3]:
1000 * 1000 * 4

4000000

**Question.** Même question avec le tenseur suivant :

In [4]:
np.ones((1000, 1000), dtype=np.float64).nbytes

8000000

## Partie 2. La mémoire

**Question.** De quelle quantité de mémoire (RAM) dispose votre ordinateur ?

_VOTRE REPONSE ICI_

**Question.** À l'aide de la fonction `np.arange`, créez un tenseur `numpy` qui soit d'une taille telle qu'il nécessite un espace mémoire environ égal à 1.5 fois votre RAM. Ajoutez lui 1. Qu'observez-vous ? Pourquoi ?

In [5]:
x = np.arange(int(32 * 1024 * 1024 * 1024  * 1.5 / 4), dtype=np.int32) + 1

**Question.** Observez l'espace mémoire occupé par votre programme Python (Gestionnaire des tâches sous Windows, Moniteur d'activité sous MacOS, `top -o MEM` dans un terminal sous Linux). Cela correspond-il aux valeurs prévues ?

_VOTRE REPONSE ICI_

**Question.** Libérez la mémoire occupée par la variable créée à la cellule précédente. Vérifiez que la mémoire a bien été libérée et que votre programme n'occupe plus maintenant qu'un espace mémoire limité.

In [6]:
del x

**Question.** Répétez les opérations précédentes avec cette fois un tenseur qui n'occupe que la moitié (environ) de votre RAM. Quelle différence observez-vous ?

In [7]:
x = np.arange(int(32 * 1024 * 1024 * 1024  * 0.5 / 4), dtype=np.int32) + 1

## Partie 3. Calcul multi-coeurs, Process et Threads

**Question.** Dans le code ci-dessous, le `with` permet de créer un thread par élément de la liste pour exécuter les calculs induits par `add_one` de manière indépendante sur chaque élément. Pourquoi utilise-t-on un `ThreadPoolExecutor` plutôt qu'un `ProcessPoolExecutor` (qui existe aussi) ?

In [8]:
from concurrent.futures import ThreadPoolExecutor

def add_one(x):
    return x + 1

ma_liste = [1, 5, 7]

with ThreadPoolExecutor() as executor:
    results = executor.map(add_one, ma_liste)

for r in results:
    print(r)


2
6
8


**Question.** Regardez le code ci-dessous. Que fait la fonction `add_one_and_sleep` ?

In [9]:
import time

def add_one_and_sleep(x):
    time.sleep(1)
    return x + 1

**Question.** Combien votre CPU a-t-il de coeurs ? Combien de temps, au minimum, prendra l'exécution du code ci-dessous ?

In [10]:
%%time

n = 10
ma_liste = list(range(n))

with ThreadPoolExecutor(max_workers=2) as executor:
    results = executor.map(add_one_and_sleep, ma_liste)

for r in results:
    print(r)

1
2
3
4
5
6
7
8
9
10
CPU times: user 1.27 ms, sys: 875 µs, total: 2.15 ms
Wall time: 5.02 s


**Question.** Est-il pertinent d'augmenter `max_workers` qui définit le nombre de threads qui seront créés pour traiter toutes les opérations à effectuer ? Jusqu'à quelle valeur ? Testez.

In [11]:
%%time

n = 10
ma_liste = list(range(n))

with ThreadPoolExecutor(max_workers=10) as executor:
    results = executor.map(add_one_and_sleep, ma_liste)

for r in results:
    print(r)

1
2
3
4
5
6
7
8
9
10
CPU times: user 2.55 ms, sys: 1.99 ms, total: 4.54 ms
Wall time: 1.01 s
