## Quelques astuces en Python

Cette section va couvrir plusieurs fonctions et aspects de Python qui ne vous permettront pas de faire plus de choses, mais vont vous simplifier la vie, raccourcir le code, le rendre plus élégant et plus lisible. La plupart de ces astuces et de ces possibilités ont été ajoutées à Python lors de mises à jour récentes du langage de programmation  : 

* [La joie des affectations multiples](#affectations-multiples-en-python) 
* [Le formatage de chaînes de caractère](#formatage-de-chaines-de-caracteres), pour enfin afficher ses nombres proprement.
* [Les listes en compréhension](#listes-en-compréhension), ou comment se libérer des boucles `for` élégamment.
* [Boucler sur plusieurs éléments en même temps](#boucler-efficacement-sur-plusieurs-variables-avec-zip) avec la fonction `zip()`
* Enfin, je [vous montre comment installer Python et vscode](#Installer-python-et-vscode) sur votre ordinateur. 

-------------------------------------------

### Affectations multiples en Python

Vous l'avez peut-être parfois vu dans l'appel à certaines fonctions qui renvoyaient plusieurs objets, on se retrouve parfois en Python à écrire :
``` 
a, b, c = my_function()
```
En fait, Python est fort flexible et permet d'affecter plusieurs valeurs à la volée sur une même ligne. Les variables à gauche, dans l'ordre, et les valeurs à droite, dans l'ordre également : 

In [None]:
radius, height, weight = 10, 20, 100 

Sachez par contre qu'il n'est pas possible d'utiliser la première des trois variables pour définir la troisième dans la liste. Les affectations se font  d'une certaine manière 'en parallèle' : 

In [None]:
pi = 3.141592
radius, area = 10, pi*radius**2 # Does not work 

On peut bien sûr combiner les affectations multiples avec des appels à des fonctions ! 

In [None]:
import numpy as np
area_1, area_2 = 12, 29
radius_1, radius_2 = np.sqrt(area_1/np.pi), np.sqrt(area_2/np.pi)

----------------------------------

### Formatage de chaines de caracteres 

Nous avions vu plus tôt en Python comment afficher une chaîne de caractères, et même convertir un nombre flottant en chaîne de caractères via l'utilisation de `str(my_number)`. Mais nous n'avons dans ce cas aucun contrôle sur la manière dont Python affiche ce nombre (par exemple, le nombre de chiffres significatifs). Nous allons voir ici comment _formater_ l'affichage de ces nombres. 

Prenons un exemple concret : je voudrais afficher le rayon d'une particule qui a pour 'aire' 10 pixels sur une image. Notre solution, pour l'instant, consiste à écrire :

In [11]:
import numpy as np

area = 10
radius = np.sqrt(area/np.pi) 

print('My radius is ' + str(radius) + ' µm')

My radius is 1.7841241161527712 µm


Personne n'a réellement besoin de tous ces chiffres significatifs, en fait.

#### Formatage a l'_ancienne_ 

 La syntaxe _recommandée_ __depuis Python 2.6__ (pas tout neuf !) consiste à utiliser la méthode `.format()` des chaînes de caractères. Son fonctionnement est un peu étrange ... mais examinons-le dans l'exemple suivant. Celui-ci va demander d'afficher le rayon avec au minimum 4 caractères (`'.'` compris) et 2 chiffres significatifs après la virgule. 

In [14]:
my_str = 'My radius is {:4.3f} µm'
print(my_str.format(radius))

My radius is 1.784 µm


Je vous avais dit que le code paraîtrait bizarre :-) . 
* Dans la première ligne, on définit une chaîne de caractères qui inclut du contenu _à convertir et formater en chaînes de caractères_ 'plus tard' selon certaines règles. Ce contenu est représenté par (pour l'instant) du charabia entouré d'accolades `{` et  `}`, à l'intérieur de la chaîne de caractères. On peut mettre du texte avant et après ces accolades dans le reste de la chaîne sans aucun souci.
* Dans la deuxième ligne, on va en fait indiquer que le contenu à formater dans la chaîne de caractères est en fait la variable `radius`. Pour cela, on va appeler la _méthode_ `.format()` associée à la chaîne de caractères `my_str`.

On a tout a fait le droit de faire ces deux opérations d'une seule traite, même si le code a alors un aspect encore plus étrange 🙃. C'est ce que font de nombreux tutoriels Python en ligne :

In [16]:
print('My radius is {:4.3g} µm'.format(radius))

My radius is 1.78 µm


##### Type d'affichage pour les nombres

À l'intérieur des accolades, on commence par deux points `':'` et on précise ensuite le formatage souhaité. Commençons par la fin, c'est à dire la lettre. J'ai mis ici `'f'`. Pour les nombres flottants, vous disposez de : 

* Le `'f'` affiche les nombres flottants de manière standard 
* Un `'e'` affiche les nombres en notation scientifique (par exemple `1.667e4` pour `16670`)
* Un `'g'` va afficher un nombre flottant standard si le nombre n'est pas trop gros ($\geq 10^{-4}$ et $\leq 10^4$), et une notation scientifique sinon.

Pour les nombres entiers, vous pouvez utiliser :

* Un `'d'` va afficher les nombres entiers en base 10, c'est à dire celle que tout le monde connaît !
µ Un `'x'` va afficher le nombre en hexadécimal avec des 'chiffres' de 0 à F 
* Un `'o'` va afficher les nombres en base 8 (avec donc des 'chiffres' de 0 à 7)
* Un `'b'` va afficher le nombre en binaire (avec des 0 et 1)

Je peux donc essayer : 

In [23]:
print('My radius is {:f} µm'.format(radius))
print('My area is {:d} µm²'.format(area))

My radius is 1.784124 µm
My area is 10 µm²


##### Régler la taille de la chaîne de caractères

Si je ne précise rien entre le `':'` et le `'d'`, `'e'` ou `'f'`, Python va se charger tout seul de choisir le nombre de caractères qu'il va utiliser pour afficher votre nombre. Si vous voulez vous charger de cela vous-même, vous pouvez indiquer un nombre entre ces deux éléments. Voyez plutôt :

In [None]:
print('My area is {:5d} µm²'.format(area))
print('My area is {:10d} µm²'.format(area))
print('My area is {:20d} µm²'.format(area))

Notre valeur `10` (en fait, deux caractères) va être alignée _à droite_, et ce _compte tenu de la longueur de chaîne_ (5, puis 10, puis 20 caractères) que nous avons précisée. Python va donc remplir les 3, 7 ou 17 caractères restants avec des espaces. Cela peut être pratique pour afficher des nombres ayant des 'longueurs' différentes mais en conservant l'alignement : 

In [24]:
print('Particle 1 is {:5d} µm'.format(7))
print('Particle 2 is {:5d} µm'.format(24))
print('Particle 3 is {:5d} µm'.format(5846))
print('Particle 4 is {:5d} µm'.format(32678)) # That is a big particle

Particle 1 is     7 µm
Particle 2 is    24 µm
Particle 3 is  5846 µm
Particle 4 is 32678 µm


Si votre nombre est trop long pour être correctement affiché par vos spécifications, il ne sera pas tronqué et va juste dépasser du format que vous aurez précisé. Dans l'exemple suivant, vous noterez donc que les `'µm'` ne sont plus alignés, car mon grand nombre `266144` possède 6 caractères :

In [25]:
print('Particle 4 is {:5d} µm'.format(32678)) # That is a big particle
print('Particle 5 is {:5d} µm'.format(266144)) # That is a rock at this point, mate...

Particle 4 is 32678 µm
Particle 5 is 266144 µm


##### Chiffres significatifs 

Dans le cas des nombres flottants et à notation scientifique, on peut bien sûr préciser la longueur de la chaîne demandée (celle-ci _inclut_ le point décimal) mais également le nombre de chiffres significatifs que l'on souhaite afficher. Pour cela, on va placer un `'.'` dans les accolades et préciser un chiffre _après_ celui-ci (ici, 3). Dans ce cas précis, comme je n'indique aucun chiffre _avant_ le point `'.'`, cela veut dire que je laisse Python décider de la longueur de la chaîne de caractères associée au nombre : 

In [26]:
import numpy as np
radius = np.sqrt(10/np.pi)

print('My radius is {:.3f} µm'.format(radius)) # Three digits after decimal point

My radius is 1.784 µm


On peut bien sûr combiner les spécifications de longueur de chaîne et de nombres décimaux : 

In [27]:
print('My radius is {:10.3f} µm'.format(radius)) # Three digits after decimal point
print('My radius is {:10.3e} m'.format(radius*1e-6)) # Scientific notation (but with meters instead of µm)

My radius is      1.784 µm
My radius is  1.784e-06 m


##### Quelques possibilités en plus :

1 . Vous pouvez en fait aligner votre chaîne de caractères à gauche ou au centre si vous n'aimez pas ce que fait Python par défaut. Vous devrez alors utiliser `'<'` et `'^'` et le placer _avant_ le nombre de caractères (ici 10) que vous souhaitez utiliser pour afficher votre nombre. Le caractère `'>'` vient naturellement compléter la liste si vous voulez fayoter et préciser que vous alignez votre texte à droite*:

<small>* Nooonnn, en fait il y a une raison et elle vient tout de suite :-)</small>

In [None]:
area = 100
print('My area is {:<10d} µm²'.format(area))
print('My area is {:^10d} µm²'.format(area))

Si vous précisez un caractère _avant_ les symboles `'>'`,  `'<'` ou  `'^'` , Python va l'utiliser pour remplir le vide au lieu de mettre des espaces :

In [28]:
area = 100
print('My area is {:0>10d} µm²'.format(area))
print('My area is {:#^10d} µm²'.format(area))

My area is 0000000100 µm²
My area is ###100#### µm²


2. Vous pouvez préciser plusieurs nombres entre différentes accolades `{}`, personne ne vous limite à un nombre affiché par chaîne de caractères. Dans ce cas, passez juste (dans l'ordre) les différentes variables à la méthode `.format()` : 

In [None]:
area = 100
zplane = 10
eccentricity = 0.665492495

print('My area is {:6d} µm², z-plane is {:3d} and eccentricity is {:5.3f}'.format(area, zplane, eccentricity))

3. Vous pouvez enfin passer des chaînes de caractères dans les accolades, et pas seulement des nombres. Dans ce cas, pas besoin de préciser un `'d'`, `'e'` ou `'f'`, mais le reste des règles de formatage fonctionne quand même. Comme ça, vous pouvez garder vos bouts de texte alignés !

In [None]:
def greet(first, last, age):
    print('Bien le bonjour {:20} {:25} à votre âge de {:3d} ans ! Comment allez-vous ?'.format(first, last, age))

fancy_f, fancy_l, fancy_age = 'Jean-Charles-Hubert', 'de la Tourelle Angevine', 103
brief_f, brief_l, brief_age = 'Luc', 'Poix', 26

greet(fancy_f, fancy_l, fancy_age)
greet(brief_f, brief_l, brief_age)


#### Nouvelle méthode, les `f-strings`

Depuis __Python 3.6__ (c'est le cas chez nous), une nouvelle possibilité existe pour formater vos chaînes de caractères. Pourquoi diable en créer une en plus ? En fait, la méthode `.format()` est sympathique, mais un code du genre :

In [None]:
print('My area is {:6d} µm², z-plane is {:3d} and eccentricity is {:5.3f}'.format(area, zplane, eccentricity))

est assez peu lisible. Ce serait _mieux_ de mettre directement le nom des variables dans les accolades, non ? Comme ça, le code deviendrait bien plus lisible. C'est le concept des `f-strings`. Leur nom l'indique, et vous ne l'aviez peut-être pas compris, comme ça, mais ce sont des chaînes de caractères qui possèdent un `f` avant le premier guillemet ; ce `f` signifie _formatté_. On peut écrire des chaînes de caractères parfaitement normales en mettant juste un `f` devant :

In [30]:
my_fstring = f'Avez-vous déjà vu Toto qui présente la météo ?'
my_fstring

'Avez-vous déjà vu Toto qui présente la météo ?'

 Elle possède les mêmes méthodes que les objets `string` normaux, mais son super-pouvoir réside dans la manière dont elle peut formatter les nombres en son sein. Cette fois-ci, on peut _directement_ inclure le nom des variables entre les accolades `{}` !

In [None]:
import numpy as np
my_radius = np.sqrt(10/np.pi)
print(f'Radius is {my_radius} µm')

Pour formater ces nombres, vous pouvez utiliser les nombreuses options de formatage que je vous ai présentées ci-dessus. Au niveau de la syntaxe, on va écrire `my_variable:format`, avec `format` les joyeusetés du genre `0<4.3f` que je vous ai présentées dans [la section précédente](#formatage-a-lancienne). On peut une fois de plus ajouter plusieurs variables dans une chaîne, et effectuer des opérations à l'intérieur des accolades, car Python va les interpréter avant de formater le tout. On peut donc écrire : 

In [None]:
print(f'Radius is {my_radius:5.2f} µm')
print(f'Radius is {my_radius:_^10.2f} µm and perimeter is {my_radius*2*np.pi:4.3f} µm')

### Listes en comprehension

Parfois en Python, vous serez amenés à vous dire qu'il serait chouette de pouvoir appliquer une fonction ou une méthode à chacun des éléments d'une liste, puis de renvoyer une liste de ces résultats en retour. Prenons un exemple : j'ai une liste contenant des chaînes de caractères, mais pour une raison mystérieuse (probablement un bug ou un concepteur de tutoriels mal intentionné) elle contient plein d'espaces inutiles au début et à la fin de la chaîne. 


In [35]:
my_dirty_list = ['Bonjour  ', ' je ', 'm''appelle ', ' René', 'et mon ', ' chat s\'appelle   ',  '   Médor '] # use\' to print an apostrophe
sentence = ' '.join(my_dirty_list)

print(sentence)

Bonjour    je  mappelle   René et mon   chat s'appelle       Médor 


Il existe une méthode `.strip()` qui fonctionne sur les `string` et qui permet de supprimer les espaces au début et à la fin de celle-ci. Mais il n'est pas possible de l'appliquer directement sur la liste sans faire de boucle, malheureusement. En théorie, on doit passer par une autre boucle pour 'nettoyer' la liste avant de repasser par la case affichage : 

In [None]:
my_clean_list = []
for word in my_dirty_list:
    my_clean_list.append(word.strip())

print(my_clean_list)

En pratique, les _listes en compréhension_ (traduit de l'anglais _list comprehension_) permet d'effectuer ce genre de tâches en une boucle écrite sur une seule ligne. Leur syntaxe diffère des boucles normales, car elle _commence_ par ce qui est effectué dans la boucle et se termine par le `for ... in` standard des boucles `for`. Et pour placer le résultat de cette _compréhension_ dans une liste, on met le tout entre crochets. Regardons comment cela fonctionne dans notre cas de nettoyage de liste : 

In [None]:
my_clean_list_too = [word.strip() for word in my_dirty_list]
my_clean_list_too

Vous pouvez donc lire la première ligne du code ci-dessus à partir du `for` : pour chaque mot de `my_dirty_list`, on va appliquer `.rstrip()`, tandis que les crochets servent bien à accumuler les résultats à la manière d'un appel à la méthode `.append()`. Rien ne vous limite au niveau des fonctions que vous pouvez utiliser, bien entendu !

__Exercice__ : 

* Essayez de convertir la liste de nombres `my_french_numbers`, formatée comme une liste de chaînes de caractère _à la francaise_ en une liste de `float` avec une liste en compréhension.
* (plus difficile ! ) créez une liste en compréhension ne contenant que les multiples de 3 contenus dans `my_too_long_list`. Vous avez le droit d'écrire une instruction `if ... ` _après_ le `for ... in` dans la liste en compréhension. 

In [None]:
import matplotlib.pyplot as plt

my_french_numbers = ['3,78', '26,76', '3,22', '9,32', '3,141592']
my_too_long_list = [3, 23, 71, 26, 12, 47, 53, 24, 18, 66]

------------------------------

### Boucler efficacement sur plusieurs variables avec `zip()`

Dans votre vie de programmeur.euse, vous allez parfois être confronté.e à des boucles `for` un peu vexantes où vous aurez besoin de parcourir plusieurs objets dans votre boucle. Prenons un exemple concret, où nous souhaitons effectuer une opération sur les éléments de deux listes (du même indice) et enregistrer le résultat dans une troisième liste. Les habitués de MATLAB sauront qu'il peuvent utiliser un `index` dans une boucle `for` afin de définir les valeurs de `x` et `y` 'actuelles' lors de l'exécution de la boucle. Le code ressemblera donc à cela :  

In [1]:
x = list(range(10))
y = list(range(0,20,2))
z = []

for index in range(len(x)):
    z.append(x[index]*y[index]**2)

En Python, il est possible de se débarrasser des `[index]` disgracieux dans ces boucles en utilisant la fonction `zip()`. Cette fonction va 'combiner' ces deux listes de $N$ `float` en une liste de $N$ `tuple` contenant deux éléments. Pour l'instant, rien de très utile, me direz-vous. _Cependant, cela vous permet de faire une boucle `for` sur le tuple_, en écrivant quelque chose comme ceci :

In [5]:
result = []
for now in zip(x,y):
    (xnow, ynow) = now 
    result.append(xnow*ynow**2)

La forme suivante n'a pas encore trop d'intérêt, mais en fait Python est capable de comprendre qu'il y a deux objets à chaque itération de la boucle, et on a _de facto_ le droit d'écrire directement : 

In [None]:
result = []
for xnow, ynow in zip(x,y):
    result.append(xnow*ynow**2)

Cela est déjà plus concis ! Et, si vous avez vu les affaires de [liste en compréhension](#listes-en-comprehension) ci-dessus, vous savez peut-être que vous pouvez finir avec un code sur une seule ligne : 

In [7]:
result = [xnow*ynow**2 for xnow, ynow in zip(x,y)] # Nice, eh ?

---------------------------

### Installer Python et vscode sur votre ordinateur 

Maintenant que vous êtes un professionnel de Python, vous vous dites peut-être qu'il serait pas mal d'avoir une installation _locale_ de Pyton, car celle-ci vous permettrait d'installer vous-même n'importe quel paquet, extension, et vous auriez également le choix de l'éditeur de code avec lequel vous travaillez. 

Sachez que tout cela est possible, _même si vous n'êtes pas administrateur de votre ordinateur !_. Je vais vous montrer deux manières d'installer et d'utiliser Python chez vous.

#### Anaconda 

[Anaconda](https://www.anaconda.com/products/distribution) est la version 'usine à gaz' de Python pour les scientifiques. Les anacondas sont en effet connus pour être plus gros que les Pythons ... Son principal avantage est qu'il contient déjà de nombreux paquets pré-installés très utiles pour les scientifiques ([Numpy](./Application_A_Numpy.ipynb), [Scipy](./Application_C_Scipy.ipynb), [Matplotlib](./Application_B_Matplotlib.ipynb), [Pandas](./Application_D_Pandas.ipynb) ...) et qu'il inclut des éditeurs de code comme Spyder et Jupyter Notebooks (celui que vous êtes probablement en train d'utiliser en ligne en ce moment !)

