# Python

Le python est une famille de reptile avec pas de pattes comprenant 10 esp√®ces. Mais [Python](https://www.python.org/about/) est un langage de programmation lanc√© en 1991 par Guido van Rossum, un fan du groupe d'humoristes britanniques Mounty Python.

[Selon le magasine Forbes](https://www.forbes.com/sites/forbestechcouncil/2022/12/28/what-your-software-partner-should-know-the-top-programming-languages-of-2023/?sh=2e55ee55182b), Python est le langage de programmation le plus en demande en 2023. Il s'agit d'un langage dynamique, c'est-√†-dire que le code peut √™tre ex√©cut√© ligne par ligne ou bloc par bloc: un avantage majeur pour des activit√©s qui n√©cessitent des interactions fr√©quentes. Python s'impose non seulement pour cr√©er des applications, mais aussi comme outil de calcul scientifique.

## Installer Python

Si vous devez installer Python localement, je sugg√®re la distribution [Mambaforge](https://mamba.readthedocs.io/en/latest/installation.html). Si toutefois vous vous satisfaites d'une plateforme de calcul infonuagique, comme nous le ferons ici, [Hex](hex.tech) et [Deepnote](deepnote.com) sont de tr√®s bons choix (il y en a [tout plein](datasciencenotebook.org) d'autres).

## Premiers pas avec Python

Ce que nous entreprendrons comme calculs sera effectu√© √† m√™me un *notebook* (ou feuille/carnet de calcul). Nous ne toucherons pas au Terminal. Pour lancer une cellule de code, appuyez sur `Ctrl+Enter` pour ex√©cuter la cellule s√©lectionn√©e ou bien `Shift+Enter` pour ex√©cuter et passer √† la suivante.

> "La libert√©, c‚Äôest la libert√© de dire que deux et deux font quatre. Si cela est accord√©, tout le reste suit." - George Orwell, 1984

In [7]:
2 + 2

4

‚òëÔ∏è Test d'Orwell, check!

In [8]:
67.1 + 43.2

110.3

In [9]:
2 * 4

8

In [10]:
2**6 # deux exposant 6

64

In [11]:
1 / 2

0.5

Tout va bien pour l'instant. Remarquez que la derni√®re op√©ration comporte des espaces entre les nombres et l'op√©rateur `/`. Dans ce cas (ce n'est pas toujours le cas), les espaces ne signifient rien - il est m√™me sugg√©r√© de les placer pour √©claircir le code, ce qui est utile lorsque les √©quations sont complexes. Puis, apr√®s l'op√©ration `2**4`, j'ai plac√© le symbole `#` suivi d'une note. Le symbole `#` est interpr√©t√© par Python comme un ordre de ne pas consid√©rer ce qui le suit. Cela est tr√®s utile pour ins√©rer √† m√™me le code des commentaires pertinents pour mieux comprendre les op√©rations. Mais en programmation litt√©raire, mieux vaut commenter dans des cellules de texte.

Assigner des objets √† des variables est fondamental en programmation. Par exemple.

In [5]:
a = 3

Techniquement, `a` pointe vers le nombre entier 3. Cons√©quemment, on peut effectuer des op√©rations sur `a`.

In [6]:
a * 6

13.200000000000001

In [7]:
A + 2

NameError: name 'A' is not defined

Le message d'erreur nous dit que `A` n'est pas d√©fini. Sa version minuscule, `a`, l'est pourtant. La raison est que Python consid√®re la *case* dans la d√©finition des objets. Utiliser la mauvaise case m√®ne donc √† des erreurs.

Le nom d'une variable doit toujours commencer par une lettre, et ne doit pas contenir de caract√®res r√©serv√©s (espaces, `+`, `*`, `.`). Par convention, les objets qui commencent par une lettre majuscules sont utilis√©s pour d√©finir des classes (modules), utiles pour le d√©veloppement de logiciels, mais rarement utilis√©s dans le cadre d'un feuille de calcul scientifique.

In [8]:
rendement_arbre = 50 
nombre_arbre = 300 
nombre_pomme = rendement_arbre * nombre_arbre
nombre_pomme

15000

## Types de donn√©es

Jusqu'√† maintenant, nous n'avons utilis√© que des **nombres entiers** (*integer* ou `int`) et des **nombres r√©els** (*float* ou `float64`). Python inclue d'autres types. La **cha√Æne de caract√®re** (*string*) est un ou plusieurs symboles. Elle est d√©finie entre des double-guillemets `" "` ou des apostrophes `' '`. Il n'existe pas de standard sur l'utilisation de l'un ou de l'autre, mais en r√®gle g√©n√©rale, on utilise les apostrophe pour les experssions courtes, contenant un simple mot ou s√©quence de lettres, et les guillements pour les phrases. Une raison pour cela: les guillemets sont utiles pour ins√©rer des apostrophes dans une cha√Æne de caract√®re.

In [9]:
a = "L'ours"
b = "polaire"
a + " " +  b + " ressemble √† un faux z√®bre."

"L'ours polaire ressemble √† un faux z√®bre."

Notez que l'objet `a` a √©t√© d√©fini pr√©c√©demment. Il est possible en Python de r√©assigner une variable, mais cela peut porter √† confusion, jusqu'√† g√©n√©rer des erreurs de calcul si une variable n'est pas assign√© √† l'objet auquel on voulait r√©f√©rer.

L'op√©rateur `+` sur des caract√®res retourne une concat√©nation.

Combien de caract√®res contient la cha√Æne `"L'ours polaire"`? Python sait compter. Demandons-lui.

In [10]:
c = a + " " +  b
len(c)

14

Quatorze, c'est bien cela (comptez "L'ours polaire", en incluant l'espace). `len`, pour *lenght* (longueur), est une fonction incluse par d√©faut dans l'environnement de travail de Python. La fonction est appel√©e en √©crivant `len()`. Mais une fonction de quoi? Des arguments qui se trouvent entre les parenth√®ses. Dans ce cas, il y a un seul argument: `c`.

En calcul scientifique, il est courant de lancer des requ√™tes testant si un r√©sultat est vrai ou faux.

In [11]:
a = 17
print(a < 10)
print(a > 10)
print(a == 10)
print(a != 10)
print(a == 17)
print(~a == 17)

False
True
False
True
True
False


Je viens d'introduire un nouveau type de donn√©e: les donn√©es bool√©ennes (*boolean*, ou `bool`), qui ne peuvent prendre que deux √©tats - `True` ou `False`. En m√™me temps, j'ai utilis√© la fonction `print` parce que dans mon carnet, seule la derni√®re op√©ration permet d'afficher le r√©sultat. Si l'on veut forcer une sortie, on utilise `print`. Puis, on a vu plus haut que le symbole `=` est r√©serv√© pour assigner des objets: pour les tests d'√©galit√©, on utilise le double √©gal, `==`, ou `!=` pour la non √©galit√©. Enfin, pour inverser une donn√©e de type bool√©enne, on utilise le symbole `~`.

Pour les tests sur les cha√Ænes de caract√®res, on utilisera `in` et son inverse `not in`.

In [14]:
print('o' in 'Ours')
print('O' in 'Ours')
print('O' not in 'Ours')

False
True
False


## Les collections de donn√©es

Les exercices pr√©c√©dents ont permis de pr√©senter les types de donn√©es offerts par d√©faut sur Python qui sont les plus importants pour le calcul scientifique¬†: `int` (*integer*, ou nombre entier), `float` (nombre r√©el), `str` (*string*, ou cha√Æne de caract√®re) et `bool` (bool√©en). D'autres s'ajouterons, comme les unit√©s de temps (date-heure), les cat√©gories et les g√©om√©tries (points, linges, polygones) g√©or√©f√©renc√©es.

Lorsque l'on proc√®de √† des op√©rations de calcul en science, nous utilisons rarement des valeurs uniques. Nous pr√©f√©rons les organiser et les traiter en collections. Par d√©faut, Python offre trois types importants¬†: les **listes**, les **tuples** et les **dictionnaires**.

D'abord, les **listes**, ou `list`, sont une s√©rie de variables sans restriction sur leur type. Elles peuvent m√™me contenir d'autres listes. Une liste est d√©limit√©e par des crochets `[ ]`, et les √©l√©ments de la liste sont s√©par√©s par des virgules.

In [15]:
magie = ['Impero', 'Protego', 'Expecto Patronum', 'Wingardium Leviosa']
magie

['Impero', 'Protego', 'Expecto Patronum', 'Wingardium Leviosa']

Pour acc√©der aux √©l√©ments d'une liste, appelle la liste suivie de la position de l'objet d√©sir√© entre crochets. Fait important¬†: en Python, l'indice du premier √©l√©ment est z√©ro.

In [16]:
print(magie[0])
print(magie[2])
print(magie[:2])
print(magie[2:])

Impero
Expecto Patronum
['Impero', 'Protego']
['Expecto Patronum', 'Wingardium Leviosa']


Pour les deux derni√®res commandes, la position `:2` signifie jusqu'√† 2 non inclusivement et `2:` signifie de 2 √† la fin.

Pour ajouter un √©l√©ment √† notre liste, on peut utiliser la m√©thode `append`. √Ä la diff√©rence d'une fonction, la m√©thode est une propri√©t√© d'un objet.

In [17]:
magie.append("Endoloris")
magie

['Impero', 'Protego', 'Expecto Patronum', 'Wingardium Leviosa', 'Endoloris']

Notez que la m√©thode `append` est appel√©e apr√®s la variable et pr√©c√©d√©e un point. Cette mani√®re de proc√©der est courante en programmation orient√©e objet. La fonction `append` est un attribut d'un objet `list` et prend un seul argument¬†: l'objet qui est ajout√© √† la liste. C'est une mani√®re de dire `grenouille.saute(longueur=0.8, hauteur=0.3)`.

 En lan√ßant `magie[2] = "Petrificus Totalus"`, on note qu'il est possible de changer une √©l√©ment de la liste.

In [19]:
print(magie)
magie[2] = "Petrificus Totalus"
print(magie)

['Impero', 'Protego', 'Expecto Patronum', 'Wingardium Leviosa', 'Endoloris']
['Impero', 'Protego', 'Petrificus Totalus', 'Wingardium Leviosa', 'Endoloris']


Si les donn√©es contenues dans une liste sont de m√™me type, cette liste peut √™tre consid√©r√©e comme un vecteur. En cr√©ant une liste de vecteurs de dimensions coh√©rentes, on cr√©e une matrice. Nous verrons plus tard que pour les vecteurs et les matrices, on utilisera un format offert par un module compl√©mentaire. Pour l'instant, on pourrait d√©finir une matrice comme suit.

In [16]:
mat = [[1, 2, 3],
       [4, 5, 6],
       [7, 8, 9],
       [10, 11, 12]]
mat

[[1, 2, 3], [4, 5, 6], [7, 8, 9], [10, 11, 12]]

Les **tuples**, d√©finis `tuple` par Python, diff√©rent des listes du fait que ses √©l√©ments ne peuvent pas √™tre modifi√©s. Un tuple est d√©limit√© par des parenth√®ses `( )`, et comme chez la liste,  ses √©l√©ments sont s√©par√©s par des virgules. Les tuples sont moins polyvalents que les listes. Vous les utiliserez probablement rarement, et surtout comme arguments dans certaines fonctions en calcul scientifique, arguments qui souvent peuvent √™tre d√©finis en termes de listes.

In [17]:
magie = ('Impero', 'Protego', 'Expecto Patronum', 'Wingardium Leviosa')
magie[2] = "Expelliarmus"

TypeError: 'tuple' object does not support item assignment

Les **dictionnaires**, ou `dict`, sont des listes dont chaque √©l√©ment est identifi√© par une cl√©. Un dictionnaire est d√©limit√© par des accolades sous forme `mon_dict = {'cl√©1': x, 'cl√©2': y, 'cl√©3': z }`. On appelle un √©l√©ment par sa cl√© entre des crochets, par exemple `mon_dict['cl√©1']`.

Le `dict` se rapproche d'un tableau: nous verrons plus tard que le format de tableau (offert dans un module compl√©mentaire) est b√¢ti √† partir du format `dict`. Contrairement √† un tableau o√π les colonnes contiennent toutes le m√™me nombre de lignes, chaque √©l√©ment du dictionnaire est ind√©pendant des autres.

In [21]:
tableau = {'espece': ['Petromyzon marinus', 'Lepisosteus osseus', 'Amia calva', 'Hiodon tergisus'], 'poids': [10, 13, 21, 4], 'longueur': [35, 44, 50, 8]}
print('Mon tableau: ', tableau)
print('Mes esp√®ces:',  tableau['espece'])
print('Noms des cl√©s (ou colonnes):',  tableau.keys())

Mon tableau:  {'espece': ['Petromyzon marinus', 'Lepisosteus osseus', 'Amia calva', 'Hiodon tergisus'], 'poids': [10, 13, 21, 4], 'longueur': [35, 44, 50, 8]}
Mes esp√®ces: ['Petromyzon marinus', 'Lepisosteus osseus', 'Amia calva', 'Hiodon tergisus']
Noms des cl√©s (ou colonnes): dict_keys(['espece', 'poids', 'longueur'])


## Les fonctions

Plus haut, j'ai pr√©sent√© la fonction `len` et  la m√©thode `append`. Une myriade de fonctions sont livr√©es par d√©faut avec Python. Mais il en manque aussi cruellement.


In [18]:
sqrt(2)

NameError: name 'sqrt' is not defined

Message d'erreur: la commande `sqrt` n'est pas d√©finie. 

> Quoi, Python n'est pas foutu de calculer une racine carr√©e?

Par d√©faut, non. ü§∑

Mais!

De nombreuses extensions (les *modules*) permettent de combler ces manques. Nous aborderons √ßa un peu plus loin dans ce chapitre. Pour l'instant, exer√ßons-nous √† cr√©er notre propre fonction de racine carr√©e.

In [20]:
def racine(x, n=2):
    r = x**(1 / n)
    return r

En Python, `def` est le mot-cl√© pour d√©finir une fonction. Suit ensuite, apr√®s un espace, le nom que vous d√©sirez donner √† la fonction: `racine`. Les arguments de la fonction suivent entre les parenth√®ses. Dans ce cas, `x` est la valeur de laquelle on veut extraire la racine et `n` est l'ordre de la racine. L'agument `x` n'a pas de valeur par d√©faut: elle doit √™tre sp√©cifi√©e pour que la fonction fonctionne. La mention `n=2` signifie que si la valeur de `n` n'est pas sp√©cifi√©e, elle prendra la valeur de 2 (la racine carr√©e). Pour marquer la fin de la d√©finition et le d√©but de la suite d'instructions, on utilise les deux points `:`, puis un retour de ligne. Une indentation (ou retrait) de quatre barres d'espacement signifie que l'on se trouve √† l'int√©rieur de la suite d'instructions, o√π l'on calcule une valeur de `r` comme l'exposant de l'inverse de l'ordre de la racine. La derni√®re ligne indique ce que la fonction doit retourner.

In [21]:
print(racine(9))
print(racine(x=9))
print(racine(8, 3))
print(racine(x=8, n=3))

3.0
3.0
2.0
2.0


S'ils ne sont pas sp√©cifi√©s, Python comprend que les arguments sont entr√©s dans l'ordre d√©fini dans la fonction. En entrant `racine(9)`, Python comprend que le `9` est attribu√© √† `x` et donne √† `n` sa valeur par d√©faut, `2`. Ce qui est √©quivalent √† entrer `racine(x=9)`. Les autres entr√©es sont aussi √©quivalentes, et extraient la racine cubique. S'il se peut qu'il y ait confusion entre les arguments nomm√©s et ceux qui ne le sont pas, Python vous retournera un message d'erreur. R√®gle g√©n√©rale, il est pr√©f√©rable pour la lisibilit√© du code de nommer les arguments plut√¥t que de les sp√©cifier dans l'ordre.

Supposons maintenant que vous avez une liste de donn√©es dont vous voulez extraire la racine.

In [22]:
data = [3.5, 8.1, 10.2, 0.5, 5.6]
racine(x=data, n=2)

TypeError: unsupported operand type(s) for ** or pow(): 'list' and 'float'

Oups. Python vous dit qu'il y a une erreur, et, dans le *Traceback*, il vous indique avec une fl√®che `---->` √† quelle ligne de notre fonction l'erreur est encourue. Les exposants `**` ne sont pas applicables aux listes. Une solution est d'appliquer la fonction √† chaque √©l√©ment de la liste avec une **it√©ration**. On verra plus tard des mani√®res plus efficaces de proc√©der. Je me sers de ce cas d'√©tude pour introduire les boucles it√©ratives.

## Les boucles

Les boucles permettent d'effectuer une m√™me suite d'op√©rations sur plusieurs objets. Pour faire suite √† notre exemple:

In [26]:
racine_data = []
for i in [0, 1, 2, 3, 4]:
    r = racine(x=data[i], n=2)
    racine_data.append(r)

racine_data

[1.8708286933869707,
 2.8460498941515415,
 3.1937438845342623,
 0.7071067811865476,
 2.3664319132398464]

Nous avons d'abord cr√©√© une liste vide, `racine_data`. Ensuite, pour (**`for`**) chaque indice de la liste (`i in [0, 1, 2, 3, 4]`), nous demandons √† Python d'effectuer la suite d'op√©ration qui suit le `:` et qui est indent√©e de quatre espaces. Dans la suite d'op√©ration, calculer la racine carr√©e de `data` √† l'indice `i`, puis l'ajouter √† la liste `racine_data`. Au lieu d'entrer une liste `[0, 1, 2, 3, 4]`, on aurait pu utiliser la fonction `range` et lui assigner automatiquement la longueur de la liste. 

On peut aussi lancer des boucles en une seule ligne.

In [None]:
racine_data = [racine(x=d, n=2) for d in data]
racine_data

[1.8708286933869707,
 2.8460498941515415,
 3.1937438845342623,
 0.7071067811865476,
 2.3664319132398464]

La fonction `range` retourne une s√©quence calcul√©e au besoin. Elle est calcul√©e si elle est √©voqu√©e dans une boucle ou en lan√ßant `list`.

In [28]:
print(range(len(data)))
print(list(range(len(data))))
print(range(2, len(data)))
print(list(range(2, len(data))))

range(0, 5)
[0, 1, 2, 3, 4]
range(2, 5)
[2, 3, 4]


Premi√®re observation, si un seul argument est inclus, `range` retourne une s√©quence partant de z√©ro. Seconde observation, la s√©quence se termine en excluant l'argument. Ainsi, `range(2,5)` retourne la s√©quence [2, 3, 4]. En sp√©cifiant la longueur de data comme argument, la s√©quence `range(5)` retourne la liste `[0, 1, 2, 3, 4]`, soit les indices dont nous avons besoin pour it√©rer dans la liste.

Les boucles `for` vous permettront par exemple de g√©n√©rer en peu de temps 10, 100, 1000 graphiques (autant que vous voulez), chacun issu de simulations obtenues √† partir de conditions initiales diff√©rentes, et de les enregistrer dans un r√©pertoire sur votre ordinateur. Un travail qui pourrait prendre des semaines sur Excel peut √™tre effectu√© en Python en quelques secondes.

Un second outil est disponible pour les it√©rations¬†: les boucles **`while`**. Elles effectuent une op√©ration tant qu'un crit√®re n'est pas atteint. Elles sont utiles pour les op√©rations dont on cherche une convergence. Je les couvre rapidement puisqu'elles sont rarement utilis√©es dans les flux de travail courants. En voici un petit exemple.

In [29]:
x = 100
while (x > 1.1):
    x=racine(x)
    print(x)

10.0
3.1622776601683795
1.7782794100389228
1.333521432163324
1.1547819846894583
1.0746078283213176


Nous avons init√© x √† une valeur de 100. Puis, tant que (`while`) le test `x > 1.1` est vrai, attribuer √† `x` la nouvelle valeur calcul√©e en extrayant la racine de la valeur pr√©c√©dente de `x`. Enfin, indiquer la valeur avec `print`.

Explorons maintenant comment Python r√©agit si on lui demande de calculer $\sqrt{-1}$.

In [30]:
racine(x=-1, n=2)

(6.123233995736766e-17+1j)

D'abord, Python ne retourne pas de message d'erreur, mais un nouveau type de donn√©e: le nombre imaginaire. Puis, `6.123233995736766e-17` n'est pas z√©ro, mais tr√®s proche. La r√©solution des calculs √©tant num√©rique, on obeserve parfois de l√©g√®res d√©viations par rapport aux solutions math√©matiques.

Si pour un cas particulier, on veut √©viter que notre fonction retourne un nombre imaginaire, comment s'y prendre? Avec une **condition**.

## Conditions: `if`, `elif`, `else`

> Si la condition 1 est remplie, effectuer une suite d'instruction 1. Si la condition 1 n'est pas remplie, et si la condition 2 est remplie, effectuer la suite d'instruction 2. Sinon, effectuer la suite d'instruction 3.

Voil√† comment on exprime une suite de conditions. Pour notre racine d'un nombre n√©gatif, on pourrait proc√©der comme suit.

In [31]:
def racine_positive_nn(x, n=2):
    if x<0:
        raise ValueError("x est n√©gatif")
    elif x==0:
        raise ValueError("x est nul")
    else:
        r = x**(1/n)
        return(r)

La racine positive et non-nulle (`racine_positive_nn`) comprend les mot-cl√©s `if` (si), `elif` (une contration de *else if*) et `else` (sinon). `ValueError` est une fonction pour retourner un message d'erreur lorsqu'elle est pr√©c√©d√©e de `raise`. Comme c'est le cas pour `def` et `for`, les instructions des conditions sont indent√©es. Notez la double indentation (8 espaces) pour les instructions des conditions. Alors que la plupart des langages de programmation demandent d'embo√Æter les instructions dans des parenth√®ses, accolades et crochets, Python pr√©f√®re nous forcer √† bien indenter le code (ce que l'on devrait faire de toute mani√®re pour am√©liorer la lisibilit√©) et s'y fier pour effectuer ses op√©rations.

In [32]:
racine_positive_nn(x=-1, n=2)

ValueError: x est n√©gatif

In [33]:
racine_positive_nn(x=0, n=2)

ValueError: x est nul

In [34]:
racine_positive_nn(x=4, n=2)

2.0

## Charger un module

Le module *Numpy* est une bo√Æte d'outil de calcul num√©rique popul√©e par de nombreuses foncions math√©matiques. Un message d'erreur appara√Ætra s'il n'est pas install√©. Pour l'installer, utilisez pr√©f√©rablement `conda install numpy` si vous utilisez la distribution Anaconda, sinon `pip install numpy`.

In [1]:
import numpy as np
np.sqrt(9)

3.0

In [36]:
from numpy import sqrt
sqrt(9)

3.0

La plupart des fonctions que vous aurez √† construire seront vou√©es √† des instructions sp√©cialis√©es √† votre cas d'√©tude. Pour la plupart des op√©rations d'ordre g√©n√©rale (comme les racines carr√©es, les tests statistiques, la gestion de matrices et de tableau, les graphiques, les mod√®les d'apprentissage, etc.), des √©quipes ont d√©j√† d√©velopp√©¬†des fonctions n√©cessaires √† leur utilisation, et les ont laiss√©es disponibles au grand public. L'introduction √† Python se termine l√†-dessus.

Comme une langue, on n'apprend √† s'exprimer en un langage informatique qu'en se mettant √† l'√©preuve, ce que vous ferez tout au long de ce cours.