# (Re)prise en main du langage Python

Toutes les séances de notre module seront présentées dans des documents au format iPython notebook, associé à l'extension `.ipynb`.  
Ce format permet de joindre dans le même document:

- du texte dans un format à balises simple, le format [markdown](http://markdowntutorial.com/),
- du code à exécuter en [Python](https://docs.python.org/3.8/) (ici la version 3.8),
- le résultat des commandes Python à la suite des cellules, que ce soit un résultat textuel ou une image.

### À noter
Les cellules en jaune (sur le modèle suivant) sont des exercices à faire!
<div class="alert alert-warning" style="margin-top: 1em"><b>Exercice</b>: Faire les exercices</div>

In [None]:
%load_ext lab_black

## Quelques éléments de syntaxe Python

Python est un langage typé dynamiquement, on n’est donc pas obligé de déclarer le type des variables.  
On pourra par exemple exécuter le programme suivant en plaçant le curseur dans la cellule et en tapant `Maj+Enter`.

In [None]:
a: int = 3  # annotation de type (optionnelle, ignorée par le langage)
b: float = 4.0
c = "a * b = "
print(c + str(a * b))

In [None]:
# On pourra préférer cette notation
print("a * b = {}".format(a * b))

In [None]:
# Les f-strings permettent d'évaluer des variables et de les formatter.
print(f"a * b = {a*b}")
# Python 3.8 permet le raccourci suivant
print(f"{a * b = }")

Les annotations (placées après les :) sont ignorées par le langage, qui n'effectue aucune vérification avec. Mais ces annotations peuvent être confortables en tant que commentaires. La seule contrainte pour une annotation est qu'elle doit être syntaxiquement valide en Python. On peut écrire un type (courant), une chaîne de caractères ou n'importe quoi.

In [None]:
angle = float
pi: angle = 3.14
pi, type(pi)

Le vrai type de la valeur n'est pas impacté. On peut alors par exemple utiliser ces annotations pour ajouter des dimensions à des grandeurs physiques

In [None]:
c: "m.s^-1" = 3e8
# ou alors
speed = float
c: speed = 3e8

Les opérateurs habituels sur les entiers et les flottants sont disponibles.  
La boucle `for` permet de parcourir des objets itérables comme des listes, des tuples etc.  
La fonction `range` permet de générer une séquence d’entiers :

In [None]:
for x in range(2, 7):  # le 7 est exclu
    print(x)

<div class="alert alert-danger">
<b>Important :</b> L’indentation est importante en Python. Elle permet de définir les blocs.  
</div>
La conditionnelle est définie classiquement :

In [None]:
if a == 3:
    print("a = 3")
else:
    print("a = something else...")

Le mot clé pour définir une fonction est `def`.
La documentation d'une fonction peut-être écrite au format `__doctest__` en utilisant les triples guillemets.
Les exemples d'utilisation indiqués dans la documentation `__doctest__` servent de test unitaire.

In [None]:
def fact(n: int) -> int:
    """Renvoie la factorielle de n.
    
    >>> fact(6)
    720
    >>> [fact(n) for n in range(6)]
    [1, 1, 2, 6, 24, 120]
    
    Si n est négatif, une exception de type ValueError est levée.
    >>> fact(-1)
    Traceback (most recent call last):
        ...
    ValueError: n doit être un entier positif
    """
    res = 1
    if n < 0:
        raise ValueError("n doit être un entier positif")
    while n > 0:
        res = n * res
        n = n - 1
    return res

In [None]:
fact(6)

Il est important de bien remplir la documentation, on pourrait en avoir besoin par la suite:

In [None]:
help(fact)

La fonction `doctest.testmod()` permet de tester toutes les fonctions d'un module donné (ici `__main__`):

In [None]:
import doctest

doctest.testmod()

Le format iPython notebook permet également de consulter la documentation dans une pop-up à part:

In [None]:
?fact

## Structures de données

Python propose un certain nombres de structures de données de base munies de facilités syntaxiques et algorithmiques.

<div class="alert alert-success" style="margin-top: 1em">
<b>Règle no.1</b> Tout l'art de la programmation consiste à choisir (et adapter) les bonnes structures de données.
</div>

### Chaînes de caractères

En Python, le type str représente une suite de caractères Unicode. Tous les caractères (y compris les accentués et ceux utilisés dans la plupart des langues connues) peuvent être concaténés dans une chaîne de caractères valide. Seul le caractère antislash \ doit être doublé
car il donne une signification spéciale à certaines séquences de caractères. Le préfixe r"" (pour raw) désactive l’interprétation de l’antislash.

In [None]:
str()

In [None]:
"bon" + "jour"

In [None]:
a: str = """Bonjour
à tous"""

a

In [None]:
a[0]

In [None]:
a[2:4]

In [None]:
a[-1]

In [None]:
a[-8:]

In [None]:
a = "heLLo"
(a + " ") * 2

In [None]:
len(a)

In [None]:
a.capitalize()

In [None]:
" hello ".strip()

In [None]:
"hello y’all".split()

### Tuples

Le tuple est une structure de base du langage Python qui concatène des variables de nature hétérogène. Il est défini par l’opérateur virgule. Le tuple est toujours affiché avec des parenthèses. Un tuple a un seul élément doit être terminé par une virgule ; un tuple sans
élément s’écrit avec des parenthèses, mais on peut préférer le constructeur explicite.

In [None]:
tuple()

In [None]:
latlon: tuple = 43.6, 1.45
latlon

In [None]:
1,

In [None]:
# tuple unpacking
lat, lon = latlon
lat

In [None]:
lat, _ = latlon  # variable muette

Le déballage requiert autant d’éléments dans la partie gauche que dans la partie droite du signe égal. Si tous les champs ne sont pas nécessaires à gauche, on utilise généralement la variable muette _ . L’opérateur préfixe * permet de grouper plusieurs variables.

In [None]:
dix = tuple(range(10))
dix

In [None]:
zero, *autres, huit, neuf = dix

In [None]:
zero

In [None]:
autres

In [None]:
huit, neuf

### Listes

La liste est un conteneur séquentiel de valeurs hétérogènes. C’est un objet mutable : on peut en modifier le contenu à tout moment. Cette structure très intuitive, munie d’une algorithmique riche, notamment pour le tri et la recherche est souvent le choix par défaut des débutants pour tous les problèmes qu’ils doivent résoudre.

In [None]:
list()

In [None]:
a: list = [1, "deux", 3.0]

In [None]:
a[0]

In [None]:
len(a)

In [None]:
a.append(1)

In [None]:
a

In [None]:
a.count(1)

In [None]:
3 in a

In [None]:
a[1] = 2

In [None]:
a

In [None]:
a.sort()

In [None]:
a

In [None]:
a[1:3]

On peut utiliser le mécanisme de *compréhension de liste* pour construire une liste facilement.  
Par exemple, pour
construire une liste contenant les carrés des valeurs comprises entre 1 et 5 :

In [None]:
[i for i in range(5)]
# similar to list(i for i in range(5))
# similar to list(range(5))

In [None]:
[str(i) for i in range(5)]

In [None]:
[i ** 2 for i in range(5)]

In [None]:
[i ** 2 for i in range(5) if i & 1 == 0]  # smarter than i%2 == 0

In [None]:
[x.upper() for x in "hello"]  # even with strings

Rappelons également le constructeur `sorted` qui crée une liste triée à partir d'une structure itérable ou d'un générateur:

In [None]:
sorted(i ** 2 for i in range(-5, 5))

### Ensembles

L’ensemble (type set) est un conteneur séquentiel d’éléments uniques. On peut créer un ensemble par énumération de valeurs, à partir d’une structure qui permet l’itération (comme une liste, une chaîne de caractères, etc.) ou par compréhension.

In [None]:
set()

In [None]:
s = {1, 2, 3, 1}
s

In [None]:
set("coucou")

In [None]:
set(i ** 2 for i in (-2, -1, 0, 1, 2))

Un set peut-être modifié en ajoutant ou supprimant des valeurs. L’arithmétique des ensembles est accessible à l’aide des opérateurs usuels pour l’union | , l’intersection & et la différence - . L’opérateur + n’est pas défini.

In [None]:
s

In [None]:
s.add(4)
s

In [None]:
s.remove(4)
s

In [None]:
s.pop(), s

In [None]:
s1 = set(range(3))
s2 = set(range(0, -3, -1))
s1, s2

In [None]:
s1 | s2  # union

In [None]:
s1 & s2  # intersection

In [None]:
s1 - s2  # différence

### Dictionnaires

Les dictionnaires (type dict ) sont des tables de hash qui fonctionnent sur le modèle clé/valeur. Toutes les valeurs utilisées comme clé doivent être hashable, exactement comme pour les ensembles. Ce sont des structures mutables : on peut librement ajouter de nouvelles clés ou remplacer des valeurs. Comme ils sont utilisés de manière extensive à des emplacements critiques du cœur du langage, les dictionnaires sont particulièrement optimisées en Python.

In [None]:
tour_eiffel = {
    "latitude": 48.8583,
    "longitude": 2.2945,
    "nom": "Tour Eiffel",
    "ville": "Paris",
}

In [None]:
tour_eiffel["pays"] = "France"

In [None]:
point = dict(latitude=43.6, longitude=1.45)  # équivalent
point

In [None]:
"latitude" in point

On peut utiliser l’opération .get() qui permet de définir une valeur par défaut si une clé n’est pas présente dans le dictionnaire :

In [None]:
altitude = point.get("altitude", 0)
altitude

In [None]:
point.keys()

In [None]:
point.values()

In [None]:
point.items()

In [None]:
dict((key.upper(), value) for (key, value) in point.items())

L’opérateur préfixe ** permet de décapsuler les dictionnaires. Il est couramment utilisé pour mettre à jour un dictionnaire ou pour en concaténer deux.

In [None]:
{**point, **{"pays": "France", "longitude": 1.45}}

<div class="alert alert-warning">
<b>Exercice</b>: Construire <b>et documenter</b> une fonction qui calcule la liste des nombres premiers inférieurs ou égaux à n.
</div>

In [None]:
# write your code here!


In [None]:
# %load solutions/prime.py

In [None]:
", ".join(str(i) for i in prime(100))


<div class="alert alert-warning">
<b>Exercice:</b> Écrire un programme qui lit le fichier <code>00-lorem-ipsum.txt</code> et y compte le nombre d’occurrences de chaque mot.
</div>

On pourra partir du modèle suivant :
```python
with open("data/00-lorem-ipsum.txt") as f:
    print(f.readlines())
```

In [None]:
# write your code here!


In [None]:
# %load solutions/lorem_ipsum.py


In [None]:
# %load solutions/lorem_ipsum_alt.py


In [None]:
# %load solutions/lorem_ipsum_alt2.py
