# (Re)prise en main du langage Python

Toutes les séances de notre module seront présentées dans des documents au format iPython notebook, associé à l'extension `.ipynb`.  
Ce format permet de joindre dans le même document:

- du texte dans un format à balises simple, le format [markdown](http://markdowntutorial.com/),
- du code à exécuter en [Python](https://docs.python.org/3.8/) (ici la version 3.8),
- le résultat des commandes Python à la suite des cellules, que ce soit un résultat textuel ou une image.

### À noter
Les cellules en jaune (sur le modèle suivant) sont des exercices à faire!
<div class="alert alert-warning" style="margin-top: 1em"><b>Exercice</b>: Faire les exercices</div>

## Quelques éléments de syntaxe Python

Python est un langage typé dynamiquement, on n’est donc pas obligé de déclarer le type des variables.  
On pourra par exemple exécuter le programme suivant en plaçant le curseur dans la cellule et en tapant `Maj+Enter`.

In [12]:
a: int = 3  # annotation de type (optionnelle, ignorée par le langage)
b: float = 4.0
c = "a * b = "
print(c + str(a * b))

a * b = 12.0


In [13]:
# On pourra préférer cette notation
print("a * b = {}".format(a * b))

a * b = 12.0


In [14]:
# Les f-strings permettent d'évaluer des variables et de les formatter.
print(f"a * b = {a*b}")
# Python 3.8 permet le raccourci suivant
print(f"{a * b = }")

a * b = 12.0
a * b = 12.0


Les annotations (placées après les :) sont ignorées par le langage, qui n'effectue aucune vérification avec. Mais ces annotations peuvent être confortables en tant que commentaires. La seule contrainte pour une annotation est qu'elle doit être syntaxiquement valide en Python. On peut écrire un type (courant), une chaîne de caractères ou n'importe quoi.

In [15]:
angle = float
pi: angle = 3.14
pi, type(pi)

(3.14, float)

Le vrai type de la valeur n'est pas impacté. On peut alors par exemple utiliser ces annotations pour ajouter des dimensions à des grandeurs physiques

In [17]:
c: "m.s^-1" = 3e8
# ou alors
speed = float
c: speed = 3e8

Les opérateurs habituels sur les entiers et les flottants sont disponibles.  
La boucle `for` permet de parcourir des objets itérables comme des listes, des tuples etc.  
La fonction `range` permet de générer une séquence d’entiers :

In [18]:
for x in range(2, 7):  # le 7 est exclu
    print(x)

2
3
4
5
6


<div class="alert alert-danger">
<b>Important :</b> L’indentation est importante en Python. Elle permet de définir les blocs.  
</div>
La conditionnelle est définie classiquement :

In [19]:
if a == 3:
    print("a = 3")
else:
    print("a = something else...")

a = 3


Le mot clé pour définir une fonction est `def`.
La documentation d'une fonction peut-être écrite au format `__doctest__` en utilisant les triples guillemets.
Les exemples d'utilisation indiqués dans la documentation `__doctest__` servent de test unitaire.

In [6]:
def fact(n: int) -> int:
    """Renvoie la factorielle de n.
    
    >>> fact(6)
    720
    >>> [fact(n) for n in range(6)]
    [1, 1, 2, 6, 24, 120]
    
    Si n est négatif, une exception de type ValueError est levée.
    >>> fact(-1)
    Traceback (most recent call last):
        ...
    ValueError: n doit être un entier positif
    """
    res = 1
    if n < 0:
        raise ValueError("n doit être un entier positif")
    while n > 0:
        res = n * res
        n = n - 1
    return res

In [7]:
fact(6)

720

Il est important de bien remplir la documentation, on pourrait en avoir besoin par la suite:

In [8]:
help(fact)

Help on function fact in module __main__:

fact(n: int) -> int
    Renvoie la factorielle de n.
    
    >>> fact(6)
    720
    >>> [fact(n) for n in range(6)]
    [1, 1, 2, 6, 24, 120]
    
    Si n est négatif, une exception de type ValueError est levée.
    >>> fact(-1)
    Traceback (most recent call last):
        ...
    ValueError: n doit être un entier positif



La fonction `doctest.testmod()` permet de tester toutes les fonctions d'un module donné (ici `__main__`):

In [9]:
import doctest

doctest.testmod()

TestResults(failed=0, attempted=3)

Le format iPython notebook permet également de consulter la documentation dans une pop-up à part:

In [10]:
?fact

[0;31mSignature:[0m [0mfact[0m[0;34m([0m[0mn[0m[0;34m:[0m [0mint[0m[0;34m)[0m [0;34m->[0m [0mint[0m[0;34m[0m[0;34m[0m[0m
[0;31mDocstring:[0m
Renvoie la factorielle de n.

>>> fact(6)
720
>>> [fact(n) for n in range(6)]
[1, 1, 2, 6, 24, 120]

Si n est négatif, une exception de type ValueError est levée.
>>> fact(-1)
Traceback (most recent call last):
    ...
ValueError: n doit être un entier positif
[0;31mFile:[0m      /mnt/storage/Documents/ISAE/3A/SDD/back2python/<ipython-input-6-ffb80be6e8d0>
[0;31mType:[0m      function


## Structures de données

Python propose un certain nombres de structures de données de base munies de facilités syntaxiques et algorithmiques.

<div class="alert alert-success" style="margin-top: 1em">
<b>Règle no.1</b> Tout l'art de la programmation consiste à choisir (et adapter) les bonnes structures de données.
</div>

### Chaînes de caractères

En Python, le type str représente une suite de caractères Unicode. Tous les caractères (y compris les accentués et ceux utilisés dans la plupart des langues connues) peuvent être concaténés dans une chaîne de caractères valide. Seul le caractère antislash \ doit être doublé
car il donne une signification spéciale à certaines séquences de caractères. Le préfixe r"" (pour raw) désactive l’interprétation de l’antislash.

In [21]:
str()

''

In [23]:
"bon" + "jour"

'bonjour'

In [24]:
a: str = """Bonjour
à tous"""

a

'Bonjour\nà tous'

In [25]:
a[0]

'B'

In [26]:
a[2:4]

'nj'

In [27]:
a[-1]

's'

In [28]:
a[-8:]

'r\nà tous'

In [29]:
a = "heLLo"
(a + " ") * 2

'heLLo heLLo '

In [30]:
len(a)

5

In [31]:
a.capitalize()

'Hello'

In [38]:
" hello ".strip()

'hello'

In [33]:
"hello y’all".split()

['hello', 'y’all']

### Tuples

Le tuple est une structure de base du langage Python qui concatène des variables de nature hétérogène. Il est défini par l’opérateur virgule. Le tuple est toujours affiché avec des parenthèses. Un tuple a un seul élément doit être terminé par une virgule ; un tuple sans
élément s’écrit avec des parenthèses, mais on peut préférer le constructeur explicite.

In [40]:
tuple()

()

In [39]:
latlon: tuple = 43.6, 1.45
latlon

(43.6, 1.45)

In [41]:
1,

(1,)

In [42]:
# tuple unpacking
lat, lon = latlon
lat

43.6

In [44]:
lat, _ = latlon  # variable muette

Le déballage requiert autant d’éléments dans la partie gauche que dans la partie droite du signe égal. Si tous les champs ne sont pas nécessaires à gauche, on utilise généralement la variable muette _ . L’opérateur préfixe * permet de grouper plusieurs variables.

In [45]:
dix = tuple(range(10))
dix

(0, 1, 2, 3, 4, 5, 6, 7, 8, 9)

In [48]:
zero, *autres, huit, neuf = dix

In [49]:
zero

0

In [50]:
autres

[1, 2, 3, 4, 5, 6, 7]

In [51]:
huit, neuf

(8, 9)

### Listes

La liste est un conteneur séquentiel de valeurs hétérogènes. C’est un objet mutable : on peut en modifier le contenu à tout moment. Cette structure très intuitive, munie d’une algorithmique riche, notamment pour le tri et la recherche est souvent le choix par défaut des débutants pour tous les problèmes qu’ils doivent résoudre.

In [52]:
list()

[]

In [54]:
a: list = [1, "deux", 3.0]

In [55]:
a[0]

1

In [56]:
len(a)

3

In [57]:
a.append(1)

In [58]:
a

[1, 'deux', 3.0, 1]

In [59]:
a.count(1)

2

In [60]:
3 in a

True

In [61]:
a[1] = 2

In [62]:
a

[1, 2, 3.0, 1]

In [63]:
a.sort()

In [64]:
a

[1, 1, 2, 3.0]

In [65]:
a[1:3]

[1, 2]

On peut utiliser le mécanisme de *compréhension de liste* pour construire une liste facilement.  
Par exemple, pour
construire une liste contenant les carrés des valeurs comprises entre 1 et 5 :

In [66]:
[i for i in range(5)]
# similar to list(i for i in range(5))
# similar to list(range(5))

[0, 1, 2, 3, 4]

In [67]:
[str(i) for i in range(5)]

['0', '1', '2', '3', '4']

In [68]:
[i ** 2 for i in range(5)]

[0, 1, 4, 9, 16]

In [69]:
[i ** 2 for i in range(5) if i & 1 == 0]  # smarter than i%2 == 0

[0, 4, 16]

In [70]:
[x.upper() for x in "hello"]  # even with strings

['H', 'E', 'L', 'L', 'O']

Rappelons également le constructeur `sorted` qui crée une liste triée à partir d'une structure itérable ou d'un générateur:

In [71]:
sorted(i ** 2 for i in range(-5, 5))

[0, 1, 1, 4, 4, 9, 9, 16, 16, 25]

### Ensembles

L’ensemble (type set) est un conteneur séquentiel d’éléments uniques. On peut créer un ensemble par énumération de valeurs, à partir d’une structure qui permet l’itération (comme une liste, une chaîne de caractères, etc.) ou par compréhension.

In [72]:
set()

set()

In [135]:
s = {1}
s

{1}

In [74]:
set("coucou")

{'c', 'o', 'u'}

In [75]:
set(i ** 2 for i in (-2, -1, 0, 1, 2))

{0, 1, 4}

Un set peut-être modifié en ajoutant ou supprimant des valeurs. L’arithmétique des ensembles est accessible à l’aide des opérateurs usuels pour l’union | , l’intersection & et la différence - . L’opérateur + n’est pas défini.

In [76]:
s

{1, 2, 3}

In [77]:
s.add(4)
s

{1, 2, 3, 4}

In [78]:
s.remove(4)
s

{1, 2, 3}

In [79]:
s.pop(), s

(1, {2, 3})

In [81]:
s1 = set(range(3))
s2 = set(range(0, -3, -1))
s1, s2

({0, 1, 2}, {-2, -1, 0})

In [82]:
s1 | s2  # union

{-2, -1, 0, 1, 2}

In [83]:
s1 & s2  # intersection

{0}

In [84]:
s1 - s2  # différence

{1, 2}

### Dictionnaires

Les dictionnaires (type dict ) sont des tables de hash qui fonctionnent sur le modèle clé/valeur. Toutes les valeurs utilisées comme clé doivent être hashable, exactement comme pour les ensembles. Ce sont des structures mutables : on peut librement ajouter de nouvelles clés ou remplacer des valeurs. Comme ils sont utilisés de manière extensive à des emplacements critiques du cœur du langage, les dictionnaires sont particulièrement optimisées en Python.

In [89]:
tour_eiffel = {
    "latitude": 48.8583,
    "longitude": 2.2945,
    "nom": "Tour Eiffel",
    "ville": "Paris",
}

In [90]:
tour_eiffel["pays"] = "France"
tour_eiffel

{'latitude': 48.8583,
 'longitude': 2.2945,
 'nom': 'Tour Eiffel',
 'ville': 'Paris',
 'pays': 'France'}

In [87]:
point = dict(latitude=43.6, longitude=1.45)  # équivalent
point

{'latitude': 43.6, 'longitude': 1.45}

In [91]:
"latitude" in point

True

On peut utiliser l’opération .get() qui permet de définir une valeur par défaut si une clé n’est pas présente dans le dictionnaire :

In [92]:
altitude = point.get("altitude", 0)
altitude

0

In [93]:
point.keys()

dict_keys(['latitude', 'longitude'])

In [94]:
point.values()

dict_values([43.6, 1.45])

In [95]:
point.items()

dict_items([('latitude', 43.6), ('longitude', 1.45)])

In [96]:
dict((key.upper(), value) for (key, value) in point.items())

{'LATITUDE': 43.6, 'LONGITUDE': 1.45}

L’opérateur préfixe ** permet de décapsuler les dictionnaires. Il est couramment utilisé pour mettre à jour un dictionnaire ou pour en concaténer deux.

In [97]:
{**point, **{"pays": "France", "longitude": 1.45}}

{'latitude': 43.6, 'longitude': 1.45, 'pays': 'France'}

<div class="alert alert-warning">
<b>Exercice</b>: Construire <b>et documenter</b> une fonction qui calcule la liste des nombres premiers inférieurs ou égaux à n.
</div>

In [139]:
# write your code here!
def prime_until(n: int) -> tuple:
    """Renvoie la la liste des nombres premiers inférieurs ou égaux à n.
    
    >>> prime_until(100)
    {2, 3, 5, 7, 11, 13, 17, 19, 23, 29, 31, 37, 41, 43, 47, 53, 59, 61, 67, 71, 73, 79, 83, 89, 97}
    
    Si n est négatif, une exception de type AssertionError est levée.
    >>> prime_until(-1)
    AssertionError: n doit être un entier positif
    """
    assert n > 0, "n must be a positive integers"
    numbers = list(range(2,n+1))
    primes = set()
    while len(numbers) > 0:
        cur = numbers[0]
        primes.add(cur)
        numbers = list((num for num in numbers if num % cur != 0))
    return primes
    
print(prime_until(100))
# print(prime_until(-1))

{2, 3, 5, 7, 11, 13, 17, 19, 23, 29, 31, 37, 41, 43, 47, 53, 59, 61, 67, 71, 73, 79, 83, 89, 97}


In [132]:
# %load solutions/prime.py
import math


def prime(n: int) -> int:
    """Computes all prime numbers below n.
    Computes the sieve of Eratosthenes
    >>> prime(20)
    {1, 2, 3, 5, 7, 11, 13, 17, 19}
    """
    assert n > 0, "Positive integers only"
    p = set(range(1, n))
    for i in range(2, int(math.sqrt(n)) + 1):
        p = p - set(x*i for x in range(2, n//i + 1))
    return p


prime(20)

{1, 2, 3, 5, 7, 11, 13, 17, 19}

In [133]:
", ".join(str(i) for i in prime(100))

'1, 2, 3, 5, 7, 11, 13, 17, 19, 23, 29, 31, 37, 41, 43, 47, 53, 59, 61, 67, 71, 73, 79, 83, 89, 97'


<div class="alert alert-warning">
<b>Exercice:</b> Écrire un programme qui lit le fichier <code>00-lorem-ipsum.txt</code> et y compte le nombre d’occurrences de chaque mot.
</div>

On pourra partir du modèle suivant :
```python
with open("data/00-lorem-ipsum.txt") as f:
    print(f.readlines())
```

In [166]:
# write your code here!
import string
from collections import defaultdict

with open("data/00-lorem-ipsum.txt") as f:
#     print(f.readlines())
    d = defaultdict(int)
    for line in f.readlines():
        for char in string.punctuation:
            line = line.replace(char, " ") 
        for word in line.split():
            d[word] += 1
    
    for key in sorted(d.keys()):
        if d[key] > 5:  # make the output a bit lighter...
            print(f"{key}: {d[key]}")

Donec: 6
Mauris: 7
Pellentesque: 6
Sed: 9
Ut: 8
a: 9
ac: 12
amet: 11
ante: 10
arcu: 7
at: 7
augue: 6
blandit: 6
consectetur: 6
dui: 6
eget: 11
eros: 7
et: 14
ex: 6
facilisis: 9
id: 9
in: 11
ipsum: 6
lacus: 6
libero: 8
ligula: 8
magna: 8
mollis: 6
nec: 8
non: 15
nunc: 7
orci: 7
pulvinar: 6
purus: 7
quis: 7
sed: 8
sit: 11
sodales: 6
tincidunt: 8
tristique: 8
vel: 6
vitae: 8


In [168]:
# %load solutions/lorem_ipsum.py
import string

with open("data/00-lorem-ipsum.txt") as f:
    d = {}
    for x in f.readlines():
        for s in string.punctuation:  # !"#$%&\'()*+,-./:;<=>?@[\\]^_‘{|}~
            x = x.replace(s, " ")
        for p in x.split():
            if p in d.keys():
                d[p] += 1
            else:
                d[p] = 1

    for key in sorted(d.keys()):
        if d[key] > 5:  # make the output a bit lighter...
            print("{}: {}".format(key, d[key]))


In [160]:
# %load solutions/lorem_ipsum_alt.py
import string
from collections import defaultdict

with open("data/00-lorem-ipsum.txt") as f:
    d = defaultdict(int)
    for x in f.readlines():
        for s in string.punctuation:  # !"#$%&\'()*+,-./:;<=>?@[\\]^_‘{|}~
            x = x.replace(s, " ")
        for p in x.split():
            d[p] += 1

    for key in sorted(d.keys()):
        if d[key] > 5:  # make the output a bit lighter...
            print(f"{key}: {d[key]}")


Donec: 6
Mauris: 7
Pellentesque: 6
Sed: 9
Ut: 8
a: 9
ac: 12
amet: 11
ante: 10
arcu: 7
at: 7
augue: 6
blandit: 6
consectetur: 6
dui: 6
eget: 11
eros: 7
et: 14
ex: 6
facilisis: 9
id: 9
in: 11
ipsum: 6
lacus: 6
libero: 8
ligula: 8
magna: 8
mollis: 6
nec: 8
non: 15
nunc: 7
orci: 7
pulvinar: 6
purus: 7
quis: 7
sed: 8
sit: 11
sodales: 6
tincidunt: 8
tristique: 8
vel: 6
vitae: 8


In [172]:
# %load solutions/lorem_ipsum_alt2.py
import string
from collections import Counter

lw=[]
with open("data/00-lorem-ipsum.txt") as f:
    for l in f.readlines():
        for s in string.punctuation:  # !"#$%&\'()*+,-./:;<=>?@[\\]^_‘{|}~
            l = l.replace(s, " ")
        lw+=[w for w in l.split()]
        
c=Counter(lw)
print(c.most_common(5))

[('non', 15), ('et', 14), ('ac', 12), ('sit', 11), ('amet', 11)]
