# TP n°1 - Prise en main de Python

## Introduction

**Objectif de ce premier TP :**
- Se familiariser avec le langage Python;
- Utiliser Python pour la data science.

**Références :**
- [Site du langage Python](https://www.python.org)
- [Documentation Python](https://docs.python.org/fr/3.8/library/index.html)

**Quelques caractéristiques de Python :**
- Langage de programmation objet;
- Typage fort : la conformité aux types est vérifiée;
- Typage dynamique : le type est déterminé à l'exécution, une déclaration explicite du type d'une variable n'est pas nécessaire, Python attribue le type à la variable selon sa valeur ;
- Sensible à l'indentation : les structures de contrôle n'emploient pas de délimiteurs (comme `begin` et `end`, ou `{` et `}`), tout est basé sur l'indentation;
- Sensible à la casse : différence entre majuscules et minuscules.

**Quelques tutoriels supplémentaires :**
- [tutoriel Python officiel en français](https://docs.python.org/fr/3/tutorial/)
- [Learn Python - Free Interactive Python Tutorial](https://www.learnpython.org/)

## Utilisation du help
Cette fonction permet d'avoir l'aide sur une fonction donnée.

In [1]:
help(str)

Help on class str in module builtins:

class str(object)
 |  str(object='') -> str
 |  str(bytes_or_buffer[, encoding[, errors]]) -> str
 |  
 |  Create a new string object from the given object. If encoding or
 |  errors is specified, then the object must expose a data buffer
 |  that will be decoded using the given encoding and error handler.
 |  Otherwise, returns the result of object.__str__() (if defined)
 |  or repr(object).
 |  encoding defaults to sys.getdefaultencoding().
 |  errors defaults to 'strict'.
 |  
 |  Methods defined here:
 |  
 |  __add__(self, value, /)
 |      Return self+value.
 |  
 |  __contains__(self, key, /)
 |      Return key in self.
 |  
 |  __eq__(self, value, /)
 |      Return self==value.
 |  
 |  __format__(self, format_spec, /)
 |      Return a formatted version of the string as described by format_spec.
 |  
 |  __ge__(self, value, /)
 |      Return self>=value.
 |  
 |  __getattribute__(self, name, /)
 |      Return getattr(self, name).
 |  
 |  

## Variables et types de données

Les types primitifs dans Python sont :
- bool : booléen (True ou False)
- int : entier.
- float : nombre flottant qui a la précision d'un double.
- str : chaîne de caractère (string).
- tuple (vecteur)
- list

La conversion d'un type à un autre se fait à travers les fonctions:
- str()
- int()
- float()
- bool()
- tuple()
- list()

In [2]:
# Affectation des valeurs aux variables
x = 1
print(f"x = {x} et le type de x est: {type(x)}")

x = 1 et le type de x est: <class 'int'>


In [22]:
# Calculer avec des variables
a = 10
b = 2
c = a + b # somme
d = a - b # soustraction
e = a * b # multiplication
f = a ** b # a exponentiel b
g = a % b # modulo (reste de la division entière de a par b)
h = a / b # division

## Les chaînes de caractères

In [23]:
chaine = "bonjour les amis"
print(chaine)

# Opérations sur les string
print(f"chaine * 2 : {chaine * 2}")
print(f"concaténation : {chaine + ', bonne année 2023'}")
print(f"ma chaine '{chaine}' contient la lettre z : {'z' in chaine}")
print(f"premier caractère de ma chaine: {chaine[0]}")
print(f"3 premiers caractères de ma chaine: {chaine[0:3]}")

# Quelques méthodes
chaine.upper() # to uppercase
chaine.lower() # to lowercase
chaine.count('z') # compte les occurances de z dans la chaine
chaine.replace('b', 'B')
chaine.capitalize()
chaine.strip() # supprimer les espaces

bonjour les amis
chaine * 2 : bonjour les amisbonjour les amis
concaténation : bonjour les amis, bonne année 2023
ma chaine 'bonjour les amis' contient la lettre z : False
premier caractère de ma chaine: b
3 premiers caractères de ma chaine: bon


'bonjour les amis'

Si l'on veut savoir quelles sont les méthodes de l'objet `x`, on peut utiliser la fonction `dir` :

In [5]:
dir(x)
# Affiche ['__add__', '__class__', ... 'count', 'index']

['__abs__',
 '__add__',
 '__and__',
 '__bool__',
 '__ceil__',
 '__class__',
 '__delattr__',
 '__dir__',
 '__divmod__',
 '__doc__',
 '__eq__',
 '__float__',
 '__floor__',
 '__floordiv__',
 '__format__',
 '__ge__',
 '__getattribute__',
 '__getnewargs__',
 '__gt__',
 '__hash__',
 '__index__',
 '__init__',
 '__init_subclass__',
 '__int__',
 '__invert__',
 '__le__',
 '__lshift__',
 '__lt__',
 '__mod__',
 '__mul__',
 '__ne__',
 '__neg__',
 '__new__',
 '__or__',
 '__pos__',
 '__pow__',
 '__radd__',
 '__rand__',
 '__rdivmod__',
 '__reduce__',
 '__reduce_ex__',
 '__repr__',
 '__rfloordiv__',
 '__rlshift__',
 '__rmod__',
 '__rmul__',
 '__ror__',
 '__round__',
 '__rpow__',
 '__rrshift__',
 '__rshift__',
 '__rsub__',
 '__rtruediv__',
 '__rxor__',
 '__setattr__',
 '__sizeof__',
 '__str__',
 '__sub__',
 '__subclasshook__',
 '__truediv__',
 '__trunc__',
 '__xor__',
 'as_integer_ratio',
 'bit_length',
 'conjugate',
 'denominator',
 'from_bytes',
 'imag',
 'numerator',
 'real',
 'to_bytes']

### Remarque

Les lignes commençant par `#` sont des **commentaires**.

Il est possible d'injecter le contenu d'une variable dans une chaîne de caractères en utilisant la fonction `format` :

In [6]:
# .format() va remplacer le contenu des accolades
message = "x vaut {}".format(x)
print(message)

x vaut 1


On peut également utiliser le format court (*f-strings*, Python 3.6 et ultérieur) :

In [7]:
x = 10
print(f"La variable x vaut {x}")

La variable x vaut 10


In [35]:
entier = 1
reel = 3.14
chaine = "pi"

Un *tuple* peut être composé de données de types différents :

In [38]:
v = (entier, reel, chaine)
print(v)
# (1, 3.14, 'pi')
print(type(v))
# <class 'tuple'>

(1, 3.14, 'pi')
<class 'tuple'>


La fonction `type()` permet d'examiner le type d'un objet.

### Question

Affichez le type des variables `entier`, `reel` et `chaine`.

In [40]:
print(f" Type entier : {type(entier)}\n Type reel : {type(reel)}\n Type chaine : {type(chaine)}")
print([type(i) for i in v])

 Type entier : <class 'int'>
 Type reel : <class 'float'>
 Type chaine : <class 'str'>
[<class 'int'>, <class 'float'>, <class 'str'>]


### Correction

Les délimiteurs d'une chaîne de caractères peuvent être soit les `"`, soit les `'` ; ce qui compte c'est la cohérence entre le début et la fin de la chaîne :

In [None]:
name = "toto"
print(name)
# 'toto'
name = 'toto'
print(name)
# 'toto'
name = "toto' # Erreur, il faut utiliser les mêmes guillemets pour ouvrir et fermer la chaîne !!

Il est possible de forcer la conversion d'un type à un autre en appelant la fonction du même :

In [None]:
nombre = 1764
chaine = str(1764)
print(nombre, type(nombre))
print(chaine, type(chaine))

In [None]:
chaine = "42.3"
nombre = float(chaine)
print(chaine, type(chaine))
print(nombre, type(nombre))

## Les listes

Les types de base modifiables (*mutable*) sont les **listes** et les **dictionnaires**.

In [None]:
liste = [entier, reel, chaine]
print(liste)
print(type(liste))
print(liste[0])
print(liste[2])
print(liste[3]) # Erreur !

Les indices négatifs permettent d'accéder aux éléments en commençant par la fin de la liste :

In [None]:
print(liste[-1])
print(liste[-2])

Le symbole `:` permet d'effectuer du *slicing*, c'est-à-dire de découper des sous-listes :

In [None]:
print(liste[:1]) # Extrait la sous-liste de tous les éléments jusqu'à 1 (exclu)
print(liste[:2]) # Extrait la sous-liste de tous les éléments jusqu'à 2 (exclu)

print(liste[:-1]) # Extrait la sous-liste jusqu'au dernier élément (exclu)
print(liste[:3])
print(liste[0:]) # Extrait la sous-liste à partir du premier élément (inclus)
print(liste[1:]) # Extrait la sous-liste à partir du deuxième élément (inclus)

Plusieurs méthodes utiles pour les listes, examinez-les avec `help(liste)` :

In [None]:
# Concaténation de listes
print(liste + liste)

In [None]:
# Longueur d'une liste
len(liste)

In [None]:
# Minimum et maximum d'une liste
print(min([3, 10, 1, 5, 24]))
print(max([1.24, -12.0, 5.99]))

# Attention, erreur si les éléments ne sont pas comparables :
print(min(['pi', '12', 3, 1]))
# Traceback (most recent call last):
#   File "<stdin>", line 1, in <module>
# TypeError: '<' not supported between instances of 'int' and 'str'

In [None]:
# Nombre d'occurrences d'un élément dans une liste
liste = [3.14, 12, 0, 3.14, 9, 3.14, 7]
liste.count(3.14)

In [None]:
# Tri d'une liste en ordre croissant
liste.sort()
print(liste)
# Avec copie
liste2 = sorted(liste)

In [None]:
# Suppression d'un élément de la liste
del liste[1]
print(liste)

In [None]:
# Cherche la position de l'élément dans la liste
print(liste.index(3.14))
# 1
print(liste.index(9))
# 4

In [None]:
# Renverse une liste
liste.reverse()
print(liste)
# [12, 9, 7, 3.14, 3.14, 0]

Considérons une nouvelle liste :

In [70]:
liste = [0, 2, 1, 9, 4, 5, 6, 8, 7, 3]


[0, 1, 2, 3, 4, 5, 6, 7, 8, 9]


### Question

En utilisant les fonctions vues ci-dessus, transformez `liste` pour obtenir les chiffres de **1 à 9 dans l'ordre décroissant**.

In [64]:
print([i for i in reversed(sorted(liste))if i > 1])
print([i for i in sorted(liste, reverse=True) if i > 1])

[9, 8, 7, 6, 5, 4, 3, 2]
[9, 8, 7, 6, 5, 4, 3, 2]


### Correction

## Les dictionnaires

Les dictionnaires sont des tableaux associatifs, autrement dit des ensembles de paires `{clé : valeur}`, par exemple :

In [None]:
cours = { 'data mining' : 2022, 'ml' : 2023, 'cloud' : 2024 }
print(cours)
print(cours['data mining'])
cours['software']  # Erreur ! La clé n'existe pas
# Traceback (most recent call last):
#  File "<stdin>", line 1, in <module>
# KeyError: 'software'

Il est possible de mélanger les types dans un dictionnaire (dans les clés et dans les valeurs), ainsi que d'avoir des valeurs qui sont des tuples ou des listes (ou des listes de listes, etc.) :

In [None]:
dico = { 1 : 'toto', 'titi' : 10, 1000 : (1,2,3) }

In [47]:
dico = { 1 : 'toto', 'titi' : 10, 1000 : [(1,2,3),['A','b']]}

Plusieurs méthodes spécifiques aux dictionnaires peuvent être utiles, par exemple :

In [48]:
print(dico.keys())

print(dico.values())

print(dico.items())

dict_keys([1, 'titi', 1000])
dict_values(['toto', 10, [(1, 2, 3), ['A', 'b']]])
dict_items([(1, 'toto'), ('titi', 10), (1000, [(1, 2, 3), ['A', 'b']])])


### Question

Que retourne chacune de ces méthodes ?

La méthode keys renvoie les clés du dictionnaire sous forme d'une liste.
La méthode values renvoie les valeurs du dictionnaire sous forme d'une liste.
La méthode items renvoie les paires clé-valeur du dictionnaire sous forme d'une liste de tuples.

### Correction



Pour tenter de clarifier la différence entre ce qui est immuable et ce qui est modifiable, prenons l'exemple suivant :

In [None]:
valeur = 1
liste = []
print(liste)
# []
liste.append(valeur)
print(liste)
# [1]
meme_liste = liste
print(meme_liste)
# [1]
meme_liste.append(3)
valeur = 2
print(valeur)
# 2
print(liste)
# [1, 3]
print(meme_liste)
# [1, 3]

Comment expliquer les résultats ? Rappelons d'abord que les « variables » de type `int` sont immuables, alors que celles de type `list` sont modifiables.

Dans la première ligne (`valeur = 1`), une association est faite entre le *nom* `valeur` et un objet qui est l'entier `1`. La seconde ligne (`liste = []`) fait une association entre le nom `liste` et un objet qui est une liste vide. L'appel de la méthode `append` dans `liste.append(valeur)` modifie cet objet liste vide en lui ajoutant l'objet désigné par le nom `valeur`. Dans `meme_liste = liste` on ajoute un nouveau nom pour l'objet désigné par `liste`.

L'appel `meme_liste.append(3)` modifie l'objet désigné par `meme_liste` (et aussi par `liste`) en lui ajoutant l'objet `3` (un entier). Avec `valeur = 2`, le nom `valeur` n'est plus associé à l'objet auquel il était associé avant (un entier `1`) mais à un nouvel objet (un entier `2`) ; cela ne peut avoir d'impact sur l'objet désigné par `liste` ou `meme_liste`, qui est une liste (vide au départ, ensuite un objet `1` lui a été ajouté, et enfin un objet `3`).

Ceci devrait permettre de comprendre aussi le passage de paramètres aux [Fonctions, fonctions anonymes](#fonctions).

## Structures de contrôle

Pour le contrôle de l'exécution d'un programme il est possible d'utiliser les tests de conditions avec `if` / `elif` / `else` et les boucles `for` ou `while`. Remarquer l'utilisation de `:` avant les lignes qui exigent un niveau d'indentation supérieur (et **obligatoire** !).

Les boucles `for` permettent de parcourir n'importe quel itérable, typiquement des listes :

In [None]:
liste = range(6)

for valeur in liste:
    if valeur in [0, 2, 4]:
        # "break" quitte la boucle sans considérer "else"
        # "continue" démarre l'itération suivante
        continue
    else:
        print(valeur,' : impaire')

Les boucles `while` s'exécutent tant qu'une condition est vérifiée :

In [None]:
i = 5
while i > 0:
    print(i)
    i = i-1

### Question

À l'aide d'une boucle, écrire un code qui, pour chaque entier impair x entre 1 et 13, affiche x^2.

In [74]:
print([f"{x}^2 : {x**2}" for x in range(1,14) if x%2 != 0])

['1^2 : 1', '3^2 : 9', '5^2 : 25', '7^2 : 49', '9^2 : 81', '11^2 : 121', '13^2 : 169']


### Correction

Il n'y a pas d'équivalent de `switch` en Python, il faut employer `if` / `elif` / `else` :

In [None]:
if liste[1] == 0:
    print('liste[1] est 0')
elif liste[1] == 1:
    print('liste[1] est 1')
else:
    print('?')

Création et manipulation de listes avec la [compréhension de liste](https://docs.python.org/fr/3/tutorial/datastructures.html#list-comprehensions) (*list comprehension*) :

In [57]:
l1 = [1, 2]
l2 = [1, 2, 3]
[x * y for x in l1 for y in l2]

[1, 2, 3, 2, 4, 6]

Forme équivalente :

In [58]:
print([x * y for x in l1 for y in l2])

[1, 2, 3, 2, 4, 6]


Autres exemples :

In [59]:
print([x * y for x in l1 if x > 1 for y in l2])
print(any([i % 3 for i in [x * y for x in l1 for y in l2]]))

[2, 4, 6]
True


### Question

Expliquez ce que fait chacun de ces exemples.

### Réponse

Le premier exemple crée une liste de x*y pour chaque x dans l1 si x est supérieur à 1 pour chaque y dans l2.
Le deuxième exemple retourne True si il y a au moins un élément dans la liste. La liste est composé des éléments présent dans la liste.

### Correction


### Question

À partir des listes suivantes de mois et respectivement de nombres de jours correspondants, construisez un dictionnaire qui associe à chaque mois son nombre de jours (années non bisextiles).

In [79]:
mois = ['janvier','février','mars','avril','mai','juin','juillet','août','septembre','octobre','novembre','décembre']
nbJours = [31, 28, 31, 30, 31, 30, 31, 31, 30, 31, 30, 31]

dico = { mois[i] : nbJours[i] for i in range(len(mois)) }

### Correction


In [82]:
var = dict(zip(mois, nbJours))

TypeError: 'dict' object is not callable


<a id='fonctions'></a>

## Fonctions, fonctions anonymes

La définition d'une fonction commence par `def`. Une fonction peut avoir zéro, un ou plusieurs arguments. Les arguments optionnels possèdent des valeurs par défaut. Une fonction peut retourner une valeur (ou un tuple, donc plusieurs valeurs) avec `return` ou non.

Le premier exemple ci-dessous devrait aider à comprendre la transmission des paramètres :

In [None]:
def fonction(immuable, modifiable, optionnel='valeur par défaut'):
    immuable = 'new'
    modifiable.append(4)
    print(immuable, modifiable, optionnel)

chaine1 = 'old'
liste = [1, 2]
chaine2 = 'nouvelle valeur'
fonction(chaine1, liste, chaine2)
# new [1, 2, 4] nouvelle valeur

Notre variable `liste` a été modifiée à l'intérieur de la fonction mais pas la variable `chaine1` car les chaînes de caractère sont immuables :

In [None]:
print(liste)
# [1, 2, 4]
print(chaine1)
# 'old'
fonction(chaine1, liste)
# new [1, 2, 4, 4] valeur par défaut

L'utilisation de `print` plutôt que l'appel direct permet de voir que la fonction ne retourne rien (`None`) :

In [None]:
print(fonction(chaine1, liste, chaine2))
# new [1, 2, 4, 4, 4] nouvelle valeur
# None

Ici, `liste` est un nom associé à un objet liste, donc modifiable ; à chaque appel, la fonction ajoute un élément à cet objet. Le nom `chaine1` est associé à un objet de type chaîne de caractères, donc immuable ; dans la fonction, le nom `chaine1` est **localement** associé à un nouvel objet, la chaîne `'new'`, mais cela n'a pas d'impact sur l'association de `chaine1` à l'objet `'old'` à l'extérieur de la fonction.

L'exemple suivant montre une fonction qui retourne un tuple :

In [None]:
def fonction2(immuable, modifiable, optionnel='valeur par défaut'):
    immuable = 'new'
    modifiable.append(4)
    return immuable, modifiable, optionnel

chaine1 = 'old'
liste = [1, 2]
chaine2 = 'nouvelle valeur'
print(fonction2(chaine1, liste, chaine2))
# ('new', [1, 2, 4], 'nouvelle valeur')

### Question

Écrire une fonction `last_number(x)` qui prend en paramètre un int ou float et renvoie son dernier chiffre. Par exemple, `last_number(0.32)` renvoie 2 et `last_number(13)` renvoie 3.

In [31]:
def last_number(x):
    return int(str(x)[len(str(x))-1])

4


### Correction

2


Les fonctions lambda ou [fonctions anonymes](https://docs.python.org/fr/3/tutorial/controlflow.html#lambda-expressions) comportent une seule instruction, par exemple :

In [None]:
somme = lambda x, y: x + y
print(somme(2,3))
# 5

Cette définition est une forme abrégée de

In [None]:
def somme(x, y): return(x + y)

Il n'est pas indispensable de donner un nom à une fonction lambda :

In [18]:
(lambda x, y: x + y)(4,6)
# 10

10

Une fonction lambda sans nom est qualifiée d'anonyme.

### Question

Écrire une fonction lambda qui renvoie la plus grande des deux valeurs numériques passées en entrée.

In [62]:
(lambda x,y : max(x,y))(4,6)

6

### Correction

6

## Exceptions

Python propose un traitement standard des exceptions. L'exemple suivant indique la syntaxe à employer.

In [25]:
def division_par(n):
        try:  # instruction susceptible de lever une exception
            print(1 / n)
        except ZeroDivisionError:  # si l'exception est levée
            print('Division par 0 !')
        else:  # sinon
            pass
        finally:
            # exécuté après le bloc "try" et le
            #  traitement des éventuelles erreurs
            print('    fini...')

division_par(1)
division_par(0)

1.0
    fini...
Division par 0 !
    fini...


### Question

Ajouter une exception au code suivant de sorte à ce qu'il affiche *« Ce mot est absent »* si la clé n'existe pas dans le dictionnaire.

### Correction

In [84]:
d = {"titi" : "i", "tata": "a", "tutu": "u"}
mots = ["tata", "tete", "titi", "toto", "tutu"]
for mot in mots : 
    try : 
            print(d[mot])
    except KeyError: 
        print("Ce mot est absent : {}".format(mot))
# TODO

a
Ce mot est absent : tete
i
Ce mot est absent : toto
u


## Classes et héritage

En Python, on peut définir des variables partagées par toutes les instances d'une classe.
**Note:** L'héritage multiple est possible.

In [None]:
class NouvelleClasse():
    attribut_de_classe = ...

    def __init__(self):  # constructeur
        # ...
        pass

    def methode(self, arg1, arg2, arg3):  # methode de l'objet
        # ...
        pass

    # ...

class NouvelleClasseHeritage(NouvelleClasse):

    # ...
    pass

Création d'une nouvelle instance de la classe :

In [None]:
instanceNouvelleClasse = NouvelleClasse()

## Entrées et sorties

La fonction native `open` permet d'ouvrir un flux de données depuis un fichier.

Cette fonction prend deux arguments : un chemin vers le fichier et le mode de lecture (lecture, écriture, binaire, etc.).

Exemple d'accès à un fichier texte :

In [None]:
# Ouverture du fichier en mode écriture ('w' pour 'write')
fichierTexte = open('texte.txt', 'w')
fichierTexte.write('Mon texte à moi\n')
fichierTexte.close()

# Ouverture du fichier en mode lecture
fichierTexte = open('texte.txt')
print(fichierTexte.read())
# Mon texte à moi
fichierTexte.close()

L'instruction `with` permet de ne pas avoir à fermer manuellement le fichier en utilisant un [gestionnaire de contexte](https://docs.python.org/fr/3/reference/compound_stmts.html?highlight=with#the-with-statement).

In [30]:
# le mode 'a' permet d'ajouter des lignes sans écraser le fichier ('append')
with open('texte.txt', 'a') as fichierTexte:
    fichierTexte.write('Et une ligne de plus\n')


with open('texte.txt') as fichierTexte:
    print(fichierTexte.read())
    # Mon texte à moi
    # Et une ligne de plus

Et une ligne de plus
Et une ligne de plus



Dans ces exemples, les fichiers sont ouverts dans le répertoire dans lequel Python a été lancé. Il est possible de spécifier le chemin avant le nom du fichier.

### Question

Quelle conséquence a la suppression du second argument de la fonction `open` ?

Le code ne fonctionnera pas car le mode d'ouverture par défaut est `'r'` (lecture) donc on ne peut pas écrire dans le fichier.

### Correction


# TP suivant ?
TP n°2: Prise en main des librairies Pandas et Numpy.
