![./pics/logo_ut1.jpg](./pics/logo_ut1.jpg)
# Master 1 Ingénierie Métier (IM) : Programmation Structurée 2 2022/2023: 

## Gestion des fichiers et journalisation

Equipe pédagogique: 
* Sophie Martinez - Sophie.Martinez@ut-capitole.fr
* Laurent Marsan - Laurent.Marsan@ut-capitole.fr
* Nicolas Verstaevel - Nicolas.Verstaevel@ut-capitole.fr

# Au module précédent, nous avons vu:
* ✔️ Listes et dictionnaires sont des structures de données avec des complexités différentes
* ✔️ Dans le cas générale, on préfère l'utilisation de dictionnaires car les opérations y sont plus rapides 
* ✔️ Un module est un fichier python permettant de regrouper plusieurs fonctions
* ✔️ Les modules peuvent être **importés** avec la commande **import**
* ✔️ Un paquetage permet d'importer plusieurs modules. 

# Objectifs du module

Au premier semestre, nous avons appris à écrire des algorithmes en Python à l'aide d'un Jupyter Notebook. Pour alimenter nos algorithmes en données, nous procédions à des saisies utilisateurs grâce à la fonction ```input()```. En sortie de nos algorithmes, nous procédions à un affichage dans le terminal à l'aide de la fonction ```print()```

Dans un programme informatique moderne, l'intéraction avec les données (en entrée ou en sortie) se fait par l'intermédiaire de fichiers. Nous allons donc voir comment intéragir avec le système d'exploitation (```os```: *Operating System*) pour explorer ou construire une arborecence de fichiers et accéder en lecture et écriture à ceux-ci. 

Nous verrons que l'intéraction avec les fichiers peut être source d'erreurs. Pour permettre la tracabilité du comportement de notre logiciel (et nottament historiser les erreurs) et améliorer sa qualité et sa maintenance, nous allons voir comment mettre en place une ```journalisation``` pour créer des fichiers dans lequel on va créer un historique des évènements normaux et anomaux survenus au cours du fonctionnement de notre application.

<div class="alert alert-block alert-warning">
<b>⚠️:</b> Ce module nécessite que vous maitrisiez quelques notions étudiées dans l'UE Architecture et Réseaux (OS, chemin relatif/absolu,...)
</div>

# Plan du module

1) Le module ```os``` pour intératigir avec le system
2) Lecture et écriture de fichiers avec ```open```
3) La journalisation avec le module ```logging```
4) Mise en pratique

# Le module ```os```

Le module ```os``` est un module *built-in* de Python qui fournit un ensemble d'opérations courantes permettant d'intéragir avec le système d'exploitation. Ces opérations sont indépendantes du système d'exploitation, c'est à dire qu'elles fonctionnent aussi bien sur Windows, Unix ou macOS.

[Documentation du module ```os```](https://docs.python.org/fr/3/library/os.html)

Pour utiliser le module ```os``` il faut procéder à son importation:


In [4]:
import os

# Rappel, vous pouvez accéder à la documentation du module à l'aide de la commande help
# help(os)

Il est possible par exemple, d'afficher le nom du système d'exploitation:

In [9]:
print(os.name)

nt


* ```posix```: pour les systèmes UNIX
* ```nt```: pour les systèmes Windows
* ```java```: pour les machines virtuels Java

Ce qui nous intéresse dans notre cas est la capacité du module ```os``` à intéragir avec les répertoires, les fichiers, et de pouvoir manipuler cette arboresence. 

## Comprendre et manipuler l'arboresence des fichiers Python

Lorsque vous lancez un script Python (ou un Jupyter Notebook), le répertoire courant du programme est celui dans lequel il est lancé. Pour connaitre le répertoire courant, on utilise la commande ```os.getcwd()```:

In [10]:
print(os.getcwd())

C:\Users\nvers\Documents\GIT\M1IM_ProgStruct2\CM\Module2


```os.getcwd()``` renvoie une chaîne de caractères représentant le répertoire de travail actuel. Par défault, c'est l'endroit où vous avez mis votre script python (ou votre notebook).

Il est possible de changer le répertoire courant à l'aide de la commande ```os.chdir(path)```. Attention, le path doit pointer vers un chemin existant, sinon des erreurs seront levées.

```os.chdir(path)```
* Change le répertoire de travail actuel par path.
* Cette fonction peut lever ```OSError``` et des sous-classes telles que ```FileNotFoundError```, ```PermissionError``` et ```NotADirectoryError```.

De manière générale, on évitera de changer le répertoire courant. On préférera la par chemin relatifs pour décrire une arboresence depuis le fichier Python. 

Il est possible de créer des répertoires pour définir une arbosence de dossiers à l'aide des commandes ```os.mkdir(path)``` et ```os.makedirs(path)```.

```os.mkdir(path)``` permet de créer un répertoire à l'adresse passée en paramètre. Si le dossier existe déjà, une erreur de type ```FileExistsError``` est levée. Si le chemin n'est pas bon, une erreur de type ```FileNotFoundError```est levée.

Par exemple, nous voulons créer un répertoire nommé ```Repertoire1```:

In [11]:
os.mkdir("Repertoire1")

Vous pouvez vérifier que votre répertoire s'est bien créé à côté de votre fichier de notebook!

Si on relance cette commande une seconde fois:

In [12]:
os.mkdir("Repertoire1")

FileExistsError: [WinError 183] Impossible de créer un fichier déjà existant: 'Repertoire1'

On obtient un message d'erreur car le répertoire est déjà existant.

Il est possible de vérifier si un chemin existe à l'aide de la methode ```os.path.exists()```

In [37]:
print ("Est-ce que ce fichier existe?:"+str(os.path.exists('toto.txt')))
print ("Est-ce que ce fichier existe?::" + str(os.path.exists('./A/a1.txt')))
print ("Est-ce que ce répertoire existe?:" + str(os.path.exists('myDirectory')))

Est-ce que ce fichier existe?:False
Est-ce que ce fichier existe?::True
Est-ce que ce répertoire existe?:False


Similairement, on peut tester si un chemin pointe vers un dossier ou un fichier:

In [40]:
print ("Est-ce un fichier?" + str(os.path.isfile('a1.txt')))
print ("Est-ce un dossier?" + str(os.path.isdir('A')))

Est-ce un fichier?False
Est-ce un dossier?True


<div class="alert alert-block alert-info">
<b>Rappel sur les exceptions:</b> On a vu au premier semestre qu'un programme informatique peut lever des exceptions. Ces exception sont là pour signaler un évènement spécifique qui doit être intercepté par le code pour être traité. Si aucun mécanisme d'interception n'est mis en place, on dit que l'erreur se propage (elle remonte l'ordre des appels de fonction). Si une erreur est progagée jusqu'au programme principal, le programme s'arrête et affiche la *traceback*: c'est le message d'erreur. 
    
Vous pouvez relire le cours sur le [debuggage, les assertions et la gestion des exceptions](https://github.com/nverstaevel/M1IM_PgStruct1/blob/main/CM/105_debugage_assert_et_exception.ipynb)
</div>

Pour gérer les exceptions en Python, on utilise le mécanisme ```try: ... except:```. Par exemple, dans notre cas, on aurait pu écrire:

In [13]:
try: 
    os.mkdir("Repertoire1")
except FileExistsError:
    print("Attention, le dossier que vous essayez de créer n'existe pas")

Attention, le dossier que vous essayez de créer n'existe pas


Evidemment, le traitement de l'exception dépend de la tâche que l'on est en train d'effectuer. Parfois, il n'est pas possible de continuer le programme car un fichier critique est manquant.

La commande ```os.mkdirs(path)``` permet quand à elle de créer récursivement une arborescence de dossier. Par exemple, je souhaite maintenant construire l'arboresecence suivante: ```Repertoire1->Repertoire1.1->Repertoire1.1.1```

In [15]:
os.makedirs("Repertoire1/Repertoire1.1/Repertoire1.1.1")

Vous pouvez vérifier dans votre répertoire que l'arboresence est bien créé. De la même manière que ```os.mkdir(path)```, ```os.makedirs(path)``` peut lever des erreurs.

La fonction ```os.listdir(path)``` retourne une liste contenant les entrées d'un répertoire donnée. Par exemple, on peut lister ce qui est contenu dans le répertoire courant:

In [16]:
path = '.'
 
files = os.listdir(path)
for name in files:
    print(name)

.ipynb_checkpoints
2_fichiers_et_logs.ipynb
A
pics
Repertoire1


<div class="alert alert-block alert-info">
<b>Rappel sur les chemins: </b></br> 
    . : répertoire courant </br> 
    .. : répertoire parent</br> 
    .\fichier1.txt: chemin relatif vers le fichier1 (c'est à dire chemin à partir du dossier courant)</br> 
    C:\Users\nvers\Documents\GIT\M1IM_ProgStruct2\CM\Module2\fichier1.txt: chemin absolu vers le fichier (on ne se réfère plus à l'emplacement courant mais que l'on remonte directement à la racine pour ensuite préciser le chemin complet)</br> 
</div>

Pour parcourir l'ensemble de l'arboresence, on peut utiliser la méthode ```os.walk(path)```. La méthode ```os.walk(path)``` retourne 3 éléments: le nom du répertoire racine, une **liste** des noms des sous-répertoires et une **liste** des noms de fichiers du répertoire en cours. 

Par exemple, je vous ai créé une arboresecence de dossier et fichiers dans le repertoire "A". Listons son contenu: 

In [35]:
path = ".\A"

for root, directories, files in os.walk(path):  
    for file in files:
        print(root+"\\"+file) # On liste les fichiers et leur chemin

.\A\a1.txt
.\A\B\b1.txt
.\A\B\b2.txt
.\A\B\b3.txt
.\A\C\c1.txt
.\A\C\c2.txt
.\A\C\D\d1.txt


On peut renommer ou deplacer un fichier à l'aide de la commande ```os.rename(src,dst)``` où ```src``` est le chemin vers le fichier à renommer et ```dst``` la nouvelle destination.

Enfin, les commandes ```os.remove(path)``` et ```os.rmdir(path)``` permettent de supprimer respectivement un fichier ou un dossier.

In [28]:
os.mkdir("Test1") # Création du répertoire Test1
os.rmdir("Test1") # Suppression du répertoire

Attention, si le dossier n'existe pas ou n'est pas video, une erreur ```FileNotFoundError``` ou une erreur ```OSError``` est levée. 

## Pour résumer

| Fonction du module ```os``` |   Description	|
|---	|---	|
|  os.getcwd() 	|   Retroune le répertoire courrant	|
| os.path.exists(path) | Retourne vrai si le chemin existe, faux sinon |
| os.path.isfile(path) | Retourne vrai si le chemin est un fichier, faux sinon |
| os.path.isdir(path) | Retourne vrai si le chemin est un dossier, faux sinon |
|  os.mkdir(path) 	|  Créé un nouveau répertoire  	|
|  os.makedirs(path) 	|  Créé une nouvelle arborescence 	|
|  os.listdir(path)     | Liste les entrées d'un répertoire donné |
| os.walk(path) | Parcour l'arborescence à partir du répertoire donné | 

# Lecture et écriture de fichier avec ```open``` et ```close```

Comme tout langage informatique, Python permet de manipuler des fichiers. Les fonctions pour manipuler un fichier sont indépendante du système d'exploitation, assurant ainsi la portabilité du code.

Toutes les opérations de manipulation d'un fichier, qu'il s'agisse de lecture, écriture, supression ou création, sont suceptible d'échouer et donc de lever une erreur de type ```OSError``` ou une erreur dérivée.

Il faudra donc redoubler de vigilance et à la fois vérifier l'existence et le type des chemins avec lesquels ont travaille, mais aussi utiliser les mécanismes de gestion des exceptions. Nous allons voir que Python nous facilite le travail pour celà.

## Ouvrir un fichier avec ```open```

La fonction ```open(path)``` permet de récupérer le descripteur d'un fichier localisé par la variable ```path``` passée en paramètre. Ce descripteur nous permet d'intéragir avec le fichier et de réaliser des opérations de lecture et/ou d'écriture.

Par exemple, j'ai créé un fichier ```a1.txt``` localisé dans le repertoire ```./A```. Pour ouvrir ce fichier, je peux:

In [112]:
f = open("./A/a1.txt")
f.close()

Un descripteur est géré par le système (les opérations d'écritures et de lecture étant faites par le système d'exploitation). Lorsque l'on a fini de travailler avec le fichier, il faut fermer le descripteur à l'aide de la méthode ```close()```. 

<div class="alert alert-block alert-warning">
<b>⚠️:</b> Oublier de fermer un descripteur avec la méthode ```close()``` peut conduire à une fuite de ressource (car beaucoup de fichier seront ouvert sans être fermés) ou à une perte de données (l'OS priorise les opérations, il est possible que vos instruction d'écriture n'aient pas encore été réalisées). Il ne faut donc jamais oublié de fermer ses fichiers.
</div>

Python fournit une commande spéciale à l'aide du mot clé ```with``` qui appel automatiquement la méthode ```close()``` a la fin du bloc:

In [113]:
with open("./A/a1.txt") as f:
    # Traitement du fichier
    pass

```f``` est ici un nom de variable que l'on choisit pour manipuler le descripteur.

<div class="alert alert-block alert-info">
<b>Note: </b> Il est possible d'ouvrir plusieurs ressources dans le même with, dans ce cas là, les ressources sont séparées par une virgule , <br/>
    Par exemple: with open("monfichier.txt") as f, open("autrefichier.txt") as f2:
</div>

## Lire le contenu d'un fichier 

La fonction ```open()``` permet de lire le contenu d'un fichier à l'aide des méthode ```read()``` et ```readlines()```:
* ```read()``` retourne le contenu du fichier sous la forme d'une chaine de caractère
* ```readlines()``` retourne le contenu du fichier sous la forme d'une liste de chaîne de caractère, où chaque case du tableau représente une ligne du texte

<div class="alert alert-block alert-info">
<b>Rappel: </b> Dans une chaine de caractère, le caractère "\n" encode un saut de ligne. Chaque ligne contient donc à la fin ce caractère spéciale. Si l'on souhaite le supprimer, on peut utiliser la fonction des strings ```str.rstrip(car)```
</div>

Par exemple, on peut maintenant lire le contenu du fichier ```./A/a1.txt```:

In [111]:
with open("./A/a1.txt") as file:
    text = file.read()
print(text)

Lâ€™Albatros
Charles Baudelaire

Souvent, pour sâ€™amuser, les hommes dâ€™Ã©quipage
Prennent des albatros, vastes oiseaux des mers,
Qui suivent, indolents compagnons de voyage,
Le navire glissant sur les gouffres amers.

A peine les ont-ils dÃ©posÃ©s sur les planches,
Que ces rois de lâ€™azur, maladroits et honteux,
Laissent piteusement leurs grandes ailes blanches
Comme des avirons traÃ®ner Ã  cÃ´tÃ© dâ€™eux.

Ce voyageur ailÃ©, comme il est gauche et veule !
Lui, naguÃ¨re si beau, quâ€™il est comique et laid !
Lâ€™un agace son bec avec un brÃ»le-gueule,
Lâ€™autre mime, en boitant, lâ€™infirme qui volait !

Le PoÃ¨te est semblable au prince des nuÃ©es
Qui hante la tempÃªte et se rit de lâ€™archer ;
ExilÃ© sur le sol au milieu des huÃ©es,
Ses ailes de gÃ©ant lâ€™empÃªchent de marcher.. 

Charles Baudelaire, Les Fleurs du Mal, 1857.


On remarque ici que le décodage des accents pose problème. Pour décoder les accents, il faut utiliser l'```utf-8```. Ouvrir un fichier en mode texte entraine un travail de conversion qui nécessite une table d'encodage. Il est possible de spécifier la famille d'encodage grâce au paramètre ```encoding```:

In [110]:
with open("./A/a1.txt", encoding = "utf-8") as file:
    text = file.read()
print(text)

L’Albatros
Charles Baudelaire

Souvent, pour s’amuser, les hommes d’équipage
Prennent des albatros, vastes oiseaux des mers,
Qui suivent, indolents compagnons de voyage,
Le navire glissant sur les gouffres amers.

A peine les ont-ils déposés sur les planches,
Que ces rois de l’azur, maladroits et honteux,
Laissent piteusement leurs grandes ailes blanches
Comme des avirons traîner à côté d’eux.

Ce voyageur ailé, comme il est gauche et veule !
Lui, naguère si beau, qu’il est comique et laid !
L’un agace son bec avec un brûle-gueule,
L’autre mime, en boitant, l’infirme qui volait !

Le Poète est semblable au prince des nuées
Qui hante la tempête et se rit de l’archer ;
Exilé sur le sol au milieu des huées,
Ses ailes de géant l’empêchent de marcher.. 

Charles Baudelaire, Les Fleurs du Mal, 1857.


Si on souhaite récupérer chaque ligne du texte dans une liste:

In [53]:
with open("./A/a1.txt", encoding = "utf-8") as file:
    print(file.readlines())

['L’Albatros\n', 'Charles Baudelaire\n', '\n', 'Souvent, pour s’amuser, les hommes d’équipage\n', 'Prennent des albatros, vastes oiseaux des mers,\n', 'Qui suivent, indolents compagnons de voyage,\n', 'Le navire glissant sur les gouffres amers.\n', '\n', 'A peine les ont-ils déposés sur les planches,\n', 'Que ces rois de l’azur, maladroits et honteux,\n', 'Laissent piteusement leurs grandes ailes blanches\n', 'Comme des avirons traîner à côté d’eux.\n', '\n', 'Ce voyageur ailé, comme il est gauche et veule !\n', 'Lui, naguère si beau, qu’il est comique et laid !\n', 'L’un agace son bec avec un brûle-gueule,\n', 'L’autre mime, en boitant, l’infirme qui volait !\n', '\n', 'Le Poète est semblable au prince des nuées\n', 'Qui hante la tempête et se rit de l’archer ;\n', 'Exilé sur le sol au milieu des huées,\n', 'Ses ailes de géant l’empêchent de marcher.. \n', '\n', 'Charles Baudelaire, Les Fleurs du Mal, 1857.']


Il est possible d'effectuer directement des séquences d'opération sur nos lignes. Par exemple, si l'on souhaite afficher le numéro à chaque ligne:

In [109]:
numero = 0
with open("./A/a1.txt", encoding = "utf-8") as file:
    for ligne in file:
        print(str(numero)+":"+ligne)
        numero = numero + 1

0:L’Albatros

1:Charles Baudelaire

2:

3:Souvent, pour s’amuser, les hommes d’équipage

4:Prennent des albatros, vastes oiseaux des mers,

5:Qui suivent, indolents compagnons de voyage,

6:Le navire glissant sur les gouffres amers.

7:

8:A peine les ont-ils déposés sur les planches,

9:Que ces rois de l’azur, maladroits et honteux,

10:Laissent piteusement leurs grandes ailes blanches

11:Comme des avirons traîner à côté d’eux.

12:

13:Ce voyageur ailé, comme il est gauche et veule !

14:Lui, naguère si beau, qu’il est comique et laid !

15:L’un agace son bec avec un brûle-gueule,

16:L’autre mime, en boitant, l’infirme qui volait !

17:

18:Le Poète est semblable au prince des nuées

19:Qui hante la tempête et se rit de l’archer ;

20:Exilé sur le sol au milieu des huées,

21:Ses ailes de géant l’empêchent de marcher.. 

22:

23:Charles Baudelaire, Les Fleurs du Mal, 1857.


## Les modes de fichier

A l'ouverture de notre fichier avec la fonction ```open```, on peut spécifier le mode d'ouverture.

Un mode d'ouverture permet de spécifier les opérations qui sont autorisées. Le ```mode``` est un paramètre à spécifier à la fonction ```open``` et est représenté par une chaine de caractère:

| Mode | Description |
|---	|---	|
| r | ouverture en lecture (mode par défaut) |
|w|ouverture en écriture (efface le contenu précédent)|
|x|ouverture uniquement pour création (l’ouverture échoue si le fichier existe déjà)|
| + | ouverture en lecture et écriture| 
| a | ouverture en écriture pour ajout en fin de fichier |
|b | fichier binaire | 
|t | fichier texte (mode par défaut)

In [108]:
# Ouverture un lecture seule
with open("./A/a1.txt", encoding = "utf-8", mode= "r") as file:
    pass

In [58]:
# Ouverture en lecture et ecriture
with open("./A/a1.txt", encoding = "utf-8", mode= "r+") as file:
    pass

## Exemple avec la lecture de fichier .csv

Un exemple d'utilisation de fichier est la collecte de données à partir d'un fichier ".csv".

Le dossier ```./A``` contient deux fichiers csv:
* oscar_age_female.csv : liste des actrices qui ont reçu l'oscar de la meilleure actrice entre 1928 et 2016 
* oscar_age_male.csv : liste des acteurs qui ont reçu l'oscar du meilleur acteur entre 1928 et 2016 

On souhaite pouvoir écrire un algorithme qui nous donne, pour une date donnée, les information de la meilleure actrice (nom, age, film). 

Dans un premier temps, affichons le contenu d'un des deux fichiers:

In [87]:
with open("./A/oscar_age_female.csv", encoding = "utf-8", mode= "r") as file:
    print(file.read())

"Index", "Year", "Age", "Name", "Movie"
 1, 1928, 22, "Janet Gaynor", "Seventh Heaven, Street Angel and Sunrise: A Song of Two Humans"
 2, 1929, 37, "Mary Pickford", "Coquette"
 3, 1930, 28, "Norma Shearer", "The Divorcee"	
 4, 1931, 63, "Marie Dressler", "Min and Bill"
 5, 1932, 32, "Helen Hayes", "The Sin of Madelon Claudet"	
 6, 1933, 26, "Katharine Hepburn", "Morning Glory"
 7, 1934, 31, "Claudette Colbert", "It Happened One Night"
 8, 1935, 27, "Bette Davis", "Dangerous"
 9, 1936, 27, "Luise Rainer", "The Great Ziegfeld"
10, 1937, 28, "Luise Rainer", "The Good Earth"
11, 1938, 30, "Bette Davis", "Jezebel"
12, 1939, 26, "Vivien Leigh", "Gone with the Wind"
13, 1940, 29, "Ginger Rogers", "Kitty Foyle"
14, 1941, 24, "Joan Fontaine", "Suspicion"	
15, 1942, 38, "Greer Garson", "Mrs. Miniver"
16, 1943, 25, "Jennifer Jones", "The Song of Bernadette"
17, 1944, 29, "Ingrid Bergman", "Gaslight"
18, 1945, 40, "Joan Crawford", "Mildred Pierce"
19, 1946, 30, "Olivia de Havilland", "To Each His

Le fichier .csv contient 5 colonnes: "Index", "Year", "Age", "Name", "Movie".

Pour pouvoir traiter ces données, on a besoin d'un structure de donnée. On aimerait pouvoir pour chaque année, donner l'age, le nom et le film qui a reçu l'oscar.

On va donc créer un dictionnaire pour associer à l'année à un autre dictionnaire qui contiendra {l'age, le nom de l'actrice,le nom du film}.

Par exemple ```1928: {'age': '22', 'nom': '"Janet Gaynor"', 'film': '"Seventh Heaven'}```

La méthode consiste donc à, pour chacune des lignes du fichier, récupérer chacune des colonnes en utilisant ", " comme séparateur, puis ajouter un nouvel élément à notre dictionnaire.

<div class="alert alert-block alert-warning">
<b>⚠️:</b> Attention lorsque l'on travaille avec les fichiers .csv! La première ligne peut contenir une entête (il faudra donc penser à l'ignorer), et il peut y avoir des saut de ligne à la fin du fichier (et donc des lignes vides!). Il faut soit netoyer le fichier, soit prévoir en amont tester si le fichier à une entête, et si la ligne n'est pas vide.
</div>

In [89]:
dico_meilleure_actrice = {} # On initialise notre dictionnaire vide

with open("./A/oscar_age_female.csv", encoding = "utf-8", mode= "r") as file:  # On ouvre le fichier en lecture seule
    nbLigne=0 # On initialise notre compteur de ligne (pour ignorer la première ligne)
    for ligne in file: # Pour chacune des lignes
        if nbLigne != 0: # Si il ne s'agit pas de la première ligne
            # Ici, une ligne est une string de la forme:  1, 1928, 22, "Janet Gaynor", "Seventh Heaven, Street Angel and Sunrise: A Song of Two Humans"
            # Il faut découper cette string par rapport à la chaine ", "
            data = ligne.split(", ")
            # data est donc une liste où 0: index, 1: année, 2: age, 3:nom actrice, 4: nom film
            # Par exemple: [1,1928,22,"Janet Gaynor","Seventh Heaven, Street Angel and Sunrise: A Song of Two Humans"]
            
            # on peut mettre à jour le dictionnaire et ajouter une nouvelle entrée
            dico_meilleure_actrice[int(data[1])] = {"age":data[2], "nom":data[3],"film":data[4]}
        nbLigne = nbLigne + 1 # On incrémente notre compteur de lignes
        
# On affiche notre dictionnaire
print(dico_meilleure_actrice)

{1928: {'age': '22', 'nom': '"Janet Gaynor"', 'film': '"Seventh Heaven'}, 1929: {'age': '37', 'nom': '"Mary Pickford"', 'film': '"Coquette"\n'}, 1930: {'age': '28', 'nom': '"Norma Shearer"', 'film': '"The Divorcee"\t\n'}, 1931: {'age': '63', 'nom': '"Marie Dressler"', 'film': '"Min and Bill"\n'}, 1932: {'age': '32', 'nom': '"Helen Hayes"', 'film': '"The Sin of Madelon Claudet"\t\n'}, 1933: {'age': '26', 'nom': '"Katharine Hepburn"', 'film': '"Morning Glory"\n'}, 1934: {'age': '31', 'nom': '"Claudette Colbert"', 'film': '"It Happened One Night"\n'}, 1935: {'age': '27', 'nom': '"Bette Davis"', 'film': '"Dangerous"\n'}, 1936: {'age': '27', 'nom': '"Luise Rainer"', 'film': '"The Great Ziegfeld"\n'}, 1937: {'age': '28', 'nom': '"Luise Rainer"', 'film': '"The Good Earth"\n'}, 1938: {'age': '30', 'nom': '"Bette Davis"', 'film': '"Jezebel"\n'}, 1939: {'age': '26', 'nom': '"Vivien Leigh"', 'film': '"Gone with the Wind"\n'}, 1940: {'age': '29', 'nom': '"Ginger Rogers"', 'film': '"Kitty Foyle"\n'

On obtient donc un dictionnaire qui à chaque année associe l'age, le nom et le film. 

<div class="alert alert-block alert-info">
<b>Remarque: </b> On remaruqe qu'afficher un dictionnaire est possible avec la méthode ```print```, mais que c'est difficilement lisible! On verra qu'avec l'utilisation de JSON dans le prochain module, on peut améliorer la lecture.
</div>

On peut maintenant facilement dire quelle actrice as été oscarisée en quelle année: 

In [86]:
year = int(input("Pour quelle année souhaitez vous obtenir les informations sur l'oscar de la meilleure actrice?"))

if year > 1928 and year < 2016:
    actrice = dico_meilleure_actrice[year]
    nom = actrice["nom"]
    age = actrice["age"]
    film = actrice["film"]
    print(f"En {year}, la meilleure actrice est {nom} à l'age de {age} ans pour son rôle dans le film {film}")

Pour quelle année souhaitez vous obtenir les informations sur l'oscar de la meilleure actrice? 2000


En 2000, la meilleure actrice est "Hilary Swank" à l'age de 25 ans pour son rôle dans le film "Boys Don't Cry"



<div class="alert alert-block alert-info">
<b>Remarque: </b> Il est aussi possible d'utiliser le module csv qui offre des fonctions facilitant la lecture et l'écriture de fichier .csv : <a href="https://docs.python.org/fr/3/library/csv.html">https://docs.python.org/fr/3/library/csv.html</a>
</div>

## Ecriture dans un fichier

Pour écrire dans un fichier, on utilise les méthodes ```write(str)``` ou la méthode ```writelines(list)``` pour écrire une liste de lignes.

Pour pouvoir écrire dans un fichier, il faut au prélable l'avoir ouvert avec un niveau de droit permettant l'écriture. 

On distingue a minima deux modes:
* **"w"** mode d'ouveture en écriture par défaut. Chaque appel à une commande d'écriture **remplace intégralement le contenu du fichier**
* **"a"** mode d'ajout en fin du fichier. Le texte est ajouter à la suite du texte déjà présent.

Par exemple:

In [102]:
# Exemple d'écriture avec le mode leacture (r) et écriture (+)
with open("hello.txt", mode="w+") as f:
    f.write("Hello le monde!\n")

with open("hello.txt", mode="r") as f:
    print(f.read())
    print("====")
    
# Exemple d'écriture avec le mode a
with open("hello.txt", mode="a+") as f:
    f.write("Hello le monde!\n")

with open("hello.txt", mode="r") as f:
    print(f.read())
    print("====")

Hello le monde!

====
Hello le monde!
Hello le monde!

====


## Rechercher un fichier avec ```glob```

Le module ```glob``` (https://docs.python.org/3.7/library/glob.html#module-glob)[https://docs.python.org/3.7/library/glob.html#module-glob]) permet d'effectuer une recherche dans une arborescence de fichier à partir d'une expression régulière. 

Le caractère ```?``` permet d'exprimer n'importe quel caractère, et le caractère ```*``` représente n'importe quelle suite de caractère.

Par exemple: 

In [104]:
import glob

liste_fichiers = glob.glob("*.txt") #recherche de tout les fichiers .txt dans le répertoire courant
print(liste_fichiers)

['hello.txt']


In [107]:
import glob

liste_fichiers = glob.glob("**/*.txt", recursive=True) #Si recursive est vrai, le motif « ** » reconnaît tous les fichiers et, zéro ou plus répertoires et sous-répertoires. 
print(liste_fichiers)

['hello.txt', 'A\\a1.txt', 'A\\B\\b1.txt', 'A\\B\\b2.txt', 'A\\B\\b3.txt', 'A\\C\\c1.txt', 'A\\C\\c2.txt', 'A\\C\\D\\d1.txt']


# La journalisation en Python

On a vu que la manipulation de fichier peut conduire à la levée d'exceptions. 

Lorsque l'on conçoit un logiciel, on essaie de garantir son intégrité, c'est à dire qu'il faut s'assurer qu'il contenue de fonctionner même si celui-ci rencontre des anomalies.

Le mecanisme de ```try: ... except:...``` permet de gérer les exceptions levées par le logiciel. Mais il peut être intéressant de conserver l'information qu'une exception (voir une erreur) est apparue.

Les jounaux (*log* en anglais), sont un mécanisme très utilisé en développement informatique et disponible dans la majorité des langages informatiques. Elle repose sur l'utilisation de fichiers (les logs) qui vont stoquer des évènements qui seront ensuite lisibles pour les développeurs.

La journalisation consiste à historiser les évènements (qu'ils soient normaux ou anormaux) survenu au cours du fonctionnement d'une application.

Les journaux sont utiles dans tous les cycles de vie d'une application:
* Dans son développement, les logs permettent de tracer et comprendre le fonctionnement en suivant et en historisant son exécution. Elle permet, en complément des outils de débugage, d'isoler les anomalies.
* Pendant la phase d'intégration, les logs permettent d'interpréter les anomalies remontées.
* Pendant la phase de production, les logs sont utilisés pour diagnostiquer l'application ou tracer les actions des utilisateurs.

Python dispose d'un module "built-in" appelé ```logging``` et qui permet de facilement construire des jounaux pour tracer le fonctionnement de votre application: [https://docs.python.org/3/library/logging.html](https://docs.python.org/3/library/logging.html)

Un journal peut stocker différents évènements, chaque évènement étant associé à un niveau de sévérité. Il existe 5 niveaux de de sévérités par ordre croissant:

| Niveau de sévérité | Fonction | Usage |
|---|---|---|
| DEBUG | logging.debug(str) | Rapport détaillé à visant à diagnostiquer un problème pour aider à son débuggage |
| INFO | logging.info(str) | Rapport confirmant le fonctionement normal d'un logiciel ou informant d'un évènement non critique |
| WARNING | logging.warning(str) | Rapport avertissant d'un évènement inatendu ou potentiellement impactant |
| ERROR | logging.error(str) | Rapport sur un problème empéchant le logiciel de réaliser certaines tâches |
| CRITICAL | logging.critical(str) | Rapport sur un problème rendant le logiciel non fonctionnel |

On initialise un logger grâce à l'import de son module ```import logging``` et à la méthode ```getLogger()```

In [128]:
import logging
logger = logging.getLogger() # Instance de notre logger
logger.debug("Ceci est un message de débug")
logger.info("Ceci est un message d'information")
logger.warning("Ceci est un message de warning")
logger.error("Ceci est un message d'erreur")
logger.critical("Ceci est un message critique")

INFO:root:Ceci est un message d'information
ERROR:root:Ceci est un message d'erreur
CRITICAL:root:Ceci est un message critique


Par défaut, le niveau de sévérité est défini sur WARNING, ce qui signifie que le module de logs Python filtrera tous les messages de niveau de sévérité inférieur à celui de WARNING, c’est-à-dire les logs de niveau DEBUG ou INFO ne seront pas affichés.

On peut personaliser le niveau de sévérité à l'aide de la méthode ```setLevel(level)```:

In [134]:
logger.setLevel(logging.INFO)
logger.info('Ceci sera loggé!')
logger.debug('Ceci ne le sera pas!')

INFO:root:Ceci sera loggé!


Plutôt que de simplement afficher les informations dans la console, on peut historiser l'ensemble des jounaux dans un fichier à l'aide de la méthode ```FileHandler```.

In [135]:
fhandler = logging.FileHandler(filename='log.log', mode='a') # filename est le nom du fichieer, a est le mode pour ajouter le texte à la suite du texte déjà présent.
logger.addHandler(fhandler)

logger.debug("test")
logger.info("info")

INFO:root:info


Un fichier ```log.log``` est créé. Vous pouvez maintenant consulter les messages!

Vous pouvez aussi formatter vos messages (plus d'informations dans la documentation : [https://docs.python.org/3/library/logging.html](https://docs.python.org/3/library/logging.html)

Par exemple:

In [137]:
formatter = logging.Formatter('%(asctime)s - %(name)s - %(lineno)s - %(levelname)s - %(message)s')
fhandler.setFormatter(formatter)
logger.info("info")

INFO:root:info


Les messages sont maintenant enregistré sous la forme : "2023-01-09 14:59:20,660 - root - 3 - INFO - info"

On dispose donc automatiquement de la date, du nom de l'utilsateur qui a lancé le script, du numéro de la ligne concerné par le message, sa sévérité et enfin le contenu du message.

## Un exemple d'utilisation du logging:

Dans la section précédente, nous avons créé une structure de donnée permettant d'associer à une année les informations de l'actrice ayant gagné l'oscar du meilleure role féminin:

In [139]:
dico_meilleure_actrice = {} # On initialise notre dictionnaire vide

with open("./A/oscar_age_female.csv", encoding = "utf-8", mode= "r") as file:  # On ouvre le fichier en lecture seule
    nbLigne=0 # On initialise notre compteur de ligne (pour ignorer la première ligne)
    for ligne in file: # Pour chacune des lignes
        if nbLigne != 0: # Si il ne s'agit pas de la première ligne
            # Ici, une ligne est une string de la forme:  1, 1928, 22, "Janet Gaynor", "Seventh Heaven, Street Angel and Sunrise: A Song of Two Humans"
            # Il faut découper cette string par rapport à la chaine ", "
            data = ligne.split(", ")
            # data est donc une liste où 0: index, 1: année, 2: age, 3:nom actrice, 4: nom film
            # Par exemple: [1,1928,22,"Janet Gaynor","Seventh Heaven, Street Angel and Sunrise: A Song of Two Humans"]
            
            # on peut mettre à jour le dictionnaire et ajouter une nouvelle entrée
            dico_meilleure_actrice[int(data[1])] = {"age":data[2], "nom":data[3],"film":data[4]}
        nbLigne = nbLigne + 1 # On incrémente notre compteur de lignes

On a ensuite écrit une fonction nous permettant de demander à l'utilisateur de saisir une année et de lui répondre avec les informations concernant la meilleure actrice:

In [140]:
def meilleure_actrice(year:int):
    year = int(input("Pour quelle année souhaitez vous obtenir les informations sur l'oscar de la meilleure actrice?"))

    if year > 1928 and year < 2016:
        actrice = dico_meilleure_actrice[year]
        nom = actrice["nom"]
        age = actrice["age"]
        film = actrice["film"]
    print(f"En {year}, la meilleure actrice est {nom} à l'age de {age} ans pour son rôle dans le film {film}")

On peut maintenant utiliser les journaux pour historiser deux informations:
* Les saisies utilisateurs: a chaque fois qu'une demande est faite par l'utilisateur on enregistre sa saisie dans un journal
* Les erreurs, nottament si un utilisateur saisie une mauvaise date

In [147]:
import logging

# Configuration du logger
logger = logging.getLogger()
# Enregistrement des informations dans un fichier actrice.log
fhandler = logging.FileHandler(filename='actrice.log', mode='a') # filename est le nom du fichieer, a est le mode pour ajouter le texte à la suite du texte déjà présent.
logger.addHandler(fhandler)
# Choix du format des message, on retient la date: %(asctime)s, la ligne %(lineno)s, le type de message %(levelname)s, et enfin le message %(message)s'
formatter = logging.Formatter('%(asctime)s : %(lineno)s : %(levelname)s : %(message)s')
fhandler.setFormatter(formatter)

def meilleure_actrice():
    year = int(input("Pour quelle année souhaitez vous obtenir les informations sur l'oscar de la meilleure actrice?"))
    # On historise la saisie
    logger.info(f"saisie utilisateur: [{year}]") 
    if year > 1928 and year < 2016:
        actrice = dico_meilleure_actrice[year]
        nom = actrice["nom"]
        age = actrice["age"]
        film = actrice["film"]
        print(f"En {year}, la meilleure actrice est {nom} à l'age de {age} ans pour son rôle dans le film {film}")
    else:
        logger.error(f"Date < 1928 ou > 2016 :  [{year}]")
meilleure_actrice()

Pour quelle année souhaitez vous obtenir les informations sur l'oscar de la meilleure actrice? 2020


INFO:root:saisie utilisateur: [2020]
ERROR:root:Date < 1928 ou > 2016 :  [2020]


<div class="alert alert-block alert-warning">
<b>⚠️:</b> Attention avec l'utilisation des journaux! Vous historiser des évènements dans des fichiers qui deviennent de plus en plus gros. Pour éviter la fuite mémoire, il faut penser à vider les journaux à interval réguliers.
</div>

# En résumé:
* Le module ```os``` permet d'intéragir avec les répertoires et les fichiers
* On peut lire et écrire des fichiers avec la fonction ```open```
* Quand on ouvre un fichier, on pense à le fermer avec la méthode ```.close()```
* Pour simplifier la gestion de la fermeture, on peut utiliser le mot clé ```with```
* On peut écrire dans des fichier en fonction d'un mode: w pour remplacer, a pour ajouter.
* On peut lire un fichier .csv et le stocker dans un dictionnaire.
* La journalisation est un moyen d'historiser des évènements en fonction de leur sévérité
* On peut journaliser les évènements dans des fichiers

# Je suis donc capable
* D'explorer et manipuler une arborescence de fichiers et de dossiers à partir de Python
* Lire et écrire dans des fichiers
* Manipuler un fichier .csv et le stocker dans un dictionnaire pour pouvoir l'interroger
* Utiliser les journaux pour tracer des évènements