<h1> Ouverture et manipulation de documents </h1>

<h3> Ouverture et lecture d'un document </h3>

La capacité de lire des données à partir de fichiers est essentielle dans la programmation Python, permettant aux scripts d'interagir avec des données persistantes.

L'ouverture de fichier peut se faire via la méthode open, qui s'écrit de cette manière : 
file = open('chemin/vers/le/fichier', 'mode')

le mode ('r', 'w', 'a', 'rb', 'wb', etc.) indique le type d'action souhaitée (lecture, écriture, ajout, création, etc...)

Objectif : Écrire un script Python qui ouvre et lit un fichier log d'un serveur pour analyser les types d'erreurs rencontrées et leur fréquence.

In [27]:
chemin_fichier = 'journal_logs.txt'
fichier = open(chemin_fichier, 'r')
print(fichier)

autre_chemin = "C:\\Users\\Lenovo Ideapad 5\\Documents\\cours\\Python_V2\\Fichiers_cours\\12_ouverture_et_manipulation_documents\\journal_logs.txt"
fichier = open(autre_chemin, 'r')
print(fichier)

<_io.TextIOWrapper name='journal_logs.txt' mode='r' encoding='cp1252'>
<_io.TextIOWrapper name='C:\\Users\\Lenovo Ideapad 5\\Documents\\cours\\Python_V2\\Fichiers_cours\\12_ouverture_et_manipulation_documents\\journal_logs.txt' mode='r' encoding='cp1252'>


Une fois le fichier ouvert, il est possible de le lire via la méthode read()

In [28]:
contenu = fichier.read()
print(contenu)

2023-01-01 00:01:23 INFO Demarrage du serveur.
2023-01-01 00:03:47 ERROR Echec de connexion Ã  la base de donnees.
2023-01-01 00:04:22 INFO Nouvelle connexion utilisateur: utilisateur123.
2023-01-01 00:05:33 ERROR Impossible d'envoyer l'email de notification.
2023-01-01 00:07:52 INFO Demande de page /accueil par utilisateur456.
2023-01-01 00:08:13 ERROR Le fichier config.txt est manquant.
2023-01-01 00:09:27 INFO DÃ©connexion utilisateur: utilisateur123.
2023-01-01 00:11:42 ERROR AccÃ¨s refusÃ© pour utilisateur789.


Il est possible de ne lire qu'un nombre précis de caractères du document

In [30]:
fichier = open(autre_chemin, 'r')
debut = fichier.read(20)
print(debut)

2023-01-01 00:01:23 


Il est également possible de lire le fichier ligne par ligne

In [34]:
fichier = open(autre_chemin, 'r')
print(fichier.readline())
print(fichier.readline())
print(fichier.readline())

2023-01-01 00:01:23 INFO Demarrage du serveur.


2023-01-01 00:03:47 ERROR Echec de connexion Ã  la base de donnees.



On peut également réaliser une boucle sur chaque ligne du fichier

In [36]:
fichier = open(autre_chemin, 'r')
for ligne in fichier:
    print(ligne)

2023-01-01 00:01:23 INFO Demarrage du serveur.


2023-01-01 00:03:47 ERROR Echec de connexion Ã  la base de donnees.

2023-01-01 00:04:22 INFO Nouvelle connexion utilisateur: utilisateur123.

2023-01-01 00:05:33 ERROR Impossible d'envoyer l'email de notification.


2023-01-01 00:07:52 INFO Demande de page /accueil par utilisateur456.

2023-01-01 00:08:13 ERROR Le fichier config.txt est manquant.

2023-01-01 00:09:27 INFO DÃ©connexion utilisateur: utilisateur123.


2023-01-01 00:11:42 ERROR Acces refuse pour utilisateur789.


Une fois la manipulation terminée, comme un fichier classique, il faut le fermer

In [37]:
fichier = open(autre_chemin, "r")
print(fichier.readline())
fichier.close()

2023-01-01 00:01:23 INFO Demarrage du serveur.



Bonne Pratique : Toujours s'assurer de fermer le fichier après son utilisation, ce qui peut être fait de manière plus sûre avec un gestionnaire de contexte.

In [39]:
with open(chemin_fichier, 'r') as fichier:
    # Le fichier sera automatiquement fermé à la sortie de ce bloc.
    print(fichier.readline())
    print(fichier.readline())
    print(fichier.readline())

2023-01-01 00:01:23 INFO Demarrage du serveur.


2023-01-01 00:03:47 ERROR Echec de connexion Ã  la base de donnees.



Analyse des logs : Identifier et compter les types de message dans le fichier

In [42]:
erreurs = {}

with open(chemin_fichier, 'r') as fichier:
    for ligne in fichier:
        message = ligne.split(" ")[2]
        if message in erreurs: 
            erreurs[message] += 1
        else: 
            erreurs[message] = 1
            
print(erreurs)



<h3> Ouverture et modification d'un document </h3>

Objectif : Appliquer des modifications à notre fichier pour corriger des erreurs de log, supprimer des entrées obsolètes et ajouter de nouvelles informations.

In [55]:
with open(chemin_fichier, 'r') as fichier:
    lignes = fichier.readlines()

print(lignes)



In [56]:
#Remplacement de "connexion" par "authentification"
lignes_corrigees = [ligne.replace("connexion", "authentification") for ligne in lignes]
print(lignes_corrigees)



In [57]:
#filtre sur des informations non nécéssaires
lignes_mises_a_jour = [ligne for ligne in lignes_corrigees if "notification" not in ligne]
print(lignes_mises_a_jour)



In [58]:
#nouvelles lignes de log à la fin du fichier ou à des positions spécifiques.
lignes_mises_a_jour.append("2023-01-02 00:12:34 INFO Nouvelle entree ajoutee.\n")

Sauvegarde des modifications, via l'ouverture en mode écriture (w) du document

In [59]:
with open(chemin_fichier, 'w') as fichier:
    fichier.writelines(lignes_mises_a_jour)

In [60]:
with open(chemin_fichier, 'r') as fichier:
    lignes = fichier.readlines()

print(lignes)



La méthode append, permet de simplement ajouter une nouvelle entrée dans le fichier, sans toucher aux lignes existantes

In [61]:
with open(chemin_fichier, 'a') as fichier:
    fichier.write("2023-01-02 00:14:29 WARNING Modifications nombreuses du fichier de logs.\n")

with open(chemin_fichier, 'r') as fichier:
    lignes = fichier.readlines()

print(lignes)



<h3> Création ou suppresion d'un document </h3>

La création d'un fichier en Python est simple grâce à la fonction open() avec le mode 'w'. Si le fichier n'existe pas, il sera créé.

In [62]:
with open('nouveau_journal.txt', 'w') as fichier:
    fichier.write("2023-01-02 00:00:00 INFO Application demarree.\n")

In [64]:
#Ajout de logs au nouveau document
with open('nouveau_journal.txt', 'a') as fichier:
    fichier.write("2023-01-02 00:05:00 WARNING Niveau de batterie faible.\n")

La suppression se fera via le package 'OS'

In [65]:
import os

if os.path.exists('nouveau_journal.txt'):
    os.remove('nouveau_journal.txt')
    print("Le fichier 'journal' a été supprimé.")
else:
    print("Le fichier 'journal' n'existe pas.")


Le fichier 'journal.log' a été supprimé.
