# **M1 - CSB**
# **TP 4 - Manipulation de fichiers**



***

[**Notions**](#notions)

1. [Nom des fichiers dans le dossier courant](#1)
2. [Créer et écrire dans un fichier un fichier](#2)
3. [Ajouter du texte à un fichier existant](#3)
4. [Python : modes d'ouvertures d'un fichier (File Modes)](#4)
5. [Lire un fichier](#5)
6. [Pickle : sauvegarder n'importe quel objet Python](#6)


*** 

[**Exercices**](#exercices)

1. Fichiers du dossier courant
2. Fichiers et datetimes
3. Zen of Python


***

<a id='1'></a>
## 1. Nom des fichiers dans le dossier courant
-  La fonction `listdir` du packages `os` permet de renvoyer les noms de tous les fichiers dans le dossier courant

In [1]:
import os

# Tous les fichiers dans le dossier courant
print("Tous les fichiers présents dans le dossier courant :")
print(os.listdir(), "\n")

# Tous les fichiers de type .txt
print("Tous les fichiers .txt présents dans le dossier courant :")
txt_files = [filename for filename in os.listdir() if filename.endswith(".txt")]
print(txt_files)

Tous les fichiers présents dans le dossier courant :
['02_pandas_tp_corr.ipynb', 'introduction_to_google_colab.ipynb', 'file_1.txt', '.DS_Store', 'file_0.txt', 'file_2.txt', 'tp_2_test_boucle_fonction.ipynb', 'tp_3_algorithmie.ipynb', 'liste_noms_des_fichiers_new.txt', 'README.md', 'introduction_m1_csb.pdf', 'file_test', 'tp_1_syntaxe_variables_et_types.ipynb', '.gitignore', 'liste_noms_des_fichiers_fadi.txt', 'drafts.ipynb', 'python_syntax.py', '.ipynb_checkpoints', 'liste_noms_des_fichiers.txt', '.git', '.vscode', 'data', 'tp_4_files.ipynb', '01_python_et_env.pdf'] 

Tous les fichiers .txt présents dans le dossier courant :
['file_1.txt', 'file_0.txt', 'file_2.txt', 'liste_noms_des_fichiers_new.txt', 'liste_noms_des_fichiers_fadi.txt', 'liste_noms_des_fichiers.txt']


<a id='2'></a>
## 2. Créer et écrire dans un fichier

- On déclare la variable f égale au fichier `file.txt`.
- Le premier argument de la fonction `open` est le nom du fichier
- Le deuxième, `w`, indique que l'on veut pouvoir écrire dans le fichier, le `+`indique qu'on veut pouvoir lire et écrire (read and write)

In [2]:
file = open("file_2.txt","w+")

- On écrit dans le fichier sur les 10 premières lignes un message indiquant le numéro de la ligne
- On ferme le fichier

In [3]:
for i in range(10):
    # Ecrire une ligne, le \n indique un retour à la ligne
    file.write(f"Ligne numéro {10*i}\n")

# Fermer le fichier
file.close() 

<a id='3'></a>

## 3. Ajouter du texte à un fichier existant

- Le `a` indique 'append' c'est à dire ajouter (comme pour la méthode pour les listes)
- Le `+`indique qu'on est en mode `read` and `write`

In [4]:
file = open("file_2.txt", "a+")

for i in range(20):
     file.write(f"Ligne ajoutée line {i}\n")
        
file.close()

<a id='4'></a>

## 4. Python : modes d'ouvertures d'un fichier (File Modes)

- 'r' : Mode par défaut. Ouvre un fichier pour le lire.
- 'w': Ouvre un fichier pour écrire. Si le fichier n'existe pas, il est créé.
- 'x': Crée un nouveau fichier. Si le fichier existe déjà, l'opération échoue.
- 'a': Ouvre un fichier en mode `append`. S'il n'existe pas, il est créé.
- 't': Mode par défaut, ouvre un fichier `text`
- 'b': Ouvre un fichier de `bytes`
- '+': On indique qu'on veut ouvrir pour lire et écrire

In [5]:
file = open("file_2.txt", "at+")

for i in range(2):
     file.write(f"Ligne ajoutée ++ line {i}\n")
        
file.close()

<a id='5'></a>

## 5. Lire un fichier
- On peut utilier la méthode `.read()` qui lit le fichier en entier et renvoie une chaîne de caractères
- On peut utilier la méthode `.readlines()` pour lire ligne par ligne

In [6]:
file = open("file_0.txt", "r")
content = file.read()
print(content, "\n")

file = open("file_0.txt", "r")
lines = file.readlines()
print(lines, "\n")

file.close()

Ligne numéro 0
Ligne numéro 1
Ligne numéro 2
Ligne numéro 3
Ligne numéro 4
Ligne numéro 5
Ligne numéro 6
Ligne numéro 7
Ligne numéro 8
Ligne numéro 9
Ligne ajoutée line 0
Ligne ajoutée line 1
Ligne ajoutée line 0
Ligne ajoutée line 1
Ligne ajoutée line 0
Ligne ajoutée line 1
Ligne ajoutée line 0
Ligne ajoutée line 1
Ligne ajoutée line 0
Ligne ajoutée line 1
Ligne ajoutée line 0
Ligne ajoutée line 1
Ligne ajoutée line 0
Ligne ajoutée line 1
Ligne ajoutée line 0
Ligne ajoutée line 1
Ligne ajoutée line 0
Ligne ajoutée line 1
Ligne ajoutée line 0
Ligne ajoutée line 1
 

['Ligne numéro 0\n', 'Ligne numéro 1\n', 'Ligne numéro 2\n', 'Ligne numéro 3\n', 'Ligne numéro 4\n', 'Ligne numéro 5\n', 'Ligne numéro 6\n', 'Ligne numéro 7\n', 'Ligne numéro 8\n', 'Ligne numéro 9\n', 'Ligne ajoutée line 0\n', 'Ligne ajoutée line 1\n', 'Ligne ajoutée line 0\n', 'Ligne ajoutée line 1\n', 'Ligne ajoutée line 0\n', 'Ligne ajoutée line 1\n', 'Ligne ajoutée line 0\n', 'Ligne ajoutée line 1\n', 'Ligne ajoutée lin

<a id='6'></a>
## 6. Pickle : sauvegarder n'importe quel objet Python

- On peut avec le package `pickle` garder une copie physique de n'importe quel objet Python (peu importe son type)


In [5]:
# Save a dictionary into a pickle file.
import pickle

# On définit un dictionnaire
my_dict = { "Max": 20, "André": 37 }

# On enregistre le dictionnaire au format pickle dans le fichier my_dict.p
# le b dans "wb" indique que l'on écrit des bytes
pickle.dump( my_dict, open("my_dict.p", "wb" ), protocol=pickle.HIGHEST_PROTOCOL)

# On réouvre ce fichier
# le b dans "wb" indique que l'on lit des bytes
my_dict_opened = pickle.load( open("my_dict.p", "rb" ) )

assert my_dict == my_dict_opened

# Vérification
print("fichier enregistré", my_dict)
print("fichier ouvert", my_dict_opened)

fichier enregistré {'Max': 20, 'André': 37}
fichier ouvert {'Max': 20, 'André': 37}


<a id='7'></a>

## 7. La syntaxe `with`

In [15]:
# Syntaxe alternartive

import pickle

my_dict_2 = { "Max": 20, "André": 37 , "Hubert": 19}

# le b dans "wb" indique que l'on écrit des bytes
with open('my_dict_2.pickle', 'wb') as file:
    pickle.dump(my_dict_2, file, protocol=pickle.HIGHEST_PROTOCOL)

# le b dans "wb" indique que l'on lit des bytes
with open('my_dict_2.pickle', 'rb') as file:
    my_dict_2_opened = pickle.load(file)

assert my_dict_2 == my_dict_2_opened

# Vérification
print("fichier enregistré", my_dict_2)
print("fichier ouvert", my_dict_2_opened)

fichier enregistré {'Max': 20, 'André': 37, 'Hubert': 19}
fichier ouvert {'Max': 20, 'André': 37, 'Hubert': 19}


<a id='exercices'></a>
## Exercices

## Exercice 1 - Fichiers du dossier courant
- Ecrire une fonction qui crée un fichier appelé `liste_noms_des_fichiers`, et qui écrit dans ce fichier la liste des noms des fichiers présents dans le dossier courant

- Ecrire une fonction qui renvoie un dictionnaire avec en clef les extentions présentes et en valeurs le nombre de fichiers avec cette extension, par exemple : 
```
{".txt": 2, 
".pdf": 2,
".ipynb": 4, 
".py": 2, 
}
```

## Exercice 1 - correction

In [7]:
def lister_fichiers():
    file = open("liste_noms_des_fichiers_new.txt", "w+")
    filenames = os.listdir()
    string_filenames = "\n".join(filenames)
    file.write(string_filenames)
    file.close()

lister_fichiers()

In [9]:
file = open("file_test", "w+")
file.write("test")
file.close()

In [73]:
def compter_extensions():
    
    # Liste des fichiers
    filenames = os.listdir()
    
    print(filenames)
    
    # On retire les fichiers dont le nom commence par un "." (fichiers cachés)
    filenames = [filename for filename in filenames if not filename.startswith(".")]
    
    d_extensions = {}
    
    # Nom complet = nom + extension
    for filename_and_extension in filenames:
        
        #print(filename_and_extension)
        
        # On coupe sur le "."
        filename_and_extension = filename_and_extension.split(".")
        
        #print(filename_and_extension)
        
        # On essaie de prendre le premier et le deuxime object dans la liste obtenue
        try:
            filename, extension = filename_and_extension[0], filename_and_extension[1]
        # Si on n'y arrive pas (il n'y avait pas de "." donc on a pas coupé sur le ".")
        except:
            continue

        # Si première fois qu'on compte cette extension
        if extension not in d_extensions:
            d_extensions[extension] = 1
            
        # Si au moins la deuxième fois qu'on compte cette extension
        else:
            d_extensions[extension] += 1
            
    return d_extensions

compter_extensions()

['02_pandas_tp_corr.ipynb', 'introduction_to_google_colab.ipynb', 'file_1.txt', '.DS_Store', 'file_0.txt', 'file_2.txt', '01_tp_2_test_boucle_fonction.ipynb', 'liste_noms_des_fichiers_new.txt', '03_tp_3_algorithmie.ipynb', 'README.md', 'introduction_m1_csb.pdf', 'file_test', '.gitignore', 'liste_noms_des_fichiers_fadi.txt', '01_tp_1_syntaxe_variables_et_types.ipynb', 'drafts.ipynb', '03_tp_4_files.ipynb', 'python_syntax.py', '.ipynb_checkpoints', 'liste_noms_des_fichiers.txt', '.git', '.vscode', 'data', '01_python_et_env.pdf']


{'ipynb': 7, 'txt': 6, 'md': 1, 'pdf': 2, 'py': 1}

## Exercice 2 - Fichiers et datetimes
- Ecrire une fonction qui pendant 30 secondes crée un fichier toutes les 5 secondes (donc 6 fichiers) : 
    - ce fichier aura comme nom son heure de création
    - Il contiendra le numéro du fichier (1 pour le premier,..., 6 pour le dernier)

## Exercice 2 - correction
#### Faire la correction ainsi si les élèves sont d'accord : j'ai une idée + StackOverflow pour une méthode 3
#### Discuter succintement de la différence entre les deux (ou trois) méthodes#

In [13]:
import datetime

# Méthode 1 
# On va regarder très régulièrement l'heure qu'il est
# Et toutes les 5 secondes


def ecrire_fichier(num_fichier, datetime):
    """Ecrit un fichier intitulé {datetime}.txt.
       Ce fichier contient la mention : Fichier numero {num_fichier}"""
    
    # On convertit en string la datetime pour nommer le fichier
    filename = datetime.isoformat() + ".txt"
    
    # On ouvre le fichier
    file = open(filename,"w+")
    
    # On écrit dans le fichier
    file.write(f"Fichier numero {num_fichier}")
    
    # On ferme le fichier
    file.close() 
    

# Datetime de debut. En remplace les microseconds par 0 pour :
    # Plus de lisibilité
    # On va générer les autres datetimes en ajoutant 5, 10, 15 seconds...
    # On ne propagera donc pas les valeurs de microseconds
    
# Datetime de début
datetime_debut = datetime.datetime.now().replace(microsecond=0)

# Toutes les datetimes auxquelles on devra écrire
liste_datetime_ecrire = [datetime_debut + datetime.timedelta(seconds=5*x) for x in range(1, 7)]

# On stocke les datetimes auxquelles on a déjà écrit (pour ne pas réécrire une deuxième fois)
liste_datetime_ecrites = []


num_fichier = 1

while True:
    
    # Si on est au 7ème on arrête
    if num_fichier == 7:
        break
    
    # Il est cette heure ci
    datetime_maintenant =  datetime.datetime.now().replace(microsecond=0)
    
    # On vérifie que c'est une heure à laquelle on doit écrire
    on_doit_ecrire_maintenant = datetime_maintenant in liste_datetime_ecrire
    
    # On vérifie qu'on a pas déjà écrit à cette heure ci
    on_l_a_deja_fait =  datetime_maintenant in liste_datetime_ecrites
    
    # Cas dans lequel on doit écrire
    if on_doit_ecrire_maintenant & (not on_l_a_deja_fait):
        
        # On écrit le fichier
        ecrire_fichier(num_fichier, datetime_maintenant)
        print(f'Fichier {num_fichier} écrit à {datetime_maintenant.isoformat()}')
        
        # On stocke la datetime correspondantes
        liste_datetime_ecrites.append(datetime_maintenant)
        
        # On incrémente le numéro du fichier
        num_fichier +=1
        
    # Dans l'autre cas, on ne fait rien
    else:
        pass


Fichier 1 écrit à 2020-11-06T10:40:11
Fichier 2 écrit à 2020-11-06T10:40:16
Fichier 3 écrit à 2020-11-06T10:40:21
Fichier 4 écrit à 2020-11-06T10:40:26
Fichier 5 écrit à 2020-11-06T10:40:31
Fichier 6 écrit à 2020-11-06T10:40:36


In [11]:
# Méthode de Raphaël 

time_in_second = 30

def create_file(s) :
    current_seconds = 0
    past_seconds = 0
    file_count = 0
    begin_time = datetime.datetime.now()
    
    while current_seconds != s :
        now = datetime.datetime.now()
        current_seconds = (now - begin_time).seconds
        
        if current_seconds != past_seconds:
            past_seconds = current_seconds
        else:
            continue
            
        print(current_seconds)
        
        if current_seconds % 5 == 0 and current_seconds != 0:
            file_count += 1
            with open(f"{datetime.datetime.now().strftime('%H:%M:%S')}.txt","w+") as f : 
                f.write(str(file_count))
                print("file created successfully")
            continue
             
create_file(time_in_second)

1
2
3
4
5
file created successfully
6
7
8
9
10
file created successfully
11
12
13
14
15
file created successfully
16
17
18
19
20
file created successfully
21
22
23
24
25
file created successfully
26
27
28
29
30
file created successfully


In [17]:
# Méthode 2
# En utilisant le package time

import time 

for num_fichier in range(1, 7):
    
    # On attend 5 secondes
    time.sleep(5)
    
    # Datetime actuelle
    datetime_maintenant = datetime.datetime.now()
    
    # On écrit le fichier
    ecrire_fichier(num_fichier, datetime_maintenant)
    print(f'Fichier {num_fichier} écrit à {datetime_maintenant.isoformat()}')

Fichier 1 écrit à 2020-11-04T22:03:52.942931
Fichier 2 écrit à 2020-11-04T22:03:57.948338
Fichier 3 écrit à 2020-11-04T22:04:02.951148
Fichier 4 écrit à 2020-11-04T22:04:07.954280
Fichier 5 écrit à 2020-11-04T22:04:12.956743
Fichier 6 écrit à 2020-11-04T22:04:17.959525


In [10]:
# Méthode de Julien

import time
import datetime

def create_files():
    
    
    for i in range(1, 6):
        
        nom_du_fichier = f"Fichier_{datetime.datetime.now().time()}_{i}.txt "
        # Caractères problématiques sur Windows
        nom_du_fichier = nom_du_fichier.replace(":", "-")
        print(nom_du_fichier)
        
        # Ouverture
        fichier = open(nom_du_fichier, "w+")
        # On écrit dans le fichier
        fichier.write(f"Fichier numero {i}")
        # On ferme le fichier
        fichier.close() 
        # Attendre 5 secondes
        time.sleep(5)
        

create_files()

Fichier_10-25-01.364484_1.txt 
Fichier_10-25-06.369498_2.txt 
Fichier_10-25-11.375250_3.txt 
Fichier_10-25-16.380506_4.txt 
Fichier_10-25-21.384255_5.txt 


## Exercice 3 - Zen of Python
- Ecrire un programme qui crée un fichier et écrit le texte suivant dans ce fichier
- Ecrire un programme qui crée un fichier et écrit le texte suivant mais seulement les lettres, espaces et retours à la ligne
- Ecrire un programme qui crée un fichier par ligne, avec comme noms 'ligne_1.txt', 'ligne_2.txt', ... et contenant chacun la première ligne, la deuxième etc...


In [None]:
a = 10


# 1000 lignes de codes


def f(b):
    
    return a + b
    
    
[1, 2, 3, 4, 5, 6]
[[1, 2], [3, 4], [5, 6]]

In [15]:
import this
zen_of_python = """
The Zen of Python, by Tim Peters

Beautiful is better than ugly.
Explicit is better than implicit.
Simple is better than complex.
Complex is better than complicated.
Flat is better than nested.
Sparse is better than dense.
Readability counts.
Special cases aren't special enough to break the rules.
Although practicality beats purity.
Errors should never pass silently.
Unless explicitly silenced.
In the face of ambiguity, refuse the temptation to guess.
There should be one-- and preferably only one --obvious way to do it.
Although that way may not be obvious at first unless you're Dutch.
Now is better than never.
Although never is often better than *right* now.
If the implementation is hard to explain, it's a bad idea.
If the implementation is easy to explain, it may be a good idea.
Namespaces are one honking great idea -- let's do more of those!
"""

The Zen of Python, by Tim Peters

Beautiful is better than ugly.
Explicit is better than implicit.
Simple is better than complex.
Complex is better than complicated.
Flat is better than nested.
Sparse is better than dense.
Readability counts.
Special cases aren't special enough to break the rules.
Although practicality beats purity.
Errors should never pass silently.
Unless explicitly silenced.
In the face of ambiguity, refuse the temptation to guess.
There should be one-- and preferably only one --obvious way to do it.
Although that way may not be obvious at first unless you're Dutch.
Now is better than never.
Although never is often better than *right* now.
If the implementation is hard to explain, it's a bad idea.
If the implementation is easy to explain, it may be a good idea.
Namespaces are one honking great idea -- let's do more of those!


## Exercice 3 - correction

In [23]:
# - Ecrire un programme qui crée un fichier et écrit le texte suivant dans ce fichier

# On ouvre le fichier
file = open("zen_of_python.txt","w+")

# On écrit dans le fichier
file.write(zen_of_python)

# On ferme le fichier
file.close() 


# - Ecrire un programme qui crée un fichier et écrit le texte suivant mais seulement les lettres, espaces et retours à la ligne

# On garde lettres, espaces et retours à la ligne
zen_of_python_list_filtered = [s for s in zen_of_python if s.isalpha() or s in [" ", "\n"] ]
#print(zen_of_python_list_filtered)

# On transforme la liste obtenue en chaîne de caractères
zen_of_python_string_filtered = "".join(zen_of_python_list_filtered)
#print(zen_of_python_string_filtered)

# On ouvre le fichier
file = open("zen_of_python_filtered.txt","w+")

# On écrit dans le fichier
file.write(zen_of_python_string_filtered)

# On ferme le fichier
file.close() 


#- Ecrire un programme qui crée un fichier par ligne, avec comme noms 'ligne_1.txt', 'ligne_2.txt', ... et contenant chacun la première ligne, la deuxième etc...

# On découpe en ligne et on stocke dans une liste
zen_of_python_list = zen_of_python.split("\n")
print(zen_of_python_list)

for num_line, line in enumerate(zen_of_python_list):
    
    # Pour commencer à 1 et pas 0
    num_line +=1 
    
    # On ouvre le fichier
    file = open(f"ligne_{num_line}.txt","w+")

    # On écrit dans le fichier
    file.write(line)

    # On ferme le fichier
    file.close() 

['', 'The Zen of Python, by Tim Peters', '', 'Beautiful is better than ugly.', 'Explicit is better than implicit.', 'Simple is better than complex.', 'Complex is better than complicated.', 'Flat is better than nested.', 'Sparse is better than dense.', 'Readability counts.', "Special cases aren't special enough to break the rules.", 'Although practicality beats purity.', 'Errors should never pass silently.', 'Unless explicitly silenced.', 'In the face of ambiguity, refuse the temptation to guess.', 'There should be one-- and preferably only one --obvious way to do it.', "Although that way may not be obvious at first unless you're Dutch.", 'Now is better than never.', 'Although never is often better than *right* now.', "If the implementation is hard to explain, it's a bad idea.", 'If the implementation is easy to explain, it may be a good idea.', "Namespaces are one honking great idea -- let's do more of those!", '']


In [22]:

for num_line, line in enumerate(zen_of_python_list):
    num_line +=1 
    print(num_line, line[:10])

1 
2 The Zen of
3 
4 Beautiful 
5 Explicit i
6 Simple is 
7 Complex is
8 Flat is be
9 Sparse is 
10 Readabilit
11 Special ca
12 Although p
13 Errors sho
14 Unless exp
15 In the fac
16 There shou
17 Although t
18 Now is bet
19 Although n
20 If the imp
21 If the imp
22 Namespaces
23 
