# Files

Bienvenue dans ce notebook d'apprentissage python. Il est consacré à l'apprentissage de la manipulation des fichiers CSV (comma-separated values), JSON (JavaScript Object Notation), Pickle… et au traitement des erreurs.


### Fichiers 

Pour tout fichier Python qu'on ouvre dans un programme Python, Python crée en réalité un objet fichier pour  nous permettre d'interagir avec ce fichier.

Lorsqu’un programme Python commence à s’exécuter, il crée trois objets de fichier standard :
  - sys.stdin — l’objet fichier d’entrée standard (est utilisé par la fonction **input** pour acceder aux valeurs         fournies en entrée par l'utilisateur)  
  - sys.stdout – l’objet de fichier de sortie standard(est utilisé par la fonction **print** pour afficheer les      valeurs de sortie par l'utilisateur;
  - sys.stderr – l’objet de fichier d’erreur standard. (python accede implicitement a ce fichier pour l'affichage d'erreur)


 Vous devez importer le module sys si vous avez besoin de faire référence à ces objets explicitement dans votre code.
 
 ### Traitement des fichiers textes
 
 #### Ecriture dans un fichier texte

In [31]:
### creation d'un nouveau fichier (.txt == plain text file) 'accounts.txt' et ecriture dans ce ficher
with open('account.txt', mode= 'w') as accounts:
    accounts.write('100 Jones 24.98\n')
    accounts.write('200 Doe 345.67\n')
    accounts.write('300 White 0.00\n')
    accounts.write('400 Stone -42.16\n')
    accounts.write('500 Rich 224.62\n')

### Meme chose que precedemment mais avec la fonction print
with open('accounts.txt', mode= 'w') as accounts:
    print('100 Jones 24.98', file=accounts)   # Ici pas besoin d'utiliser le caractere retour a la ligne \n.
    print('200 Jones 24.98', file=accounts)   # Pour aller a la ligne. Elle s'effectue automatiquement avec print.

L'instruction **with** de python:
 - Accede a une ressource et a affecter l'objet de cette ressource a une variable
 - Permet la modification de cette ressource via cette variable
 - ferme automatiquement la ressource une fois le programme atteint la fin de l'instruction **with** 

L'instruction **open** de python:
- Ouvre le fichier
- le parametre **mode** specifie le mode d'ouverture:'w' pour ecriture, 'r' pour lecture

L'instruction **as** permet d'assigner l'objet du fichier a une variable (accounts dans l'exemple precedent)

La methode **write** du l'objet fichier permet d'enregistrer des valeurs dans le fichier.


### Lecture des donnees dans un fichier

In [32]:
with open('account.txt', mode= 'r') as accounts:
    print(f'{"Account":<10}{"Name":<10}{"Balance":<10}')
    for records in accounts:
        account, name, balance = records.split()
        print(f'{account:<10}{name:<10}{balance:<10}')
    

Account   Name      Balance   
100       Jones     24.98     
200       Doe       345.67    
300       White     0.00      
400       Stone     -42.16    
500       Rich      224.62    


- la methode **readline** aussi permet de lire les fichiers mais s'avere tres consmmateur en temps lorsque le fichier est de grande taille.C'est beaucoup moins efficace que le programme ecrit precedemment.

### Mise a jour du fichier accounts
Nous voulons changer le nom  du compte 300 de white par williams dans le fichier accounts. Que faire?

nous pouvons :
- copier les enregistrements avant 300 white 0.00 dans un fichier temporaire,
- écrire le dossier du compte 300 dans ce fichier, en le mettant à jour et au format correct;
- copier les enregistrements après 300 White 0.00 dans le fichier temporaire,
- supprimer l’ancien fichier et
- renommer le fichier temporaire pour utiliser le nom du fichier d’origine.

Cette methode est tres fastidieuse car requiert le traitement de toutes les  donnees pour la modification d'une seule ligne. 

In [33]:
accounts = open('account.txt', mode= 'r')

temp_file = open('temp_file.txt', mode= 'w')

with accounts, temp_file:
    
    for record in accounts:
        account, name, balance = record.split()
        
        if account!= '300': 
            temp_file.write(record)
        else:

            new_record = ' '.join([account, 'Williams', balance])
            temp_file.write(new_record + '\n')


Il nous reste a supprimer l'ancien fichier 'account.txt' et renommer le fichier 'temp_file.txt' en 'account.txt' pour finaliser la mise a jour. Cela est possible avec les fonctions du module OS(Operating System).

In [34]:
import os    # importation du module os
os.remove('account.txt')     # suppression du fichier accounts
os.rename('temp_file.txt', 'account.txt')   # renomme le fichier temp_file.txt  en fichier accounts.txt 

### La serialisation avec JSON

la serialisation avec JSON consiste a convertir des objects ou structure de donnees en une chaine de caractere au format json. Les principales utilisation de la serialisation sont les suivantes:

**1-Communication :** Transfert de données entre systèmes via des API ou des fichiers.

**2-Stockage :** Sauvegarde de données dans des fichiers ou bases JSON.

**3-Interopérabilité :** Échange entre différents langages de programmation.

La fonction **dump** du module **json** de python permet de faire la serialisation. les objets JSON sont similaire aux dictionnaires python  


In [35]:
# Exemple de serialisation avec json
## creation de dictionnaire 
accounts_dict = {'accounts': [{'account': 100, 'name': 'Jones', 'balance': 24.98},
{'account': 200, 'name': 'Doe', 'balance': 345.67}]}  # ceation d'un dictionnaire 

## Serialisation proprement dite en JSON
import json 
with open('accounts.json', 'w') as accounts:
    json.dump(accounts_dict, accounts)        # un objet Json delimite une chaine de caractere qu'avec 
                                              # les doubles quote

### La deserialisation avec JSON

C'est l'operation inverse de la serialisation. Passer du  contenue entier en json en l'objet python correspondant. Cette operation est realisee avec la fonction load() du module json

In [36]:
with open('accounts.json','r') as account:
    accounts_json = json.load(account)

In [37]:
 accounts_json

{'accounts': [{'account': 100, 'name': 'Jones', 'balance': 24.98},
  {'account': 200, 'name': 'Doe', 'balance': 345.67}]}

### Affichage d'un texte JSON
L'affichage d'un texte json se fait avec la fonction **dumps**(pour 'dump string') et **load** du module json.

In [38]:
with open('accounts.json', 'r') as accounts:
    print(json.dumps(json.load(accounts), indent=4))  ## l'argument indent permet de faire de la pretty printing

{
    "accounts": [
        {
            "account": 100,
            "name": "Jones",
            "balance": 24.98
        },
        {
            "account": 200,
            "name": "Doe",
            "balance": 345.67
        }
    ]
}


### Focus sur la securite: La serialisation et deserialisation  avec pickle
La librairie pickle permet de serialiser et deserialiser les fichier dans un format specific de python. Cependant ce type de serialisation et deserialisatoion n'est pas conseille a cause de soon faible niveau de securite.

Preventions dans la doc de pickle:
- “Pickle files can be hacked. If you receive a raw pickle file over the network, don’t
  trust it! It could have malicious code in it, that would run arbitrary Python when
  you try to de-pickle it. However, if you are doing your own pickle writing and
  reading, you’re safe (provided no one else has access to the pickle file, of course.)”
- “Pickle is a protocol which allows the serialization of arbitrarily complex Python
  objects. As such, it is specific to Python and cannot be used to communicate with
  applications written in other languages. It is also insecure by default: deserializing
  pickle data coming from an untrusted source can execute arbitrary code, if the
  data was crafted by a skilled attacker.”


### Remarques additionnelles concernant les tableaux


|Mode|Description| 
|----|----------------------------------------------------------------------------------------------------------|
| 'r'|  Open a text file for reading. This is the default if you do not specify the file-open mode when you call open.| 
|'w' | Open a text file for writing. Existing file contents are deleted.|
| 'a' | Open a text file for appending at the end, creating the file if it does not exist. New data is written at the end of the file.|
|'r+'| Open a text file reading and writing.|
|'w+'| Open a text file reading and writing. Existing file contents are deleted.|
|'a+'| Open a text file reading and appending at the end. New data is written at the end
of the file. If the file does not exist, it is created.|



Voici quelques autres méthodes utiles pour les objets de fichier.
- Pour un fichier texte, la méthode **read** renvoie une chaîne contenant le nombre de caractères spécifié par l'argument entier de la méthode. Pour un fichier binaire, la méthode retourne le nombre spécifié d'octets. Si aucun argument n'est spécifié, la méthode retourne l'intégralité du contenu du fichier.
- La méthode **readline** renvoie une ligne de texte sous forme de chaîne, y compris le caractère de nouvelle ligne s'il y en a un. Cette méthode retourne une chaîne vide lorsqu'elle rencontre la fin du fichier.
- La méthode **writelines** reçoit une liste de chaînes de caractères et écrit son contenu dans un fichier.
- La méthode **readlines** renvoie le contenu de l'ensemble du fichier sous forme de liste de chaînes de caractères, où chaque élément de la liste représente une ligne du fichier.
Les classes que Python utilise pour créer des objets de fichier sont définies dans le module io de la bibliothèque standard Python (https://docs.python.org/3/library/io.html).
