# Entrées/Sorties

## Introduction

La gestion des entrées/sorties est une compétence essentielle en programmation Python puisqu'un des cas d'usage très répandu de Python consiste à récupérer des fichiers, leur appliquer des transformations et les réexporter.

## La fonction ```open```

Cette fonction est en réalité un alias vers la fonction ```io.open()``` de la librairie ```io``` (input output).

La clause ```with``` permet de s'assurer que le fichier n'est plus en écriture lorsqu'on sort de cette clause. C'est une bonne pratique que de l'utiliser. Ouvrons un fichier en mode écriture (```"w"``` pour "write").

In [None]:
lines = ["Hello everyone \n", "This is a line \n", "And again, a new line! \n"]
 
with open("myfile.txt", "w") as f:
    f.write("Hello \n")
    f.writelines(lines)

## Le module ```io```

Le module ```io``` fournit les classes de base pour la gestion des entrées/sorties. Il est utilisé pour lire et écrire des fichiers binaires et textuels. Une partie de ses fonctions sont appelées par le "built-in" de Python.

La norme d'encodage (*encoding*) est l'encodage le plus commun depuis le début des années 2010. On peut le spécifier pour être sûr que Python l'utilise.

L'argument ```'r'``` signifie "read".

In [None]:
lines = ["Hello everyone \n", "This is a line \n", "And again, a new line! \n"]

with open("myfile.txt", 'w', encoding='utf-8') as f:
    f.write("Hello \n")
    f.writelines(lines)
    
### Now let's read a file

with open("myfile.txt", 'r', encoding='utf-8') as f:
    content = f.read()
    print(content)

## Exercice

❓ **>>>** Écrivez un programme Python qui demande à l'utilisateur d'entrer son nom et son âge avec la fonction ```input()```, puis écrit ces informations dans un fichier texte nommé `info.txt`. Ensuite, lisez le contenu du fichier et affichez-le à l'écran. Exemple du fichier:

```
Nom : John
Age : 72
```

In [None]:
# Code here!


## Module ```csv```

Le module ```csv``` permet de lire et d'écrire des fichiers CSV (Comma-Separated Values). Il est toutefois de plus en plus remplacé par la librairie Pandas.

In [None]:
import csv

# Writing
with open('example.csv', 'w', newline='') as f:
    writer = csv.writer(f)
    writer.writerow(['Name', 'Age', 'City'])
    writer.writerow(['Alice', 49, 'Paris'])
    writer.writerow(['Bob', 25, 'Lyon'])

# Reading
with open('example.csv', 'r') as f:
    reader = csv.reader(f)
    for row in reader:
        print(row)

## Utilisation de fichier JSON

Le module `json` permet de lire et d'écrire des fichiers JSON (JavaScript Object Notation).

La syntaxe entre les dictionnaires et les JSON semble proche, mais elle n'est pas exactement la même.

### Comparaison entre JSON et Dictionnaire Python

| Caractéristique                                 | JSON                                                                 | Dictionnaire Python                                                 |
|-------------------------------------------------|---------------------------------------------------------------------|---------------------------------------------------------------------|
| Types de clés                                   | Les clés JSON ne peuvent être que des chaînes de caractères.        | Les clés du dictionnaire peuvent être n'importe quel objet hashable. |
| Ordre et répétition des clés                    | Les clés JSON sont ordonnées séquentiellement et peuvent être répétées. | Les clés du dictionnaire ne peuvent pas être répétées et doivent être distinctes. |
| Valeur par défaut des clés                      | Les clés JSON ont une valeur par défaut de `undefined`.             | Il n'y a pas de valeur par défaut dans les dictionnaires.           |
| Accès aux valeurs                               | Les valeurs dans un fichier JSON sont accessibles en utilisant l'opérateur "." (point) ou "[]". | L'opérateur de souscription est utilisé pour accéder aux valeurs dans le dictionnaire. Par exemple, si `dict = {'A': '123R', 'B': '678S'}`, on peut récupérer les données en appelant `dict['A']`. |
| Guillemets pour les chaînes de caractères       | Pour les objets de type chaîne, nous devons utiliser des guillemets doubles. | Pour les objets de type chaîne, nous pouvons utiliser des guillemets simples ou doubles. |
| Type de retour de l'objet                       | En JSON, le type de retour de l'objet est un type d'objet 'string'. | Le type de retour de l'objet est un type d'objet 'dict' dans un dictionnaire. |

[source](https://www.geeksforgeeks.org/difference-between-json-and-dictionary-in-python/)

### Écriture d'un JSON

In [None]:
import json

data = {
    'name': 'Alice',
    'age': 30,
    'city': 'Paris'
}

with open('example.json', 'w') as f:
    json.dump(data, f)

with open('example.json', 'r') as f:
    data = json.load(f)
    print(data)

## Exercice

❓ **>>>** Écrivez un programme Python qui lit un fichier JSON dans le dossier "data" qui se nomme `persons.json` et transforme son contenu en un fichier CSV nommé `persons.csv`. Le fichier JSON contient une liste de dictionnaires, où chaque dictionnaire représente une ligne du fichier CSV.

**Astuces**

- La méthode ```csv.DictWriter``` prend un argument "fieldnames" afin de connaître le nom des champs.
- La méthode ```.writeheader()``` peut être utile pour écrire l'en-tête (*header*).

In [None]:
import json
import csv

# Code here!


## Fichiers YAML

### Introduction

YAML (YAML Ain't Markup Language) est un format de sérialisation de données lisible par un être humain, souvent utilisé pour stocker des configurations et des paramètres. En Python, vous pouvez utiliser la bibliothèque `PyYAML` pour lire et écrire des fichiers YAML.

### Installation de PyYAML

Pour utiliser YAML en Python, vous devez d'abord installer la bibliothèque `PyYAML`.

```sh
pip install pyyaml
```

### Structure d'un fichier YAML

Un fichier YAML est un fichier texte qui utilise une syntaxe simple pour représenter des données structurées :

```yaml
# config.yaml
database:
  host: localhost
  port: 5432
  user: admin
  password: secret

logging:
  level: INFO
  file: app.log
```

**>>> Copiez-coller le contenu du fichier dans un nouveau fichier YAML que vous appellerez "config.yaml".**

### Lire un fichier YAML

Pour lire un fichier YAML en Python, vous pouvez utiliser la fonction `yaml.safe_load()` de la bibliothèque `PyYAML`.

In [None]:
import yaml

with open('config.yaml', 'r') as file: # 'r' stands for 'read'
    config = yaml.safe_load(file)

print(config['database']['host'])  # Output: localhost
print(config['database']['port'])  # Output: 5432
print(config['logging']['level'])  # Output: INFO
print(config['logging']['file'])   # Output: app.log

### Écrire un fichier YAML

Pour écrire des données dans un fichier YAML, vous pouvez utiliser la fonction `yaml.dump` de la bibliothèque `PyYAML`.

In [None]:
import yaml

# Dict of parameters
config = {
    'database': {
        'host': 'localhost',
        'port': 5432,
        'user': 'admin',
        'password': 'secret'
    },
    'logging': {
        'level': 'INFO',
        'file': 'app.log'
    }
}

# Dumping the parameters in a file
with open('config.yaml', 'w') as file:
    yaml.dump(config, file)

## La sérialisation avec le module `Pickle`

Le module `pickle` permet de sérialiser et de désérialiser des objets Python. Pour être sûr que le chargement d'un de ces fichiers soit bien effectué, il faut tenter de le charger dans le même environnement (même version de Python et des librairies).

In [None]:
import pickle

data = {
    'name': 'Alice',
    'age': 30,
    'city': 'Paris'
}

with open('exemple.pkl', 'wb') as f:
    pickle.dump(data, f)

with open('exemple.pkl', 'rb') as f:
    data = pickle.load(f)
    print(data)

## La sérialisation avec le module `Shelve`

Le module `shelve` permet de stocker des objets Python dans un fichier de manière persistante mais comme une base de données clé-valeur. Le format de fichier ressemble à du JSON (ou du YAML) qui pourrait stocker des objets Python un peu comme du pickle. Ce format est de moins en moins utilisé car il souffre de son manque de compatibilité avec tout ce qui n'est pas Python.

In [None]:
import shelve

# Écriture dans un fichier Shelve
with shelve.open('exemple.db') as db:
    db['nom'] = 'Alice'
    db['âge'] = 30
    db['ville'] = 'Paris'

# Lecture d'un fichier Shelve
with shelve.open('exemple.db') as db:
    print(db['nom'])
    print(db['âge'])
    print(db['ville'])