# Python File I/O
## Python file operation

Un fichier est un conteneur pour stocker des données. Python a plusieurs fonctions pour créer, lire, mettre à jour et supprimer des fichiers.

Pour manipuler un fichier, il faut d'abord l'ouvrir, le modifier (ecrire/lire) puis le fermer. Il est indispensable de fermer un fichier après l'avoir ouvert afin de libérer les ressources associées au fichier.

## Ouvrir un fichier en python

En python, on peut ouvrir un fichier en utilisant la fonction `open()`. La syntaxe de la fonction `open()` est la suivante:

```python
open(file, mode='r', buffering=-1, encoding=None, errors=None, newline=None, closefd=True, opener=None)
```

- `file`: le nom du fichier à ouvrir
- `mode`: le mode d'ouverture du fichier.
- `buffering`: le mode de buffering. Les modes de buffering sont:
    - `0`: pas de buffering
    - `1`: buffering ligne par ligne
    - `>1`: buffering avec la taille spécifiée
    - `-1`: buffering par défaut
- `encoding`: le mode d'encodage du fichier
- `errors`: le mode de gestion des erreurs
- `newline`: le mode de gestion des sauts de ligne
- `closefd`: le mode de fermeture du fichier
- `opener`: le mode d'ouverture du fichier

La fonction `open()` retourne un objet de type `file`. On peut utiliser cet objet pour lire, écrire et modifier le fichier.

> **Note**: Nous allons utiliser le fichier stocké dans `./files/test.txt` dans ce `Jupyter Notebook`.

In [1]:
TEST_FILE_PATH = "./files/test.txt"

In [2]:
# open file
file1 = open("./files/test.txt")

# Explicit mode declaration
file2 = open(TEST_FILE_PATH, "r")

Ici, nous avons crée un objet `file1` qui est associé au fichier `test.txt`. Par défaut s'il n'est pas spécifié, le mode d'ouverture est `r` (read). On peut spécifier le mode d'ouverture en utilisant le paramètre `mode` de la fonction `open()`.

### Différents modes d'ouverture

| Mode | Description |
| --- | --- |
| `r` | Ouvre un fichier en lecture seule. C'est le mode par défaut. |
| `w` | Ouvre un fichier en écriture seule. Ecrase le fichier s'il existe. Crée un nouveau fichier sinon. |
| `a` | Ouvre un fichier en écriture seule. Ajoute le contenu à la fin du fichier s'il existe. Crée un nouveau fichier sinon. |
| `x` | Ouvre un fichier en écriture seule. Crée un nouveau fichier. Retourne une erreur si le fichier existe déjà. |
| `t` | Ouvre un fichier en mode texte. C'est le mode par défaut. |
| `+` | Ouvre un fichier en lecture et écriture. |
| `b` | Ouvre un fichier en mode binaire. |

```python
file1 = open(TEST_FILE_PATH)      # equivalent to 'r' or 'rt'
file1 = open(TEST_FILE_PATH,'w')  # write in text mode
file1 = open(TEST_FILE_PATH,'r+b') # read and write in binary mode
```

## Read file

Une fois le fichier ouvert, on peut lire son contenu en utilisant la méthode `read()` de l'objet `file`. La méthode `read()` retourne le contenu du fichier sous forme de chaîne de caractères. La syntaxe de la méthode `read()` est la suivante:

```python
file.read(size=-1)
```

La méthode `read()` prend un paramètre optionnel `size` qui indique le nombre maximum de caractères à lire. Si le paramètre `size` n'est pas spécifié, la méthode `read()` lit tout le contenu du fichier.

In [None]:
# open a file
file11 = open(TEST_FILE_PATH, "r")

# read the file
read_content = file11.read()
print(read_content)

## Closing file

Quand nous avons terminé de travailler avec un fichier, il est important de le fermer. La méthode `close()` de l'objet `file` permet de fermer un fichier et de libérer la resource. La syntaxe de la méthode `close()`.

In [3]:
# open a file
file1 = open(TEST_FILE_PATH, "r")

# read the file
read_content = file1.read()
print(read_content)

# close the file
file1.close()

This is a test file.
Hello from the test file.


> **Note**: Apres avoir utilisé le fichier, il est important de le fermer. C'est une bonne pratique en programmation.

## with...open syntax

La syntaxe `with...open` permet d'ouvrir un fichier et de le fermer automatiquement après avoir terminé de travailler avec. La syntaxe de la syntaxe `with...open` est la suivante:

```python
with open(file, mode='r', buffering=-1, encoding=None, errors=None, newline=None, closefd=True, opener=None) as file:
    # do something with file
```

In [None]:
with open(TEST_FILE_PATH, "r") as file1:
    read_content = file1.read()
    print(read_content)

> **Note**: La syntaxe `with...open` est recommandée pour ouvrir un fichier, car elle se charge de fermer le fichier automatiquement.

## Ecrire dans un fichier

Pour écrire dans un fichier, on utilise la méthode `write()` de l'objet `file`. La syntaxe de la méthode `write()` est la suivante:

```python
file.write(str)
```

Il y deux choses a se souvenirs quand on écrit dans un fichier en mode `w`:

- Si le fichier n'existe pas, il sera crée.
- Si le fichier existe, son contenu sera écrasé.

In [4]:
with open('./files/test2.txt', 'w') as file2:
    # write contents to the test2.txt file
    file2.write('Programming is Fun. \n')
    file2.write('Written from Python.')

## Python file methods

| Method | Description |
| --- | --- |
| `close()` | Ferme le fichier. |
| `detach()` | Sépare le fichier du buffer. |
| `fileno()` | Retourne le numéro du fichier. |
| `flush()` | Vide le buffer du fichier. |
| `isatty()` | Retourne `True` si le fichier est un terminal. |
| `read(n)` | Lit `n` octets du fichier. |
| `readable()` | Retourne `True` si le fichier est lisible. |
| `readline(n=-1)` | Lit une ligne du fichier. |
| `readlines(n=-1)` | Lit `n` lignes du fichier. |
| `seek(offset, from=SEEK_SET)` | Change la position du curseur. |
| `seekable()` | Retourne `True` si le fichier supporte `seek()`. |
| `tell()` | Retourne la position du curseur. |
| `truncate(size=None)` | Tronque le fichier à `size` octets. |
| `writable()` | Retourne `True` si le fichier est écrivable. |
| `write(s)` | Ecrit la chaîne `s` dans le fichier. |
| `writelines(lines)` | Ecrit une liste de lignes dans le fichier. |

# CSV file

Le type de fichier CSV (Comma Separated Values) est un format de fichier qui permet de stocker des données tabulaires (lignes / colonnes). Chaque ligne du fichier représente une ligne du tableau. Les valeurs de chaque ligne sont séparées par une virgule.

## Exemple de fichier CSV

| id | name | age | city | uid | pwd |
| --- | --- | --- | --- | --- | --- |
| 1 | John | 25 | New York | toto | 12345 |
| 2 | Jack | 30 |  | titi | 12345 |

```csv
id,name,age,city,uid,pwd
1,John,25,New York,toto,12345
2,Jack,30,,titi,12345
```

Ici, on a un fichier CSV qui contient 4 colonnes: `id`, `name`, `age` et `city`. Chaque ligne du fichier représente une personne. La première ligne du fichier est appelée `header` et contient les noms des colonnes.

## Le module CSV

Python a un module CSV qui permet de lire et d'écrire des fichiers CSV. Le module CSV fournit des classes pour lire et écrire des données tabulaires au format CSV.

## Lire un fichier CSV

Pour lire un fichier CSV, on utilise la classe `reader` du module CSV. La classe `reader` permet de lire les données d'un fichier CSV ligne par ligne. La syntaxe de la classe `reader` est la suivante:

```python
csv.reader(csvfile, dialect='excel', **fmtparams)
```

La classe `reader` prend un paramètre obligatoire `csvfile` qui est un objet `file` ou une chaîne de caractères qui représente le chemin du fichier CSV. La classe `reader` prend aussi un paramètre optionnel `dialect` qui permet de spécifier le dialecte du fichier CSV. Le paramètre `dialect` prend un objet `Dialect` ou une chaîne de caractères qui représente le nom du dialecte. Il est aussi possible de spécifier des paramètres optionnels en lien avec le dialecte en utilisant le paramètre `fmtparams`.

### l'objet Dialect

L'objet `Dialect` permet de spécifier le dialecte du fichier CSV. L'objet `Dialect` a les attributs suivants:

| Attribut | Description |
| --- | --- |
| `delimiter` | Le caractère qui sépare les champs. Par défaut `,`. |
| `doublequote` | Si `True`, on utilise deux symboles de citation a la suite, sinon on utilise le caractère d'échapement |
| `escapechar` | Le caractère qui échappe les caractères spéciaux. Par défaut `None`. Si `None` l'escaping est désactivé |
| `lineterminator` | Le caractère qui termine une ligne. Par défaut `'\r\n'`. |
| `quotechar` | Le caractère qui entoure les champs. Par défaut `'"'`. |
| `quoting` | Définis comment géré les caractères d'échapement. Les valeurs possibles sont: <ul><li>`csv.QUOTE_ALL`: tous les champs sont entourés de `quotechar`</li><li>`csv.QUOTE_MINIMAL`: seuls les champs qui contiennent des caractères spéciaux sont entourés de `quotechar`</li><li>`csv.QUOTE_NONNUMERIC`: seuls les champs qui ne sont pas des nombres sont entourés de `quotechar`</li><li>`csv.QUOTE_NONE`: aucun champ n'est entouré de `quotechar`</li>Par défaut `QUOTE_MINIMAL`.<ul> |
| `skipinitialspace` | Si `True`, les espaces après le délimiteur sont ignorés. Par défaut `True`. |
| `strict` | Si `True`, une exception `Error` est levée si le fichier est mal formé. Par défaut `False`. |

### Les diferents Dialect par defaut

| Parameter | default | excel | excel-tab | unix |
| --- | --- | --- | --- | --- |
| delimiter | ',' | ',' | '\t' | ',' |
| doublequote | True | True | True | False |
| escapechar | None | None | None | None |
| lineterminator | '\r\n' | '\r\n' | '\r\n' | '\n' |
| quotechar | '"' | '"' | '"' | '"' |
| quoting | csv.QUOTE_MINIMAL | csv.QUOTE_MINIMAL | csv.QUOTE_MINIMAL | csv.QUOTE_ALL |
| skipinitialspace | False | False | False | False |
| strict | False | False | False | False |

[Source](https://wellsr.com/python/introduction-to-csv-dialects-with-the-python-csv-module/)

### Définir un dialecte

On peut définir un dialecte en utilisant la fonction `register_dialect()` du module CSV. La syntaxe de la fonction `register_dialect()` est la suivante:

```python
csv.register_dialect(name, dialect=None, **fmtparams)
```


In [8]:
CSV_FILE = './files/users.csv'
CSV_FILE_EU = './files/users_eu.csv'

In [9]:
# read csv file using csv module
import csv

with open(CSV_FILE, 'r') as file:
    reader = csv.reader(file)
    for row in reader:
        print(row)

['id', 'name', 'age', 'city', 'uid', 'pwd']
['1', 'John', '25', 'New York', 'toto', '12345']
['2', 'Jack', '30', '', 'titi', '12345']


In [10]:
with open(CSV_FILE, 'r') as file:
    reader = csv.reader(file)
    next(reader) # skip the first row
    for row in reader:
        print(row)

['1', 'John', '25', 'New York', 'toto', '12345']
['2', 'Jack', '30', '', 'titi', '12345']


In [11]:
with open(CSV_FILE, 'r') as file:
    reader = csv.reader(file)
    # use list comprehension to convert each item in the reader object to a tuple
    users = [tuple(row) for row in reader]
    print(users)

[('id', 'name', 'age', 'city', 'uid', 'pwd'), ('1', 'John', '25', 'New York', 'toto', '12345'), ('2', 'Jack', '30', '', 'titi', '12345')]


## Changer le delimiter

On peut changer le délimiteur en utilisant le paramètre `delimiter` de la classe `reader`. Le paramètre `delimiter` prend un caractère qui représente le délimiteur.

```python
csv.reader(csvfile, delimiter=',')
```

In [None]:
with open(CSV_FILE_EU, 'r') as file:
    reader = csv.reader(file)
    for row in reader:
        print(row)

with open(CSV_FILE_EU, 'r') as file:
    reader = csv.reader(file, delimiter=';')
    for row in reader:
        print(row)

## Ecrire dans un fichier CSV

Pour écrire dans un fichier CSV, on utilise la classe `writer` du module CSV. La classe `writer` permet d'écrire les données dans un fichier CSV ligne par ligne. La syntaxe de la classe `writer` est la suivante:

```python
csv.writer(csvfile, dialect='excel', **fmtparams)
```

La classe `writer` prend un paramètre obligatoire `csvfile` qui est un objet `file` ou une chaîne de caractères qui représente le chemin du fichier CSV. La classe `writer` prend aussi un paramètre optionnel `dialect` qui permet de spécifier le dialecte du fichier CSV. Le paramètre `dialect` prend un objet `Dialect` ou une chaîne de caractères qui représente le nom du dialecte. Il est aussi possible de spécifier des paramètres optionnels en lien avec le dialecte en utilisant le paramètre `fmtparams`.

### La fonction writerow()

La classe `writer` a une méthode `writerow()` qui permet d'écrire une ligne dans le fichier CSV. La syntaxe de la méthode `writerow()` est la suivante:

```python
csvwriter.writerow(row)
```

La méthode `writerow()` prend un paramètre `row` qui est un itérable (liste, tuple, dictionnaire, etc.) qui représente une ligne du fichier CSV.

In [None]:
# Wrtie to csv file using csv module

with open(CSV_FILE, 'r') as file:
    reader = csv.reader(file)
    users = [tuple(row) for row in reader]

    with open("./files/users_w.csv", 'w', newline='') as file:
        writer = csv.writer(file)
        for user in users:
            if user[0] == 'id':
                writer.writerow((user[0], user[1], user[2], 'is_active'))
            else:
                writer.writerow((user[0], user[1], user[2], '1'))