
# Manipulation de fichiers


# open

Le mode est donn√© sous la forme d'une cha√Æne de caract√®res. Voici les principaux modes :

    'r' : ouverture en lecture (Read).

    'w' : ouverture en √©criture (Write). Le contenu du fichier est √©cras√©. Si le fichier n'existe pas, il est cr√©√©.

    'a' : ouverture en √©criture en mode ajout (Append). On √©crit √† la fin du fichier sans √©craser l'ancien contenu du fichier. Si le fichier n'existe pas, il est cr√©√©.
    

In [None]:
f = open("toto.txt",mode='w')
f.write('yep')

# close

Lorsque l'on a fini de manipuler un fichier ouvert, il est normalement necessaire de le fermer, pour liberer les ressources li√©es √† ce fichier

In [None]:
f.close()

# with

La "vraie" maniere "pythonique" de faire consiste a utiliser le mot-cl√© "with". Ceci evite d'avoir √† fermer explicitement le fichier avec close. C'est un gestionnaire de contexte, il encapsule une s√©rie d'op√©ration et g√®re les exceptions.

In [None]:
with open("toto.txt",'r') as f:  # le fichier existe √† l'avance sinon error
    print(f.closed) ## closed (et pas 'close') est un marqueur booleen indiquant si le fichier est ouvert ou ferm√©
print(f.closed)


# read

In [None]:
### je veux voir le contenu de mon fichier
with open("toto.txt",'r') as f:
    val = f.read() 
print('val : ', val)

tout le contenu du fichier est lu d'un coup

# readlines

In [None]:
# let write a multi line
txt = """yep
yop
yip
"""
with open("toto2.txt",'w') as f:
    f.write(txt)

In [None]:
### je veux voir le contenu de mon fichier ligne par ligne
f = open("toto2.txt",'r')
lines = f.readlines()
f.close()
print(lines)

### Exo tampon

Ecrivez la cellule pr√©c√©dente avec le mot-clef "with"

### Solution Exo tampon

# Lecture string/bytes et importance de l'encoding (UTF-8)

str = Pour le texte humain (multi-langue, symboles).

bytes = Pour les donn√©es binaires (r√©seau, fichiers, chiffrement).

In [None]:
chaine1 = b"Ceci est une chaine d'octets"

print(chaine1)
print(type(chaine1))
print(chaine1[-1])

chaine2 = "Ceci est une chaine de caract√®res particuliers ‰Ω†Â•Ω ÿµÿ®ÿßÿ≠ ÿßŸÑÿÆŸäÿ±"

print(chaine2)
print(type(chaine2))
print(chaine2[-2])


### Exo tampon

Quel est le code binaire de la lettre "c" ?

### Solution Exo tampon

#### ¬†ASCII ou l'esperanto informatique des ann√©es 60

L‚ÄôASCII (American Standard Code for Information Interchange) est un format d‚Äôencodage historique (1963) qui associe des caract√®res (lettres, chiffres, symboles) √† des nombres.

7 bits par caract√®re ‚Üí 128 combinaisons possibles (de 0 √† 127).

Exemple :

    A = 65 (en d√©cimal) = 1000001 (en binaire).

    a = 97, 0 = 48, @ = 64.


- Fondement des textes num√©riques : Fichiers .txt, code source, protocoles r√©seau.

- Communication entre syst√®mes : Permet √† des machines h√©t√©rog√®nes d‚Äô√©changer du texte.

- Limitations : Ne g√®re pas les accents (√®, √±) ni les alphabets non-latins (‚Üí Unicode aujourd‚Äôhui).


### UTF-8

- ASCII (7 bits) encode 128 caract√®res basiques (anglais), de fa√ßon unique.
- Unicode √©tend cela √† tous les alphabets (üåç, √©, Â≠ó).
- UTF-8 est un encodage d‚ÄôUnicode r√©tro-compatible avec ASCII (1 byte pour ASCII, 2-4 bytes pour les autres).

In [None]:
# lets put this 2 object in the same file
with open("chaine.txt",'wb') as f:
    f.write(chaine1)

with open("chaine.txt",'a') as f:
    f.write('\n')
    f.write(chaine2)

In [None]:
with open('chaine.txt', mode= 'r', encoding='utf8') as f:
    txt = f.read()
print(txt, type(txt), len(txt))

In [None]:
with open('chaine.txt', mode='rb') as f:
    b = f.read()
print(b, type(b), len(b))

In [None]:
txt2 = b.decode('utf8')
print(txt2, type(txt2))

# Sauvegarde et lecture avec numpy : format texte


## loadtxt 

In [None]:
import numpy as np

data = np.loadtxt('./data/Coords.txt') 
print (data)


## savetxt

In [None]:
data = np.zeros(shape = (1000,1000), dtype = "float32")
print(data)

In [None]:
np.savetxt("data.txt", data, fmt = "%f")

# Sauvegarde et lecture avec numpy : format .npy, load et save

Plus rapide et plus l√©ger.

In [None]:
np.save("data.npy", data)

In [None]:
data2 = np.load("data.npy")
data2

# Concept d'Arborescence

![Image](./img/mac_tree.png)     ![Image](./img/win_tree.jpg)    ![Image](./img/linux-tree.png)

Racine :

    mac et linux : /
    
    windows : C:\
            


Chemin absolu :
    
    linux : /home/alex/projets/formation_python/
    
    windows : C:\\Users\\alex\\projets\\formation_python\\   (double\ car caract√®re d'√©chapement)
    
    mac : /Disque dur/Users/alex/projets/formation_python/

Chemin relatif :

    ./          l√† ou je suis actuellement
    ../       je remonte d'un dossier par rapport √† l√† ou je suis
    
    idem windows mais avec \
    
    
    exemple : np.loadtxt('./data/Coords.txt') 
    
    

## Le module os (Operating System)



### 1 - Prendre de l'information sur le sys√®me de fichiers

+ import os


+ os.uname() : infos syst√®me


+ os.getcwd() : pour obtenir le r√©pertoire en cours


+ os.path.abspath(path) : retourne une version absolue du chemin path


+ os.path.relpath(path[, start]) : retourne une version relative du chemin path. Par d√©faut, par rapport au working dir, sinon : sp√©cifier un argument start qui sera le r√©pertoire de base


### 2 - Faire des actions sur le syst√®me de fichiers

+ os.chdir(foldername)  : va dans le r√©pertoire sp√©cifi√©


+ os.mkdir(‚Äômydir‚Äô) : cr√©e le r√©pertoire mydir


+ os.rename(oldname, newname) : renomme oldname en newname


+ os.remove(filename) : efface le fichier filename


### 3 - Utilitaires

+ os.path.join(morceau1, morceau2) : colle deux morceaux de chemin ensemble  en utilisant les caract√®res adapt√©s au syst√®me


+ os.path.expanduser("~") : retourne le chemin vers le r√©pertoire "Home" de l'utilisateur sur la machine


+ os.path.split(racine/nomfichier_ou_rep) : permet de s√©parer la derni√®re branche de la racine, r√©sultat sous forme de tuple
    *ex : (filepath, filename) = os.path.split("/Users/admin/Desktop") 
    *filename: "Desktop"


+ os.path.splitext(nomfichier.extension) : s√©pare le nom de l'extension. R√©sultat sous forme de tuple


+ os.listdir(path) :  prend un nom de chemin et retourne une liste du contenu du r√©pertoire.


+ os.path.isfile : pour s√©parer les fichiers des r√©pertoires. (os.path.isdir existe aussi). isfile prend un nom de chemin et :
     *retourne 1 / True si le chemin repr√©sente un fichier
     *0 / False dans le cas contraire. 


+ os.walk(top, topdown=True) : √† parir de top (repertoire racine), parcourt l'arborescence en descendant si topdown=True, en montant sinon, et renvoie un tuple : (dirpath, dirnames, filenames) qui contient tous les r√©pertoires dirnames rencontr√©s avec les fichiers filenames qui s'y trouvent

>for dossier, sous_dossiers, fichiers in os.walk('/tmp/test'):

>        for fichier in fichiers:

>            print(os.path.join(dossier, fichier))

In [None]:
import os
os.listdir('./')

## Le module pathlib = nouvelle m√©thode

In [None]:
from pathlib import Path

home = Path.home()
home


In [None]:
ici = Path('.').absolute()
ici

In [None]:
doc = home / 'Documents'
doc

In [None]:
for item in Path('/').iterdir():
    print(item)

In [None]:
file_path = Path('./img/linux-tree.png')

print(file_path.is_file())

print(file_path.stem)
print(file_path.suffix)
print(file_path.parent)
print(file_path.parents[0])
print(file_path.parents[1])
#print(file_path.parents[2])



In [None]:
ici = Path('.').absolute()

for file in ici.glob('*.ipynb'):
    print(file)

In [None]:
# recursif
for file in Path('/home/alex/').glob('**/*.ipynb'):
    print(file)


## Exercice 1

a. Faire un script pour explorer le dossier 'data/data_folder'

b. Lire les datas dans une structure hierachique adapt√©e (dict/list/array)



## Solution 1.a.

## Solution 1.b.