# Manipulation de fichiers


## open

Le mode est donné sous la forme d'une chaîne de caractères. Voici les principaux modes :

    'r' : ouverture en lecture (Read).

    'w' : ouverture en écriture (Write). Le contenu du fichier est écrasé. Si le fichier n'existe pas, il est créé.

    'a' : ouverture en écriture en mode ajout (Append). On écrit à la fin du fichier sans écraser l'ancien contenu du fichier. Si le fichier n'existe pas, il est créé.
    

In [None]:
f = open("toto.txt",'r') ### le fichier existe a l'avance, sinon error

## close

Lorsque l'on a fini de manipuler un fichier ouvert, il est normalement necessaire de le fermer, pour liberer les ressources liées à ce fichier

In [None]:
f.close()

## with

La "vraie" maniere de faire consiste a utiliser le mot-clé "with". Ceci evite d'avoir à fermer explicitement le fichier avec close

In [None]:

with open("toto.txt",'r') as f:
    print(f.closed) ## closed (et pas 'close') est un marqueur booleen indiquant si le fichier est ouvert ou fermé
print(f.closed) 


## read

In [None]:
### je veux voir le contenu de mon fichier
val = f.read() 
print(val)

tout le contenu du fichier est lu d'un coup

In [None]:
### la chaine de caratere est une en realité une liste de caratere
print(val[0])
print(val[1])
print(val[-1]) ### c'est le dernier e

In [None]:
### on peut tester la valeur de chaque caractere
for i,car in enumerate(val):
    if car == " " :
        break
    print(i, car)
print("fini!")

## readlines

In [None]:
### je veux voir le contenu de mon fichier ligne par ligne
print(f.readlines())

chaque ligne est stockée comme un element d'un liste python

In [None]:
### !Attention, une fois le readlines effectué, on est la fin du fichier! Pour revenir au debut on peut refaire un open
with open("toto.txt") as f:
    val = f.readlines()
    print(val[1]) ## affiche la deuxieme ligne STP 

In [None]:
### ou bien faire 
f.seek(0)



la segmentation du fichier par caractere n'est pas tres interessante pour un fichier texte 
(ca peut l'etre pour un fichier binaire)

En revanche la segmentation par mots (i.e. groupe de carateres separés par des espaces) est intéressante

In [None]:
with open("toto.txt") as f:
    for line in f.readlines():
        print (line.split(" "))

on a chaque mot segmente dans une liste de chaine de caractere

In [None]:
## pour eviter d'avoir le retour a la ligne '\n' on peut utiliser la commande strip() sur la ligne
with open("toto.txt") as f:
    for line in f.readlines():
        line = line.strip()
        print(line)
        if 'toto' in line.split(" "):
            break ### stop si on trouve 'toto' dans la ligne
            


In [None]:
### on peut aussi boucler sur la liste apres .split

list_mots_sans_te = []
with open("toto.txt") as f:
    for line in f.readlines():
        for word in line.strip().split(" "):
            
            if word.endswith("te"):                
                print ("found fic") ### stop si le mot commence par fic
                
            else:
                list_mots_sans_te.append(word)
print (list_mots_sans_te)

                

In [None]:
### Encore plus court (facultatif, si list comrehension a été vu...)
with open("toto.txt") as f :
    list_mots_sans_te = [word for line in f.readlines() for word in line.strip().split(" ") if not word.endswith("te")]
print(list_mots_sans_te)

# Lecture de données

## "A l'ancienne"

In [None]:
with open('Coords.txt', 'r') as f:
    
    tab = []
    for line in f.readlines():
        
        val = line.strip().split('\t')
        
        val = list(map(int,val)) ### string to integer
        print (val)
        
        tab.append(val)
        
    data = np.array(tab)
    
    print (data.shape)
    

## csv

In [None]:
import csv

with open('Coords.txt', 'r') as f:
    reader = csv.reader(f)
    print (reader)
    for row in reader:
        print (row)



In [None]:
### par default, 
with open('Coords.txt', 'r') as f:
    reader = csv.reader(f,delimiter = '\t')
    print (reader)
    
    list_vals = []
    
    for row in reader:
        list_vals.append(list(map(int,row)))
    print(list_vals)
    
    data= np.array(list_vals)
    print(data)
    
    


## loadtxt (numpy)

In [None]:
import numpy as np

data = np.loadtxt("Coords.txt") ### par default, delimiter = "any whitespace", c.a.d. un ou plusieurs espace et/ou tabulations

print (data)