# Manipulation des fichiers
Dans la thématiques des I/O. Comment lire/écrire de la donnée sur disque ?

# Intermede : les arguments nommés

In [None]:
def add(a,b,  c):
    return a + b + c


print(add(1,2, 3))

print(add(1, 2, c =3))

print(add(1, 2, 3))
#les arguments nommmés doivent être à la fin

print(add(1, b=2, 3)) #ne marchera pas


SyntaxError: positional argument follows keyword argument (<ipython-input-69-863d2f4d9225>, line 11)

In [None]:
with open('test.txt', 'r', encoding="utf-8") as f:
    print(f.read())


with open('test.txt', encoding="utf-8", mode='r') as f:
    print("read2", f.read())



une nouvelle ligne
read2 une nouvelle ligne


## Les fichiers texte

In [None]:
# version naïve
f = open("mon_texte.txt", "w")
f.write("Hey, je suis une ligne inutile !\n")
f.close()
# default = mode "r" pour la lecture

# la lecture d'un fichier inexistant occasionnerait une erreur : 
#f = open("mon_machin.txt", "r")

# la version safe
try:
    f = open('un_fichier', encoding='utf-8')
except:
    print('ce fichier n\'existe pas')


try:
    f = open('un_fichier', encoding='utf-8')
except:
    print('ce fichier n\'existe pas')
finally:
    f.close()

# la version context manager (safe au sens de f.close())
with open("test.txt", encoding = 'utf-8', mode='w') as f:
    f.write('une nouvelle ligne')

ce fichier n'existe pas
ce fichier n'existe pas


## Les fichiers JSON

In [None]:
mes_eleves = { 
   "classe":{ 
      "eleves": 
      [
          {
            "name":"Magdalena",
            "notes":{ 
                "physique": 18,
                "histoire": 19
            }
         },
         {
            "name":"Jean-Eudes",
            "notes":{ 
                "maths": 13,
                "SVT":17,
                "EPS": 15
         }
      }
   ]},
   "promotion" : 2021
} 
print(mes_eleves)


# Ecriture : 
import json
with open('mes_eleves.json', 'w', encoding='utf-8') as file:
    json.dump(mes_eleves, file)
print('J\'ai écrit dans mes_eleves.json')


# Lecture :
print('\non procède maintenant à la lecture :')
with open('mes_eleves.json', 'r', encoding='utf-8') as json_file:
   data = json.load(json_file)
   print(data)

from pprint import pprint
pprint(json.dumps(data, indent=4))

{'classe': {'eleves': [{'name': 'Magdalena', 'notes': {'physique': 18, 'histoire': 19}}, {'name': 'Jean-Eudes', 'notes': {'maths': 13, 'SVT': 17, 'EPS': 15}}]}, 'promotion': 2021}
J'ai écrit dans mes_eleves.json

on procède maintenant à la lecture :
{'classe': {'eleves': [{'name': 'Magdalena', 'notes': {'physique': 18, 'histoire': 19}}, {'name': 'Jean-Eudes', 'notes': {'maths': 13, 'SVT': 17, 'EPS': 15}}]}, 'promotion': 2021}
('{\n'
 '    "classe": {\n'
 '        "eleves": [\n'
 '            {\n'
 '                "name": "Magdalena",\n'
 '                "notes": {\n'
 '                    "physique": 18,\n'
 '                    "histoire": 19\n'
 '                }\n'
 '            },\n'
 '            {\n'
 '                "name": "Jean-Eudes",\n'
 '                "notes": {\n'
 '                    "maths": 13,\n'
 '                    "SVT": 17,\n'
 '                    "EPS": 15\n'
 '                }\n'
 '            }\n'
 '        ]\n'
 '    },\n'
 '    "promotion": 2021\n'
 

# différence json.loads / json.load et json.dumps / json.dump


load**s** veut dire load "string"

dump**s** veut dire dump "string"

donc si on veut lire un fichier json : load
si on veut convertir une chaine de caractère json en dictionnaire :loads

si on veut sauvegarde un dictionnaire dans un fichier json : dump
si on veut convertir un dictionnaire en string json : dumps

In [None]:
d = {
    'username': "laurent",
    'address': {
        'city': "Aix-En-Provence"
    }
}

import json

str_json = json.dumps(d)
print(type(str_json), str_json)

<class 'str'> {"username": "laurent", "address": {"city": "Aix-En-Provence"}}


## Les fichiers .csv

In [None]:
# écriture dans des fichiers Comma Separated Value

import csv

with open('exemple_tabulaire.csv', mode='w') as employee_file:
    writer = csv.writer(employee_file, delimiter=',', quotechar="\"")
    writer.writerow(['nom', 'prenom', 'matricule', 'salaire'])
    writer.writerow(['Jean', 'Didier', '0x01,un autre truc', '52000'])
    writer.writerow(['Prevot', 'Pascaline', '0x02', '650000'])

print('écrit')

# lecture des fichiers .csv
import csv
with open('exemple_tabulaire.csv') as csv_file:
    reader = csv.DictReader(csv_file, delimiter=',', quotechar="\"")
    for row in reader :
        print(dict(row))
     

écrit
{'nom': 'Jean', 'prenom': 'Didier', 'matricule': '0x01,un autre truc', 'salaire': '52000'}
{'nom': 'Prevot', 'prenom': 'Pascaline', 'matricule': '0x02', 'salaire': '650000'}


Le yaml est très utilisé pour la configuration

Le xml, a été très populaire dnas le monde de java pour échanger de l'information entre services / applications (cf l'ère Service oriented architecture SOA)


C'est le plus "structuré" (mais le plus lourd)

```xml
<customers>
    <customer>
        <name>Jane Lila</name>
        <age>22</age>
    </customer>
    <customer>
        <name>Karim Strongman</name>
        <age>30</age>
    </customer>
    <customer>
        <name>Karim The wise</name>
        <age>60</age>
    </customer>
    <customer>
        <name>Tom bombadil</name>
        <age>250</age>
    </customer>
</customers>
```

En python pour manipuler du xml , il existe plusieurs librairie, la plus répandue est lxml

In [None]:
!pip install lxml

You should consider upgrading via the '/root/venv/bin/python -m pip install --upgrade pip' command.[0m


In [None]:
import lxml as etree 


tree = etree.parse('data.xml')

root_node = tree.getroot() #permet d'avoir le noeud racine


#plusieurs méthode pour extraire une info

#parcours des enfants 

for child in root_node:
    print(childe)

#utilisation du langage de requêtage avec XPath et les méthode find et findall

nodes = root_node.findall('.//age') #récupérer toutes les balises age

# quand on a un node on peut utiliser l'attribut .text pour en récupérer le contenu

node = nodes[0]
data = node.text

<a style='text-decoration:none;line-height:16px;display:flex;color:#5B5B62;padding:10px;justify-content:end;' href='https://deepnote.com?utm_source=created-in-deepnote-cell&projectId=25ad01f7-ec4b-4ac8-bce6-a3745ef02c96' target="_blank">
 </img>
Created in <span style='font-weight:600;margin-left:4px;'>Deepnote</span></a>