<a href="https://colab.research.google.com/github/gafnhug/2024_Geoinformatique_gafnhug/blob/main/Copie_de_S3_IP_tutoriel.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# Tutoriel 3: Structure de donn√©es

Dans cette section, nous aborderons les points suivants:

1. File I/O
2. List
3. Tuples
4. Sets
5. Dictionnaires

R√©f√©rences:
* IBM Congnitive Class - Intro to Python (https://github.com/computationalcore/introduction-to-python)
* CUSP UCSL bootcamp 2017 (https://github.com/Mohitsharma44/ucsl17)

## File I/O
Dans cette section, nous pr√©senterons les fonctions de base que nous pouvons utiliser pour stocker et r√©cup√©rer des donn√©es √† partir de fichiers de diff√©rents formats.

Pour les projets en sciences de l'environnement, les donn√©es de recherche sont le plus souvent stock√©es dans les formats suivants :
1.   Fichiers texte (`TXT`)
2.   Fichiers tabulaires (par exemple, `CSV`, `XLS`)
3.   Donn√©es structur√©es / dictionnaires Python, etc. (par exemple, `Pickle`, `dill`, `JSON`)
4.   Donn√©es maill√©es (par exemple, `HDF5`, `NetCDF`)

Nous allons maintenant voir comment nous pouvons utiliser Python et diff√©rents paquets Python pour r√©cup√©rer les donn√©es stock√©es dans ces formats, et comment sauvegarder vos donn√©es dans diff√©rents formats pour une utilisation ult√©rieure.

R√©f√©rence:
*   CUSP UCSL bootcamp 2017 (https://github.com/Mohitsharma44/ucsl17)
*   Python 3 tutorial (https://docs.python.org/3/tutorial/inputoutput.html)
*   GSFC Python Bootcamp (https://github.com/astg606/py_materials/blob/master/useful_modules/)
*   Working on JSON Data in Python (https://realpython.com/python-json/)
*   PyHOGS (http://pyhogs.github.io/intro_netcdf4.html)

Commen√ßons par importer quelques paquets...

In [8]:
import csv
# import netCDF4
import pickle
import pandas as pd
import xarray as xr
import numpy as np

### Fichiers TXT
Nous allons maintenant apprendre √† √©crire des informations dans un fichier .TXT et √† les relire √† l'aide de fonctions Python int√©gr√©es. Les donn√©es utilis√©es dans cette partie du tutoriel seront tr√®s simples. Dans les prochains exercices, nous pr√©senterons √©galement les commandes des paquets communautaires qui nous permettent de lire et de stocker des donn√©es plus complexes.

#### Ouverture de fichiers :
Les fichiers peuvent √™tre ouverts en utilisant la fonction int√©gr√©e de Python `open()`. Cette fonction cr√©e un objet fichier pour les op√©rations suivantes. Utilisez la syntaxe suivante pour lire un fichier TXT : \\
`fhandler = open(file_name, access mode, encoding)`

- `nom_du_fichier` : Le nom du fichier sur lequel vous souhaitez effectuer vos op√©rations d'E/S. \
Notez qu'il s'agit du chemin d'acc√®s complet au fichier (par exemple, $\text{\\home\\Documents\\file.txt}$ )
- `encodage` : Sch√©ma d'encodage √† utiliser pour convertir le flux d'octets en texte. (Standard=`utf-8`)
- `access_mode` : La fa√ßon dont un fichier est ouvert, les choix disponibles pour cette option incluent :

|access_mode | Its Function|
|:------|------------:|
|r	|Ouvre un fichier en lecture seule|
|rb	|Ouvre un fichier en lecture seule au format binaire|
|r+	|Ouvre un fichier pour la lecture et l'√©criture|
|rb+	|Ouvre un fichier pour la lecture et l'√©criture au format binaire|
|w	|Ouvre un fichier en √©criture uniquement|
|wb	|Ouvre un fichier en √©criture uniquement au format binaire|
|w+	|Ouvre un fichier en lecture et en √©criture|
|wb+	|Ouvre un fichier pour l'√©criture et la lecture au format binaire|
|a	|Ouvre un fichier pour l'ajouter|
|ab	|Ouvre un fichier pour l'ajouter en binaire|
|a+	|Ouvre un fichier pour l'ajout et la lecture|
|ab+	|Ouvre un fichier pour l'ajout et la lecture au format binaire|

Dans l'exemple ci-dessous, nous allons essayer de stocker plusieurs phrases dans un nouveau fichier TXT, et utiliser la fonction `open()` pour voir si le code fonctionne comme pr√©vu.

In [1]:
fhandler = open('test.txt', 'w', encoding="utf-8")
fhandler.write('Hello World!\n')
fhandler.write('I am a UNIL Master Student.\n')
fhandler.write('I am learning how to code!\n')
fhandler.close()

```{note}
In the code above, we use the `open()` command to create a *write-only* (`access_mode='w'`) file `test.txt`. The open command creates a file object (`fhandler`) on which we can perform extra operations.

We then try to add three sentences to the TXT file using the `.write()` operation on the file object.

Remember to close the file with `.close()` command so that the changes can be finalized!

If the code is writing, we should see a `test.txt` file created in the same path as this notebook. Let's see if that's the case!
```

In [None]:
! ls .

In [None]:
! cat test.txt

Hourra ! √áa marche ! üòÄ

Mais n'avons-nous pas dit que nous voulions le relire ? ü§®

Essayons de lire le fichier alors ! Pouvez-vous penser √† des fa√ßons de le faire ?

Voici quelques-unes des fonctions que vous pourriez utiliser.

1.   `.close()` : Ferme le fichier actuellement ouvert.
2.   `.readline([size])` : Lit les cha√Ænes de caract√®res d'un fichier jusqu'√† ce qu'il atteigne le caract√®re de nouvelle ligne `\n` si le param√®tre `size` est vide. Sinon, il lira la cha√Æne de caract√®res de la taille donn√©e.
3.   `.readlines([size])` : Appelle r√©p√©titivement `.readline()` jusqu'√† la fin du fichier.
4.   `.write(str)` : √âcrit la cha√Æne de caract√®res str dans le fichier.
5.   `.writelines([list])` : Ecrit une s√©quence de cha√Ænes de caract√®res dans un fichier. Aucune nouvelle ligne n'est ajout√©e automatiquement.

In [2]:
fhandler = open('test.txt','rw',encoding='utf-8')
fhandler.readlines()

['Hello World!\n',
 'I am a UNIL Master Student.\n',
 'I am learning how to code!\n']

Et si nous voulions ajouter du texte au fichier ?

In [3]:
with open('test.txt', 'r+') as fhandler:
  print(fhandler.readlines())
  fhandler.writelines(['Now,\n', 'I am trying to', ' add some stuff.'])
  # Go to the starting of file
  fhandler.seek(0)
  # Print the content of file
  print(fhandler.readlines())

['Hello World!\n', 'I am a UNIL Master Student.\n', 'I am learning how to code!\n']
['Hello World!\n', 'I am a UNIL Master Student.\n', 'I am learning how to code!\n', 'Now,\n', 'I am trying to add some stuff.']


Ici, nous utilisons une autre m√©thode pour ouvrir et √©crire le fichier de donn√©es.
En utilisant l'instruction `with` pour ouvrir le fichier TXT, nous nous assurons que les donn√©es sont automatiquement ferm√©es apr√®s l'op√©ration finale. Nous n'avons plus besoin d'√©crire l'instruction `fhandler.close()`.

### Fichiers tabulaires
Que feriez-vous si vous aviez des donn√©es joliment organis√©es dans le format ci-dessous ?
```
Donn√©es1, Donn√©es2, Donn√©es3
Exemple01, Exemple02, Exemple03
Exemple11, Exemple12, Exemple13
```
Lorsque vous ouvrez un fichier de ce type dans Excel, voici √† quoi il ressemble :

||||
|:--|:--|:--|
|Donn√©e1	|Donn√©e2	|Donn√©e3|
|Exemple1	|Exemple2	|Exemple3|

Il s'agit d'un fichier tabulaire _s√©par√© par des virgules_. Les fichiers de ce type sont g√©n√©ralement enregistr√©s avec l'extension `.csv`. Les fichiers `.csv` peuvent ensuite √™tre ouverts et visualis√©s √† l'aide d'un tableur, tel que Google Sheets, Numbers ou Microsoft Excel.

Mais qu'en est-il si nous voulons utiliser les donn√©es dans Python ?

#### Ouverture des fichiers :
Heureusement, il existe des paquets communautaires qui peuvent vous aider √† importer et √† r√©cup√©rer vos donn√©es tabulaires avec un minimum d'effort. Nous pr√©sentons ici deux de ces packages : CSV et Pandas.

##### Lire des fichiers CSV avec le paquetage `CSV`

`reader()` peut √™tre utilis√© pour cr√©er un objet qui est utilis√© pour lire les donn√©es d'un fichier CSV. Le lecteur peut √™tre utilis√© comme un it√©rateur pour traiter les lignes du fichier dans l'ordre. Voyons un exemple :

In [4]:
import pooch
import urllib.request
datafile = pooch.retrieve('https://unils-my.sharepoint.com/:x:/g/personal/tom_beucler_unil_ch/ETDZdgCkWbZLiv_LP6HKCOAB2NP7H0tUTLlP_stknqQHGw?download=1',
                          known_hash='c7676360997870d00a0da139c80fb1b6d26e1f96050e03f2fed75b921beb4771')

Downloading data from 'https://unils-my.sharepoint.com/:x:/g/personal/tom_beucler_unil_ch/ETDZdgCkWbZLiv_LP6HKCOAB2NP7H0tUTLlP_stknqQHGw?download=1' to file '/root/.cache/pooch/489ae79e8d80d9513daa4dc2e77ba99c-ETDZdgCkWbZLiv_LP6HKCOAB2NP7H0tUTLlP_stknqQHGw'.


In [9]:
row = []
# https://unils-my.sharepoint.com/:x:/g/personal/tom_beucler_unil_ch/ETDZdgCkWbZLiv_LP6HKCOAB2NP7H0tUTLlP_stknqQHGw?e=N541Yq
with open(datafile, 'r') as fh:
  reader = csv.reader(fh)
  for info in reader:
    row.append(info)

In [10]:
print(row[0])

['station', 'valid', 'tmpf', 'dwpf', 'relh', 'drct', 'sknt', 'p01i', 'alti', 'mslp', 'vsby', 'gust', 'skyc1', 'skyc2', 'skyc3', 'skyc4', 'skyl1', 'skyl2', 'skyl3', 'skyl4', 'wxcodes', 'ice_accretion_1hr', 'ice_accretion_3hr', 'ice_accretion_6hr', 'peak_wind_gust', 'peak_wind_drct', 'peak_wind_time', 'feel', 'metar', 'snowdepth']


In [11]:
print(row[1])

['ALO', '2022-01-01 00:54', '26.10', '19.90', '77.06', '350.00', '14.00', '0.00', '29.80', '1010.30', '9.00', 'M', 'BKN', 'OVC', 'M', 'M', '1600.00', '2300.00', 'M', 'M', 'M', 'M', 'M', 'M', '26.00', '340.00', '2021-12-31 23:59', '13.56', 'KALO 010054Z 35014KT 9SM BKN016 OVC023 M03/M07 A2980 RMK AO2 PK WND 34026/2359 SLP103 T10331067 $', 'M']


``{tip}
Dans le code ci-dessus, nous utilisons la m√©thode `csv.reader()` pour lire it√©rativement chaque ligne du fichier CSV.

Nous ajoutons une nouvelle ligne √† une liste vide √† chaque it√©ration.

Nous utilisons la fonction `print()` pour voir ce qui a √©t√© √©crit dans la liste. Nous avons constat√© que la premi√®re ligne contient des informations sur les noms de variables, tandis que la deuxi√®me ligne contient des donn√©es √† un pas de temps donn√©.
```

#### Extraire les donn√©es et les √©crire dans un nouveau fichier CSV :
Le fichier CSV que nous venons d'importer contient en fait les donn√©es des stations m√©t√©orologiques de janvier 2022 √† ao√ªt 2022. Que se passe-t-il si nous ne voulons que les donn√©es des cinq premi√®res lignes ? Pouvons-nous extraire les donn√©es et les enregistrer dans un nouveau fichier CSV ?

In [12]:
with open('testsmall.csv', 'w') as fh:
  writer = csv.writer(fh)
  for num in range(5):
    writer.writerow(row[num])

```{note}

En fait, il existe un meilleur paquetage pour les donn√©es tabulaires. Cette biblioth√®que s'appelle `Pandas`. Nous pr√©senterons ce paquetage plus en d√©tail la semaine prochaine. Pour l'instant, nous allons simplement d√©montrer que nous pouvons utiliser pandas pour faire la m√™me proc√©dure FileI/O que nous avons faite plus t√¥t avec CSV.

Ici, nous lisons la grande feuille de donn√©es de la station m√©t√©orologique `datafile` avec la fonction pandas `.read_csv()`.
```

In [13]:
# importer fichier CSV avec pandas
ALOdatasheet = pd.read_csv(datafile)

In [14]:
# Exporter les cinq premi√®res lignes du cadre de donn√©es Pandas vers un fichier CSV
ALOdatasheet[0:5].to_csv('./testsmall_pd.csv')

### S√©rialisation et d√©s√©rialisation avec Pickle
(R√©√©crit √† partir du GSFC Python Bootcamp)

Pickle est un format interne de Python qui permet d'√©crire des donn√©es arbitraires dans un fichier de mani√®re √† pouvoir les relire, intactes.
* `pickle` "s√©rialise" d'abord l'objet avant de l'√©crire dans un fichier.
* Le d√©capage (s√©rialisation) est un moyen de convertir un objet Python (liste, dict, etc.) en un flux de caract√®res qui contient toutes les informations n√©cessaires pour reconstruire l'objet dans un autre script Python.

Les types suivants peuvent √™tre s√©rialis√©s et d√©s√©rialis√©s en utilisant le module `pickle` :
* Tous les types de donn√©es natifs support√©s par Python (bool√©ens, None, entiers, flottants, nombres complexes, cha√Ænes de caract√®res, octets, tableaux d'octets).
* Dictionnaires, ensembles, listes et tuples - tant qu'ils contiennent des objets s√©lectionnables.
* Les fonctions (d√©crypt√©es par leur nom de r√©f√©rence, et non par leur valeur) et les classes qui sont d√©finies au niveau sup√©rieur d'un module.

Les fonctions principales de `pickle` sont :

* `dump()` : r√©cup√®re des donn√©es en acceptant des donn√©es et un objet fichier.
* `load()` : prend un objet fichier, reconstruit les objets √† partir de la repr√©sentation d√©cap√©e, et les renvoie.
* `dumps()` : renvoie les donn√©es d√©crypt√©es sous forme de cha√Æne de caract√®res.
* `loads()` : lit les donn√©es extraites d'une cha√Æne.

`dump()`/`load()` s√©rialise/d√©s√©rialise les objets √† travers des fichiers mais `dumps()`/`loads()` s√©rialise/d√©s√©rialise les objets √† travers une repr√©sentation sous forme de cha√Æne de caract√®res.

In [None]:
# Exemple de dictionnaire Python
data_org = { 'mydata1':np.linspace(0,800,801), 'mydata2':np.linspace(0,60,61)}

In [None]:
# Enregistrer un dictionnaire Python dans un fichier pickle
with open('pickledict_sample.pkl', 'wb') as fid:
     pickle.dump(data_org, fid)
# Deserialize saved pickle file
with open('pickledict_sample.pkl', 'rb') as fid:
     data3 = pickle.load(fid)

In [None]:
for strg in data_org.keys():
  print(f"Variable {strg} is the same in data_org and data3: {(data_org[strg]==data3[strg]).all()}")

## Lists

La cr√©ation de listes est tr√®s facile en Python. Nous pouvons cr√©er des listes en s√©parant les diff√©rents √©l√©ments par des virgules entre crochets:``[Item1,Item2,Item3]``.
`[√âl√©ment1,√âl√©ment2,√âl√©ment3]`

Il existe de nombreuses fa√ßons d'interagir avec les listes. Les explorer fait partie du plaisir de Python.

**list.append(x)** Ajoute un √©l√©ment √† la fin de la liste. Equivalent √† `a[len(a) :] = [x]`.

**list.extend(L)** √âtendre la liste en y ajoutant tous les √©l√©ments de la liste donn√©e. Equivalent √† `a[len(a) :] = L`.

**list.insert(i, x)** Ins√®re un √©l√©ment √† une position donn√©e. Le premier argument est
l'indice de l'√©l√©ment avant lequel ins√©rer, donc `a.insert(0, x)` ins√®re en d√©but de liste, et `a.insert(0, x)` ins√®re en fin de liste.
au d√©but de la liste, et `a.insert(len(a), x)` est √©quivalent √†
`a.append(x)`.

**list.remove(x)** Supprime le premier √©l√©ment de la liste dont la valeur est x. C'est une erreur s'il n'y a pas d'√©l√©ment de ce type.

**list.pop([i])** Enl√®ve l'√©l√©ment √† la position donn√©e dans la liste et le renvoie.
Si aucun index n'est sp√©cifi√©, `a.pop()` supprime et renvoie le dernier √©l√©ment de la liste.
(Les crochets autour du i dans la signature de la m√©thode indiquent que le param√®tre est optionnel, et non pas que vous devez le retourner).
 est optionnel, et non pas que vous devez taper des crochets √† cette position.
 √† cette position. Vous verrez souvent cette notation dans la r√©f√©rence de la biblioth√®que Python).

 **list.clear()** Supprime tous les √©l√©ments de la liste. Equivalent √† `del a[ :]`.

**list.index(x)** Retourne l'index dans la liste du premier √©l√©ment dont la valeur est x.
C'est une erreur s'il n'y a pas d'√©l√©ment de ce type.

**list.count(x)** Retourne le nombre de fois que x appara√Æt dans la liste.

**list.sort()** Trie les √©l√©ments de la liste √† la place.

**list.reverse()** Inverse les √©l√©ments de la liste en place.

**list.copy()** Retourne une copie superficielle de la liste. Equivalent √† `a[ :]`.

In [None]:
# Exp√©rimentons quelques-unes de ces m√©thodes !
# 1. Cr√©er d'abord une liste
l = ['chien', 'chat', 'poisson', 'poulet', 'oeufs', 'canard']
type(l)

list

In [None]:
# D√©coupage de la liste
print(l[0],l[-1],l[0:3],l[-3:-1])

chien canard ['chien', 'chat', 'poisson'] ['poulet', 'oeufs']


**Pensez √† m√©moriser cette syntaxe !**
Elle est au c≈ìur de Python et s'av√®re souvent d√©routante pour les utilisateurs qui viennent d'autres langages.

#### **Mise √† jour de la liste**
Contrairement aux cha√Ænes et aux tuples, les listes sont mutables. Vous pouvez mettre √† jour la liste et modifier les √©l√©ments quand vous le souhaitez.

In [None]:
my_list = ['chien', 'chat', 'poisson', 'poulet', '≈ìufs', 'canard']
my_list[2] = 'Arbre'
print('Contenu original : \n', my_list)
print('Longueur originale du tableau : \n', len(my_list))

# Enlever quelques √©l√©ments/changer la taille
my_list[2:4] = []
print('Contenu modifi√© : \n', my_list)
print('Longueur modifi√©e du tableau : \n', len(my_list))

Contenu original : 
 ['chien', 'chat', 'Arbre', 'poulet', '≈ìufs', 'canard']
Longueur originale du tableau : 
 6
Contenu modifi√© : 
 ['chien', 'chat', '≈ìufs', 'canard']
Longueur modifi√©e du tableau : 
 4


Modifions la liste √† l'aide des m√©thodes sp√©cifiques aux listes dont nous avons parl√© pr√©c√©demment.

In [None]:
#@title #### **Ajouter de nouveaux √©l√©ments √† la liste**
my_list = ['chien', 'chat', 'poisson', 'poulet', 'oeufs', 'canard']
my_list.append('Python') # Cela ajoutera l'√©l√©ment √† la fin de la liste
print(my_list)
my_list.insert(0, 'Julia')
print(my_list)

['chien', 'chat', 'poisson', 'poulet', 'oeufs', 'canard', 'Python']
['Julia', 'chien', 'chat', 'poisson', 'poulet', 'oeufs', 'canard', 'Python']


In [None]:
#@title #### **Supprimez des √©l√©ments de la liste**
my_list.pop(0)
print(my_list)
del(my_list[-1])
print(my_list)

['chien', 'chat', 'poisson', 'poulet', 'oeufs', 'canard', 'Python']
['chien', 'chat', 'poisson', 'poulet', 'oeufs', 'canard']


In [None]:
#@title #### **Compte, Index**
print(my_list.count('poisson'))
print(my_list.index('canard'))

1
5


In [None]:
#@title #### **Tri, Inversion**
my_list = ['chien', 'chat', 'poisson', 'poulet', 'oeufs', 'canard']
my_list.reverse()
print(my_list)
my_list.sort()
print(my_list)
my_list.sort(reverse=True)
print(my_list)

['canard', 'oeufs', 'poulet', 'poisson', 'chat', 'chien']
['canard', 'chat', 'chien', 'oeufs', 'poisson', 'poulet']
['poulet', 'poisson', 'oeufs', 'chien', 'chat', 'canard']


In [None]:
#@title #### **Concat√©nation de listes**
my_list = ['chien', 'chat', 'poisson', 'poulet', 'oeufs', 'canard']
my_list2 = ['Python', 'Julia', 'C++']
print(my_list+my_list2)
my_list.extend(my_list2)
print(my_list)

['chien', 'chat', 'poisson', 'poulet', 'oeufs', 'canard', 'Python', 'Julia', 'C++']
['chien', 'chat', 'poisson', 'poulet', 'oeufs', 'canard', 'Python', 'Julia', 'C++']


#### **Utiliser des listes en boucle**

In [None]:
for index in range(len(my_list)) : # commence √† 0 et va jusqu'√† la longueur de la liste.
    print("my_list[{}] : {}".format(index, my_list[index]))

ma_liste[0] : chien
ma_liste[1] : chat
ma_liste[2] : poisson
ma_liste[3] : poulet
ma_liste[4] : oeufs
ma_liste[5] : canard
ma_liste[6] : Python
ma_liste[7] : Julia
ma_liste[8] : C++


In [None]:
# Nous pouvons en fait faire la m√™me chose avec enumerate()
for index,items in enumerate(my_list) :
  print("my_list[{}] : {}".format(index,items))

my_list[0] : chien
my_list[1] : chat
my_list[2] : poisson
my_list[3] : poulet
my_list[4] : oeufs
my_list[5] : canard
my_list[6] : Python
my_list[7] : Julia
my_list[8] : C++


**Compr√©hension de liste**

La compr√©hension de liste est un moyen syntaxique de cr√©er une liste bas√©e sur la liste existante, comme nous l'avons fait en copiant les listes ci-dessus. La structure de base de la syntaxe comprend une boucle for qui parcourt la liste et √©value une condition √† l'aide de la condition if... else. Elle stocke ensuite la sortie de la condition dans une nouvelle liste. Voyons un exemple rapide :

In [None]:
my_list1 = [elem for index,elem in enumerate(my_list) if index % 2 == 0]
print(my_list1)

carr√©s = [n**2 for n in range(5)]
print(carr√©s)

['chien', 'poisson', 'oeufs', 'Python', 'C++']
[0, 1, 4, 9, 16]


**Traverser deux listes ensemble avec `zip()`**

In [None]:
# iterate over two lists together uzing zip
for item1, item2 in zip(['cochon','canard','papillon'],[0,1,2]):
    print('first:', item1, 'second:', item2)

first: cochon second: 0
first: canard second: 1
first: papillon second: 2


## Tuples

Les tuples sont similaires aux listes, mais ils sont *immuables*, c'est-√†-dire qu'ils ne peuvent pas √™tre √©tendus ou modifi√©s. Quel en est l'int√©r√™t ? D'une mani√®re g√©n√©rale, il s'agit de regrouper des donn√©es non homog√®nes. Les tuples peuvent ensuite √™tre d√©compress√©s et distribu√©s par d'autres parties de votre code.

Les tuples peuvent sembler d√©routants au d√©but, mais avec le temps, vous finirez par les appr√©cier.

In [18]:
# les tuples sont cr√©√©s avec des parenth√®ses, ou simplement des virgules
a = ('Ryan', 33, True)
b = 'Takaya', 25, False
type(b)

tuple

In [19]:
# peut √™tre index√© comme un tableau
print(a[1]) # pas le premier √©l√©ment !

33


In [23]:
# et ils peuvent √™tre d√©compress√©s
nom, age, statut = a
print(age,nom,statut)

33 Ryan True


In [None]:
print(a.index('Ryan'))

0


## Sets

Un ensemble (set) est une structure de donn√©es non ordonn√©e qui ne permet pas les √©l√©ments dupliqu√©s. Les ensembles sont utiles pour effectuer des op√©rations ensemblistes telles que l'union, l'intersection et la diff√©rence.

Cr√©ation d'un ensemble:

In [24]:
# Cr√©ation d'un ensemble vide
ensemble_vide = set()

# Cr√©ation d'un ensemble avec des √©l√©ments
mon_ensemble = {1, 2, 3, 4, 5}

Ajout d'√©l√©ments:

In [25]:
# Ajout d'un √©l√©ment √† un ensemble
mon_ensemble.add(6)

# Ajout de plusieurs √©l√©ments √† un ensemble
mon_ensemble.update({7, 8, 9})

Suppression d'√©l√©ments:

In [26]:
# Suppression d'un √©l√©ment sp√©cifique
mon_ensemble.remove(3)

# Suppression d'un √©l√©ment sans g√©n√©rer d'erreur si l'√©l√©ment n'est pas pr√©sent
mon_ensemble.discard(10)

Op√©rations ensemblistes:

In [33]:
# Union de deux ensembles
ensemble1 = {1, 2, 3}
ensemble2 = {3, 4, 5}
union_resultat = ensemble1.union(ensemble2)

# Intersection de deux ensembles
intersection_resultat = ensemble1.intersection(ensemble2)

# Diff√©rence entre deux ensembles
difference_resultat = ensemble1.difference(ensemble2)
difference_resultat2 = ensemble2.difference(ensemble1)

print(intersection_resultat)
print(difference_resultat)
print(difference_resultat2)

{3}
{1, 2}
{4, 5}


V√©rification d'appartenance:

In [35]:
# V√©rification si un √©l√©ment appartient √† l'ensemble
appartient = 2 in ensemble1
print(appartient)

True


Parcours d'un ensemble:

In [36]:
# Parcours des √©l√©ments de l'ensemble
for element in mon_ensemble:
    print(element)

1
2
4
5
6
7
8
9


Conversion vers un ensemble:

In [None]:
# Conversion d'une liste en ensemble
liste = [1, 2, 3, 4, 5]
ensemble_a_partir_de_liste = set(liste)

 La capacit√© √† g√©rer des donn√©es non ordonn√©es et √† √©liminer les doublons les rend utiles dans de nombreuses situations.

## Dictionnaires

Il s'agit d'une structure de donn√©es extr√™mement utile. Elle associe des **cl√©s** √† des **valeurs**.

Les dictionnaires ne sont pas ordonn√©s !

In [38]:
#@title #### **Diff√©rentes fa√ßons de cr√©er des dictionnaires**
d = {'nom' : 'Hugo', 'age' : 23} # √âcrivez votre nom et votre √¢ge ici
e = dict(nom='Nina', age=21) # Inscrivez le nom et l'√¢ge de quelqu'un d'autre ici

In [39]:
#@title #### **Acc√©der aux √©l√©ments du dictionnaire**
print(d['nom'])
print("nom : ", d.get('nom' , 'Pas trouv√©'))
print("sexe :   ", d.get('gender', 'Pas trouv√©'))

Hugo
nom :  Hugo
sexe :    Pas trouv√©


In [43]:
#@title #### **Mise √† jour du dictionnaire**
# Ajouter une nouvelle paire variable-valeur :
d['taille'] = (1,50) # un tuple, par exemple votre taille en (m√®tres,centim√®tres)
d

{'nom': 'Hugo',
 'age': 23,
 'lieu': 'Lausanne',
 'nationalite': 'CH',
 'annee_naissance': '2000',
 'taille': (1, 50)}

In [42]:
#@title #### **Ajouter un dictionnaire**
# update() ajoute deux dictionnaires ensemble
newdict = dict(lieu='Lausanne',nationalite='CH',annee_naissance='2000')
d.update(newdict)
print(d)

{'nom': 'Hugo', 'age': 23, 'lieu': 'Lausanne', 'nationalite': 'CH', 'annee_naissance': '2000', 'taille': (1, 50)}


In [44]:
#@title #### **Supprimer les √©l√©ments du dictionnaire**
# pop(),del()
d2 = d.copy()
d2.pop('age')
del d['age']
print(f"Identique ? {d==d2}")

Identique ? True


In [45]:
#@title #### **Dictionnaire transversal**
# it√©rer sur les cl√©s
for k in d :
    print(k, d[k])

nom Hugo
lieu Lausanne
nationalite CH
annee_naissance 2000
taille (1, 50)


In [46]:
print(list(d.keys()))
print(list(d.values()))
print(list(d.items()))

['nom', 'lieu', 'nationalite', 'annee_naissance', 'taille']
['Hugo', 'Lausanne', 'CH', '2000', (1, 50)]
[('nom', 'Hugo'), ('lieu', 'Lausanne'), ('nationalite', 'CH'), ('annee_naissance', '2000'), ('taille', (1, 50))]


In [47]:
#@title #### **Triez le dictionnaire**
# sorted()
states_dict = {'AL' : 'Alabama', 'CA' : 'California',
               'NJ' : 'New Jersey', 'NY' : 'New York'}
sorted_keys = sorted(list(states_dict.keys()), reverse=False)
for key in sorted_keys :
    print('{} : {}'.format(key, states_dict[key]))

AL : Alabama
CA : California
NJ : New Jersey
NY : New York
