# Indexation de table

## Pourquoi indexer une table ?

Jusqu'ici, on a vu que __pour extraire de l'information d'une table, il fallait toujours parcourir l'ensemble de cette table__. On peut aisément comprendre que ce coût est très important lorsqu'il s'agit de traiter des tables de grande taille.

Il devient alors intéressant de créer de nouvelles structures pour accélérer des recherches type. Comme on l'a vu (et on le détaillera un peu plus tard), les dictionnaires ont des qualités intrinsèques qui permettent de trouver une valeur efficacement, par clé plutôt que par indice. 

Il suffit donc de créer un nouveau dictionnaire, en choisissant les bonnes clés. Celles qui seront à l'origine des recherches futures.

Ce principe s'appelle l'__indexation__ : on crée un __dictionnaire, avec des clés judicieusement choisies, pour améliorer les performances de recherche dans une table__.

Dans le cas d'une table, __l'indexation consite donc souvent à créer un dictionnaire de dictionnaires__.

Reprenons notre exemple de table de naissances...

In [None]:
import csv

with open("244400404_prenoms-enfants-nes-nantes.csv", mode='r', encoding='utf-8') as f:
    reader = csv.DictReader(f, delimiter=';')
    table_naissances = [dictionnaire for dictionnaire in reader]

print(table_naissances)

Quel type de recherche pourrait être la plus fréquente sur cette table ?

Il est raisonnable de penser que les __recherches par prénom__ seront très utiles à optimiser car potentiellement les plus fréquentes.

## Comment indexer une table ?

Que pourrait-on chercher comme information tirée de cette table lorsqu'on fait une __recherche sur un prénom__ ?

Là encore, c'est subjectif, mais le plus probable est que vous souhaitiez __connaître le nombre de naissances, pour telle ou telle année__. Sur un __site web dédié aux prénoms__ par exemple.

### Indexation par prénom

Nous allons créer un index favorisant une recherche par prénom.

In [None]:
index_par_prenom = {}
for dico in table_naissances:
    if dico['Prénom'] in index_par_prenom:
        index_par_prenom[dico['Prénom']].update({dico['Année de naissance'] : dico['Occurence']})
    else:
        index_par_prenom[dico['Prénom']] = {dico['Année de naissance'] : dico['Occurence']}

print(index_par_prenom)

En passant, cet index nous permet de savoir très facilement __combien de prénoms différents__ (dont l'occurrence annuelle est supérieure ou égale à 5) ont été donnés pendant cette période :

In [None]:
len(index_par_prenom)

La recherche sur un prénom se fait maintenant de façon __très simple et très rapide__.

In [None]:
index_par_prenom['DAVID']

> __Remarque :__ la tentation de trier ce résultat par date est forte mais...

In [None]:
index_par_prenom['DAVID'].sort()

__Un dictionnaire n'étant pas ordonnée, on ne peut pas le trier !__

Qu'à cela ne tienne, il suffit de créer une liste à partir du dictionnaire.

In [None]:
liste_david = list(index_par_prenom['DAVID'].items())
liste_david.sort()

print(liste_david)

Cet index nous permet bien un traitement aisé et efficace lors d'une recherche par prénom. Mais qu'en est-il d'une __recherche par année__ ?

### Indexation par année

Si on veut connaître les prénoms les plus donnés telle ou telle année, cet index serait particulièrement inadapté. Il faut donc créer un nouvel index dédié à ce type de recherche.

A vous de jouer...

Trouver les __prénoms les plus populaires en 2008__ :

Trouver les __10 prénoms__ les plus populaires en 2019 :

### Indexation pour une recherche par sexe (Approfondissement)

Même principe que précédemment : créer un index pour anticiper une __recherche par année uniquement sur les prénoms de fille__.

Trouver les __10 prénoms de fille__ les plus populaires en 2004 :

Créer un index pour anticiper une __recherche par sexe et par année__. C'est à dire, un index permettant de faire ce type de recherche :

`index_par_annee_et_sexe['GARCON']['2003']`

In [None]:
index_par_annee_et_sexe['GARCON']['2003']

Trouver les __10 prénoms de garçon les plus populaires en 2003__ :

## Que retenir ?
### À minima...

- Un index permet de retrouver des informations présentes dans une table de façon plus simple et rapide.
- Il est nécessaire d'anticiper le type de recherche qui sera effectué pour créer un index utile.
- Lorsqu'on a déterminé le descripteur qui servira de base aux recherches, on peut utiliser soit :
  - ce descripteur comme clé de l'index (ex : `'GARCON'`, `'FILLE'`).
  - les attributs de ce descripteur comme clé de l'index (ex : `'CAMILLE'`, `'FATIMA'`, `'BORIS'`,...).
- Un index est donc un dictionnaire.
- Les valeurs de ce dictionnaire sont souvent également des dictionnaires.
- Savoir faire des recherches dans un index (ex : `index['CAMILLE']`).

### Au mieux...

- Savoir choisir les clés pertinentes en fonction d'un besoin de recherche ultérieur.
- Savoir créer un index, basé sur ces clés pertinentes.
- Savoir faire une recherche à plusieur niveaux de profondeur dans un index (ex : `index['GARCON']['2003']`).

---
[![Licence CC BY NC SA](https://licensebuttons.net/l/by-nc-sa/3.0/88x31.png "licence Creative Commons CC BY-NC-SA")](http://creativecommons.org/licenses/by-nc-sa/3.0/fr/)
<p style="text-align: center;">Auteur : David Landry, Lycée Clemenceau - Nantes</p>