# Principales opérations sur les tableaux de données

## Conventions

|      nom      | alias |                           commentaire                           |      type      |   alias   |
|:-------------:|:-----:|:---------------------------------------------------------------:|:--------------:|:---------:|
|   `tableau`   |  `t`  | le tableau de données (tableau de tuples nommés)                |  `[ objet_t ]` |           |
|    `objet`    |  `o`  | une ligne de ce tableau                                         | `{ d_t: v_t }` | `objet_t` |
| `descripteur` |  `d`  | l'un des descripteurs (et donc une colonne du tableau)          |      `str`     |   `d_t`   |
|    `valeur`   |  `v`  | valeur associée à un certain descripteur. (une case du tableau) |      `str`     |   `v_t`   |

## Sélection

**Objectif**: Ne conserver que certaines **lignes** du tableau - c'est-à-dire certains *objets*.

**Filtre** `fn_sel` - de type *function* ou plus précisément «`objet_t -> bool`»: si renvoie `True` on conserve, sinon on élimine.

In [None]:
# ensemble...

```python
# o alias de objet
[ o for o in tableau if fn_sel(o) ]
```

## Projection

**Objectif**: Ne conserver que certains *descripteurs* - revient à sélectionner certaine **colonnes** du tableau (et à oublier les autres).

`a_conserver`: la liste des **descripteurs** à conserver - de *type* «`[ d_t ]`»:

In [None]:
# ensemble...

```python 
[ { 
    # d, v, o alias de descripteur, valeur, objet
    d: v 
    for d, v in o.items()
    if d in a_conserver 
  }
    for o in tableau
]
```

## Trie

**Objectif**: Ré-ordonner les objets (de type «tuples nommés») du tableau selon un certain critère: généralement les valeurs d'un ou de plusieurs descripteurs.

**Cas 1**: Trier selon les valeurs croissantes d'*un seul descripteur* `'d'`

In [None]:
# ensemble ...

```python
# ajouter le paramètre reverse=True pour trier dans l'ordre inverse
sorted( tableau, key=lambda objet: objet['d'] )
```

**Cas 2**: Trier selon les valeurs croissantes d'un premier descripteur `'d1'` **puis** (en cas d'égalité) d'un second `'d2'`

In [None]:
# ensemble ...

```python
# même remarque que précédemment.
sorted( tableau, key=lambda o: (o['d1'], o['d2']) )
```

## Pré-traitements - conversion

**Objectif**: les valeurs associées aux descripteurs son de type `str` par défaut. Pour un descripteur fixé, il est parfois souhaitable d'utiliser un **type plus précis**; on procède donc à un **ajustement de type** (*conversion*).

À un descripteur tel que:
- `age`, `n_client`, `quantite` ... on s'attend à une valeur entière `int`.
- `prix`, `latitude`, `coefficient` ...  à une valeur «décimale» `float` (ou ...)
- `position`, `coordonnées`, ... à un `tuple` ou plus précisément `(float, float)`
- ... etc.

`fn_conv`: la fonction de conversion (`str -> t`) ou `t` représente le **type cible** comme `int`, `float`, ...

`'d_cible'` représente le **descripteur** dont on souhaite convertir la *valeur*.

In [None]:
# ensemble...

```python 
[ { 
    # opérateur ternaire «e1 if cond else e2»
    d: fn_conv(v) if d == 'd_cible' else v
    for d, v in o.items() 
   } 
 for o in tableau
]
```

## Post-Traitements ...

**Objectif**: obtenir une **synthèse** de toutes ces données - **numérique**: somme, moyenne, médiane, ... - **graphique** carte, courbe, camembert ...

**Exemple1**: Supposons que l'on ait une collection de données dont les objets représentent des achats dans une boutique. 
De plus, supposons qu'il y ait un descripteur `'prix'` et un descripteur `'quantite'`.

On souhaite connaître le *montant total des achats* ...

**1.** Construire la liste des produits «quantité * prix» puis faire sa somme.

In [None]:
# ensemble ...

```python
total = sum( [ o['quantite'] * o['prix'] for o in tableau ] )
```

**2.** Synthèse:

In [None]:
# ensemble ...

```python
print(f"Total des achats: { round(total,2) } euros")
```

**Exemple2** - *suite de l'exemple1*: supposons de plus que les achats aient un descripteur `'nom_client'` et qu'on souhaite trouver le «meilleur» client ... pour lui envoyer un cadeau par exemple!

**1.** Fractionnons le tableau en plusieurs sous tableaux: *un par client*.

**a.** Trouver les personnes à l'aide du descripteur `nom_client`

In [5]:
# ensemble ... (c'est le cas de le dire ici ...)

```python
# Bizarre, il manque le séparateur «:» ...
clients_set = { o['nom_client'] for o in tableau }
```

**b.** Fractionnons le tableau ... «`{ nom: son_tableau }`» donc type `{ d_t: [ objet_t ] }`

In [None]:
# ensemble ...

```python
tableaux_d = { 
    c: [ o for o in tableaux if o['nom_client'] == c ]
    for c in clients_set 
}
```

**2.** Pour chaque client, calculons le total des ses achats *tout en conservant l'association du client et du total de ses achats* donc type « `{ client: montant }` » soit `{ d_t: float }`

In [None]:
# ensemble ...

```python
totaux = { 
    c: sum( [ o['quantite'] * o['prix'] for o in t ] )
    # c, t alias de client, tableau
    for c, t in tableaux_d.items()
}
```

**3.** Trouvons le gagnant et synthèse!

In [None]:
# ensemble ...

```python
# accumulateurs
gagnant = None
## -1 pour être sûr que c'est le plus petit ...
montant_max = -1

# parcours des totaux
for c, m in totaux.items(): # c alias client, m alias montant
    if m > montant_max:
        montant_max = m
        gagnant = c

# Au final:
print(f"Le meilleur client est {gagnant} pour un montant total d'achat de { round(montant_max,2) }€")
```

**Exemple 3 - graphique**: voir TP 05_application_carte_interactive...