<div class="alert alert-success">

# P3-4 : Traitement de données en table: Fusion de tables

</div>

###  Préliminaires : Récupérer les données de deux fichiers 
On dipose de deux fichiers `elements.csv` et  `familles.csv` contenant des informations sur la classification périodique des éléments. 

Le 1er fichier liste les 20 premiers **éléments** chimiques, et le 2nd fichier les éléments des 3 **familles** chimiques à connaître au lycée.

- Le 1er fichier précise le nom et le symbole des éléments. 
- Le 2ème préicise la famille des éléments et leur position dans la classification périodique (ligne L et colonne C).

In [None]:
import csv

In [None]:
# import des données dans les tables elements et familles, qui sont des listes de dictionnaires
with open('familles.csv', encoding='utf-8') as source:
    familles = csv.DictReader(source, delimiter=',')
    familles_descripteurs = familles.fieldnames
    familles = list(familles)

with open('elements.csv', encoding='utf-8') as source:
    elements = csv.DictReader(source, delimiter=',')
    elements_descripteurs = elements.fieldnames
    elements = list(elements)

print(f"Descripteurs des éléments :\n{elements_descripteurs}\n")

print(f"Descripteurs des familles :\n{familles_descripteurs}")

**Outil** : Afin de visualiser les données plus facilement, on propose une fonction `affichage(table)` qui prend en paramètre une liste de dictionnaires (qui partagent des clefs communes), et qui affiche sur une 1ère ligne les clefs, puis sur les lignes suivantes les valeurs pour chaque dictionnaire de la liste.

In [None]:
def affichage(table):
    for clef in table[0].keys():
        print(clef.center(15), end='')
    print()
    for data in table:
        for valeur in data.values():
            print(valeur.center(15), end='')
        print()

In [None]:
affichage(elements)

In [None]:
affichage(familles)

<div class="alert alert-warning">
    
## Problématique :

Quelle table permet de répondre **à elle seule** aux questions suivantes ?
1. Quelle est la liste  des symboles des Alcalins ?
1. Comment s'appelle l'élément halogène de la 3ème ligne ?
1. A quelle famille appartient le Sodium ?
1. Dans quelle colonne se situe le Néon ?
1. F et Cl appartiennent-ils à la même famille ?
</div>

<div class="alert alert-success">

**=> impossible de répondre sans fusionner les informations des 2 tables !**
</div>

<div class="alert alert-danger">
    
# Fusion
    
Lorsque 2 tables **partagent un même descripteur commun** (même s'il est nommé différemment), il est possible de créer une nouvelle table en **fusionnant** les informations des 2 tables "en s'appuyant" sur ce desripteur commun.
</div>

<div class="alert alert-warning">
    
### **Exo** : 
    
1. Identifier le descripteur commun que partagent ces deux tables.
2. Répondre (sans programmation) aux questions de la problématique.
</div>

<h2 class="alert alert-info">Première résolution en programmant, sans construire de table fusion.</h2>

On présente ci-dessous une solution à la 1ère question :

**Le principe consiste à parcourir une 1ère table à la recherche d'un critère particulier, et lorsque ce critère est satisfait, on parcourt les éléments de la 2ème table en sélectionnant les éléments qui partagent le descripteur commun des 2 tables.** On manipule donc *2 boucles for imbriquées*.

In [None]:
# 1. Quelle est la liste des symboles des Alcalins ?
requete1 = []

for elt1 in familles:
    if elt1['Famille'] == 'Alcalin':
        for elt2 in elements:
            if elt2['Numéro atomique'] == elt1['Z']:
                requete1.append(elt2['Symbole'])
                
requete1

In [None]:
# 2. Comment s'appelle l'élément halogène de la 3ème ligne ?
requete2 = []

for elt1 in familles:
    if elt1['Famille'] == 'Halogène' and int(elt1['L']) == 3:
        for elt2 in elements:
            if elt2['Numéro atomique'] == elt1['Z']:
                requete2.append(elt2['Nom'])
                
requete2                

<div class="alert alert-warning">
    
### **Exo** : Répondez de façon similaires aux questions 3, 4 et 5.
</div>

In [None]:
# 3. A quelle famille appartient le Sodium ?

# A VOUS DE JOUER
# ...

In [None]:
# 4. Dans quelle colonne se situe le Néon ?

# A VOUS DE JOUER
# ...

In [None]:
# 5. F et Cl appartiennent-ils à la même famille ?

# A VOUS DE JOUER
# ...

<h2 class="alert alert-info">Deuxième résolution, en construisant d'abord une table fusionnée.</h2>

<div class="alert alert-warning">
    
### **Exo** : Vous devez créer une table `fusion` qui liste tous les enregistrements de la table `elements` et tous ceux de la table `familles` seulement s'ils partagent bien la même valeur de Z.
    
*Résultat attendu :*
    
       Z             Nom          Symbole        Famille           C              L       
       2            Hélium           He         Gaz noble          8              1       
       3           Lithium           Li          Alcalin           1              2       
       9            Fluor            F           Halogène          7              2       
       10            Néon            Ne         Gaz noble          8              2       
       11           Sodium           Na          Alcalin           1              3       
       17           Chlore           Cl          Halogène          7              3       
       18           Argon            Ar         Gaz noble          8              3       
       19         Potassium          K           Alcalin           1              4       


</div>

In [None]:
# A VOUS DE JOUER
# Compléter ce code à trous

for elt1 in ...:
    Z = elt1['Numéro atomique']
    for elt2 in ...:
        if elt2['Z'] == ...:
            element = {'Z':Z, 'Nom':elt1['Nom'], ...,
                       'Famille':elt2['Famille'], ...}
            fusion.append(...)

affichage(fusion)

<div class="alert alert-warning">
    
### **Exo** : En exploitant cette table fusionnée, répondre à nouveau aux mêmes questions.
</div>

**Rappel des questions :**


1. Quelle est la liste  des symboles des Alcalins ?
1. Comment s'appelle l'élément halogène de la 3ème ligne ?
1. A quelle famille appartient le Sodium ?
1. Dans quelle colonne se situe le Néon ?
1. F et Cl appartiennent-ils à la même famille ?

In [None]:
requete1 = [element['Symbole'] for element in fusion if element['Famille'] == 'Alcalin']
requete1

In [None]:
requete2 = 

# A VOUS DE JOUER
# ...

In [None]:
requete3 = 

# A VOUS DE JOUER
# ...

In [None]:
requete4 = 

# A VOUS DE JOUER
# ...

In [None]:


# A VOUS DE JOUER
# ...

<h2 class="alert alert-info">Compléments facultatifs (à traiter en autonomie).</h2>

## Fusion avec jointure interne.

La table obtenue par fusion précédemment correspond à une **fusion interne**, mais on va voir que d'autres fusions sont possibles.

## Fusion avec jointure à gauche.

On continue d'utiliser le descripteur commun pour créer une nouvelle table par fusion de ces 2 tables. 
La nouvelle table va lister tous les enregistrements de la table `elements` et ajouter les champs de la table `familles` correspondants, càd qui partagent le même numéro atomique (lorsque c'est possible). 

Par exemple, le lithium de numéro atomique Z=3, appartient à la famille des alcalins (dans la 1ere colonne à la 1ère ligne).

Autre exemple : on ne peut pas obtenir d'info complémentaire sur le calcium de numéro atomique Z=20 car il n'apparait pas dans la 2eme table. On écrira donc des données 'vides' dans ce cas.

Cette **fusion** est appelée **jointure à gauche** car c'est la table de gauche qui sert de base et pour lesquelles toutes ses infos seront reprises.

In [None]:
fusion_gauche = []

for elt_g in elements:
    Z = elt_g['Numéro atomique']
    element = {'Z':Z, 'Nom':elt_g['Nom'], 'Symbole':elt_g['Symbole'],
                       'Famille':'-', 'C':'-', 'L':'-'}
    for elt_d in familles:
        if elt_d['Z'] == Z:
            element['Famille'] = elt_d['Famille']
            element['C'] = elt_d['C']
            element['L'] = elt_d['L']
            break  # on a trouvé une correspondance de Z, on peut quitter la boucle for
    fusion_gauche.append(element)

affichage(fusion_gauche)

## Fusion avec jointure à droite :

ON peut aussi créer une table `fusion_droite` qui liste tous les enregistrements de la table `familles` en ajoutant lorsque c'est possible les informations correspondantes de la table `elements`.

Par exemple, la nouvelle table aura les lignes suivantes (attention, extrait seulement) :

       Z             Nom          Symbole        Famille           C              L       
       3           Lithium           Li          Alcalin           1              2 
       37             -              -           Alcalin           1              5     
       

In [None]:
fusion_droite = []

for elt_d in familles:
    Z = elt_d['Z']
    element = {'Z':Z, 'Nom':'-', 'Symbole':'-',
                       'Famille':elt_d['Famille'], 'C':elt_d['C'], 'L':elt_d['L']}
    for elt_g in elements:
        if elt_g['Numéro atomique'] == Z:
            element['Nom'] = elt_g['Nom']
            element['Symbole'] = elt_g['Symbole']
            break  # on a trouvé une correspondance de Z, on peut quitter la boucle for
    fusion_droite.append(element)

affichage(fusion_droite)

## Fusion avec jointure externe :

Pour créer une table `fusion_externe` qui liste tous les enregistrements de la table `elements` et tous ceux de la table `familles` en combinant les informations correspondantes lorsque c'est possible, on procède en 2 étapes :
1. on commence par une fusion_gauche
2. puis on reprend comme une fusion_droite, mais seulement pour les éléments qui ne sont pas déjà enregistrés dans la fusion gauche.

In [None]:
fusion_externe = []

Z_deja_vus = [] # enregistre les numéros atomiques présents dans les 2 tables

# 1er temps : on commence par une fusion à gauche 
for elt_g in elements:
    Z = elt_g['Numéro atomique']
    element = {'Z':Z, 'Nom':elt_g['Nom'], 'Symbole':elt_g['Symbole'],
                       'Famille':'-', 'C':'-', 'L':'-'}
    for elt_d in familles:
        if elt_d['Z'] == Z:
            element['Famille'] = elt_d['Famille']
            element['C'] = elt_d['C']
            element['L'] = elt_d['L']
            break 
    Z_deja_vus.append(Z) # on retient cet élément pour ne pas en tenir compte dans la fusion droite (2ème étape)
    fusion_externe.append(element)

# 2ème temps : on ajoute les autres éléments comme une fusion à droite, 
# mais sans reprendre les éléments déjà enregistrés
for elt_d in familles:
    if elt_d['Z'] not in Z_deja_vus: # cet élément n'est pas déjà enregistré, alors on l'ajoute 
        element = {'Z':elt_d['Z'], 'Nom':'-', 'Symbole':'-',
                       'Famille':elt_d['Famille'], 'C':elt_d['C'], 'L':elt_d['L']}
        fusion_externe.append(element)

affichage(fusion_externe)