## Activité sur le tri et la recherche

<div class = "alert alert-info">

Une association loi 1901 dispose d’un fichier de ses membres faisant apparaître les renseignements suivants :
    
- Nom,
- Prénom,
- Numéro de rue,
- Rue,
- Complément d'adresse,
- Code postal,
- Ville,
- Mail personnel,
- Mail professionnel,
- Téléphone personnel,
- Téléphone portable,
- Cotisation,
- Date d’adhésion,
- Statut.

Elle souhaite mettre en œuvre un certain nombre de routines pour pouvoir obtenir quelques informations sur ce fichier.
Vous êtes chargé de réaliser le programme correspondant.
Vous disposez du fichier **adherents.csv**, qui contient un extrait du registre des adhérents de l'association.
</div>

Il faudra exécuter les cellules **Python** au fur et à mesure de la progression, après avoir éventuellement complété le code.
Des cellules de contrôle **tests** sont incluses.

### Partie 1 : travail avec un tableau de tableaux

__Exercice 1__

On commence par importer le module csv.

In [1]:
import csv

Compléter ci-dessous la fonction import_csv(fichier) permettant de charger le fichier csv sous forme d’un tableau.

La ligne des descripteurs du fichier csv constitue la ligne 0 du tableau (table[0]). Ces descripteurs sont :

    ['nom', 'prénom', 'numéro rue', 'rue', 'complément', 'code postal', 'ville', 'mail personnel', 'mail professionnel', 'téléphone personnel', 'téléphone portable', 'cotisation', 'date d’adhésion', 'statut']

On transformera :
- les données numériques 'numéro rue' et 'code postal' en entiers ;
- la donnée 'cotisation' en booléen.

In [2]:
def import_csv(fichier):
    """ Fonction qui ouvre le fichier csv dont le nom est fichier
        renvoie une table bi-dimensionnelle
        table[0] contient les titres des colonnes
        Les données numériques ('numéro rue' et 'code postal') doivent être des entiers;
        La cotisation (payée ou pas payée) doit être un booléen;
        Les numéros de téléphone sont complétés en chaîne de 10 caractères.
    """
    with open(fichier,"r", newline="", encoding="utf-8") as adherents:
        table = adherents.read()
    table = table.split("\n")[:-1]
    for k in range(len(table)):
        table[k] = table[k].split(",")
        if k>0:
            table[k][2] = int(table[k][2]) # on transforme le numéro de rue en entier
            table[k][5] = int(table[k][5]) # on transforme le numéro de rue en entier
            table[k][11] = table[k][11]=="oui"
            table[k][9] = "{:0>10}".format(table[k][9])
            table[k][10] = "{:0>10}".format(table[k][10])
    return table

Contrôler votre fonction à l'aide des tests ci-dessous :

In [3]:
liste = import_csv("adherents.csv")
descripteurs = liste[0]
assert liste[1][2]==14, "Problème de type avec numéro de rue"
assert liste[3][5]==45460, "Problème de type avec Code postal"
assert liste[15][11], "Problème de type sur la cotisation"
assert not liste[5][11], "Problème de type sur la cotisation"

In [4]:
liste[1]

['ASSELIN',
 'Francis',
 14,
 'Rue des Lilas',
 '',
 45270,
 'Bellegarde',
 'ass4@gmail.com',
 'asselin.francis@unic.fr',
 '0238901586',
 '0689154763',
 True,
 '04/06/2008',
 'membre']

**Exercice 2**

On veut pouvoir rechercher les personnes qui ne sont pas à jour de leur cotisation.

Compléter la fonction **cotisation_pasajour(donnees)** permettant cette requête.

Elle doit renvoyer un tableau des tuples __(nom, prénom)__ des personnes.

In [5]:
def cotisation_pasajour(donnees):
    """ Fonction qui cherche les membres dont la cotisation n'est pas à jour
        renvoie une liste des noms et prénoms ces membres sous forme d'un tuple :
        [(nom, prenom)].
    """
    reponse = []
    for personne in donnees:
        if not personne[11]:
            reponse.append((personne[0],personne[1]))
    return reponse

Tester votre fonction à l'aide des tests ci-dessous :

In [6]:
cotis_absente = cotisation_pasajour(liste)
assert ('FOURNIER', 'Virginie') in cotis_absente, "Devrait être dans la liste"
assert not ('PAILLART', 'Mélanie') in cotis_absente, "Ne devrait pas être dans la loste"
assert len(cotis_absente)==7, "Il en manque"

In [7]:
cotis_absente

[('BOUGEOT', 'Gilles'),
 ('JACQUET', 'Jean-rémy'),
 ('MERCIER', 'Jean-Claude'),
 ('CAMUS', 'Martial'),
 ('LEMOSSE', 'Matine'),
 ('BARRANGER', 'Rodolphe'),
 ('FOURNIER', 'Virginie')]

**Exercice 3**

On veut obtenir un nouveau fichier CSV où les membres de l’association sont triés par ancienneté.

Écrire la fonction **anciennete(donnees)** permettant le tri du fichier en définissant les variables **ancien** et __actuel__ suivant les spécifications données, ainsi que la condition du test de comparaison.

In [8]:
def anciennete(donnees):
    """ Fonction qui tri par sélection le tableau suivant le critère d'ancienneté
        ancien et actuel sont les variables qui stockent les dates d'adhésion
        de deux membres (i et k dans la liste)
        au format [jour, mois, année] "jour", "mois" et "année" sont des entiers.
    """
    nb_adh = len(donnees)
    for i in range(1,nb_adh):
        position = i
        if donnees[i][12]!='':
            ancien = list(map(int, donnees[i][12].split('/')))
            for k in range(i+1,nb_adh):
                if donnees[k][12]!='':
                    actuel = list(map(int, donnees[k][12].split('/')))
                    if actuel[2]<ancien[2] or\
                    (actuel[2]==ancien[2] and actuel[1]<ancien[1]) or\
                    (actuel[2]==ancien[2] and actuel[1]==ancien[1] and actuel[0]==ancien[0]):
                        position = k # mémorise l'indice du plus ancien
                        ancien = actuel # mémorise la date du plus ancien
            donnees[i], donnees[position] = donnees[position],donnees[i]

Tester votre fonction à l'aide des tests ci-dessous :

In [9]:
anciennete(liste)
assert liste[0]==descripteurs, "Problème ligne des titres"
assert liste[1][0]=='PAILLART', "Problème : traitement de l'année"
assert liste[5][0]=='BOUGEOT', "Problème : traitement du mois"
assert liste[6][0]=='MERCIER' and liste[7][0]=='SICARD', "Problème : traitement du jour"

In [10]:
liste

[['nom',
  'prénom',
  'numéro rue',
  'rue',
  'complément',
  'code postal',
  'ville',
  'mail personnel',
  'mail professionnel',
  'téléphone personnel',
  'téléphone portable',
  'cotisation',
  'date d’adhésion',
  'statut'],
 ['PAILLART',
  'Mélanie',
  45,
  "Route du Chateau d'eau",
  '',
  45420,
  'Bonny sur Loire',
  'paillmela@yahoo.fr',
  'paillard.melanie@free.fr',
  '0000000000',
  '0614632578',
  True,
  '05/05/1999',
  'vice présidente'],
 ['PINOTEAU',
  'Carine',
  25,
  'Rue de Colmart',
  '',
  45760,
  'Boigny sur Bionne',
  'carine5@yahoo.fr',
  'portier.carine@gdf.fr',
  '0238759356',
  '0689125632',
  True,
  '05/09/1999',
  'présidente'],
 ['JOUAN',
  'Raymond',
  32,
  'Rue de Bellevue',
  '',
  45460,
  'Les Bordes',
  'jouanray2@sfr.fr',
  'jouan.raymond@edf.fr',
  '0238298615',
  '0615986378',
  True,
  '15/10/1999',
  'secrétaire'],
 ['PINOTEAU',
  'Andrée',
  15,
  'Rue des Clos',
  '',
  45390,
  'Boësses',
  'pinot_and@yahoo.fr',
  'pinoteau.andree@tu

**Exercice 4**

On souhaite pouvoir trier le tableau par liste alphabétique de nom et prénom.

Compléter la fonction **alphabetique(donnees)** permettant le tri par insertion du fichier.

In [11]:
def alphabetique(donnees):
    """ Fonction qui tri par insertion le tableau suivant le critère nom, prénom
        Attention ! La ligne de titre n'est pas à trier.
    """
    for i in range(2,len(donnees)): # A COMPLÉTER
        insere = donnees[i]
        identifie = (insere[0], insere[1])
        k = i
        while k>1 and identifie<(donnees[k-1][0],donnees[k-1][1]):
            donnees[k] = donnees[k-1]
            k = k - 1
        donnees[k] = insere

Tester votre fonction à l'aide des tests ci-dessous et en allant contrôler le fichier sauvegardé :

In [13]:
alphabetique(liste)
assert liste[0]==descripteurs, "Problème ligne des titres"
assert liste[1][0]=='ASSELIN', "Problème : critère nom"
assert liste[22][0]=='PINOTEAU' and liste[22][1]=='Andrée', "Problème : critère prénom"

In [14]:
liste

[['nom',
  'prénom',
  'numéro rue',
  'rue',
  'complément',
  'code postal',
  'ville',
  'mail personnel',
  'mail professionnel',
  'téléphone personnel',
  'téléphone portable',
  'cotisation',
  'date d’adhésion',
  'statut'],
 ['ASSELIN',
  'Francis',
  14,
  'Rue des Lilas',
  '',
  45270,
  'Bellegarde',
  'ass4@gmail.com',
  'asselin.francis@unic.fr',
  '0238901586',
  '0689154763',
  True,
  '04/06/2008',
  'membre'],
 ['BARRANGER',
  'Rodolphe',
  39,
  'Rue du Canal',
  '',
  45760,
  'Boigny sur Bionne',
  'barra_rodol@orange.fr',
  'barranger.rodolphe@cit.fr',
  '0945698723',
  '0000000000',
  False,
  '13/10/2015',
  'membre'],
 ['BERTRAND',
  'Thierry',
  51,
  'Rue du 14 Juillet',
  'C1 résidence les Puisseaux',
  45420,
  'Bonny sur Loire',
  'bertrand_5@sfr.fr',
  'bertrand.thierry@caf.fr',
  '0225984127',
  '0000000000',
  True,
  '01/02/2012',
  'membre'],
 ['BOUGEOT',
  'Gilles',
  37,
  'Rue Gambetta',
  'residence les tilleuls',
  45270,
  'Bellegarde',
  'boug

### Partie 2

On souhaite maintenant que les données de chaque membre de l’association soit un dictionnaire avec les clés :

    {"nom" : ,
     "prénom" : ,
     "adresse" : {"numéro rue" : ,
                  "rue" : ,
                  "complément" : ,
                  "code postal" : ,
                  "ville" : },
     "mail personnel" : ,
     "mail professionnel" : ,
     "téléphone personnel" : ,
     "téléphone portable" : ,
     "cotisation" : ,
     "date d'adhésion" : ,
     "statut" : }
 
La liste des adhérents sera alors un tableau de dictionnaires.

__Exercice 5__

Compléter la fonction **import_dico(fichier)** permettant de charger le fichier CSV sous cette forme.

In [18]:
def import_dico(fichier):
    """ Fonction qui ouvre le fichier csv dont le nom est fichier
        renvoie une liste de dictionnaires dont les clés sont
        les titres des colonnes du fichier csv.
        Les données numériques ('numéro rue' et 'code postal') doivent
        être des entiers ;
        et la cotisation un booléen (payée = True ou pas payée = False);
        Les numéros de téléphone sont complétés en chaîne de 10 caractères.
        De plus, les éléments de l'adresse sont regroupés dans un dictionnaire.
    """
    donnees=[]
    with open(fichier, "r", newline="",encoding="utf-8" ) as adherents:
        # création du lecteur csv utilisant la ligne d'entête
        # comme clés du dictionnaire des enregistrements.
        table=csv.DictReader(adherents,delimiter=",")
        for element in table:
            donnees.append({"nom" : element["nom"],
                            "prénom" : element["prénom"],
                            "adresse" : {"numéro rue" : int(element["numéro rue"]),
                                         "rue" : element["rue"],
                                         "complément" : element["complément"],
                                         "code postal" : int(element["code postal"]),
                                         "ville" : element["ville"]},
                            "mail personnel" : element["mail personnel"],
                            "mail professionnel" : element["mail professionnel"],
                            "téléphone personnel" : "{:0>10}".format(element["téléphone personnel"]),
                            "téléphone portable" : "{:0>10}".format(element["téléphone portable"]),
                            "cotisation" : element["cotisation"]=="oui",
                            "date d'adhésion" : element["date d’adhésion"],
                            "statut" : element["statut"]})
    return donnees

Tester votre fonction à l'aide des tests ci-dessous :

In [20]:
dico = import_dico("adherents.csv")
assert "mail professionnel" in dico[0].keys()
assert dico[0]["nom"]=="ASSELIN"
assert dico[0]['adresse']["numéro rue"]==14, "Problème de type avec numéro de rue"
assert dico[2]['adresse']["code postal"]==45460, "Problème de type avec Code postal"
assert dico[5]["téléphone personnel"]=="0225984127", "Problème de format téléphone perso sur 10 chiffres"
assert dico[6]["téléphone portable"]=="0689125632", "Problème de format téléphone perso sur 10 chiffres"
assert dico[14]["cotisation"], "Problème de type sur la cotisation"
assert len(dico)==35, "Problème nombre d'adhérents"

In [21]:
dico[0]

{'nom': 'ASSELIN',
 'prénom': 'Francis',
 'adresse': {'numéro rue': 14,
  'rue': 'Rue des Lilas',
  'complément': '',
  'code postal': 45270,
  'ville': 'Bellegarde'},
 'mail personnel': 'ass4@gmail.com',
 'mail professionnel': 'asselin.francis@unic.fr',
 'téléphone personnel': '0238901586',
 'téléphone portable': '0689154763',
 'cotisation': True,
 "date d'adhésion": '04/06/2008',
 'statut': 'membre'}

__Exercice 6__

On souhaite pouvoir retrouver l’adresse mail personnelle d’un membre de l'association.

Écrire la fonction **adresse_mail(donnees, nom, prenom)** permettant d’effectuer cette requête.

In [None]:
def adresse_mail(donnees, nom, prenom):
    """ Fonction qui cherche les membres dont les nom et prénom sont
        ceux fournis en argument
        renvoie une liste des adresses mail personnelles des personnes
    """
    # À COMPLÉTER
    pass

Tester votre fonction à l'aide des tests ci-dessous :

In [None]:
assert adresse_mail(dico, "ASSELIN", "Francis") == ["ass4@gmail.com"], "Problème : recherche ?"
assert sorted(adresse_mail(dico, "VANNIER", "Anne")) == ["vannier_2@orange.fr","vannier_4@red.fr"], "Problème : plusieurs homonymes"

__Exercice 7__

On veut obtenir un numéro de téléphone, de préférence portable, pour contacter un membre de l'association.

Écrire la fonction **telephone(donnees, nom, prenom)** permettant d’effectuer cette requête.

In [None]:
def telephone(donnees, nom, prenom):
    """ Fonction qui cherche les membres dont les nom et prénom
        sont fournis en argument.
        renvoie un tableau des numéros telephones, portables
        si possible, de ces personnes.
    """
    # À COMPLÉTER
    pass

Tester votre fonction à l'aide des tests ci-dessous :

In [None]:
assert telephone(dico, "ASSELIN", "Francis") == ["0689154763"], "Problème : recherche ?"
assert telephone(dico, "LELAY", "Romuald") == ["0238963791"], "Problème : fixe si pas de portable"
assert sorted(telephone(dico, "VANNIER", "Anne")) == ["0203690452","0713791685"], \
        "Problème : plusieurs homonymes"

**Exercice 8**

La responsable souhaite organiser une présentation d’un professionnel dans plusieurs villes. Elle veut savoir combien de personnes seront à contacter pour chaque commune.

Écrire la fonction **classement_par_villes(donnees)** permettant d’obtenir une table des différentes villes et du nombre de membres par ville.

La table doit être classée par ordre décroissant du nombre de membres, puis par ordre alphabétique de la ville.

Pour cela, on pourra utiliser la méthode .sort() avec le critère **key = lambda ville :critère** et éventuellement **reverse**. Il faudra l'utiliser deux fois.

In [None]:
def classement_par_villes(donnees):
    """ Fonction qui crée un tableau de couples
        (ville, nombre d'adhérents).
        renvoie ce tableau trié
        par ordre décroissant du nombre d'adhérents,
        puis par ordre alphabétique des villes.
        On utilisera pour cela deux fois la fonction prédéfinie
        sort(key = lambda ville:critère, reverse=booleen)
    """
    dico_ville = {}
    # instruction à écrire pour obtenir un dictionnaire {ville:nombre}
    tableau = []
    # instruction à écrire pour obtenir le tableau de couples,
    # à partir du dictionnaire
    tableau.sort() # à compléter avec les critères
    tableau.sort() # à compléter avec les critères
    return tableau

Tester votre fonction à l'aide des tests ci-dessous :

In [None]:
villes = classement_par_villes(dico)
assert(villes[0] == ('Bellegarde',8)), "Problème : format des données"
assert(villes[2][1] == 6), "Problème : tri sur le nombre"
assert(villes[4][0] == 'Boisseaux'), "Problème : tri alphabétique"