Énoncé de l&#39;exercice :

Titre : Algorithmes de recherche sur une base de données simulée
Objectif : Vous allez travailler avec une liste de personnes, chacune ayant une note. Cette
liste simulera une base de données et vous devrez appliquer différents algorithmes de
recherche dessus. L&#39;objectif est de comparer les temps d&#39;exécution des algorithmes de
recherche pour une liste de taille variable.

1. Étape 1 : Chargement des données
○ Créer une fonction load_person_data(filename, n) qui permet de charger une
liste de personnes avec leurs notes depuis un fichier CSV. Chaque ligne du
fichier contient le nom d&#39;une personne et sa note.
○ La fonction prend le paramètre n en entrée, et renvoie les n premiers
éléments du fichier.

In [30]:
import pandas as pd

def load_person_data(filename, n):
    data = pd.read_csv(filename, header=None, names=['Name', 'Grade'])
    # Retourner les n premières lignes sous forme de liste de tuples
    return list(data.head(n).itertuples(index=False, name=None))

L = load_person_data('person_data.csv', 100)
print(L)

    

[('Alex', 8.8), ('Marie', 13.74), ('Lucas', 11.77), ('Emma', 7.88), ('Paul', 3.17), ('Laura', 0.49), ('Hugo', 8.32), ('Chloe', 16.85), ('Maxime', 10.42), ('Sophie', 13.94), ('Nathan', 3.0), ('Camille', 10.09), ('Thomas', 10.14), ('Juliette', 7.59), ('Matthieu', 14.22), ('Manon', 5.7), ('Leo', 8.61), ('Sarah', 18.95), ('Antoine', 0.76), ('Lucie', 5.94), ('Julien', 6.24), ('Clara', 4.45), ('Romain', 4.2), ('Elise', 4.93), ('Pierre', 9.85), ('Alicia', 5.58), ('Bastien', 15.45), ('Eva', 19.03), ('David', 6.03), ('Alice', 8.55), ('Quentin', 5.41), ('Jeanne', 9.78), ('Arthur', 9.77), ('Louise', 6.49), ('Benoit', 0.95), ('Lea', 10.92), ('Gaetan', 1.91), ('Margaux', 4.78), ('Jeremy', 4.85), ('Amandine', 6.71), ('Florian', 2.43), ('Anais', 6.47), ('Cedric', 7.1), ('Marine', 4.34), ('Guillaume', 10.16), ('Mathilde', 15.46), ('Vincent', 18.74), ('Charlotte', 1.91), ('Kevin', 8.07), ('Marion', 4.63), ('Dylan', 4.43), ('Nina', 9.6), ('Mickael', 2.19), ('Celine', 10.11), ('Fabien', 10.25), ('Aurelie

2. Étape 2 : Recherche
○ Utilisez les algorithmes de recherche suivants pour trouver une personne
dans la liste en fonction de son nom ou de sa note :
■ Recherche linéaire
■ Recherche dichotomique (binaire) (la liste doit être triée)
○ PS : En premier, chercher la note de “Juliette” sur les 20 premiers étudiants
■ En second, récupérer toute la liste, et chercher “Yohan”
■ Time %time, tm_debut , tm_fin

In [44]:
def lineaire(x, L):
    for i in range(len(L)):
        name, grade = L[i] 
        if name == x:
            return f"Élément '{x}' TROUVÉ À LA POSITION {i} AVEC LA NOTE {grade}"
    else:
        return False


In [45]:
x="Yohan"

In [46]:
resultat_lineaire=lineaire(x,L)
print(result)

Élément 'Yohan' TROUVÉ À LA POSITION 69 AVEC LA NOTE 15.12


In [47]:
def bineaire(x, L):
    L.sort()
    gauche = 0
    droite = len(L) - 1
    

    while gauche <= droite:
        milieu = (gauche + droite) // 2
        name, grade = L[milieu]  # Déstructuration du tuple
        
        if x == name:
            return f"Élément '{x}' TROUVÉ À LA POSITION {milieu} AVEC LA NOTE {grade}"
        elif x < name:
            droite = milieu - 1
        else:
            gauche = milieu + 1
    
    return False


In [48]:

resultat_bineaire=bineaire("Yohan",L)
print(resultat_bineaire)

Élément 'Yohan' TROUVÉ À LA POSITION 99 AVEC LA NOTE 15.12


3. Étape 3 : Créer une fonction générale qui prend en paramètres un nom, un
dataframe, et un algorithme de recherche. Cette fonction doit retourner la note
correspondante au nom recherché ainsi que le temps d&#39;exécution de l&#39;algorithme.

In [52]:
import time

def main(name, df, search_algorithm):

    start_time = time.time()
    
    result = search_algorithm(name, L)
    
    execution_time = time.time() - start_time

    return result, execution_time


In [53]:
resultat_lineaire=main("Juliette",L,lineaire)

In [54]:
print(resultat_lineaire)

("Élément 'Juliette' TROUVÉ À LA POSITION 54 AVEC LA NOTE 7.59", 1.8835067749023438e-05)


In [55]:
resultat_bineaire=main("Juliette",L,bineaire)

In [56]:
print(resultat_bineaire)

("Élément 'Juliette' TROUVÉ À LA POSITION 54 AVEC LA NOTE 7.59", 3.600120544433594e-05)


4. Étape 4 : Mesure des performances
○ Mesurer les performances en simulant les deux algorithmes sur des données
de taille variable, allant de 10 à 100.

In [66]:
import pandas as pd
import random
import time
import matplotlib.pyplot as plt

def data(n):
    names = [f"Person_{i}" for i in range(n)]
    grades = [random.randint(50, 100) for _ in range(n)]
    return pd.DataFrame({'Name': names, 'Grade': grades})


def measure_performance():
    sizes = range(10, 101, 10) 
    linear_times = []
    binary_times = []
    
    for size in sizes:

        df = data(size)
        
        target_name = random.choice(df['Name'])
        

        linear_time = main(target_name, df, lineaire)
        linear_times.append(linear_time)
        

        df_sorted = df.sort_values(by='Name')
        

        binary_time = main(target_name, df_sorted, bineaire)
        binary_times.append(binary_time)
    
    return sizes, linear_times, binary_times




5. Étape 5 : Résultats
○ Présentez vos résultats sous forme de tableau comparatif des temps pour
chaque algorithme et chaque taille de liste.

In [67]:
import pandas as pd

def create_comparison_table(sizes, linear_times, binary_times):
    df_comparison = pd.DataFrame({
        'Taille des données': sizes,
        'Temps recherche linéaire (s)': linear_times,
        'Temps recherche binaire (s)': binary_times
    })
    

    return df_comparison

df_comparison = create_comparison_table(sizes, linear_times, binary_times)
print(df_comparison)


   Taille des données  Temps recherche linéaire (s)  \
0                  10                      0.000833   
1                  20                      0.000005   
2                  30                      0.000006   
3                  40                      0.000005   
4                  50                      0.000004   
5                  60                      0.000005   
6                  70                      0.000005   
7                  80                      0.000005   
8                  90                      0.000004   
9                 100                      0.000005   

   Temps recherche binaire (s)  
0                     0.000016  
1                     0.000009  
2                     0.000006  
3                     0.000005  
4                     0.000005  
5                     0.000005  
6                     0.000006  
7                     0.000005  
8                     0.000004  
9                     0.000004  


Le tableau montre clairement que le temps de la recherche linéaire augmente presque linéairement avec la taille des données.
Le temps de la recherche binaire augmente beaucoup plus lentement, montrant que cet algorithme est plus efficace, surtout pour de grandes quantités de données.