# TP 3 — Mutabilité, fonctions anonymes, application aux listes

## 1. Mutabilité

Le type *fonction* en Python est un type mutable. Selon la définition du cours "Un objet Python est dit mutable **si l'on peut changer sa valeur après sa création**. Autrement, le type est non-mutable".

In [2]:
def foo():
    print("bar")
foo.attr = 1
print(id(foo))
foo.attr = 0
print(id(foo))

1684388898400
1684388898400


Dans cet exemple, on peut voir que l'id (l'adresse de la fonction dans la mémoire) de la fonction *foo* ne change pas, malgré le fait que son attribut `attr` ait été changé. Ce qui fait de la fonction un type **non mutable**

## 2. Application aux listes

### Exercice 1 : Trier une liste de mots par taille

In [4]:
def trier_par_longueur(l:list) -> list:
    return sorted(l, key= lambda w: (len(w), w))


words = ["La", "fourmi", "n'est", "pas", "prêteuse."]
print(trier_par_longueur(words))

['La', 'pas', "n'est", 'fourmi', 'prêteuse.']


### Exercice 2 : Quelles villes sont les plus peuplées ?

#### 1

In [9]:
import csv 

data = []
with open("ensemble/donnees_communes.csv", encoding='utf-8', mode='r') as csv_file:
    csv_reader = csv.DictReader(csv_file, delimiter=";")
    for i in csv_reader:
        data.append(i)

sorted_data = sorted(data, key= lambda x : int(x["PTOT"])) # Liste des communes classées par population croissante.

max_bas_rhin = [c for c in sorted_data if c["DEP"] == "67"][-1]
print(f"La ville la plus peuplée du Bas-Rhin est {max_bas_rhin['Commune']} avec {max_bas_rhin['PTOT']} habitants")

max_calvados = [c for c in sorted_data if c["DEP"] == "14"][-1]
print(f"La ville la plus peuplée du Calvados est {max_calvados['Commune']} avec {max_calvados['PTOT']} habitants")

max_isere = [c for c in sorted_data if c["DEP"] == "38"][-1]
print(f"La ville la plus peuplée de l'Isère est {max_isere['Commune']} avec {max_isere['PTOT']} habitants")

La ville la plus peuplée du Bas-Rhin est Strasbourg avec 294564 habitants
La ville la plus peuplée du Calvados est Caen avec 110520 habitants
La ville la plus peuplée de l'Isère est Grenoble avec 158601 habitants


#### 2

In [7]:
import csv 

data = []
with open("ensemble/donnees_communes.csv", encoding='utf-8', mode='r') as csv_file:
    csv_reader = csv.DictReader(csv_file, delimiter=";")
    for i in csv_reader:
        data.append(i)

sorted_data = sorted(data, key= lambda x : int(x["PTOT"])) # Liste des communes classées par population croissante.

min_sarthe = [c for c in sorted_data if c["DEP"] == "72"][0:3]
print(f"Les trois communes les moins peuplées de la Sarthe sont {', '.join([c['Commune'] for c in min_sarthe])}")

min_vaucluse = [c for c in sorted_data if c["DEP"] == "84"][0:3]
print(f"Les trois communes les moins peuplées du Vaucluse sont {', '.join([c['Commune'] for c in min_vaucluse])}")

min_gironde = [c for c in sorted_data if c["DEP"] == "33"][0:3]
print(f"Les trois communes les moins peuplées de la Gironde sont {', '.join([c['Commune'] for c in min_gironde])}")

Les trois communes les moins peuplées de la Sarthe sont Nauvay, Panon, Dureil
Les trois communes les moins peuplées du Vaucluse sont Saint-Léger-du-Ventoux, Lagarde-d'Apt, Sivergues
Les trois communes les moins peuplées de la Gironde sont Lartigue, Bossugan, Castelmoron-d'Albret


#### 3

In [None]:
import csv 

def extract_communes() -> list:
    data = []
    with open("ensemble/donnees_communes.csv", encoding='utf-8', mode='r') as csv_file:
        csv_reader = csv.DictReader(csv_file, delimiter=";")
        for i in csv_reader:
            data.append(i)
    return data

def min_communes(sorted_data:list) -> dict:
    min_communes = {}
    for c in sorted_data:
        if c["DEP"] in min_communes.keys():
            if int(c["PTOT"]) < int(min_communes[c["DEP"]][0]):
                min_communes[c["DEP"]] = (c["PTOT"], c["Commune"])
            else:
                pass
        else:
            min_communes[c["DEP"]] = (c["PTOT"], c["Commune"])
    return min_communes

def max_communes(sorted_data:list) -> dict:
    max_communes = {}
    for c in sorted_data:
        if c["DEP"] in max_communes.keys():
            if int(c["PTOT"]) > int(max_communes[c["DEP"]][0]):
                max_communes[c["DEP"]] = (c["PTOT"], c["Commune"])
            else:
                pass
        else:
            max_communes[c["DEP"]] = (c["PTOT"], c["Commune"])
    return max_communes

def extract_departements() -> list:
    departements = []
    with open("ensemble/donnees_departements.csv", encoding='utf-8', mode='r') as csv_file:
        csv_reader = csv.DictReader(csv_file, delimiter=";")
        for i in csv_reader:
            departements.append(i)
    return departements

def final_dict(departements:list, max_communes:list, min_communes:list) -> list:
    final = []
    for i in departements:
        new_dico = {}
        new_dico["Num_departement"] = i["DEP"]
        new_dico["Nom_departement"] = i["Département"]
        new_dico["Ville_plus_habitants"] = max_communes[i["DEP"]][1]
        new_dico["Ville_moins_habitants"] = min_communes[i["DEP"]][1]
        new_dico["Total_habitants"] = i["PTOT"]
        final.append(new_dico)
    return final

def write_final(final:list) -> None:
    with open("final.csv", encoding='utf-8', mode="w", newline='') as csv_file:
        fieldnames = [x for x in final[0].keys()]
        csv_writer = csv.DictWriter(csv_file, fieldnames, delimiter=",")
        csv_writer.writeheader()
        for i in final:
            csv_writer.writerow(i)

if __name__ == "__main__":
    data = extract_communes()
    sorted_data = sorted(data, key= lambda x : int(x["PTOT"])) # Liste des communes classées par population croissante.
    communes_moins = min_communes(sorted_data)
    communes_plus = max_communes(sorted_data)
    departements = extract_departements()
    dico = final_dict(departements, communes_plus, communes_moins)
    write_final(dico)

### Exercice 3 : Trier des phrases par complexité linguistique

#### 1,2,3

In [13]:
import re
import string

LETTERS_FR = string.ascii_letters + "àâçéèêëîïôùûÿœæÀÂÇÉÈÊËÎÏÔÙÛŸŒÆ"

def complexite_phrase(phrase:str) -> tuple:
    exp_punct = r"[^'\w\sàâçéèêëîïôùûÿœæÀÂÇÉÈÊËÎÏÔÙÛŸŒÆ]"
    phrase = re.sub(exp_punct, '', phrase)
    exp_split = r"'| "
    split_phrase = re.split(exp_split, phrase)
    total_words = len(split_phrase)
    
    total_letters = 0
    for i in phrase:
        if i in LETTERS_FR:
            total_letters+=1
    avg_letters = total_letters/total_words
    return (avg_letters, total_words)

def trier_phrases(phrases:list) -> list:
    sorted_phrases = sorted(phrases, key=lambda x : complexite_phrase(x))
    return sorted_phrases

def extract_txt(path:str) -> string:
    text = []
    with open(path, encoding='utf-8', mode="r") as file:
        for i in file:
            text.append(i.strip())
    text = [x for x in text if x != '']
    return text

if __name__ == "__main__":
    phrases = [
    "Les modèles de langue traitent le texte.", 
    "L'intelligence artificielle transforme notre manière de communiquer.",
    "GPT est un réseau neuronal puissant.",
    "L'apprentissage automatique est fascinant."]
    for i in phrases:
        print(complexite_phrase(i))
    print(trier_phrases(phrases))

    phrases = extract_txt("corpus_wiki_kino.txt")
    print(trier_phrases(phrases))

(4.714285714285714, 7)
(7.5, 8)
(5.0, 6)
(7.4, 5)
['Les modèles de langue traitent le texte.', 'GPT est un réseau neuronal puissant.', "L'apprentissage automatique est fascinant.", "L'intelligence artificielle transforme notre manière de communiquer."]
['Kino et Viktor Tsoï', "Le groupe s'est séparé après la mort de Viktor Tsoï le 15 août 1990 dans un accident de voiture (il se serait endormi au volant), marquant l'un des derniers destins tragiques de la musique russe du XXe siècle. Sa popularité est encore très grande dans les pays de langue russe et sa personne fait même l'objet d'une sorte d'idolâtrie1 avec notamment la création du mur de Tsoï2 dans le vieil Arbat au cœur historique de Moscou où se recueillent encore aujourd'hui ses fans venus de toutes les anciennes Républiques Soviétiques 3.", 'Kino est un groupe de rock soviétique des années 1980 formé autour du chanteur et auteur Viktor Tsoï.', "Formé en 1981 à Léningrad (aujourd'hui Saint-Pétersbourg), Kino est devenu, grâce au