<h1 style="font-size: 30px; text-align: center;">TP - Algorithme des k plus proches voisins</h1>

> Abr√©g√© *kppv* en fran√ßais. En anglais, on dit *k nearest neighbors* souvent abr√©g√© *knn*.

L‚Äô**algorithme des k plus proches voisins** appartient √† la famille des algorithmes d‚Äô*apprentissage automatique* (machine learning) qui constituent le poumon de l'intelligence artificielle actuellement.

Pour simplifier, l'apprentissage automatique part souvent de donn√©es (data) et essaye de dire quelque chose des donn√©es qui n'ont pas encore √©t√© vues : il s'agit de *g√©n√©raliser*, de *pr√©dire*.

On va utiliser l'algorithme des k plus proches voisins pour r√©soudre un *probl√®me de classification* : pr√©dire la classe d'une donn√©e *inconnue* √† partir de la classe des donn√©es connues.

Avant de d√©crire cet algorithme, introduisons la situation et le probl√®me.

# Pr√©sentation d'un probl√®me de classification

## Le jeu de donn√©es sur les Pok√©mons

<img src="https://cdn.pixabay.com/photo/2020/07/21/16/10/pokemon-5426712_960_720.png" alt="pokeball" width="200">

On dispose de donn√©es sur 34 Pok√©mons : leur type (Psy ou Eau), leur points de vie et la valeur de leurs attaques.

Ces donn√©es sont stock√©es dans le fichier CSV `pokemons.csv` que l'on s'empresse d'importer dans un tableau de dictionnaires appel√© `pokemons`:

In [None]:
import csv
fichier = open('pokemons.csv', 'r', encoding = 'UTF-8')
t = csv.DictReader(fichier, delimiter=';')
pokemons = [dict(ligne) for ligne in t]  # cr√©ation et construction du tableau par compr√©hension
fichier.close()

pokemons  # pour voir les donn√©es import√©es

On peut repr√©senter ces donn√©es graphiquement dans un rep√®re orthonorm√©, avec les valeurs d'attaque en abscisses et les points de vie en ordonn√©es. Les Pok√©mons de type "Eau" sont repr√©sent√©s pas les triangles bleus, et ceux de type "Psy" par les points rouges.

![graphique](data/pokemons.png)

>C'est ce que vous allez faire par la suite !

## Probl√®me : peut-on pr√©dire le type d'un nouveau Pok√©mon inconnu ?

On consid√®re maintenant que l'on poss√®de des donn√©es sur un nouveau Pok√©mon inconnu et on aimerait pr√©dire s'il s'agit d'un Pok√©mon de type "Eau" ou de type "Psy".

![graphique](data/methodeKPPV.png)

Ce probl√®me, qui demande √† pr√©dire √† quelle cat√©gorie, ou *classe*, appartient ce nouvel √©l√©ment donn√©, est appel√© *probl√®me de classification*. L'algorithme des k plus proches voisins permet de trouver les k voisins les plus proches de ce nouvel √©l√©ment dans le but de lui associer une *classe* plausible (Psy ou Eau, dans cet exemple). Par exemple, si k = 5 va chercher les 5 voisins les plus proches.

# Algorithme des kppv

## √ânonc√© et sp√©cification

√Ä partir d'un jeu de donn√©es `donnees` (par exemple, les donn√©es sur nos 34 Pok√©mons) et d'une donn√©e cible `cible` (le nouveau Pokemon √† classifier), l'algorithme de $k$ plus proches voisins doit d√©terminer les $k$ donn√©es les plus proches de la cible.

Plus pr√©cis√©ment, la sp√©cification de l'algorithme des kppv est la suivante :

- **Entr√©es** : 
    - une table `donnees` de taille n contenant les donn√©es et leurs classes
    - une donn√©e cible : `cible`
    - un nombre `k`
    - une r√®gle permettant de calculer la *distance* entre deux donn√©es
- **Sortie** : une table `k_plus_proches_voisins`
- **R√¥le** : trouver les `k` donn√©es les plus proches de `cible` parmi celles de la table `donnees` ("plus proches" au sens de la distance d√©finie au d√©part) 
- **Pr√©condition** : $n \geq 1$ et $k <= n$.
- **Postcondition** : `k_plus_proches_voisins` contient les k plus proches voisins de `cible` parmi les donn√©es de la table `donnees`

## Algorithme

L'algorithme *naif* des kppv s'exprime de mani√®re simple :

1. Cr√©er une table `distances_voisins` contenant les √©l√©ments de la table `donnees` et leurs distances avec la donn√©e `cible`.  
2. Trier les donn√©es de la table `distances_voisins` selon la distance croissante avec la donn√©e `cible`
3. Renvoyer les `k` premiers √©l√©ments de cette table tri√©e (`k_plus_proches_voisins`)

# Impl√©mentation de l'algorithme

L'algorithme des plus proches voisins repose presque enti√®rement sur la *distance* entre deux donn√©es. Il faut donc commencer par d√©finir une distance entre deux donn√©es.

## √âtape 0 : Choix et impl√©mentation de la distance

Dans la suite, on va choisir la distance "naturelle", c'est-√†-dire celle "√† vol d'oiseau". On parle de *distance euclidienne*.

Dans un rep√®re orthonorm√©, si $A$ et $B$ ont pour coordonn√©es respectives $(x_A, y_A)$ et $(x_B, y_B)$ alors la distance (euclidienne) entre ces deux points est donn√©e par la formule :

$$\text{distance}(A, B) = \sqrt{(x_B-x_A)^2 + (y_B-y_A)^2}.$$ 

>**Important**: Sachez cependant qu'il existe d'autres distances possibles et que le choix de la distance n'est pas anodin car ce choix peut aboutir √† trouver des voisins les plus proches diff√©rents et donc conduire √† des pr√©dictions diff√©rentes (voir le r√©sum√© de cours !).

Dans notre cas, chaque Pok√©mon poss√®de une abscisse √©gale √† sa valeur d'attaque et une ordonn√©e √©gale √† ses points de vie. Ainsi, la formule de la distance entre deux pok√©mons `d1` et `d2` se traduit ainsi :

$$\text{distance}(\text{d1}, \text{d2}) = \sqrt{(\text{valeur d'attaque de d2}-\text{valeur d'attaque de d1})^2 + (\text{points de vie de d2}-\text{points de vie de d1})^2}.$$ 

‚úçÔ∏è **Question 1** : Calculez √† la main la distance entre les deux Pok√©mons suivants.

```python
p1 = {'Nom': 'Aligatueur', 'Type': 'Eau', 'Points de vie': '85', 'Attaque': '105'}
p2 = {'Nom': 'Bargantua', 'Type': 'Eau', 'Points de vie': '70', 'Attaque': '92'}
```

üíª **Question 2** : √âcrivez les instructions permettant d'acc√©der :
- √† la valeur d'attaque de `p1`
- au points de vie de `p2`

In [None]:
p1 = {'Nom': 'Aligatueur', 'Type': 'Eau', 'Points de vie': '85', 'Attaque': '105'}
p2 = {'Nom': 'inconnu', 'Type': 'inconnu', 'Points de vie': '92', 'Attaque': '127'}

In [None]:
# √† vous de jouer !


In [None]:
# √† vous de jouer !


üíª **Question 3** : Compl√©tez la fonction `distance_euclidienne(d1, d2)` suivante qui renvoie la distance euclidienne entre deux Pok√©mons `d1` et `d2`. 

>‚ö†Ô∏è Il faut bien veiller √† convertir les valeurs d'attaque et les points de vie en des nombres pour faire les calculs !*

In [None]:
# √† vous de jouer !
from math import sqrt  # pour utiliser la racine carr√©e

def distance_euclidienne(d1, d2):
    x1 = ...  # abscisse de la donn√©e 1
    y1 = ...  # ordonn√©e de la donn√©e 1
    x2 = ...  # abscisse de la donn√©e 2
    y2 = ...  # ordonn√©e de la donn√©e 2
    return sqrt(...)  # formule donnant la distance euclidienne

üíª **Question 4** : Appelez cette fonction pour v√©rifier votre r√©ponse √† la question 1.

In [None]:
# √† vous de jouer !


## √âtape 1 : Cr√©ation de la table avec les distances

Maintenant que notre distance est d√©finie, on peut passer √† l'impl√©mentation de l'algorithme. On va donc commencer par cr√©er la table `distances_voisins` contenant les distances entre toutes nos donn√©es et la donn√©e `cible`.

On choisit de reprendre les dictionnaires de la table `pokemons` en leur ajoutant une cl√© correspondant √† la distance avec la cible. Par exemple, le premier √©l√©ment de `distances_voisins` sera un dictionnaire de la forme

```python
{'Nom': 'Aligatueur', 'Type': 'Eau', 'Points de vie': '85', 'Attaque': '105', 'distance': dist}
```

dans lequel `dist` est la distance √† calculer entre le Pok√©mon  `'Aligatueur'` et la cible.

üíª **Question 5** : √âcrivez une fonction `table_avec_distances(donnees, cible)` qui renvoie la table `distances_voisins` contenant les √©l√©ments de la table `donnees` auxquels on a ajout√© la cl√© `distance` dont la valeur est leur distance avec la donn√©e `cible`.

*Exemple*: Si `cible = {'Nom': 'inconnu', 'Type': 'inconnu', 'Points de vie': '92', 'Attaque': '127'}` alors l'appel `table_avec_distances(pokemons, cible)` renvoie le tableau dont le d√©but est le suivant :

```python
[{'Nom': 'Aligatueur',
  'Type': 'Eau',
  'Points de vie': '85',
  'Attaque': '105',
  'distance': 23.08679276123039},
 {'Nom': 'Bargantua',
  'Type': 'Eau',
  'Points de vie': '70',
  'Attaque': '92',
  'distance': 41.340053217188775},
 ...
]
```


In [None]:
def table_avec_distances(donnees, cible):
    # √† vous de jouer !
    



# ESSAI
cible = {'Nom': 'inconnu', 'Type': 'inconnu', 'Points de vie': '92', 'Attaque': '127'}
distances_voisins = table_avec_distances(pokemons, cible)
distances_voisins

## √âtape 2 : Tri de la table selon la distance croissante

On va maintenant trier notre table de la plus petite √† la plus grande distance avec notre cible, soit du plus proche au plus √©loign√© des voisins. Pour cela, on va utiliser la fonction `sorted` dont on peut afficher l'aide pour rappel :

In [None]:
help(sorted)

> Vous pouvez aussi revoir le TP sur les tris de table si n√©cessaire : [TP - Trier une table de donn√©es](https://notebook.basthon.fr/?from=https://raw.githubusercontent.com/germainbecker/NSI/master/Premiere/Theme3_traitement_donnees_tables/TriTable.ipynb&aux=https://raw.githubusercontent.com/germainbecker/NSI/master/Premiere/Theme3_traitement_donnees_tables/eleves.csv&aux=https://raw.githubusercontent.com/germainbecker/NSI/master/Premiere/Theme3_traitement_donnees_tables/prenoms2021.csv#Trier-des-donn%C3%A9es-en-fonction-d'une-cl%C3%A9).

üíª **Question 6** : Cr√©er une fonction `tri_distance(d)` qui servira de cl√© √† notre tri.

In [None]:
# √† vous de jouer !


üíª **Question 7** : Utilisez maintenant la fonction `sorted` pour cr√©er une *nouvelle table* `distances_voisins_triee` contenant les donn√©es de `distances_voisins` tri√©s par ordre croissant de distance.

In [None]:
cible = {'Nom': 'inconnu', 'Type': 'inconnu', 'Points de vie': '92', 'Attaque': '127'}
distances_voisins = table_avec_distances(pokemons, cible)

# √† vous de jouer !





## √âtape 3 : D√©termination des k plus proches voisins

Le plus dur est fait, il ne reste plus qu'√† construire la table `k_plus_proches_voisins` contenant les k plus proches voisins. Comme la table `distances_voisins_triee` contient les voisins du plus proches au plus √©loign√©, il suffit de conserver les k premiers √©l√©ments de cette table !

üíª **Question 8** : √âcrivez une fonction `conserve_k_premiers(k, table)` qui renvoie une nouvelle table contenant les `k` premiers √©l√©ments de la table `table` (o√π `k` est un entier positif inf√©rieur ou √©gale √† `len(table)`).

In [None]:
# √† vous de jouer !


üíª **Question 9** : V√©rifiez qu'en appelant cette fonction avec k = 3 et `table` = `distances_voisins_triee` vous obtenez bien les 3 premiers √©l√©ments de `distances_voisins_triee`.

In [None]:
# √† vous de jouer !


## Bilan

On peut maintenant regrouper tout ce qui vient d'√™tre fait pour chaque √©tape pour √©crire une fonction `kppv(donnees, cible, k)` qui renvoie les `k` plus proches voisins de `cible` dans `donnees`.

üíª **Question 10** : Compl√©tez la fonction `kppv(donnees, cible, k)` suivante qui renvoie les `k` plus proches voisins de `cible` dans `donnees`.

In [None]:
# RECOPIE DES FONCTIONS UTILES :

from math import sqrt
# Calcul de la distance
def distance_euclidienne(d1, d2):
    # recopiez le code √©crit √† la question 3
    pass

# Fonction qui calcule et ajoute la distance entre la cible et chacune des donn√©es
def table_avec_distances(donnees, cible):
    # recopiez le code √©crit √† la question 5
    pass

# Cl√© du tri
def tri_distance(d):
    # recopiez le code √©crit √† la question 6
    pass
    

    
# √Ä COMPL√âTER :

def kppv(donnees, cible, k):    
    # √©tape 1 : cr√©ation de la table avec les distances
    distances_voisins = ...
    
    # √©tape 2 : tri par distance croissante
    distances_voisins_triee = ...
    
    # √©tape 3 : r√©cup√©ration de k plus proches voisins
    k_plus_proches_voisins = ...
    
    return ...


üíª **Question 11** : Appelez la fonction la fonction `kppv` pour conna√Ætre les 3 plus proches voisins de notre cible `{'Nom': 'inconnu', 'Type': 'inconnu', 'Points de vie': '92', 'Attaque': '127'}`. 

In [None]:
cible = {'Nom': 'inconnu', 'Type': 'inconnu', 'Points de vie': '92', 'Attaque': '127'}
# √† vous de jouer !


üíª **Question 12** : M√™me question pour les 5 plus proches voisins puis pour les 9 plus proches voisins.

In [None]:
# √† vous de jouer !


# Et notre pr√©diction alors ?

![image sorci√®re](data/witch.png)

L'algorithmes des kppv en lui-m√™me n'apporte pas la r√©ponse √† notre probl√®me de classification puisqu'il ne fournit que les k plus proches voisins (et leurs classes) de notre donn√©e cible. Il reste donc une derni√®re √©tape pour pr√©dire la classe de notre nouvel √©l√©ment : pour cela, on choisit la *classe majoritaire* (la plus pr√©sente) dans les k plus proches voisins.

> On est contents si k est impair car il ne peut pas y avoir d'ex-aequo !

‚úçÔ∏è **Question 13** : Donnez la classe majoritaire parmi les plus proches voisins lorsque k = 3, 5 puis 9. Pour chaque valeur de k, quelle serait la pr√©diction pour notre Pok√©mon cible inconnu ?

>**Moralit√©** : La valeur du param√®tre `k` est importante car elle a une influence forte sur la pr√©diction. En pratique, elle doit √™tre judicieusement choisie : üëâ voir dans le cours comment trouver exp√©rimentalement une bonne valeur de k.

# Visualisation graphique

On peut utiliser le module `matplotlib` pour repr√©senter graphiquement nos Pok√©mons, et observer graphiquement les plus proches voisins selon la valeur de `k` choisies.

Pour cr√©er une nuage de points, il suffit d'utiliser la fonction `plot` qui prend en param√®tres deux tableaux contenant respectivement la liste des abscisses et la liste des ordonn√©es des points √† construire, ainsi qu'un param√®tre permettant de d√©finir le type de points et leur couleur :

In [None]:
import matplotlib.pyplot as plt

liste_abscisses = [0, 2, 5, 9, 7]  # tableau avec les abscisses
liste_ordonnees = [5, 7, 12, 3, 8]  # tableau avec les ordonn√©es

plt.plot(liste_abscisses, liste_ordonnees,'ro')  # r pour red, o pour un cercle

plt.xlim(-2, 12)  # pour d√©finir la fen√™tre en abscisse
plt.ylim(0, 14)  # pour d√©finir la fen√™tre en ordonn√©e
plt.gca().set_aspect('equal', adjustable='box')  # pour que le rep√®re soit orthonorm√© (m√™me unit√© sur chaque axe)

plt.show()  # affichage du graphique

Pour repr√©senter nos Pok√©mons sous forme de nuages de points (valeur d'attaque en abscisse et points de vie en ordonn√©e), il suffit alors de cr√©er un tableau contenant les abscisses (valeur d'attaque) et un tableau contenant les ordonn√©es (points de vie) puis d'utiliser la fonction `plot` pour construire les points.

Pour bien visualiser les deux classes, on va cr√©er un nuage de points pour chaque classe : les Pok√©mons de type "Eau" seront repr√©sent√©s par des points bleus et les Pok√©mons "Psy" par des points rouges. On cr√©e aussi le point correspondant √† notre Pok√©mon cible en cyan :

In [None]:
import matplotlib.pyplot as plt

# construction des Pok√©mons de type 'Eau'
valeur_attaque_eau = [int(p['Attaque']) for p in pokemons if p['Type'] == 'Eau']  # tableau des abscisses
points_de_vie_eau = [int(p['Points de vie']) for p in pokemons if p['Type'] == 'Eau']  # tableau des orodonn√©es
plt.plot(valeur_attaque_eau, points_de_vie_eau, 'bv')  # construction du graphique avec des triangles bleus

# construction des Pok√©mons de type 'Psy'
valeur_attaque_psy = [int(p['Attaque']) for p in pokemons if p['Type'] == 'Psy']
points_de_vie_psy = [int(p['Points de vie']) for p in pokemons if p['Type'] == 'Psy']
plt.plot(valeur_attaque_psy, points_de_vie_psy, 'ro')  # construction du graphique avec des cercles rouges

# construction du Pok√©mon cible
cible = {'Nom': 'inconnu', 'Type': 'inconnu', 'Points de vie': '92', 'Attaque': '127'}
valeur_attaque_cible = int(cible['Attaque'])
points_de_vie_cible = int(cible['Points de vie'])
plt.plot(valeur_attaque_cible, points_de_vie_cible, 'cD')


# Pour d√©finir le titre, noms de axes et la l√©gende
plt.title("Pok√©mons")
plt.xlabel("Valeur d'attaque")
plt.ylabel("Points de vie")
plt.legend(["Type Eau", "Type Psy"], loc='upper center', bbox_to_anchor=(1.2, 0.8))

plt.xlim(0, 200)
plt.ylim(40, 120)
plt.gca().set_aspect('equal', adjustable='box')

plt.show()

üíª **Question 14** : Compl√©tez ci-dessous le programme pr√©c√©dent pour construire √©galement le nuage de points correspondant aux k plus plus proches voisins d√©termin√©s par notre algorithme. V√©rifiez ensuite graphiquement pour diff√©rentes valeurs de k que les plus proches voisins sont les bons.

In [None]:
import matplotlib.pyplot as plt

# construction des Pok√©mons de type 'Eau'
valeur_attaque_eau = [int(p['Attaque']) for p in pokemons if p['Type'] == 'Eau']  # tableau des abscisses
points_de_vie_eau = [int(p['Points de vie']) for p in pokemons if p['Type'] == 'Eau']  # tableau des orodonn√©es
plt.plot(valeur_attaque_eau, points_de_vie_eau, 'bv')  # construction du graphique avec des triangles bleus

# construction des Pok√©mons de type 'Psy'
valeur_attaque_psy = [int(p['Attaque']) for p in pokemons if p['Type'] == 'Psy']
points_de_vie_psy = [int(p['Points de vie']) for p in pokemons if p['Type'] == 'Psy']
plt.plot(valeur_attaque_psy, points_de_vie_psy, 'ro')  # construction du graphique avec des cercles rouges

# construction du Pok√©mon cible
cible = {'Nom': 'inconnu', 'Type': 'inconnu', 'Points de vie': '92', 'Attaque': '127'}
valeur_attaque_cible = int(cible['Attaque'])
points_de_vie_cible = int(cible['Points de vie'])
plt.plot(valeur_attaque_cible, points_de_vie_cible, 'cD')


# construction des KPPV
# √Ä COMPL√âTER :





# Pour d√©finir le titre, noms de axes et la l√©gende
plt.title("Pok√©mons")
plt.xlabel("Valeur d'attaque")
plt.ylabel("Points de vie")
plt.legend(["Type Eau", "Type Psy"], loc='upper center', bbox_to_anchor=(1.2, 0.8))

plt.xlim(0, 200)
plt.ylim(40, 120)
plt.gca().set_aspect('equal', adjustable='box')

plt.show()

# Et si on change de distance ?

On a utilis√© la distance euclidienne pour mesurer la distance entre nos donn√©es et la cible. C'est la distance "naturelle" mais il existe d'autres distances. Par exemple, la **distance de Manhattan** entre deux donn√©es $d_1(x_1, y_1)$ et $d_2(x_2, y_2)$ est d√©finie ainsi $\text{distance_manhattan}(d_1, d_2) = |x_2-x_1| + |y_2-y_1|$.

>Article Wikip√©dia : [Distance de Manhattan](https://fr.wikipedia.org/wiki/Distance_de_Manhattan)

On peut modifier notre programme simplement en d√©finissant et en utilisant cette nouvelle distance :

In [None]:
# d√©finition de la distance utilis√©e
def distance_manhattan(d1, d2):
    x1 = float(d1['Attaque'])
    y1 = float(d1['Points de vie'])
    x2 = float(d2['Attaque'])
    y2 = float(d2['Points de vie'])
    return abs(x2-x1) + abs(y2-y1)  # abs est la fonction valeur absolue

def table_avec_distances(donnees, cible):
    distances_voisins = [d for d in donnees]
    for d in distances_voisins:
        distance = distance_manhattan(d, cible)  # CHANGEMENT DE DISTANCE
        d['distance'] = distance
    return distances_voisins

def tri_distance(d):
    return d['distance']

def kppv(donnees, cible, k):    
    # √©tape 1 : cr√©ation de la table avec les distances
    distances_voisins = table_avec_distances(donnees, cible)    
    # √©tape 2 : tri par distance croissante
    distances_voisins_triee = sorted(distances_voisins, key=tri_distance)    
    # √©tape 3 : r√©cup√©ration de k plus proches voisins
    k_plus_proches_voisins = conserve_k_premiers(k, distances_voisins_triee)
    
    return k_plus_proches_voisins


En d√©terminant les 3 plus proches voisins on obtient :

In [None]:
cible = {'Nom': 'inconnu', 'Type': 'inconnu', 'Points de vie': '92', 'Attaque': '127'}
kppv(pokemons, cible, 3)

Dans ce cas, pour k = 3, on pr√©dirait que notre Pok√©mon inconnu est de type "Eau" (2 "Eau" contre 1 "Psy") et la pr√©diction serait l'inverse de celle utilisant la distance euclidienne !

>**Moralit√©** : La distance utilis√©e a √©galement toute son importance puisque son choix peut aboutir √† des pr√©dictions diff√©rentes. De plus, nous n'avons parl√© ici que de distances *g√©om√©triques* s'appliquant √† des donn√©es chiffr√©es. Toutes les donn√©es ne sont pas adapt√©es √† ce type de distance : si on veut comparer la distance entre deux cha√Ænes de caract√®res (dans le but de pr√©dire la langue d'origine de certains mots par exemple) d'autres types de distances sont √† consid√©rer : *la distance de Hamming* ou la *distance d'√©dition* qui seront abord√©es en Terminale.

# EXERCICES 

## Exercice 1

On donne des points dans un rep√®re orthonorm√©. Chaque point poss√®de une classe : Rouge ou Bleue. Dans cette exercice, on utilise la **distance euclidienne** (naturelle) pour l'algorithme des $k$ plus proches voisins.

![figure](data/ex1.png)

‚úçÔ∏è **Question 1** : On consid√®re le point $M(1, 3)$. Appliquez l'algorithme des 3 plus proches voisins √† ce point puis donnez une pr√©diction quant √† sa classe.

‚úçÔ∏è **Question 2** : M√™me question avec le point $N(4, 4)$.

‚úçÔ∏è **Question 3** : Donnez une valeur de $k$ qui donnerait la pr√©diction "Bleue" pour le point $N$ apr√®s avoir appliqu√© l'algorithme des $k$ plus proches voisins.


## Exercice 2

On peut ainsi repr√©senter l'ensemble des points de l'exercice 1 dans un tableau `donnees` comme ci-dessous :

In [None]:
A = {'nom': 'A', 'abs': 1, 'ord': 1, 'classe': 'Bleu'}
B = {'nom': 'B', 'abs': 2, 'ord': 2, 'classe': 'Bleu'}
C = {'nom': 'C', 'abs': 4, 'ord': 2, 'classe': 'Bleu'}
D = {'nom': 'D', 'abs': 2, 'ord': 3, 'classe': 'Rouge'}
E = {'nom': 'E', 'abs': 4, 'ord': 3, 'classe': 'Bleu'}
F = {'nom': 'F', 'abs': 3, 'ord': 5, 'classe': 'Rouge'}
G = {'nom': 'G', 'abs': 2, 'ord': 5, 'classe': 'Rouge'}
H = {'nom': 'H', 'abs': 6, 'ord': 4, 'classe': 'Bleu'}
I = {'nom': 'I', 'abs': 5, 'ord': 5, 'classe': 'Rouge'}

donnees = [A, B, C, D, E, F, G, H, I]
donnees

üíª **Question** : Utilisez la fonction `kppv` d√©finie dans le TP sur l'algorithme des k plus proches voisins (question 10) pour v√©rifier vos r√©ponses aux questions de la partie A. *Vous utiliserez la distance euclidienne qu'il faudra bien s√ªr l√©g√®rement adapter au format de nos donn√©es*.

In [None]:
# √† vous de jouer !


## Exercice 3 : Top 14

Le fichier `top14.csv` contient des donn√©es sur tous les joueurs du top 14 de rugby. On peut repr√©senter ces donn√©es de la fa√ßon suivante.

![top14](data/top14_v2.png)

üíª **Question** : Vous rencontrez une personne souhaitant jouer au rugby. Elle vous donne sa taille (180 cm) et son poids (100 kg). Vous allez utiliser l'algorithme des k plus proches voisins pour lui indiquer quel poste est le plus proche de ses caract√©ristiques physiques. *Essayez plusieurs valeurs de k et n'h√©sitez pas √† repr√©senter graphiquement les donn√©es comme sur l'image au-dessus.*


In [None]:
# √† vous de jouer !


**R√©f√©rences :**
- √âquipe p√©dagogique du DIU EIL, Universit√© de Nantes (C. JERMANN).
- Prepabac, sp√©cialit√© NSI 1√®re, C. ADOBET, G. CONNAN, G. ROZSAVOLGYI, L. SIGNAC (pour l'id√©e de l'activit√©).
- Cours de G. LASSUS pour l'id√©e de l'exercice 3 sur les joueurs du Top 14 : [lien vers son Notebook sur Github](https://github.com/glassus/nsi/blob/master/Premiere/Theme05_Algorithmique/07_Algorithme_KNN.ipynb)

---
Germain BECKER & S√©bastien POINT, Lyc√©e Mounier, ANGERS ![Licence Creative Commons](https://i.creativecommons.org/l/by-nc-sa/4.0/88x31.png)