<a href="https://colab.research.google.com/github/LSMISN/NSI/blob/master/Algorithmique.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# Introduction #

**L'algorithmique** désigne l'ensemble des méthodes permettant de créer des algorithmes.

**Un algorithme** apporte une solution à un problème sous la forme d'un enchaînement d'opérations à effectuer.

### Un problème exemple

On considère le problème : obtenir la plus grande valeur d'une liste de n entiers naturels.

Pour construire un algo, on doit enchainer des opérations qui manipulent:
- des données (variables, constantes, listes, tableaux ...)
- des structures de contrôle (boucles, test conditions, ...)

Un algo n'est pas écrit spécialement dans un langage de programmation.

Tout est organisé de manière séquentielle : une suite d'instructions.

On pourra utiliser le langage naturel pour le formuler, mais on utilisera plutôt un pseudo-langage (pseudo code) qui permettra un transposition facilité vers un langage de programmation.


Sur le problème donné ici :

On dispose d'une list de n entiers : [$n_0$, $n_1$, $n_2$, ..., $n_{n-1}$]

On recherche le plus grand, et la méthode naturelle consiste à créer une variable max qui contient $n_0$,

puis on va comparer max à chacun des $n-1$ autres termes de la liste en remplaçant par le terme comparé si celui-ci est plus grand.

Si on essaie de formuler plus précisément :
```python
maListe [contient une liste de n nombre entiers naturels]

max = maListe[0] (max contient le premier élément de cette liste)

POUR i allant de 1 à n-1:

  SI max < maListe[i] 
    ALORS
      max = maListe[i]
afficher max
```
Les données utilisées sont : une liste et une variable.

Les structures de contrôle sont : une boucle POUR, et un test de condition.

Une fois l'algo écrit, il faut vérifier que :
- la terminaison : être certain que l'algo se termine,
- la correction : être sûr que le résultat est la (ou une) solution du problème.
- la complétude : être certain que l'algo reste correct si (dans notre cas) on modifie la liste d'entiers du départ.

Dans notre cas présent : 
- l'algo se termine car on a une boucle POUR (boucle finie bornée),
- il est correct puisqu'à chaque pas max contient le plus grand élément,
- complétude vérifiée dans la mesure où la liste contient des éléments comparables.


On va s'intéresser à l'efficacité en terme de nombre d'opérations élémentaires effectuées (et eventuellement la quantité de ressource mémoire utilisée).

- -1 affectation : max = maListe[0]
- (n-1) comparaisons 

Dans tous les cas, on a n opérations.

On dit que le côut est d'ordre n (ou linéaire).

Remarque : On parle de complexité asymptotique en O(n).

Debugger : http://www.pythontutor.com/visualize.html#mode=edit

In [0]:
# Exercice : implémenter l'algorithme de recherche du plus grand élément d'une liste

import random

# on crée une liste de nombres entiers
maListe = [i for i in range(1,100)]
# on melange
random.shuffle(maListe)
# on ne garde que les 20 premiers termes
maListe = maListe[:21]
print(f"maListe = {maListe}")

def trouverMax(laListe: list):
  max = laListe[0]
  for valeur in laListe:
    if valeur > max :
      max = valeur
  return max

print(f"la valeur la plus grande valeur de maListe est {trouverMax(maListe)}")

maListe = [86, 19, 67, 40, 5, 88, 4, 98, 61, 43, 21, 59, 24, 22, 14, 96, 69, 72, 18, 71, 3]
la valeur la plus grande valeur de maListe est 98


# Les algorithmes de tris #

Plusieurs algo de tri existent. Leur efficacité est variable suivant la nature des données à trier, et 
suivant comment sont positionnées les données au départ (rangement partiel, désordre total...).

Dans ce cours, on va étudier le tri par insertion, et le tri par sélection.

## Tri par insertion ##

```python
maListe = [contient n nombres entiers naturels en ordre aléatoire]

POUR k variant de 1 à n-1:
  POUR j variant de k à 1 : (on parcourt la partie triée par la fin):
    SI maListe[j-1] > maListe[j]
    ALORS on les échange

afficher maListe (triée)
```
On va vérifier la terminaison, la correction et la complétude de cet algo:
- La terminaison est assurée étant donné que on utilise des boucles bornées (POUR)

- La correction ?

Il faut trouver un invariant de boucle : c'est une propriété qui est vérifiable et valable constamment (invariance) à chaque tour de boucle

Notre invariant ici est la propriété suivante : le sous-tableau de 1 à j-1 est trié.


---


La correction d'un algorithme se fait en 3 étapes :

- initialisation : on doit montrer que l'invariant de boucle est vrai avant la première itération de boucle,
- conservation : on doit montrer que si l'invariant de boucle est vrai avant une itération de boucle, il le reste avant l'itération suivante,
- terminaison : une fois la boucle terminée, l'invariant fournit une propriété utile qui aide à montrer la correction de l'algorithme.
---

La correction est vérifiée grâce à notre invariant de boucle pour cet algo.

- La complétude est assurée dans la mesure où la liste est faite de nombres entiers naturels comparables.


#### Complexité asymptotique (coût) ####


On se place dans le pire des cas (liste triée dans l'ordre décroissant), on considère pour simplifier qu'un échange coute pour 1 seule opération.
- pour k=1, on effectue 1 échange (ou décalage)
- pour k=2, 2 échanges
- pour k=3, 3 échanges
- ...
- pour k=$n-1$, $n-1$ échanges

On fait le budget du coût en faisant l'addition des différents coûts :

coût = 1+2+3+...+($n-1$) = $\frac{n(n-1)}{2}$ = $\frac{n^2 - n}{2}$

On voit que le coût varie en $n^2$ (ou quadratique). La complexité asymptotique est en O($n^2$).

#### Exercice : écrire le code en Python implémentant l'algorithme de tri par insertion précédent.###

Debugger : http://www.pythontutor.com/visualize.html#mode=edit

In [0]:
# Codage du tri par insertion
from random import shuffle
# on commence par créer une liste constitué des entiers de 1 à 8
maListe = [i for i in range(1,9)] # comprehension list
# on les mélange
shuffle(maListe)
print(f"avant : {maListe}")

def triParInsertion(uneListe:list):
  """
    trie la liste passée en argument en appliquant l'algorithme de tri par insertion
  """
  for k in range(1,len(uneListe)):
    for j in range(k, 0, -1):
      if uneListe[j] < uneListe[j-1]:
        temp = uneListe[j-1]
        uneListe[j-1] = uneListe[j]
        uneListe[j] = temp
        
# On regarde si ça marche    
triParInsertion(maListe)
print(f"après : {maListe}")

avant : [6, 5, 4, 8, 2, 1, 7, 3]
après : [1, 2, 3, 4, 5, 6, 7, 8]


### Remarque Pythonesque

On a souvent besoin dans cette famille d'algorithme d'échanger la position des valeurs (swap en anglais), une manière très Python mais élégante de faire est d'utiliser le mecanisme d'affectation multiple.
Voici une autre version du code. 

In [0]:
# Codage du tri par insertion version Pythonesque de l'échange
from random import shuffle
# on commence par créer une liste constitué des entiers de 1 à 8
maListe = [i for i in range(1,9)]
# on les mélange
shuffle(maListe)
print(f"avant : {maListe}")

def triParInsertion(uneListe:list):
  """
    trie la liste passée en argument en appliquant l'algorithme de tri par insertion
  """
  for k in range(1,len(uneListe)):
    for j in range(k, 0, -1):
      if uneListe[j] < uneListe[j-1]:
        uneListe[j], uneListe[j-1] = uneListe[j-1], uneListe[j]  # ...et on admire la beauté du code :)

# On regarde si ça marche  
triParInsertion(maListe)
print(f"après : {maListe}")

avant : [8, 3, 1, 5, 2, 4, 7, 6]
après : [1, 2, 3, 4, 5, 6, 7, 8]


## Tri par sélection ##

On recherche l'élément le plus grand, on le place en fin de tableau,
on répète l'opération pour les n-1 éléments de la liste restant

```python
maListe = [contient n nombres entiers naturels en ordre aléatoire]

POUR i allant de 0 à n-1
  max = i

  POUR j allant de i+1 à n-1 
    SI maListe[j] > maListe[max] ALORS max = j 
  
  SI max <> i ALORS échanger maListe[max] et maListe[i]

afficher maListe (triée)
```
On a un coût asymptotique en O($n^2$).

#### Exercice : écrire le code en Python implémentant l'algorithme de tri par sélection précédent.###

Debugger : http://www.pythontutor.com/visualize.html#mode=edit

In [0]:
# Codage du tri par sélection
from random import shuffle
# on commence par créer une liste constitué des entiers de 1 à 8
maListe = [i for i in range(1,9)]
#print(maListe)
# on les mélange
shuffle(maListe)
print(f"avant : {maListe}")

def triParSelection(uneListe:list):
  """
    Tri la liste passée en argument en utilisant l'algorithme de tri par sélection
  """
  for i in range(0, len(maListe)):
    max = i
    for j in range(i+1, len(maList)):
      if maListe[j] > maListe[max]:
        max = j
    if max != i :
       maListe[i], maListe[max] = maListe[max], maListe[i]

# on teste si ça fonctionne
triParInsertion(maListe)
print(f"après : {maListe}")

avant : [3, 1, 6, 8, 7, 2, 4, 5]
après : [1, 2, 3, 4, 5, 6, 7, 8]


# Algorithme de dichotomie #

>DICHOTOMIE (ch se prononce k) nom féminin
xviiie siècle. Emprunté du grec dikhotomia, « division en deux parties égales ».
https://www.dictionnaire-academie.fr/article/A9D2403

Il est utilisé pour rechercher un élément dans une liste **triée**

**Le principe**

Soit une liste de n objets classés. On recherche un objet en particulier.

--> On choisit dans la liste l'objet médian.

--> On compare les deux objets.

--> Si on a trouvé alors c'est fini.

--> Si l'objet recherché est placé avant l'objet choisi alors on recommence avec cette partie de la liste.

--> Si l'objet recherché est placé après l'objet choisi alors on recommence avec cette partie de la liste.

--> Au bout d'un certain nombre d'essais (cela se calcule) soit on a trouvé l'objet soit il n'est pas dans la liste.

On utilise par exemple cette méthode pour rechercher la solution d'une équation en mathématique ou bien encore trouvé un mot dans un dictionnaire.

Voici un exemple d'algorithme qui rechercherait la valeur recherchée en parcourant toutes les valeurs de la liste

```python

tableau = [liste triée de n valeurs]

fonction recherche(tableau, valeur) : 
  trouvé = FAUX
  POUR i allant de 0 à n-1:
    SI tableau[i] == valeur
      ALORS 
        trouve = VRAI
  retourne trouve
```
L'algorithme explore tous les éléments de la liste pour tester la présence de l'élément recherché.

Supposons que le tableau est un annuaire qui contienne les noms, prénoms, adresses... des 7 milliards d'êtres humains vivant sur la terre.

On constate que cet algorithme a un coût asymptotique linéaire O(n), ce qui le rend long et inefficace sur un tableau de taille importante.

Voici une version dichotomique de la fonction de recherche

```python
tableau = [liste triée de n valeurs]

fonction recherche(tableau, valeur) :
  a = 0 (borne inférieur de l intervalle de recherche)
  b = n-1 (borne supérieur de l intervalle de recherche)
  TANT QUE (a <= b)
    SI tableau[(a+b)/2] == valeur
      retourner VRAI
    SINON
      SI tableau[(a+b)/2] > valeur
        b = (a+b)/2 - 1 (on va chercher dans la partie inférieur)
      SINON
        a = (a+b)/2 + 1 (on va chercher dans la partie superieur)
  retourner FAUX
```
Comme à chaque itération on divise le nombre de personne par 2, et, en supposant que la personne cherchée est la 1ère ou la dernière. La question revient à :

Combien de fois faut-il que je divise 7 milliards par 2 pour qu'il n'en reste qu'un ?

Cela revient à résoudre l'équation $2^n = 7 000 000 000$  dont la solution est : $n=\frac{ln(7000000000)}{ln(2)} = 32,0704$ ... soit au maximum 33 itérations !

On dira donc que la complexité asymptotique est en O($log_2(n)$)


Exercice : implémenter la fonction en Python

Debugger : http://www.pythontutor.com/visualize.html#mode=edit

In [0]:
# exercice : algorithme dichotomique
# on crée une liste triée

maListe = [x for x in range(10000)]

def recherche(uneListe:list, valeur:int):
  """
    recherche la valeur entière dans la liste d'entiers naturels triée
  """
  a=0 # borne inferieur de l'interval de recherche
  b=len(uneListe)-1 # borne supérieur de l'interval de recherche
  c=0 # un compteur d'itération
  while a <= b:
    if uneListe[(a+b)//2] == valeur:
      c = c+1
      return(True,c)
    else:
      if uneListe[(a+b)//2] > valeur:
        b = (a+b)//2-1
        c = c+1
      else:
        a = (a+b)//2+1
        c = c+1
  return (False, c)
# on teste la fonction
recherche(maListe, 4)

(True, 13)

Exercice : 

Concevoir un programme qui illustre la situation suivante :

Stéphane (S) propose à Patrice (P) le jeu suivant :

"choisis en secret un nombre compris entre 0 et 100; je vais essayer de le deviner le plus rapidement possible, en ne pouvant que te poser des questions auxquelles tu réponds par oui ou par non ".

Deux cas sont envisageables :

Stéphane dans le rôle de l'ordinateur

Patrice dans le rôle de l'ordinateur

In [0]:
# Version 1 : c'est l'ordinateur qui essaie de deviner le nombre que l'utilisateur a choisi entre 0 et 100

In [0]:
# Version 2 : c'est l'utilisateur qui essaie de deviner le nombre que l'ordinateur a choisi entre 0 et 100
from random import randint
# la machine choisit un nombre entre 0 et 100
choixMachine = randint(0,100)

print("Essaie de deviner quel nombre entier entre 0 et 100, j'ai choisi")
proposition = int(input("Quelle valeur, ai-je choisi Humain :) "))


### Bonus ###

#### Algorithme récursif ####

Une fonction récursive est une fonction qui s'appelle elle même dans la définition de son corps.

Voici une version récursive de l'algorithme de recherche dichotomique

```python
tableau = [liste triée de n valeurs]

fonction rechercheDichotomique(tableau, valeur, a, b) :
  SI (a<=b) :
      m = (a+b)/2
      SI  tableau[m] == valeur : 
        retouner m
      SINON :
        SI t[m] < val :
          retourner rechercheDichotomique(tableau, valeur, a, m-1)
        SINON : 
          retourner rechercheDichotomique(tableau, valeur, m+1, b)
  SINON :
    retourner null


In [0]:
# Exercice :  recherche dichotomique à implémenter

# Algorithme des k plus proches voisins (knn : k nearest neighbors) #

## Introduction ##
L’algorithme des k plus proches voisins appartient à la famille des algorithmes d’apprentissage automatique (machine learning).

L’idée d’apprentissage automatique ne date pas d’hier, puisque le terme de machine learning a été utilisé pour la première fois par
l’informaticien américain Arthur Samuel en 1959.
Les algorithmes d’apprentissage automatique ont connu un fort regain d’intérêt
au début des années 2000 notamment grâce à la quantité de données disponibles sur internet.
<div text-align="center"
<a align="center" title="Xl2085 / CC BY-SA (https://creativecommons.org/licenses/by-sa/4.0)" href="https://commons.wikimedia.org/wiki/File:This_is_the_photo_of_Arthur_Samuel.jpg"><img width="128" alt="This is the photo of Arthur Samuel" src="https://upload.wikimedia.org/wikipedia/commons/f/f8/This_is_the_photo_of_Arthur_Samuel.jpg"></a>
</div>

L’algorithme des k plus proches voisins est un algorithme d’apprentissage supervisé, il est nécessaire d’avoir des données labellisées. À partir d’un ensemble E de données labellisées, il sera possible de classer (déterminer le label) d’une nouvelle donnée (donnée n’appartenant pas à E).

L'algorithme est également en regression, dans lequel la valeur prise par la donnée sera la valeur moyenne de ses k plus proches voisins. Nous ne traiterons pas ce cas là.

**Remarque**

De nombreuses sociétés (exemple les GAFAM) utilisent les données
concernant leurs utilisateurs afin de ”nourrir” des algorithmes de machine learning qui permettront à ces sociétés d’en savoir toujours plus sur eux et ainsi de mieux cerné leurs ”besoins” en termes de consommation.

A noter que la plupart des données transmises sont auto-labellisées par les utilisateurs eux-mêmes (like, no-like, #, et autres ...), sur les photos et les textes (instagram, WhatsApp, Twitter ...). Les utilisateurs se regroupent eux-mêmes dans les groupes d'intérêt, ce qui facilite le profilage par les machines.


## La problématique ##

exemple : On dispose de deux populations dont on connaît la localisation (coordonnées) et une caractéristique ( Rouge ou Verte )

>>>![image knn1](https://raw.githubusercontent.com/LSMISN/NSI/master/image_knn1.png)



Un nouvel individu se présente avec ses coordonnées, quelle couleur lui donne-t-on ?

>>>![image knn2](https://raw.githubusercontent.com/LSMISN/NSI/master/image_knn2.png)

On lui donne la couleur des k plus proches voisins majoritaires.

## l'algorithme ##

L’algorithme de k plus proches voisins ne nécessite pas de phase d’apprentissage à proprement parler, il faut juste stocker le jeu de données d’apprentissage.
Soit un ensemble E contenant n données labellisées : 
E = {( $y_i$, 	$\overrightarrow{x_i}$ )} 

avec i compris entre 1 et n, où $y_i$ correspond à la classe
(le label) de la donnée i et où le vecteur $\overrightarrow{x_i}$ de dimension p ($\overrightarrow{x_i}$ = ( $x_{1i}$, $x_{2i}$,..., $x_{pi}$, )) représente les variables prédictrices de la donnée i. Soit une donnée u qui n’appartient pas à E et qui ne possède pas de label (u est uniquement caractérisée par un vecteur
$\overrightarrow{x_u}$ de dimension p). Soit d une fonction qui renvoie la distance entre la donnée u et une donnée quelconque appartenant à E. Soit un entier k inférieur ou égal à n. Voici le principe de l’algorithme de k plus proches voisins :

-  On calcule les distances entre la donnée u et chaque donnée appartenant à E à l’aide de la fonction d
-  On retient les k données du jeu de données E les plus proches de u
-  On attribue à u la classe qui est la plus fréquente parmi les k données les plus proches.

**la distance utilisée est souvent la distance Euclidienne (mais on en trouve d'autres suivant le cas : distance de Manhattan, distance de Hamming ...)**


On rappelle la formule permettant de calculer la distance entre deux données de dimensions n=2 $X_0(x_0,y_0)$ et $X_1(x_1,y_1)$

$D(X_0,X_1) = \sqrt{(x_0-x_1)^2 + (y_0-y_1)^2}$

La distance Euclidienne généralisée à des vecteurs $\overrightarrow{a}$ et $\overrightarrow{b}$ de dimension p $\overrightarrow{a}$ = ($a_0$, $a_1$,...,$a_p$), $\overrightarrow{b}$ = ($b_0$, $b_1$,...,$b_p$), serait :

$D(a,b) = \sqrt{(a_0-b_0)^2 + (a_1-b_1)^2 + ... + (a_p-b_p)^2}$




## Exemple 1 : Fidélité client##

On a le jeu de donnée suivant :

| Nom      |     Age    | Revenus (k€)   | Nombre d'achats | Fidélité |
| ------------- |:-------------: | :---------: |:---------: |:---------: |
|Jean      |        35        |      35 | 3 | N|
| Louis        |        22        |      50 | 2 | O
| Anne      |        63        |      200 | 1|N|
|Suzanne|59|170|1|N|
|Nicolas|25|40|4| O|

Un nouveau client se présente et on souhaite estimer sa fidélité, au regard du jeu de données que l'on possède.


| Nom      |     Age    | Revenus (k€)   | Nombre d'achats | Fidélité |
| ------------- |:-------------: | :---------: |:---------: |:---------: |
| David | 37 | 50 | 2 | ? |



On va utiliser l'algorithme knn.

**remarque**

Pour faire écho à l'algorithme ci-dessus, ici on constate que chaque client est caractérisé par 3 propriétés : l'age, le revenu, le nombre d'achat. 

Chaque individu est donc un vecteur de dimension 3 (p=3).

Le jeu de donnée est donc composé de 5 vecteurs (n=5).

Le label est unique, il s'agit de la fidélité qui peut prendre ici 2 états (Oui ou Non).

Notre nouvel individu se présente en entrée de l'algorithme avec ses 3 propriétés l'algorithme va déterminer suivant la valeur de k (nombre de voisins) choisi quel est son profile de fidélité à priori.

***Exercice:***

Appliquer l'algorithme "à la main" pour évaluer la fidélité de David pour k=3

- calculer la distance de David avec tous les autres participant (distance Euclidienne)

Exemple :
Les deux points de départ 
David(37,50,2)
Jean(35,35,3)

d(David, Jean) = $\sqrt{(37-35)^2+(50-35)^2+(2-3)^2} = 15,165$
- ...

In [4]:
import math
clients = [
           ['Jean', 35, 35, 3,'N'],
           ['Louis', 22, 50, 2, 'O'],
           ['Anne', 63, 200, 1, 'N'],
           ['Suzanne', 59, 170, 1, 'N'],
           ['Nicolas', 25, 40, 4, 'O']  
           ]

nouveau = ['David', 37, 50, 2]
# distance avec Jean
print(f"Jean: {math.sqrt((37-35)**2+(50-35)**2+(2-3)**2)}")
# distance avec Louis
print(f"Louis: {math.sqrt((37-22)**2+(50-50)**2+(2-2)**2)}")
# distance avec Anne
print(f"Anne: {math.sqrt((37-63)**2+(50-200)**2+(2-1)**2)}")
# distance avec Suzanne
print(f"Suzanne: {math.sqrt((37-59)**2+(50-170)**2+(2-1)**2)}")
# distance avec Anne
print(f"Nicolas: {math.sqrt((37-25)**2+(50-40)**2+(2-4)**2)}")


Jean: 15.165750888103101
Louis: 15.0
Anne: 152.23994219652081
Suzanne: 122.00409829181969
Nicolas: 15.748015748023622


On constate que Suzanne et Anne sont à des distances éloignées. Si on prend k=3, on choisit les 3 plus proches voisins, il reste Jean, Louis et  Nicolas.

On regarde la fidélité des 3 individus :
Jean : 'N'
Louis : 'O'
Nicolas : 'O'

On a une majorité de 'Oui' sur le voisinage (k=3), on met l'étiquette 'Oui' (bon client) à David.


## Exemple 2 :  Les Iris de Fisher##



![Iris setosa](https://pixees.fr/informatiquelycee/n_site/img/iris_setosa.jpeg)
![Iris virginica](https://pixees.fr/informatiquelycee/n_site/img/iris_virginica.jpeg)
![Iris versicolor](https://pixees.fr/informatiquelycee/n_site/img/iris_versicolor.jpeg)

[Activité pixees.fr](https://pixees.fr/informatiquelycee/n_site/nsi_prem_knn.html)

In [0]:
import pandas
import matplotlib.pyplot as plt

iris=pandas.read_csv("iris.csv")
x = iris.loc[:,"petal_length"]
y = iris.loc[:,"petal_width"]
lab=iris.loc[:,"species"]
plt.scatter(x[lab==0], y[lab==0], color='g', label='setosa')
plt.scatter(x[lab==1], y[lab==1], color='r', label='virginica')
plt.scatter(x[lab==2], y[lab==2], color='b', label='versicolor')
plt.legend()
plt.show()

## Exercice Implémentation de l'algorithme ##



1.   implémenter la fonction distance_euclidienne(point1, point2) qui calcule et renvoie la distance entre les points1 et points2 qui sont des listes de coordonnées
2.   implémenter la fonction knn(donnees, pointCible, k) qui renvoie une liste des indices des k plus proches voisins de pointCible

On pourra tester avec le jeu de données suivant :
```python
exemple_donnees = [
                [65.75, 112.99],
                [71.52, 136.49],
                [69.40, 153.03],
                [68.22, 142.34],
                [67.79, 144.30],
                [68.70, 123.30],
                [69.80, 141.49],
                [70.01, 136.46],
                [67.90, 112.37],
                [66.49, 127.45],
                ]

nouvelleCible = [70, 140]
```

In [5]:
# Essayons d'implémenter l'algorithme knn
from math import sqrt

# On peut commencer par implémenter une fonction pour calculer la distance Euclidienne
def distance_euclidienne(point1:list, point2:list):
  """
      Calcule la distance euclidienne entre les point1 et point2 et renvoie cette valeur
  """
  somme_carres = 0
  for i in range(len(point1)):
    somme_carres = somme_carres + (point1[i]-point2[i])**2
  return sqrt(somme_carres) # on renvoie la racine carree

# Puis knn 
def knn(donnees:list, NouveauPoint:list, k):
  """
  renvoie la liste des indices des k plus proches voisins de Nouveaupoint
  issu du jeu de donnees
  """
  indice_plus_proches_voisins =[]
  # On calcule la dist_ance de NouveauPoint avec toutes les donnees et on memorise les resultats dans une liste
  lst_distances = []
  for indiceVoisin, pointVoisin in enumerate(donnees):
    distance = distance_euclidienne(NouveauPoint, pointVoisin)
    lst_distances.append((distance, indiceVoisin))
  # on trie le résultat
  lst_distances = sorted(lst_distances)
  # A terminer
  # récupérer les indices des k plus proches voisins et les stocker dans la liste indice_plus_proches_voisins
  
  # on retourne le resultat
  return indice_plus_proches_voisins

# Le jeu de donnees d'entree 
exemple_donnees = [
                [65.75, 112.99],
                [71.52, 136.49],
                [69.40, 153.03],
                [68.22, 142.34],
                [67.79, 144.30],
                [68.70, 123.30],
                [69.80, 141.49],
                [70.01, 136.46],
                [67.90, 112.37],
                [66.49, 127.45],
                ]
# La valeur cible
nouveau = [70, 140]

# valeur de test pour calculer la distance
point1 = [35, 35, 3]
point2 = [37, 50, 2]
distance_euclidienne(point1,point2)


15.165750888103101