# Classification des Iris avec du Machine Learning
## Algorithme K-NN

On suppose qu’une botaniste amatrice souhaite distinguer les espèces de certaines fleurs d’iris qu’elle a récoltées.
Elle a effectué des mesures sur chaque iris récolté :
- Longueur et largeur des pétales, 
- Longueur et largeur des sépales, 
- Toutes mesurées en centimètres.


## Chargement des librairies

In [None]:
from sklearn.datasets import load_iris
from sklearn.model_selection import train_test_split
from sklearn.neighbors import KNeighborsClassifier
import matplotlib.pyplot as plt

## Définition de variables

In [None]:
training_accuracy = []
test_accuracy = []
neighbors_settings = range(1,11)

## Chargement du modèle de données

In [None]:
iris_dataset = load_iris()
# Extraction des attributs/Features 
X = iris_dataset.data
# Extraction des Cible
y = iris_dataset.target

## Information sur le jeu de données.

In [None]:
print('The full description of the dataset:\n',iris_dataset['DESCR'])

## Extraction des éléments

In [None]:
# Extraction des attributs/Features 
X = iris_dataset.data
# Extraction des Cible
y = iris_dataset.target

## Partage des données (Test, Entrainement)

In [None]:
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.25, random_state=50)

## Entrainement d'un modèle avec un nombre de voisin défini  

In [None]:
neigh = KNeighborsClassifier(n_neighbors=3)
neigh.fit(X_train, y_train)

## Test de la performance du modèle

In [None]:
##Enregistrement de la performance sur le jeu d'entrainement
print("Performance sur le jeu d'entrainement : ")
print(neigh.score(X_train, y_train))

## Enregistrement de la performance sur le jeu de test
print("Performance sur le jeu de test : ")
print(neigh.score(X_test, y_test))

## Entrainement de plusieurs modèles avec un nombre variable  

In [None]:
for n_neighbors in neighbors_settings:
    # Construction du modèle
    clf = KNeighborsClassifier(n_neighbors=n_neighbors)
    clf.fit(X_train, y_train)
    # Enregistrement de la performance sur le jeu d'entrainement
    training_accuracy.append(clf.score(X_train, y_train))
    # Enregistrement de la performance sur le jeu de test
    test_accuracy.append(clf.score(X_test, y_test))

## Affichage des résultats

In [None]:
training_accuracy

In [None]:
test_accuracy

In [None]:
plt.plot(neighbors_settings,
         training_accuracy, label="training accuracy")
plt.plot(neighbors_settings,
        test_accuracy, label="test accuracy")
plt.ylabel("Accuracy")
plt.xlabel("n_neighbors")
plt.legend()

## Test d'une Iris

### Entrainement d'un modèle : Combien de voisins ?

In [None]:
neigh = KNeighborsClassifier(n_neighbors=XXXXXXX)
neigh.fit(X_train, y_train)

print(iris_dataset.target_names[neigh.predict([[4.30,1.10,3.00,0.10]])])

In [None]:
print(iris_dataset.target_names[neigh.predict([[6.10,4.90,3.00,1.80]])])

## Quel type d'iris a un sépale de 3 cm x 5 cm et un pétale de 4 cm x 2 cm ?