## 1.1 Jeu de données

L'ensemble de données Iris est un ensemble de données célèbre et largement utilisé dans l'apprentissage automatique et les statistiques.
Il a été introduit par le biologiste et statisticien britannique Ronald A. Fisher en 1936.
L'ensemble de données consiste en des mesures de diverses caractéristiques de trois espèces différentes de fleurs d'iris :

- Setosa
- Versicolor
- Virginica

Pour chacune de ces trois espèces, quatre caractéristiques ou mesures sont enregistrées :

- Longueur du sépale : Longueur du sépale de la fleur d'iris (le verticille le plus à l'extérieur de la fleur).
- Largeur du sépale : largeur du sépale de la fleur d'iris.
- Longueur du pétale : Longueur du pétale de la fleur d'iris (le verticille intérieur de la fleur).
- Largeur du pétale : largeur du pétale de la fleur d'iris.

L'ensemble de données sur les iris est un ensemble de données de classification multi-classes classique et très simple.

In [None]:
#Import libraries
import pandas as pd
from sklearn.datasets import load_iris
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import KBinsDiscretizer
from sklearn.naive_bayes import MultinomialNB
from sklearn.metrics import accuracy_score, classification_report

In [None]:
# Load the Iris dataset
iris = load_iris(as_frame=True)

In [None]:
# Create a DataFrame from the dataset
iris_df = pd.DataFrame(data=iris.data, columns=iris.feature_names)

In [None]:
# Add the target column to the DataFrame
iris_df['target'] = iris.target

In [None]:
# Display the first few rows of the DataFrame as a table
iris_df.head()

## 1.2 Division de l'ensemble de données en ensembles de données de formation et de test

In [None]:
# Split the dataset into features (X) and target labels (y)
X = iris_df.drop('target', axis=1)  # Features
y = iris_df['target']  # Target labels

In [None]:
# Split the data into a training set (80%) and a testing set (20%)
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

## 1.3 Transformer les éléments continus en cellules discrètes

In [None]:
# Create a KBinsDiscretizer transformer
discretizer = KBinsDiscretizer(n_bins=5, encode='ordinal', strategy='uniform')

In [None]:
# Fit and transform the continuous features into discrete bins
X_train_binned = discretizer.fit_transform(X_train)
X_test_binned = discretizer.transform(X_test)

In [None]:
# Display the shapes of the training and testing sets
print("X_train shape:", X_train_binned.shape)
print("X_test shape:", X_test_binned.shape)

## 1.4 Définir le modèle de classification

In [None]:
# Create a Multinomial Naive Bayes classifier


In [None]:
# Train the classifier on the binned training data


## 1.5 Evaluation

In [None]:
# Make predictions on the binned test data



In [None]:
# Calculate and display the accuracy


In [None]:
# Display a classification report
