#  Le classifier Naive Bayes 

* Le Naive Bayes est l’un des algorithmes de classification les plus simples à comprendre . Un des domaines d’application classique de ce modèle est la classification de textes en se basant uniquement sur la fréquence d’apparition des mots.

* cette algorithme se repose  sur l’hypothèse simpliste (naïve) d’indépendance totale des variables, c’est un algorithme polyvalent dont on retrouve naturellement l’application dans de multiples secteurs d’activité, même quand l’hypothèse de base est violée . 


Le classifieur optimale de bayes est par : 

$$g(x) = \argmax_{l \in \{1, \dots, K \} } \mathbb{P}(Y=l|X=x)$$

Pour pouvoir appliquer cette règle, il faut disposer des probabilité à posteriori $\mathbb{P}(Y=l|X=x)$


* Les approches basées sur un modèle consistent à apprendre la loi de $Y$ sachant
$X$ pour en déduire ensuite la règle de classification $g$ on peut citer : 

1. analyse discriminante linéaire et quadratique, 
2. bayésien naïf
3. régression logistique.
4. $\dots$

Dans cette meme approche on peut scinder en deux : 
- *Une approche directe* : consiste à apprendre directement la loi de $Y$ sachant $X$. Par
exemple en régression logistique 


In [54]:
import numpy as np 
import pandas as pd 
import math 
import matplotlib.pyplot as plt 
from sklearn.datasets import load_iris


In [55]:
data = load_iris( )
X = data.data 
y = data.target 

In [136]:
class NaivesBayes: 
    def __init__(self):
        self._pdf = np.vectorize(self._pdf)
        


    def fit(self, X, y): 
        n_samples, n_features = X.shape 
        self.n_classes = np.unique(y).shape[0]

        data = np.concatenate([X, y.reshape(-1,1)], axis=1)



        self.mean = np.zeros(shape=(self.n_classes, n_features))
        self.var= np.zeros(shape=(self.n_classes, n_features)) 
        self.prior = np.zeros(shape=(self.n_classes))


        for c in range(self.n_classes): 
            X_c = data[y==c][:, :-1]
            self.mean[c] = X_c.mean(axis=0)
            self.var[c]= X_c.var(axis=0)
            prior_c = X_c.shape[0]/n_samples
            self.prior[c]= prior_c


    def predict(self,X): 
        predicted = [self._predict(x) for x in X]
        return np.array(predicted)

        
    
    def _predict(self, obs): 

        L = []
        for c  in range(self.n_classes):
            res = self._pdf(obs, self.mean[c], self.prior[c]).prod() * self.prior[c]
            L.append(res)
        
        L = np.array(L)

        

        return  np.argmax(L) 
        

    def _pdf(self,x, mean, var):

        numerator = math.exp((-(x-mean)**2)/(2*var))
        denominator = math.sqrt(2* math.pi * (var))
        return numerator / denominator
    
     

In [137]:
model = NaivesBayes()

In [138]:
model.fit(X, y)
obs = X[0]

In [140]:
pred = model.predict(X)

In [118]:
def f(x, mean, var):
    numerator = math.exp((-(x-mean)**2)/(2*var**2))
    denominator = math.sqrt(2* math.pi * (var**2))
    return numerator / denominator

In [142]:
np.sum(pred==y) / y.shape[0]

0.9266666666666666

In [127]:
np.argmax(A)

1

In [86]:
# pour la classe 0 
f(obs[0],mean[0,0],var[0,0])*f(obs[1],mean[0,0],var[0,0])*f(obs[2],mean[0,0],var[0,0])*f(obs[3],mean[0,0],var[0,0])*prior[0]

0.0

array([[5.006, 3.428, 1.462, 0.246],
       [5.936, 2.77 , 4.26 , 1.326],
       [6.588, 2.974, 5.552, 2.026]])

In [83]:
var 

array([[0.121764, 0.140816, 0.029556, 0.010884],
       [0.261104, 0.0965  , 0.2164  , 0.038324],
       [0.396256, 0.101924, 0.298496, 0.073924]])