<div style="text-align: center;">
   <h1>Probl√®me : Conception d'un syst√®me de pr√©diction de donn√©es avec Python avanc√© </h1>
   
</div>

## Interface `IModel`
> L'interface IModel est une classe abstraite qui d√©finit deux m√©thodes principales que tout mod√®le de machine learning doit impl√©menter :
- `train` : Pour entra√Æner le mod√®le avec des donn√©es d'entra√Ænement.
- `predict` : Pour faire des pr√©dictions sur de nouvelles donn√©es.

In [2]:
from abc import ABC, abstractmethod
from typing import List
import pandas as pd

class IModel(ABC):
    @abstractmethod
    #M√©thode d'entra√Ænement du mod√®le.
    def train(self, X: pd.DataFrame, y: pd.Series) -> None:
        pass
    
    #M√©thode de pr√©diction sur des donn√©es.
    @abstractmethod
    def predict(self, X: pd.DataFrame) -> List[float]:
        pass


## D√©corateur `@log_decorator`
> La fonction log_decorator est un d√©corateur Python qui permet de :
- Enregistrer un message de log avant l'ex√©cution d'une fonction avec ses arguments.
- Enregistrer un message de succ√®s si la fonction s'ex√©cute correctement.
- Enregistrer un message d'erreur avec les d√©tails si une exception survient dans la fonction.


In [3]:
import logging

# Configuration de base du logging
logging.basicConfig(level=logging.INFO, format='%(asctime)s - %(levelname)s - %(message)s', filename='system.log')

def log_decorator(func):
    def wrapper(*args, **kwargs):
        try:
            logging.info(f"Running {func.__name__} with arguments {args} {kwargs}")
            result = func(*args, **kwargs)
            logging.info(f"{func.__name__} completed successfully.")
            return result
        except Exception as e:
            logging.error(f"Error in {func.__name__}: {e}")
            raise e
    return wrapper


## Classe `DataPipeline`
> La classe DataPipeline g√®re le chargement, le pr√©traitement, et la division des donn√©es. Elle utilise un g√©n√©rateur pour parcourir les donn√©es ligne par ligne.
- Attributs :
    - `_filename` : Nom du fichier CSV contenant les donn√©es.
    - `_data` : Donn√©es charg√©es sous forme de DataFrame de pandas.
- M√©thodes :
    - `load_data` : Charge les donn√©es depuis un fichier CSV.
    - `preprocess_data` : Nettoie les donn√©es en supprimant les valeurs manquantes.
    - `split_data` : Divise les donn√©es en ensembles d'entra√Ænement et de test.
    - `data_generator` : G√©n√©rateur qui permet de parcourir les donn√©es ligne par ligne.


In [9]:

import pandas as pd 
from sklearn.model_selection import train_test_split 
from typing import Tuple, Generator

class DataPipeline:
    def __init__(self, filename: str):
        self._filename = filename
        self._data: pd.DataFrame = None

    @property
    #Getter pour les donn√©es.
    def data(self) -> pd.DataFrame:
        return self._data

    @data.setter
    #Setter pour les donn√©es.
    def data(self, data: pd.DataFrame) -> None:
        self._data = data

    @log_decorator
    #Charge les donn√©es depuis un fichier CSV.
    def load_data(self) -> None:
        self._data = pd.read_csv(self._filename)
        print(f"Donn√©es charg√©es depuis üòÑ {self._filename}")

    @log_decorator
    def preprocess_data(self) -> None:
        self._data = self._data.dropna(inplace=True)

    @log_decorator
    #Diviser les donn√©es en ensemble d'entra√Ænement et de test.
    def split_data(self, test_size: float = 0.2) -> Tuple[pd.DataFrame, pd.DataFrame, pd.Series, pd.Series]:
        X = self._data.drop('target', axis=1)
        y = self._data['target']
        return train_test_split(X, y, test_size=test_size, random_state=42)

    #G√©n√©rateur pour parcourir les donn√©es.
    def data_generator(self, batch_size: int) -> Generator[pd.DataFrame, None, None]:
        for start in range(0, len(self._data), batch_size):
            yield self._data.iloc[start:start + batch_size]



## D√©corateur `@timing`
>  Le d√©corateur @timing mesure et affiche le temps d'ex√©cution des m√©thodes qu'il d√©core. Il est utilis√© pour suivre la performance en temps r√©el.


In [5]:
import time

def timing(func):
    def wrapper(*args, **kwargs):
        start_time = time.time()
        result = func(*args, **kwargs)
        end_time = time.time()
        print(f"Temps d'ex√©cution de {func.__name__}: {end_time - start_time:.4f} secondes")
        return result
    return wrapper


## Classe `RandomForestModel`
> Impl√©mente le mod√®le de Random Forest √† l'aide de l'interface IModel. Ce mod√®le utilise RandomForestClassifier de scikit-learn.
- M√©thodes :
    - `train` : Entra√Æne le mod√®le avec des donn√©es d'entra√Ænement.
    - `predict` : Fait des pr√©dictions sur de nouvelles donn√©es.
    - `evaluate` : Calcule la pr√©cision du mod√®le sur des donn√©es de test.


In [10]:
from sklearn.ensemble import RandomForestClassifier
from sklearn.metrics import accuracy_score

class RandomForestModel(IModel):
    def __init__(self):
        self.model = RandomForestClassifier()

    @log_decorator
    @timing
    #Entra√Æner le mod√®le RandomForest.
    def train(self, X: pd.DataFrame, y: pd.Series) -> None:
        self.model.fit(X, y)
        
    @log_decorator
    @timing
    #Pr√©diction avec le mod√®le RandomForest.
    def predict(self, X: pd.DataFrame) -> List[float]:
        return self.model.predict(X).tolist()

    @log_decorator
    #√âvaluer le mod√®le sur un ensemble de test.
    def evaluate(self, X_test: pd.DataFrame, y_test: pd.Series) -> float:
        y_pred = self.predict(X_test)
        return accuracy_score(y_test, y_pred)
    
    # √âvaluer le mod√®le sans sklearn accuracy_score.
    # def evaluate(self, X_test: pd.DataFrame, y_test: pd.Series) -> float:
    #     y_pred = self.predict(X_test)
    #     correct = sum(y_test == y_pred)
    #     return correct / len(y_test)


## Classe `SVMModel`
> Impl√©mente le mod√®le SVM en utilisant SVC de scikit-learn. Ce mod√®le impl√©mente √©galement l'interface IModel.
- M√©thodes :
    - `train` : Entra√Æne le mod√®le SVM.
    - `predict` : Fait des pr√©dictions sur de nouvelles donn√©es.
    - `evaluate` : Calcule la pr√©cision du mod√®le.


In [13]:
from sklearn.svm import SVC

class SVMModel(IModel):
    def __init__(self):
        self.model = SVC()

    @log_decorator
    @timing
    #Entra√Æner le mod√®le SVM.
    def train(self, X: pd.DataFrame, y: pd.Series) -> None:
        self.model.fit(X, y)

    @log_decorator
    @timing
    #Pr√©diction avec le mod√®le SVM.
    def predict(self, X: pd.DataFrame) -> List[float]:
        return self.model.predict(X).tolist()

    #√âvaluer le mod√®le sur un ensemble de test.
    def evaluate(self, X_test: pd.DataFrame, y_test: pd.Series) -> float:
        y_pred = self.predict(X_test)
        return accuracy_score(y_test, y_pred)
    
    # √âvaluer le mod√®le sans sklearn accuracy_score.
    # def evaluate(self, X_test: pd.DataFrame, y_test: pd.Series) -> float:
    #     y_pred = self.predict(X_test)
    #     correct = sum(y_test == y_pred)
    #     return correct / len(y_test)


In [14]:
if __name__ == "__main__":
    # 1. Charger et pr√©traiter les donn√©es
    pipeline = DataPipeline('data.csv')
    pipeline.load_data()
    pipeline.preprocess_data()
    
    # 2. Diviser les donn√©es
    X_train, X_test, y_train, y_test = pipeline.split_data(test_size=0.2)
    
    # 3. Entra√Æner et √©valuer le mod√®le RandomForest
    print("\nRandomForestModel")
    rf_model = RandomForestModel()
    rf_model.train(X_train, y_train)
    rf_model.evaluate(X_test, y_test)
    
    # 4. Entra√Æner et √©valuer le mod√®le SVM
    print("\nSVMModel")
    svm_model = SVMModel()
    svm_model.train(X_train, y_train)
    svm_model.evaluate(X_test, y_test)
    
    # 7. Utiliser le g√©n√©rateur pour parcourir les donn√©es
    print("\nData Generator:")
    for row in pipeline.data_generator(batch_size=1000):
        print(row)
        break  #show the first row  üòé
    

Donn√©es charg√©es depuis üòÑ data.csv

RandomForestModel
Temps d'ex√©cution de train: 0.1964 secondes
Temps d'ex√©cution de predict: 0.0089 secondes

SVMModel
Temps d'ex√©cution de train: 0.0020 secondes
Temps d'ex√©cution de predict: 0.0010 secondes

Data Generator:
   feature1  feature2  feature3  feature4  target
0  0.374540  2.378596  1.068571  0.773856       1
1  0.950714  0.405175  0.836367  0.046878       0
2  0.731994  2.123425  0.599406  0.084544       0
3  0.598658  0.299509  1.188251  0.991677       0
4  0.156019  2.862336  0.296391  1.194115       1
5  0.155995  1.220905  1.526876  0.953861       0
6  0.058084  0.346888  0.354275  0.741358       1
7  0.866176  0.173258  0.904170  1.169807       1


### Output:

1. **Donn√©es charg√©es depuis `data.csv`**:
   - Les donn√©es ont √©t√© charg√©es avec succ√®s depuis le fichier `data.csv`.

2. **RandomForestModel**:
   - **Temps d'ex√©cution de `train`**: 0.1964 ondes  
     Cela indique que la m√©thode `train` du mod√®le `RandomForestModel` a pris **0.1964condes** pour s'ex√©cuter.
   - **Temps d'ex√©cution de `predict`**: 0.0089econdes  
     Cela montre que la m√©thode `predict` du mod√®le `RandomForestModel` a pris **0.0089econdes** pour faire des pr√©dictions.

3. **SVMModel**:
   - **Temps d'ex√©cution de `train`**: 0.0020 secondes  
     La m√©thode `train` du mod√®le `SVMModel` a pris **0.0020 secondes** pour s'ex√©cuter.
   - **Temps d'ex√©cution de `predict`**: 0.0010 secondes  
     La m√©thode `predict` du mod√®le `SVMModel` a pris **0.0010 secondes** pour faire des pr√©dictions.

4. **Data Generator**:
   - Le g√©n√©rateur de donn√©es a renvoy√© les premi√®res lignes des donn√©es suivantes :

| feature1 | feature2 | feature3 | feature4 | target |
|----------|----------|----------|----------|--------|
| 0.374540 | 2.378596 | 1.068571 | 0.773856 | 1      |
| 0.950714 | 0.405175 | 0.836367 | 0.046878 | 0      |
| 0.731994 | 2.123425 | 0.599406 | 0.084544 | 0      |
| 0.598658 | 0.299509 | 1.188251 | 0.991677 | 0      |
| 0.156019 | 2.862336 | 0.296391 | 1.194115 | 1      |
| 0.155995 | 1.220905 | 1.526876 | 0.953861 | 0      |
| 0.058084 | 0.346888 | 0.354275 | 0.741358 | 1      |
| 0.866176 | 0.173258 | 0.904170 | 1.169807 | 1      |





<div style="text-align: center;">
   <h2>Mohamed BELANNAB </h2>
</div>