<a href="https://colab.research.google.com/github/sabrinekri/Loan_Solvability_CRISP-DM/blob/main/Correction_POO_Partie_3.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

## üß± Relation de composition en Programmation Orient√©e Objet

La **composition** est une relation entre classes o√π :
> **une classe est compos√©e d‚Äôune ou plusieurs autres classes**.

üëâ Un objet contient **des objets d‚Äôautres classes** comme attributs.

On dit souvent :
- **"A a un B"**
- Exemple :  
  - Un mod√®le IA **a des** couches  
  - Un dataset **a des** √©chantillons  
  - Une classe **contient** une liste ou un dictionnaire d‚Äôobjets

üìå En Python, la composition est r√©alis√©e naturellement √† l‚Äôaide :
- d‚Äôattributs simples (objet unique)
- de listes d‚Äôobjets
- de dictionnaires d‚Äôobjets


## üìä Probl√®me 1 : Dataset et √âchantillon (2 classes)

Un **Dataset** est compos√© de plusieurs **√âchantillons**.
Chaque √©chantillon repr√©sente une observation utilis√©e en IA.

Relation :
- Dataset **contient** une liste d‚Äôobjets √âchantillon


In [None]:
class Echantillon:
    def __init__(self, features, label):
        self.features = features  # vecteur de donn√©es
        self.label = label        # classe ou valeur cible

    def __repr__(self):
        return f"Echantillon(features={self.features}, label={self.label})"


In [None]:
e1 = Echantillon([1.2, 0.5], "chat")
e2 = Echantillon([0.8, 1.1], "chien")

dataset = Dataset("Animaux")
dataset.ajouter(e1)
dataset.ajouter(e2)

print(dataset)
print(dataset.echantillons[0])


Dataset Animaux (2 √©chantillons)
Echantillon(features=[1.2, 0.5], label=chat)


## üß† Probl√®me 2 : Mod√®le IA, Couche et Neurone (3 classes)

Un **Mod√®le IA** est compos√© de plusieurs **Couches**.
Chaque **Couche** est compos√©e de plusieurs **Neurones**.

Relation de composition :
- Mod√®leIA ‚Üí liste de Couche
- Couche ‚Üí liste de Neurone


In [None]:
class Neurone:
    def __init__(self, poids):
        self.poids = poids

    def __str__(self):
        return f"Neurone(poids={self.poids})"


In [None]:
class Couche:
    def __init__(self, nom):
        self.nom = nom
        self.neurones = []  # liste d'objets Neurone

    def ajouter_neurone(self, neurone):
        self.neurones.append(neurone)

    def __str__(self):
        return f"Couche {self.nom} ({len(self.neurones)} neurones)"


In [None]:
class ModeleIA:
    def __init__(self, nom):
        self.nom = nom
        self.couches = []  # liste d'objets Couche

    def ajouter_couche(self, couche):
        self.couches.append(couche)

    def __str__(self):
        return f"Mod√®le IA {self.nom} ({len(self.couches)} couches)"


In [None]:
n1 = Neurone([0.1, 0.3])
n2 = Neurone([0.4, 0.7])

couche1 = Couche("Entr√©e")
couche1.ajouter_neurone(n1)
couche1.ajouter_neurone(n2)

modele = ModeleIA("R√©seauSimple")
modele.ajouter_couche(couche1)

print(modele)
print(couche1)
print(couche1.neurones[0])


Mod√®le IA R√©seauSimple (1 couches)
Couche Entr√©e (2 neurones)
Neurone(poids=[0.1, 0.3])


## üìà Probl√®me 3 : √âvaluation IA avec dictionnaire d‚Äôobjets

Un mod√®le IA peut √™tre √©valu√© par plusieurs **m√©triques** :
accuracy, pr√©cision, rappel, etc.

On utilise un **dictionnaire d‚Äôobjets** :
- cl√© : nom de la m√©trique
- valeur : objet Metrique


In [None]:
class Metrique:
    def __init__(self, nom, valeur):
        self.nom = nom
        self.valeur = valeur

    def __str__(self):
        return f"{self.nom} = {self.valeur}"


In [None]:
class EvaluationIA:
    def __init__(self):
        self.metriques = {}  # dictionnaire d'objets Metrique

    def ajouter_metrique(self, metrique):
        self.metriques[metrique.nom] = metrique

    def afficher(self):
        for m in self.metriques.values():
            print(m)


In [None]:
eval_ia = EvaluationIA()
eval_ia.ajouter_metrique(Metrique("Accuracy", 0.92))
eval_ia.ajouter_metrique(Metrique("Recall", 0.88))

eval_ia.afficher()


Accuracy = 0.92
Recall = 0.88


## üìù R√©sum√© : Composition en POO

| Type de composition | Exemple |
|--------------------|--------|
| Objet simple | Dataset ‚Üí Echantillon |
| Liste d‚Äôobjets | Mod√®le ‚Üí Couches |
| Liste imbriqu√©e | Couche ‚Üí Neurones |
| Dictionnaire d‚Äôobjets | √âvaluation ‚Üí M√©triques |

üëâ La composition permet de construire des syst√®mes complexes
√† partir de classes simples et bien d√©finies.


## üß© Probl√®me 1 : Enrichissement des classes `Echantillon` et `Dataset`

Dans ce probl√®me, on travaille avec un **dataset r√©el (CSV)**.
L‚Äôobjectif est d‚Äôenrichir progressivement les classes :

- `Echantillon` : traitement d‚Äôun √©chantillon individuel
- `Dataset` : gestion globale des donn√©es



### ‚ùì Question 1 ‚Äî Norme d‚Äôun √©chantillon

Ajouter √† la classe `Echantillon` une m√©thode `norme()` qui retourne
la norme euclidienne du vecteur de caract√©ristiques de l‚Äô√©chantillon.


### ‚ùì Question 2 ‚Äî Distance entre deux √©chantillons

Ajouter √† la classe `Echantillon` une m√©thode `distance(self, other)`
qui calcule la distance euclidienne entre deux √©chantillons.


### ‚ùì Question 3 ‚Äî Chargement d‚Äôun fichier CSV

Ajouter √† la classe `Dataset` une m√©thode `charger_csv(nom_fichier)` qui :

- lit un fichier CSV r√©el,
- cr√©e un objet `Echantillon` pour chaque ligne,
- stocke les √©chantillons


### ‚ùì Question 4 ‚Äî Labels uniques

Ajouter √† la classe `Dataset` une m√©thode `labels_uniques()` qui retourne
l‚Äôensemble des labels pr√©sents dans le dataset.



### ‚ùì Question 5 ‚Äî Acc√®s aux √©chantillons (`__getitem__`)

Red√©finir la m√©thode sp√©ciale `__getitem__(self, i)` dans la classe `Dataset`
afin de permettre l‚Äôacc√®s direct √† un √©chantillon par son indice :


### ‚ùì Question 6 ‚Äî Normalisation du dataset

Ajouter √† la classe `Dataset` une m√©thode `normaliser()` qui :

- normalise chaque caract√©ristique des √©chantillons,
- utilise la normalisation min‚Äìmax,
- retourne un **nouveau dataset normalis√©** (sans modifier l‚Äôoriginal).

üìå Formule utilis√©e :
$$
x' = \frac{x - min}{max - min}
$$

### ‚ùì Question 7 ‚Äî S√©paration Train / Test

Ajouter √† la classe `Dataset` une m√©thode `split(train_ratio)` qui :

- s√©pare le dataset en deux datasets :
  - un dataset d‚Äôentra√Ænement
  - un dataset de test
- retourne les deux datasets.


##### üìö Documentation ‚Äî M√©thode `sample` (module `random`)

La m√©thode `sample` appartient au module standard `random` de Python.
Elle permet de **s√©lectionner al√©atoirement des √©l√©ments sans r√©p√©tition**
√† partir d‚Äôune collection.

---

##### üîπ Syntaxe g√©n√©rale

```python
random.sample(population, k)


In [None]:
import numpy as np
import random
class Echantillon:
    def __init__(self, features, label):
        self.features = np.array(features)  # vecteur de donn√©es ( numpy )
        self.label = label        # classe ou valeur cible

    def __repr__(self):
        return f"Echantillon(features={self.features}, label={self.label})"
    # Q1
    def norme( self ) :
        return np.linalg.norm( self.features)
    # Q2
    def distance(self , other) :
        return np.linalg.norm(self.features-other.features)

In [None]:
# Test :
E1 = Echantillon( [1.2 , 5.3 , 4.2 , 0.3 ] , 'setosa')
print(E1)
print("norme = ", E1.norme())
E2 = Echantillon( [1.2 , 4.3 , 2.2 , 1.3 ] , 'virginica')
print("dist (E1 , E2) = " , E1.distance(E2))

Echantillon(features=[1.2 5.3 4.2 0.3], label=setosa)
norme =  6.874590896918885
dist (E1 , E2) =  2.449489742783178


In [None]:
class Dataset:

    def __init__(self, nom):
        self.nom = nom
        self.echantillons = []  # liste d'objets Echantillon
        self.size = 0

    def ajouter(self, echantillon):
        self.echantillons.append(echantillon)
        self.size += 1

    def __len__(self):
        return self.size

    def __str__(self):
        return f"Dataset {self.nom} ({len(self)} √©chantillons)"

    # Q3
    def charger_csv(self, nom_fichier) :
        f = open(nom_fichier , 'r')

        header  = f.readline()

        for line in f :         # line = "5.1,3.5,1.4,0.2,0\n"
            line = line.strip() # line = "5.1,3.5,1.4,0.2,0"
            L = line.split(',') # L = ['5.1' , '3.5' , ... ]
            L1 = [float(x)  for x in L ]
            objEch = Echantillon( L1[ : -1] , int(L1[-1]) )
            self.ajouter( objEch )
        f.close()

    def getNameTargets(self , nom_fichier) :
        f = open(nom_fichier , 'r')
        header = f.readline()
        f.close()
        return header.strip().split(',')



    # Q4
    def labels_uniques(self , nom_fichier ) :
        targets = list( {E.label for E in self.echantillons}  )
        targetName  = self.getNameTargets( nom_fichier)

        D = { targ : name for targ, name in zip(targets , targetName)}
        return D # D est un dict de label : {0 : setosa , 1:virginica , 2:versicolor}

    # Q5
    def __getitem__(self, i) :
        pass

    # Q6 :
    def normaliser(self) :
        pass


In [None]:
D1 = Dataset( 'iris' )
D1.echantillons

[]

In [None]:
D1.ajouter( Echantillon([1.2 , 0.5 , 0.3 , 1.9] , 'setosa'))

In [None]:
D1.echantillons

[Echantillon(features=[1.2 0.5 0.3 1.9], label=setosa)]

In [None]:
D1.charger_csv( 'iris.csv')

In [None]:
D1.echantillons[ : 5]

[Echantillon(features=[1.2 0.5 0.3 1.9], label=setosa),
 Echantillon(features=[5.1 3.5 1.4 0.2], label=0),
 Echantillon(features=[4.9 3.  1.4 0.2], label=0),
 Echantillon(features=[4.7 3.2 1.3 0.2], label=0),
 Echantillon(features=[4.6 3.1 1.5 0.2], label=0)]

In [None]:
len(D1)

151

In [None]:
i = random.randint(0 , 150)
j = random.randint(0 , 150)

# calculer la distance entre la fleur d'index i et celle d'index j
dij = D1.echantillons[i].distance( D1.echantillons[j] )
print(dij)

2.754995462791182


In [None]:
D1.labels_uniques('iris.csv')

{0: 'setosa', 1: 'virginica', 2: 'versicolor'}