# **Python pour la Data Science**
## **Classes et modules**

## **Introduction**
En Python et dans de nombreux autres langages de programmation, la **programmation orient√©e objet** consiste √† cr√©er des **classes** d‚Äôobjets qui contiennent des informations sp√©cifiques et des outils adapt√©s √† leur manipulation.

**Tous les outils** que nous utilisons pour faire de la Data Science et que vous verrez plus tard (Arrays Numpy, DataFrames pandas, Mod√®les de scikit-learn, Figures matplotlib,...) sont construits de cette mani√®re.
Comprendre les m√©caniques des objets Python et savoir les utiliser est essentiel pour exploiter toutes les fonctionnalit√©s de ces outils.

## **1. Les Classes**

Une classe d'objets contient 3 types d'√©l√©ments **fondamentaux** :

- Un **constructeur** : une fonction qui permet d'**initialiser** un objet de la classe.
- Des **attributs** : Des variables **sp√©cifiques** √† l'objet cr√©√© permettant de d√©finir ses **propri√©t√©s**.
- Des **m√©thodes** : Des fonctions sp√©cifiques √† la classe qui permettent d'interagir avec un objet.

Pour comprendre les classes d'objets, faisons une analogie avec une voiture.

Les voitures sont une classe d'objets d√©signant des v√©hicules √† roues motoris√©s et destin√©s au transport terrestre.

On suppose que le **constructeur** de la classe des voitures est une **usine** qui les produit.
√Ä partir des **attributs** souhait√©s pour la voiture comme la **couleur**, le **mod√®le** ou la **cylindr√©e**, l'usine doit √™tre capable de produire une voiture qui correspond aux caract√©ristiques donn√©es.

Ainsi, l'usine est analogue √† une **fonction** qui prend en **argument** les **attributs** de la voiture et **retourne** la voiture **construite** et pr√™te √† l'emploi.

![constructor](https://github.com/diaBabPro/colabs/blob/main/constructor.png?raw=true)

Les **m√©thodes** de la voiture sont les commandes permettant d'acc√©l√©rer ou de freiner le v√©hicule. Ces commandes sont analogues √† des **fonctions** qui prennent en argument la **pression** sur la p√©dale et **appliquent** une acc√©l√©ration √† la voiture.

En Python, une classe est d√©finie avec la clause **`class`**. Cette clause permet de d√©buter un bloc de codes o√π nous pouvons d√©finir le constructeur de la classe et ses m√©thodes.

La d√©finition du constructeur se fait avec la m√©thode nomm√©e **`__init__`** qui nous permet d'initialiser les **attributs** de l'objet que nous voulons construire (attention au fait qu'il y a 2 underscores avant et 2 underscores apr√®s init) :

```python
# D√©finition de la classe Car
   class Car:
      # D√©finition du constructeur de la classe Car
      def __init__(self, color, model, horsepower):
          # Initialisation des attributs de la classe avec les arguments du constructeur
          self.color = color
          self.model = model
          self.horsepower = horsepower
```

L'argument **`self`** correspond √† l'**objet appelant la m√©thode**. Cet argument nous permet d'acc√©der aux attributs de l'objet au sein de la m√©thode.

**Toutes les m√©thodes** d'une classe doivent avoir comme **premier argument** l'argument **`self`** car les m√©thodes d'une classe re√ßoivent syst√©matiquement l'objet qui les appelle en argument.

Nous pouvons d√©finir d'autres m√©thodes au sein de cette classe :

```python
# D√©finition de la classe Car
  class Car:
      # D√©finition du constructeur de la classe Car
      def __init__(self, color, model, horsepower):
         # Initialisation des attributs de la classe avec les arguments du constructeur
         self.color = color
         self.model = model
         self.horsepower = horsepower

      # D√©finition d'une m√©thode permettant de changer la couleur d'une voiture
      def change_color(self, new_color):
          self.color = new_color
```

Pour cr√©er un objet de cette classe, nous devons utiliser la syntaxe suivante :

```python
 # Cr√©ation d'un objet de la classe Car
   aventador = Car(color = "orange",
                   model = "Aventador",
                   horsepower = 700)
```

Pour cr√©er l'objet, `Car` s'utilise comme une fonction. En fait, Python fait appel √† la m√©thode `__init__` de la classe `Car` en lui renseignant les arguments que nous avons utilis√©s dans la "fonction" `Car`.
C'est pourquoi on appelle aussi la fonction Car() le constructeur de la classe.

Le processus de construction d'un objet et d'assignation √† une variable s'appelle l'**instanciation**.

On dit que `aventador` est une **instance** de la classe `Car`.

En vous inspirant de la classe `Car` d√©finie ci-dessus :

- **(a)** D√©finir une nouvelle classe `Complexe` √† 2 attributs :

  - **partie_re** qui contient la partie r√©elle du `Complexe`.

  - **partie_im** qui contient la partie imaginaire du `Complexe`.

- **(b)** D√©finir dans la classe `Complexe` une m√©thode `afficher` ne prenant pas d'arguments √† part `self` permettant d'afficher un `Complexe` sous sa forme alg√©brique  ùëé+ùëèùëñ
  o√π  ùëé
  est la partie r√©elle d'un complexe et  ùëè
  sa partie imaginaire.

>Il faudra adapter cette m√©thode au signe de la partie imaginaire (L'affichage devrait donner `4 - 2i`, `6 + 2i`, `5`).

- **(c)** Instancier deux `Complexe` correspondant au nombres complexes  4+5ùëñ
  et  3‚àí2ùëñ
  puis les afficher avec la m√©thode `afficher`.

In [5]:
# A & B
class Complexe:
      """
      La classe Complexe permet de construire un nombre complexe.

      Param√®tres
      ----------
      partie_re : Entier : Partie r√©elle du nombre complexe.
      partie_im : Entier : Partie imaginaire du nombre complexe.

      Exemple
      -------
      complexe1 = Complexe(4, 5)
      complexe2 = Complexe(3, -2)
      """

      def __init__(self, partie_re, partie_im):
         # Initialisation des attributs de la classe avec les arguments du nombre complexe
         self.partie_re = partie_re
         self.partie_im = partie_im

      def afficher(self):
         """
         M√©thode permettant d'afficher un complexe sous sa forme alg√©brique.
         """
         if self.partie_im >= 0:
          print(str(self.partie_re) + " + " + str(self.partie_im) + "i")
         else:
          print(str(self.partie_re) + " - " + str(abs(self.partie_im)) + "i")

# C
complexe1 = Complexe(4, 5)
complexe2 = Complexe(3, -2)
complexe1.afficher()
complexe2.afficher()

4 + 5i
3 - 2i


## **2. Classes et Documentations**

Pour √™tre utilisable, une classe doit toujours √™tre **proprement document√©e**.
Comme pour les fonctions, l'√©criture de la documentation d'une classe commence et termine avec trois guillemets `"""` :
```python
 class Car:
       """
       La classe Car permet de construire une voiture.

       Param√®tres
       ----------
       color : Cha√Æne de caract√®res : Couleur de la voiture.
       model : Cha√Æne de caract√®res : Mod√®le de la voiture.
       horsepower : Entier : Puissance de la voiture.

       Exemple
       -------
       aventador = Car(color = "orange", model = "Aventador", horsepower = 700)
       """
     def __init__(self, color, model, horsepower):
          self.color = color
          self.model = model
          self.horsepower = horsepower

     def change_color(self, new_color):
         """
          Modifie la couleur d'une voiture.

          Param√®tres
          ----------
          new_color : Cha√Æne de caract√®res : Nouvelle couleur de la voiture.
          """
          self.color = new_color
```

√Ä pr√©sent, lorsqu'un utilisateur a besoin d'aide pour utiliser cette classe, il peut utiliser la fonction **`help`** pour afficher sa documentation :

```python

  help(Car)
   class Car(builtins.object)
    |  Car(color, model, horsepower)
    |  
    |  La classe Car permet de construire une voiture.
    |  
    |  Param√®tres
    |  ----------
    |  color : Cha√Æne de caract√®res : Couleur de la voiture.
    |  model : Cha√Æne de caract√®res : Mod√®le de la voiture.
    |  horsepower : Entier : Cylindr√©e de la voiture.
    |  
    |  Exemple
    |  -------
    |  aventador = Car(color = "orange", model = "Aventador", horsepower = 700)
    |  
    |  Methods defined here:
    |  
    |  __init__(self, color, model, horsepower)
    |      Initialize self.  See help(type(self)) for accurate signature.
    |  
    |  change_color(self, new_color)
    |      Modifie la couleur d'une voiture.
    |      
    |      Param√®tres
    |      ----------
    |      new_color : Cha√Æne de caract√®res : Nouvelle couleur de la voiture.

```

L'int√©r√™t d'une documentation est d'√™tre **lue et comprise par d'autres utilisateurs**.
Elle nous permet aussi de comprendre l'int√©r√™t d'une m√©thode que nous avions d√©finie et dont nous avons oubli√© l'utilit√©.

La documentation est la **premi√®re** ressource √† consulter pour comprendre comment manipuler une classe.
Toutes les classes que vous utiliserez dans votre formation ont des documentations tr√®s compl√®tes. N√©anmoins, elles peuvent √™tre difficiles √† comprendre avec peu d'exp√©rience.

Nous disposons de la liste `u = [1, 9, -3, 3, -5, 4, -4, 7, 3, 4, 5, 0, 8, 7, -1, -3, 7, 6, 0, 2]`.

- **(a)** √Ä l'aide de la fonction **`help`**, trouver une m√©thode de la classe des listes permettant de trier la liste `u` puis afficher `u` tri√©e.
- **(b)** Trouver une m√©thode permettant de supprimer tous les √©l√©ments de la liste `u`.

In [10]:
u = [1, 9, -3, 3, -5, 4, -4, 7, 3, 4, 5, 0, 8, 7, -1, -3, 7, 6, 0, 2]

# On peut afficher la documentation d'une classe √† partir d'une instance
help(u)

# A
u.sort()
print(u)

# B
u.clear()
print(u)

Help on list object:

class list(object)
 |  list(iterable=(), /)
 |  
 |  Built-in mutable sequence.
 |  
 |  If no argument is given, the constructor creates a new empty list.
 |  The argument must be an iterable if specified.
 |  
 |  Methods defined here:
 |  
 |  __add__(self, value, /)
 |      Return self+value.
 |  
 |  __contains__(self, key, /)
 |      Return key in self.
 |  
 |  __delitem__(self, key, /)
 |      Delete self[key].
 |  
 |  __eq__(self, value, /)
 |      Return self==value.
 |  
 |  __ge__(self, value, /)
 |      Return self>=value.
 |  
 |  __getattribute__(self, name, /)
 |      Return getattr(self, name).
 |  
 |  __getitem__(...)
 |      x.__getitem__(y) <==> x[y]
 |  
 |  __gt__(self, value, /)
 |      Return self>value.
 |  
 |  __iadd__(self, value, /)
 |      Implement self+=value.
 |  
 |  __imul__(self, value, /)
 |      Implement self*=value.
 |  
 |  __init__(self, /, *args, **kwargs)
 |      Initialize self.  See help(type(self)) for accurate sign

## **3. Les Modules**
Un module (aussi connu sous le nom *package* ou *librairie*) est un fichier Python contenant des d√©finitions de classes et de fonctions.

Les modules permettent de r√©utiliser des fonctions d√©j√† √©crites sans avoir √† les copier.

Les modules sont facilement partageables et en g√©n√©ral les modules se sp√©cialisent dans des t√¢ches tr√®s sp√©cifiques comme :

- La manipulation de donn√©es (`pandas`).
- Le calcul optimis√© (`numpy`).
- Le tra√ßage de graphiques (`matplotlib`).
- Le machine learning (`scikit-learn`).
Toutes les t√¢ches de Data Science que vous verrez dans votre formation d√©pendent de modules √©crits par d'autres d√©veloppeurs.
Ces modules font toute la richesse du langage Python et l'absence de ces modules ferait de Python un langage sous-optimal pour la Data Science.

Il existe de nombreux langages de programmation plus performants que Python. N√©anmoins, tant que les modules que nous utilisons ne seront pas disponibles dans ces langages, il sera tr√®s difficile de migrer.

Afin d'importer un module, il faut utiliser le mot-cl√© **`import`** :

```python
  # On importe toute la librairie Numpy
   import numpy
```
Pour utiliser une fonction de ce module, il faut y acc√©der en passant par le module :

```python
   x = 0

   # La fonction 'cos' de numpy permet de calculer le cosinus d'un nombre
   print(numpy.cos(x))
   >>> 1.0
```

Il n'est pas tr√®s pratique de devoir √©crire `numpy` √† chaque fois que nous voulons utiliser une fonction de ce module.
Pour cela, nous pouvons **abr√©ger** son nom √† l'aide du mot cl√© **`as`** :

```python

 # On importe numpy et on abr√®ge son nom avec 'np'
   import numpy as np

   x = 0
   print(np.cos(x))
   >>> 1.0

```
On dit que `np` est l'alias de `numpy`.

Cette pratique est tr√®s souvent utilis√©e. Dans le reste de votre formation, vous verrez tr√®s souvent les instructions :

```python
import numpy as np
   import pandas as pd
   import matplotlib.pyplot as plt
```

Si on ne souhaite pas importer le module enti√®rement, il est possible de n'importer que quelques fonctions ou classes du module √† l'aide du mot-cl√© **`from`** :

```python
  # On n'importe que les fonctions cos, sin et exp du module numpy
   from numpy import cos, sin, exp
```

- **(a)** Importer la fonction **`load_boston`** du module **`sklearn.datasets`**.
- **(b)** Dans une variable nomm√©e `boston_dataset`, stocker ce que renvoie la fonction `load_boston` lorsqu'elle est lanc√©e sans arguments. De quel type est cette variable ?

In [17]:
# A
from sklearn.datasets import fetch_openml

# B
boston_dataset = fetch_openml(data_id=43465)
print(type(boston_dataset))

<class 'sklearn.utils._bunch.Bunch'>


La variable `boston_dataset` se comporte comme un **dictionnaire**.
On rappelle qu'un dictionnaire est une structure de donn√©es o√π les donn√©es sont index√©es par des cl√©s. Pour acc√©der √† une cl√© d'un dictionnaire, il suffit de renseigner la cl√© entre crochets :

```python
un_dictionnaire['cl√©']
```

Le dictionnaire `boston_dataset` contient 4 cl√©s :

- `'data'` : Le jeu de donn√©es immobilier de Boston. Il contient des caract√©ristiques sur des biens immobiliers.
- `'target'` : Le prix de ces biens immobiliers. L'objectif du jeu de donn√©es est de d√©terminer le prix de vente d'un bien immobilier en fonction de ses caract√©ristiques.
- `'feature_names'` : Les noms donn√©s aux caract√©ristiques des biens immobiliers.
- `'DESCR'` : Un texte qui d√©crit le jeu de donn√©es et ses variables.

- **(c)** Dans une variable `X`, stocker la valeur associ√©e √† la cl√© **`'data'`** du dictionnaire `boston_dataset`.
- **(d)** Dans une variable `feature_names`, stocker la valeur associ√©e √† la cl√© **`'feature_names'`** du dictionnaire `boston_dataset`.

In [18]:
# C
X = boston_dataset['data']

# D
feature_names = boston_dataset['feature_names']

>Nous allons maintenant instancier un objet de la classe `DataFrame` qui est tr√®s utile pour visualiser et traiter des jeux de donn√©es.

- **(e)** Importer le module `pandas` sous l'alias **`pd`**.
- **(f)** Instancier un objet de la classe `DataFrame` √† l'aide du constructeur `pd.DataFrame()`. Cet objet sera nomm√© **`df`** et les arguments du constructeur seront **`data = X, columns = feature_names`**.
- **(g)** Afficher les 10 premi√®res lignes du `DataFrame` `df` en appelant sa **m√©thode** **`head`** avec l'argument **`n = 10`**.

In [19]:
# E
import pandas as pd

# F
df = pd.DataFrame(data = X, columns = feature_names)

# G
df.head(n = 10)

Unnamed: 0,CRIM,ZN,INDUS,CHAS,NOX,RM,AGE,DIS,RAD,TAX,PTRATIO,B,LSTAT
0,0.00632,18.0,2.31,0.0,0.538,6.575,65.2,4.09,1.0,296.0,15.3,396.9,4.98
1,0.02731,0.0,7.07,0.0,0.469,6.421,78.9,4.9671,2.0,242.0,17.8,396.9,9.14
2,0.02729,0.0,7.07,0.0,0.469,7.185,61.1,4.9671,2.0,242.0,17.8,392.83,4.03
3,0.03237,0.0,2.18,0.0,0.458,6.998,45.8,6.0622,3.0,222.0,18.7,394.63,2.94
4,0.06905,0.0,2.18,0.0,0.458,7.147,54.2,6.0622,3.0,222.0,18.7,396.9,5.33
5,0.02985,0.0,2.18,0.0,0.458,6.43,58.7,6.0622,3.0,222.0,18.7,394.12,5.21
6,0.08829,12.5,7.87,0.0,0.524,6.012,66.6,5.5605,5.0,311.0,15.2,395.6,12.43
7,0.14455,12.5,7.87,0.0,0.524,6.172,96.1,5.9505,5.0,311.0,15.2,396.9,19.15
8,0.21124,12.5,7.87,0.0,0.524,5.631,100.0,6.0821,5.0,311.0,15.2,386.63,29.93
9,0.17004,12.5,7.87,0.0,0.524,6.004,85.9,6.5921,5.0,311.0,15.2,386.71,17.1


Vous venez d'importer et afficher votre premier jeu de donn√©es √† l'aide des modules `sklearn.datasets` et `pandas`.

Comme vous le verrez dans la suite de votre formation, la classe `DataFrame` de `pandas` est une classe beaucoup plus pratique que la classe des listes ou des dictionnaires pour manipuler des donn√©es tabulaires.
C'est un des outils fondamentaux de l'analyse de donn√©es avec Python.

## **Conclusion**

Vous avez √† pr√©sent acquis les bases de Python.
Vous pourrez d√©sormais d√©couvrir les excellents modules disponibles sur Python.

La suite de votre formation portera sur l'introduction et l'approfondissement de modules sp√©cialis√©s pour la Data Science.
Ceci vous donnera les meilleurs outils existants pour le traitement et l'analyse de donn√©es et vous permettra de mener √† bien vos projets data.