# Programmation Orientée Objet 
## Les classes 
### Introduction et pré-requis
En Python et dans de nombreux autres langages de programmation, la programmation orientée objet consiste à créer des classes d’objets qui contiennent des informations spécifiques et des outils adaptés à leur manipulation.

Tous les outils que nous utilisons pour faire de la data science (DataFrames, modèles de scikit-learn, matplotlib,...) sont construits de cette manière. Comprendre les mécaniques des objets Python et savoir les utiliser est essentiel pour pouvoir exploiter toutes les fonctionnalités de ces outils bien pratiques.

De plus, la programmation orientée objet donne au développeur la flexibilité de réadapter un objet à ses besoins grâce à la notion d'héritage que nous verrons en deuxième partie. En effet, cette technique est très utilisée pour développer des packages tels que scikit-learn qui permettent à un utilisateur de développer et évaluer facilement les modèles dont il a besoin.

Pour aborder ces modules dans les meilleures conditions, il est important d'avoir fait le module d'introduction à la programmation Python.

### Les Classes
En Python, une classe est définie de la manière suivante:

In [1]:
class Vehicule: # définition de la classe Vehicule
   def __init__(self, a, b = []):
       self.seats = a  # nombre de places dans le vehicule  
       self.passengers = b  #liste contenant le nom des passagers
   def print_passengers(self):
       for i in range(len(self.passengers)):
           print(self.passengers[i])

voiture1= Vehicule(4, ['Pierre','Adrian']) # déclaration d'un objet de la classe Vehicule

Le code ci-dessus correspond à la définition d'une classe nommée Vehicule qui contient 2 informations: le nombre de places du Vehicule dans la variable seats et les noms des passagers à bord du Vehicule dans la variable passengers.

Cette classe contient une méthode print_passengers qui permet d’afficher les noms des passagers à bord dans la console.

L'instruction voiture1 = Vehicule(4, ['Pierre', 'Adrian']) correspond à une instanciation de la classe Vehicule.

**Remarques et définitions importantes**
- Vehicule est une classe d'objets.
- voiture1 est une instance de la classe Vehicule
- seats et passengers sont appelés les attributs ou membres de la classe Vehicule
- Les fonctions définies dans la classe Vehicule comme print_passengers et __init__ sont appelées les méthodes de la classe Vehicules
- La méthode __init__ prend en argument les variables qui définiront les attributs d’une instance lors de sa création.  

     - La méthode init est automatiquement appelée lors de l’instanciation de n’importe quelle classe.   
       Toutes les méthodes définies au sein d’une classe ont comme premier paramètre l’argument self. Ce paramètre sert à préciser à la méthode l’instance qui l’a appelée.   
       
En vous inspirant de la classe Vehicule définie ci-dessus :

- Définir une nouvelle classe Complexe à 2 attributs:
- partie_re qui contient la partie réelle du Complexe
- partie_im qui contient la partie imaginaire Complexe
- Définir dans la classe Complexe une méthode afficher qui permet d'afficher un Complexe sous sa forme algébrique a ± bi.    

Il faudra adapter cette méthode au signe de la partie imaginaire (L'affichage devrait donner 4 - 2i, 6 + 2,5i).

- Instancier deux Complexe correspondant au nombres complexes  4+5i  et  3−2i  puis les afficher sur la console.

In [2]:
class Complexe:
    def __init__(self, partie_re, partie_im):
        self.partie_re = partie_re
        self.partie_im = partie_im
    def afficher_z(self):
        if self.partie_im < 0:
            print(self.partie_re," - ",-self.partie_im,"i")    # le - devant self transforme la partie_im en +, et avec le - du print c'est OK !
        elif self.partie_im > 0:
            print(self.partie_re," + ",self.partie_im,"i")
        else:
            print(self.partie_re)
        
z = Complexe(-2, -1.3)
z.afficher_z()


-2  -  1.3 i


- Une fois qu'un objet d'une classe est instancié, il est possible d'acceder à ses attributs et méthodes en utilisant les commandes .attribut et .methode() comme ci-dessous:

In [3]:
class Vehicule:
    def __init__(self, a, b=[]):
        self.seats = a
        self.passengers = b
    def print_passengers(self):
        for i in range(len(self.passengers)):
            print(self.passengers[i])



#Lancez la cellule. Vous pouvez modifier l'instanciation pour faire apparaître les modifications.
voiture2 = Vehicule(4,['Dimitri', 'Charles', 'Yohan'])

print(voiture2.seats)          # Affichage de l'attribut seats
voiture2.print_passengers()    # Execution de la méthode print_passengers

4
Dimitri
Charles
Yohan


La flexibilité des classes en programmation orientée objet permet au développeur d'enrichir une classe en lui ajoutant de nouveaux attributs et méthodes. Toutes les instances de cette classe pourront ensuite faire appel à ces méthodes. Par exemple, nous pouvons définir dans la classe Vehicule une nouvelle méthode add qui ajoutera un individu dans la liste des passagers:

In [4]:
  class Vehicule:
       def __init__(self, a, b=[]):
           self.seats = a
           self.passengers = b
       def print_passengers(self):
           for i in range(len(self.passengers)):
               print(self.passengers[i])


       def add(self,name): #Nouvelle méthode
           self.passengers.append(name)

En Python, une liste est une instance de la classe prédéfinie list.    
Ainsi, l'appel de la méthode append se fait de la même façon que l'appel d'une méthode de la classe Vehicule ou Complexe.

In [5]:
class Vehicule:
    def __init__(self, a, b=[]):
        self.seats = a
        self.passengers = b
    
    def print_passengers(self):
        for i in range(len(self.passengers)):
            print(self.passengers[i])
    
    def add(self,name): #Nouvelle méthode
        self.passengers.append(name)
        

voiture1 = Vehicule(4, ['Charles', 'Paul']) #declaration de l'instance voiture1
voiture1.add('Raphaël')                     #ajout de 'Raphaël' dans la liste des passagers

voiture1.print_passengers()                 #affichage de la liste des passagers dans la console


Charles
Paul
Raphaël


- Définir dans la classe Complexe une méthode add qui prend en paramètre un Complexe et le somme à l'instance appelant la méthode. Le résultat de cette somme sera stocké dans les attributs du Complexe appelant la méthode.
- Tester la nouvelle méthode add sur deux instances de la classe Complexe et afficher leur somme sur la console.

In [6]:
class Complexe:
    def __init__(self, a, b):
        self.partie_re = a
        self.partie_im = b
    def afficher(self):
        if(self.partie_im < 0):
            print(self.partie_re,'-', -self.partie_im,'i')
        if(self.partie_im == 0):
            print(self.partie_re)
        if(self.partie_im > 0):
            print(self.partie_re, '+',self.partie_im,'i')
    def add(self , c):
        self.partie_re = self.partie_re + c.partie_re
        self.partie_im = self.partie_im + c.partie_im
        

z1 = Complexe(2, 3)
z2 = Complexe(-1, 1)

z1.add(z2)
z1.afficher()

1 + 4 i


## L'héritage
L’héritage consiste à créer une sous-classe à partir d’une classe existante. On dit que cette nouvelle classe hérite de la première car elle aura automatiquement les mêmes attributs et méthodes.

De plus, il est possible d’ajouter des attributs ou des méthodes qui seront spécifiques à cette sous-classe.

Dans la première partie de ce module, nous avons introduit la classe Vehicule définie ainsi:

In [7]:
class Vehicule: 
    def __init__(self, a, b = []):
        self.seats = a   
        self.passengers = b  
    def print_passengers(self):
        for i in range(len(self.passengers)):
            print(self.passengers[i])
    def add(self,name):
            self.passengers.append(name)

Nous pouvons définir une classe Moto qui hérite de la classe Vehicule de la façon suivante:

In [9]:
class Moto(Vehicule):
    def __init__(self, b, c):
        self.seats = 2
        self.passengers = b
        self.brand = c
        
moto1 = Moto(['Pierre','Dimitri'], 'Yamaha')

Grâce à l'héritage, nous pouvons faire appel à la méthode print_passengers définie dans la classe Vehicule sur une instance de la classe Moto.

Lancez les cases suivantes pour vous en convaincre.

In [10]:
class Vehicule: # définition de la classe Vehicule
    def __init__(self, a, b = []):
        self.seats = a  # nombre de places dans le vehicule  
        self.passengers = b  # liste contenant le nom des passagers
    
    def print_passengers(self): # Affiche le nom de tous les passagers présents dans le véhicule
        for i in range(len(self.passengers)):
            print(self.passengers[i])
    
    def add(self,name): # Ajoute un nouveau passager dans la liste des passagers du véhicule
            self.passengers.append(name)
    
class Moto(Vehicule):
    def __init__(self, b, c):
        self.seats = 2      # Le nombre de sièges est automatiquement initialisé à 2 et n'est pas modifié par les
                            # arguments passés en paramètres.
        self.passengers = b 
        self.brand = c

moto1 = Moto(['Pierre','Dimitri'], 'Yamaha')
moto1.add('Yohann')
moto1.print_passengers()

Pierre
Dimitri
Yohann


Définir dans la classe Moto une méthode add qui ajoutera un nom passé en argument dans la liste des passagers en vérifiant qu'il reste des places disponibles. S'il ne reste pas de places sur la Moto, elle affichera Le véhicule est rempli. S'il en reste, la méthode ajoutera le nom à la liste et affichera le nombre de places restantes.

In [12]:
class Moto(Vehicule):
    def __init__(self, b, c):
        self.seats = 2
        self.passengers = b
        self.brand = c
        
    def add(self, name):
        if( len(self.passengers) <  self.seats):
            self.passengers.append(name)
            print('Il reste', self.seats - len(self.passengers), 'places')
        else:
            print("Le véhicule est rempli")


Quel est l'affichage de l'instruction Moto2.print_passengers()?:

- A : Guillaume Charles Dimitri
- B : Guillaume Charles
- C : Le véhicule est rempli

In [15]:
voiture2 = Vehicule(3 , ['Antoine', 'Thomas', 'Raphaël'])
Moto2 = Moto(['Guillaume', 'Charles'] , 'Honda')
voiture2.add('Benjamin')
Moto2.add('Dimitri')

Le véhicule est rempli


In [16]:
Moto2.print_passengers()

Guillaume
Charles


In [None]:
# widget pour poser cette question et doner la réponse !!!

In [17]:
import ipywidgets as widgets
from IPython.display import display, Markdown
from ipywidgets import VBox, Layout

Question1 = widgets.ToggleButtons(
    options=['Reponse A', 'Reponse B', 'Reponse C'],
   # description='Choisir:',
    disabled=False,
    button_style='success', # 'success', 'info', 'warning', 'danger' or ''
    tooltips=['Reponse A', 'Reponse B', 'Reponse C'],
    value=None
#     icons=['check'] * 3
)

Reponse1_A = "<div class='alert alert-danger'>&#10008;&emsp;Faux : La méthode add de la classe <code style = 'background-color: transparent ; color : inherit'>Moto</code> n'ajoute pas d'individu dans la liste des passagers s'il ne reste plus de place, contrairement à la méthode add de la classe <code style = 'background-color: transparent ; color : inherit'>Vehicule</code>.</div>"
Reponse1_B = "<div class='alert alert-success'>&#10004;&emsp;Correct ! En effet, lorsque l'instruction <code style = 'background-color: transparent ; color : inherit'>Moto2.add('Dimitri')</code> est lancée, elle n'ajoute pas 'Dimitri' dans la liste des passagers puisqu'il ne reste plus de place. </div>"
Reponse1_C = "<div class='alert alert-danger'>&#10008;&emsp;Faux : La méthode <code style = 'background-color: transparent ; color : inherit'>print_passengers</code> n'affiche en aucun cas <code style = 'background-color: transparent ; color : inherit'>Le véhicule est rempli</code>.</div>"

output_question_1 = widgets.Output()
output_question_1.layout = Layout( height='100px')
#output.append_display_data(Markdown(''))
output_question_1.append_stdout('')

def update_output_question_1(change):
    output_question_1.clear_output()
    if(change['new'] == 'Reponse A'):
        output_question_1.append_display_data(Markdown(Reponse1_A))
    if(change['new'] == 'Reponse B'):
        output_question_1.append_display_data(Markdown(Reponse1_B))
    if(change['new'] == 'Reponse C'):
        output_question_1.append_display_data(Markdown(Reponse1_C))

    
    
Question1.observe(update_output_question_1, 'value')

QCM1 = VBox(children = [Question1, output_question_1])
display(QCM1)

VBox(children=(ToggleButtons(button_style='success', options=('Reponse A', 'Reponse B', 'Reponse C'), tooltips…

Quel est l'affichage de l'instruction print(voiture2.seats)?
- A : Antoine Thomas Raphael Benjamin
- B : 4
- C : Le véhicule est rempli
- D : 3

In [18]:
print(voiture2.seats)

3


In [19]:
# widget pour cette question et réponse !!!

Question2 = widgets.ToggleButtons(
    options=['Reponse A', 'Reponse B', 'Reponse C','Reponse D'],
   # description='Choisir:',
    disabled=False,
    button_style='success', # 'success', 'info', 'warning', 'danger' or ''
    tooltips=['Reponse A', 'Reponse B', 'Reponse C','Reponse D'],
    value = None
#     icons=['check'] * 3
)

Reponse2_A = "<div class='alert alert-danger'>&#10008;&emsp;Faux : L'attribut <code style = 'background-color: transparent ; color : inherit'>seats</code> est un entier qui contient le nombre de places dont dispose le véhicule. Il ne contient pas la liste des passagers.</div>"
Reponse2_B = "<div class='alert alert-danger'>&#10008;&emsp;Faux : L'instance <code style = 'background-color: transparent ; color : inherit'>voiture2</code> a été initialisé avec seulement 3 places. L'attribut <code style = 'background-color: transparent ; color : inherit'>seats</code> reste inchangé.</div>"
Reponse2_C = "<div class='alert alert-danger'>&#10008;&emsp;Faux : Cet output correspond à celui de la méthode <code style = 'background-color: transparent ; color : inherit'>add</code> qui n'est pas l'instruction appelée dans cette question.</div>"
Reponse2_D = "<div class='alert alert-success'>&#10004;&emsp;Correct ! En effet, l'attribut <code style = 'background-color: transparent ; color : inherit'>seats</code> de l'instance <code style = 'background-color: transparent ; color : inherit'>voiture2</code> a été initialisé avec la valeur 3. Cette valeur reste inchangée.</div>"
output_question_2 = widgets.Output()
output_question_2.layout = Layout( height='100px')
#output.append_display_data(Markdown(''))
output_question_2.append_stdout('')
def update_output_question_2(change):
    output_question_2.clear_output()
    if(change['new'] == 'Reponse A'):
        output_question_2.append_display_data(Markdown(Reponse2_A))
    if(change['new'] == 'Reponse B'):
        output_question_2.append_display_data(Markdown(Reponse2_B))
    if(change['new'] == 'Reponse C'):
        output_question_2.append_display_data(Markdown(Reponse2_C))
    if(change['new'] == 'Reponse D'):
        output_question_2.append_display_data(Markdown(Reponse2_D))

Question2.observe(update_output_question_2, 'value')

QCM2 = VBox(children = [Question2, output_question_2])
display(QCM2)

VBox(children=(ToggleButtons(button_style='success', options=('Reponse A', 'Reponse B', 'Reponse C', 'Reponse …

Pourquoi l'instruction voiture3 = Vehicule(4) est bien écrite mais l'instruction moto3 = Moto(6) renvoie une erreur?:
- A : Une Moto ne peut pas avoir 6 places.
- B : Le constructeur de la classe Voiture ne prend qu'un argument en paramètre.
- C : Il manque un argument à l'initialisation de l'instance moto3.

In [20]:
Question3=widgets.ToggleButtons(
    options=['Reponse A', 'Reponse B', 'Reponse C'],
   # description='Choisir:',
    disabled=False,
    button_style='success', # 'success', 'info', 'warning', 'danger' or ''
    tooltips=['Reponse A', 'Reponse B', 'Reponse C'],
    value = None
#     icons=['check'] * 3
)

Reponse3_A = "<div class='alert alert-danger'>&#10008;&emsp;Faux : Le premier argument passé en paramètre lors de l'instanciation d'un objet de la classe <code style = 'background-color: transparent ; color : inherit'>Moto</code> devrait être la liste des noms des passagers. Comme le type de l'attribut <code style = 'background-color: transparent ; color : inherit'>passengers</code> n'est pas défini, il est donc possible de passer n'importe quel type d'argument en paramètre du constructeur sans que Python ne renvoie une erreur.</div>"
Reponse3_B = "<div class='alert alert-danger'>&#10008;&emsp;Faux : Le constructeur de la classe <code style = 'background-color: transparent ; color : inherit'>Voiture</code> prend 2 paramètres, mais le paramètre <code style = 'background-color: transparent ; color : inherit'>b</code> s'initialise par défaut avec une liste vide lorsque l'argument n'est pas renseigné. Il est donc possible d'initialiser une instance de la classe <code style = 'background-color: transparent ; color : inherit'>Voiture</code> avec 1 seul argument.</div>"
Reponse3_C = "<div class='alert alert-success'>&#10004;&emsp;Correct ! En effet, le constructeur de la classe <code style = 'background-color: transparent ; color : inherit'>Moto</code> prend 2 arguments en paramètre dont aucun de dispose de valeur par défaut. Le constructeur ne parvient pas à créer l'instance.</div>"
output_question_3 = widgets.Output()
output_question_3.layout = Layout( height='100px')
#output.append_display_data(Markdown(''))
output_question_3.append_stdout('')
def update_output_question_3(change):
    output_question_3.clear_output()
    if(change['new'] == 'Reponse A'):
        output_question_3.append_display_data(Markdown(Reponse3_A))
    if(change['new'] == 'Reponse B'):
        output_question_3.append_display_data(Markdown(Reponse3_B))
    if(change['new'] == 'Reponse C'):
        output_question_3.append_display_data(Markdown(Reponse3_C))

    
    
Question3.observe(update_output_question_3, 'value')

QCM3 = VBox(children = [Question3, output_question_3])
display(QCM3)

VBox(children=(ToggleButtons(button_style='success', options=('Reponse A', 'Reponse B', 'Reponse C'), tooltips…

- Créer une classe Convoi qui contiendra 2 attributs: Le premier, nommé vehicule_list est une liste d'instances de type Vehicule et le deuxième length est le nombre total de véhicules dans le Convoi. Un convoi sera automatiquement initialisé avec 1 véhicule de 4 places sans passagers.
- Définir dans la classe Convoi une méthode add_vehicule qui ajoutera un objet de type Vehicule à la fin de la liste des véhicules du convoi. Il ne faudra pas oublier de mettre à jour la longueur du convoi.

In [21]:
class Convoi:
    def __init__(self):
        self.vehicule_list = []   # initialisation de l'attribut vehicule_list avec une liste vide       
        self.vehicule_list.append(Vehicule(4))
        self.length = 1  # initialisation de l'attribut length à 1.
    
    def add_vehicule(self, vehicule):
        self.vehicule_list.append(vehicule) # ajout du vehicule en fin de liste
        self.length = self.length + 1 # mise à jour de la longueur du convoi

- Initialiser une instance convoi1 de la classe Convoi.
- Ajoutez le passager "Albert" dans le premier véhicule de l'instance convoi1.
- Ajoutez une moto de marque "Honda" à convoi1 qui sera conduite par "Raphael".

In [22]:
convoi1 = Convoi() # Initialisation du convoi

convoi1.vehicule_list[0].add('Albert') # Ajout de "Albert" dans le premier véhicule du convoi

convoi1.add_vehicule(Moto(['Raphael'] , 'Honda')) # Il ne faut pas oublier que le premier paramètre du constructeur
                                                    # de la classe Vehicule est une liste et non une chaîne de caractères

- Ecrire un petit script qui affichera tous les passagers dans convoi1.

In [24]:
for vehicule in convoi1.vehicule_list: # On parcourt la liste de véhicules du convoi
    vehicule.print_passengers() # On utilise la méthode print_passengers de la classe Vehicule.

Albert
Raphael


## Les classes prédéfinies 
En Python, de nombreuses classes prédéfinies telles que les classes list, tuple ou str sont régulièrement utilisées pour faciliter les tâches du développeur. Comme toutes les autres classes, elles disposent de leurs propres attributs et méthodes qui sont à la disposition de l'utilisateur.

Un des grands intérêts de la programmation orientée objet est de pouvoir créer des classes et les partager avec d'autres développeurs. Ceci se fait grâce à des packages tels que numpy, pandas ou scikit-learn. Tous ces packages sont en fait des classes créées par d'autres développeurs de la communauté Python afin de nous donner des outils qui faciliteront le développement de nos propres algorithmes.

Nous allons dans un premier temps aborder l'une des classes d'objets prédéfinies les plus importantes, la classe list, afin d'apprendre à l'exploiter au maximum de ses capacités.
Ensuite, nous introduirons brièvement la classe DataFrame du package pandas et apprendrons à identifier et manipuler ses méthodes.

### La classe list
Utiliser la commande dir(list) pour afficher tous les attributs et méthodes de la classe list.

In [25]:
dir(list)

['__add__',
 '__class__',
 '__class_getitem__',
 '__contains__',
 '__delattr__',
 '__delitem__',
 '__dir__',
 '__doc__',
 '__eq__',
 '__format__',
 '__ge__',
 '__getattribute__',
 '__getitem__',
 '__gt__',
 '__hash__',
 '__iadd__',
 '__imul__',
 '__init__',
 '__init_subclass__',
 '__iter__',
 '__le__',
 '__len__',
 '__lt__',
 '__mul__',
 '__ne__',
 '__new__',
 '__reduce__',
 '__reduce_ex__',
 '__repr__',
 '__reversed__',
 '__rmul__',
 '__setattr__',
 '__setitem__',
 '__sizeof__',
 '__str__',
 '__subclasshook__',
 'append',
 'clear',
 'copy',
 'count',
 'extend',
 'index',
 'insert',
 'pop',
 'remove',
 'reverse',
 'sort']

- Utiliser la commande help(list) pour afficher la documentation de la classe list.   Cette documentation vous sera utile pour comprendre l'utilisation des méthodes d'une classe.

In [26]:
help(list)

Help on class list in module builtins:

class list(object)
 |  list(iterable=(), /)
 |  
 |  Built-in mutable sequence.
 |  
 |  If no argument is given, the constructor creates a new empty list.
 |  The argument must be an iterable if specified.
 |  
 |  Methods defined here:
 |  
 |  __add__(self, value, /)
 |      Return self+value.
 |  
 |  __contains__(self, key, /)
 |      Return key in self.
 |  
 |  __delitem__(self, key, /)
 |      Delete self[key].
 |  
 |  __eq__(self, value, /)
 |      Return self==value.
 |  
 |  __ge__(self, value, /)
 |      Return self>=value.
 |  
 |  __getattribute__(self, name, /)
 |      Return getattr(self, name).
 |  
 |  __getitem__(...)
 |      x.__getitem__(y) <==> x[y]
 |  
 |  __gt__(self, value, /)
 |      Return self>value.
 |  
 |  __iadd__(self, value, /)
 |      Implement self+=value.
 |  
 |  __imul__(self, value, /)
 |      Implement self*=value.
 |  
 |  __init__(self, /, *args, **kwargs)
 |      Initialize self.  See help(type(self))

- Les commandes dir et help sont les premières commandes à lancer lorsque vous ne comprenez pas comment utiliser une méthode d'une classe ou lorsque vous ne vous souvenez plus du nom d'une méthode.
- À l'aide des commandes dir et help, trouver une méthode qui va inverser l'ordre des éléments de la liste liste_1.

In [27]:
liste_1 = [1, 2, 3, 4, 5, 6, 7, 8, 9]

liste_1.reverse() # inverse l'ordre des éléments de la liste. Cette méthode MODIFIE la liste qui l'a appelée.

liste_1

[9, 8, 7, 6, 5, 4, 3, 2, 1]

- À l'aide des commandes dir et help, trouver une méthode qui va insérer la valeur 10 en cinquième position de la liste liste_2.

In [28]:
liste_2 = [1, 2, 3, 4, 5, 6, 7, 8, 9]

liste_2.insert(4, 10) # insère l'entier 10 à l'indice 4 (cinquième position) de la liste.

liste_2

[1, 2, 3, 4, 10, 5, 6, 7, 8, 9]

- À l'aide des commandes dir et help, trouver une méthode qui va trier la liste liste_3.

In [29]:
liste_3 = [5, 2, 4, 9, 6, 7, 8, 3, 10, 1]

liste_3.sort() # trie les éléments de la liste par ordre croissant. Cette méthode MODIFIE la liste qui l'a appelée.

liste_3

[1, 2, 3, 4, 5, 6, 7, 8, 9, 10]

### La classe DataFrame
Le package pandas contient une classe nommée DataFrame dont l'utilité en fait le package le plus utilisé par les datascientists pour manipuler des données.

Pour utiliser le package pandas, il faut d'abord l'importer. Ensuite, pour instancier un DataFrame, il faut appeler son constructeur défini dans le package pandas.

- Importer le package pandas sous l'alias pd.
- Instancier un DataFrame vide grâce au constructeur contenu dans le package pandas. Ce DataFrame portera le nom df.

In [31]:
import pandas as pd
df = pd.DataFrame()  # création d'un df vide

Si vous lancez l'instruction dir(df) ou dir(pd.DataFrame), vous verrez que la classe DataFrame possède énormément de méthodes et attributs. Il est très difficile de tous les retenir, d'où l'utilité des commandes dir et help.

Néanmoins, au vu de la longueur de la documentation, il n'est pas pratique d'utiliser directement la commande dir(df) ou help(df). Pour avoir accès directement à la documentation d'une méthode spécifique, vous pouvez plutôt utiliser la commande dir avec l'argument objet.nom_methode.

- En vous aidant de la commande help(pd.DataFrame), construire un DataFrame nommé df1 grâce à la liste liste_4.

In [34]:
# help(df)  => très longue aide

In [37]:
liste_4 = [1, 5, 45, 42,None, 123, 4213 ,None, 213]
df1 = pd.DataFrame(liste_4)
df1

Unnamed: 0,0
0,1.0
1,5.0
2,45.0
3,42.0
4,
5,123.0
6,4213.0
7,
8,213.0


En affichant la DataFrame df1, vous pouvez apercevoir que certaines de ses valeurs sont affectées à NaN. En pratique, cela arrive très souvent lorsque la base de données est brute. La classe DataFrame contient une méthode très simple pour se débarasser de ces valeurs manquantes : la méthode dropna.

     - Contrairement aux méthodes de la classe list, les méthodes de la classe DataFrame ne modifient pas l'instance appelant la méthode. Ces méthodes renvoient une nouvelle DataFrame sur laquelle la méthode sera appliquée. Il faudra systématiquement stocker cette nouvelle DataFrame pour conserver le résultat de la méthode.
- En utilisant la méthode dropna de la classe DataFrame, créer une nouvelle DataFrame nommée df2 qui ne contiendra pas de valeurs manquantes.

In [40]:
df2 = df1.dropna(axis=1)  # bizarre qu'avec axis=1 cela élimine la colonne entiere !!!
print(df2.shape)
print(df2.head(10))
df2

(9, 0)
Empty DataFrame
Columns: []
Index: [0, 1, 2, 3, 4, 5, 6, 7, 8]


0
1
2
3
4
5
6
7
8


In [42]:
pd.__version__  # 1.3.0 ici, 1.1.5 chez DS et 2.6.1 normale... !!!

'1.3.0'

In [41]:
df2 = df1.dropna()  # Appel de la méthode dropna de la classe DataFrame
print(df2.shape)
print(df2.head(10))
df2

(7, 1)
        0
0     1.0
1     5.0
2    45.0
3    42.0
5   123.0
6  4213.0
8   213.0


Unnamed: 0,0
0,1.0
1,5.0
2,45.0
3,42.0
5,123.0
6,4213.0
8,213.0


Une autre méthode de la classe DataFrame qui est très utilisée est la **méthode apply**.   
Cette méthode permet d'appliquer une fonction passée en argument à toutes les cases du DataFrame appelant la méthode.

- Définir une fonction divise2 qui retourne la division par 2 de l'argument passé en paramètre.
- Créer un DataFrame nommé df3 qui contiendra les valeurs de df2 que l'on aura divisé par 2.

In [43]:
def divise2(x):   # Définition de la fonction que nous allons appliquer aux cellules du DataFrame
    return x/2

df3 = df2.apply(divise2)  # Application de la fonction divise2 à toutes les cellules du DataFrame

df3

Unnamed: 0,0
0,0.5
1,2.5
2,22.5
3,21.0
5,61.5
6,2106.5
8,106.5


La classe DataFrame possède de nombreuses méthodes comme apply ou dropna que vous aborderez plus en profondeur dans le module dédié au package pandas. La classe list étant trop basique pour les besoins des datascientists, ces méthodes font de la classe DataFrame la référence pour manipuler facilement des données.

Tous les packages que vous serez invités à utiliser dans votre formation seront manipulés comme des objets, c'est-à-dire qu'il faudra d'abord initialiser un objet de la classe (DataFrame, Scikit Model, Python Plot, ...) puis faire appel aux méthodes définies dans la classe.

Les commandes dir et help vous accompagneront dans la manipulation de ces classes. N'oubliez pas de les utiliser régulièrement!

## Built-in methods 
### Les méthodes prédéfinies
Les classes définies en Python ont des méthodes dont le nom est déja défini. Le premier exemple de méthode de ce type que nous avons vu est la méthode __init__ qui permet d'initialiser un objet, mais ce n'est pas la seule.

Ces méthodes donnent à la classe la possibilité d'interagir avec des fonctions Python prédéfinies telles que print, len, help et les opérateurs de bases. Ces méthodes ont en général les affixes __ au début et à la fin de leurs noms, ce qui nous permet de les identifier facilement.

- Grâce à la commande dir(object), nous pouvons avoir un aperçu de quelques méthodes prédéfinies communes à tous les objets Python.

In [44]:
dir(object)

['__class__',
 '__delattr__',
 '__dir__',
 '__doc__',
 '__eq__',
 '__format__',
 '__ge__',
 '__getattribute__',
 '__gt__',
 '__hash__',
 '__init__',
 '__init_subclass__',
 '__le__',
 '__lt__',
 '__ne__',
 '__new__',
 '__reduce__',
 '__reduce_ex__',
 '__repr__',
 '__setattr__',
 '__sizeof__',
 '__str__',
 '__subclasshook__']

## La méthode str
Une des méthodes les plus pratiques est la méthode __str__ qui est appelée automatiquement lorsque l'utilisateur lance la commande print sur un objet. Cette méthode renvoie une chaîne de caractère qui représente l'objet l'ayant appelé.

Toutes les classes en Python sur lesquelles nous pouvons appliquer la fonction print ont cette méthode dans leur définition.

In [45]:
# La classe int
i = 10
i.__str__()

'10'

In [46]:
# La classe list

tab = [1, 2 , 3, 4, 5, 6]
tab.__str__()

'[1, 2, 3, 4, 5, 6]'

Lorsque nous définissons notre propre classe, il est préférable de lui définir une méthode __str__ plutôt qu'une méthode de type afficher comme nous l'avons fait précédemment. Ceci permettra à tous les futurs utilisateurs d'utiliser directement la fonction print pour afficher l'objet sur la console.

Nous allons reprendre la classe Complexe que nous avions défini dans le premier module d'introduction à la programmation orientée objet:

In [47]:
class Complexe:
        def __init__(self, a = 0, b = 0):
            self.partie_re = a        # Initialisation de la partie réelle
            self.partie_im = b        # Initialisation de la partie imaginaire
        def afficher(self):
            if(self.partie_im < 0):
                print(self.partie_re, self.partie_im, 'i')   # Affichage de a - bi si b < 0
            if(self.partie_im == 0):
                print(self.partie_re)                              # Affichage de a si b = 0
            if(self.partie_im > 0):
                print(self.partie_re, '+', self.partie_im, 'i')    # Affichage de a - bi si b < 0

- Définir dans la classe Complexe la méthode __str__ qui doit renvoyer une chaîne de caractères correspondant à la représentation algébrique  a+bia+bi  d'un nombre complexe. Cette méthode remplacera la méthode afficher.   
     - Pour obtenir la représentation en chaîne de caractères d'un nombre, vous pouvez appeler sa méthode str.
- Instancier un Complexe correspondant au nombre  6−3i6−3i  puis l'afficher sur la console à l'aide de la fonction print.

In [48]:
class Complexe:
    def __init__(self, a = 0, b = 0):
        self.partie_re = a
        self.partie_im = b
    
    def __str__(self):
        if(self.partie_im < 0):
            return self.partie_re.__str__() + self.partie_im.__str__() + 'i'  # renvoie 'a' '-b' 'i'
        
        if(self.partie_im == 0):
            return self.partie_re.__str__()    # renvoie 'a'
        
        if(self.partie_im > 0):
            return self.partie_re.__str__() + '+' + self.partie_im.__str__() + 'i' # renvoie 'a' '+' 'b' + 'i'
        
z = Complexe(6, -3)
print(z)

6-3i


## Les méthodes de comparaison
Comme pour les classes int ou float, nous aimerions pouvoir comparer les objets de la classe Complexe entre eux, c'est-à-dire pouvoir utiliser les opérateurs de comparaison (>, <, ==, !=, ...). Pour cela, les développeurs Python ont prévu les méthodes suivantes:

__le__ / __ge__': lesser or equal / greater or equal
__lt__ / __gt__: lesser than / greater than
__eq__ / __ne__ : equals / not equal
- Ces méthodes sont automatiquement appelés lorsque les opérateurs de comparaison sont utilisés et renvoient un booléen (True ou False).

In [49]:
x = 5
y = 3

print(x > y)  # True

print(x.__gt__(y)) # True   
                                # Ces deux types d'écriture sont strictement équivalents
print(x < y) # False

print(x.__lt__(y)) # False

True
True
False
False


- Pour la classe Complexe, nous allons faire la comparaison grâce au module calculé par la formule  |a+bi| = √(a²+b² )
- Définir dans la classe Complexe une méthode mod qui renvoie le module du Complexe appelant la méthode. Vous pourrez utiliser la fonction sqrt du package numpy pour calculer une racine carrée.
- Définir dans la classe Complexe les méthodes __lt__ et __gt__ (strictement inférieur et strictement supérieur). Ces méthodes doivent retourner un booléen.
- Effectuer les deux comparaisons sur les nombres complexes  3+4i  et  2−5i

In [51]:
import numpy as np

class Complexe:
    def __init__(self, a = 0, b = 0):
        self.partie_re = a
        self.partie_im = b
    
    def __str__(self):
        if(self.partie_im < 0):
            return self.partie_re.__str__() + self.partie_im.__str__() + 'i' 
        
        if(self.partie_im == 0):
            return self.partie_re.__str__()    
        
        if(self.partie_im > 0):
            return self.partie_re.__str__() + '+' + self.partie_im.__str__() + 'i' 
        
    def mod(self):
        return np.sqrt( self.partie_re ** 2 + self.partie_im ** 2)  # renvoie (sqrt(a² + b²))
    
    def __lt__(self, other):    
        if( self.mod() < other.mod()):   # renvoie True si |self| < |other|
            return True
        else:
            return False
        
    def __gt__(self, other):
        if( self.mod() > other.mod()):   # renvoie True si |self| > |other|
            return True
        else:
            return False
        
        
z1 = Complexe(3, 4)
z2 = Complexe(2, 5)
print(z1 > z2)
print(z1 < z2)
        

False
True
