# La programmation orientée objet en Python

Nous avons déjà vu les notions de base liées aux classes.

La programmation orientée objet (POO) amène certains avantages par rapport à la programmation procédurale.

- Elle permet d’obtenir un code plus réutilisable. En effet, les types d’objets créés peuvent servir de base pour d’autres objets en ne développant que les évolutions nécessaires.

- Elle offre un code plus compréhensible. En effet, chaque objet va contenir ses propriétés et ses méthodes. Il est donc aisé de voir ce qu’une fonction manipule et à quoi correspondent les variables disponibles.

- Elle amène un code modulaire. En effet, chaque type d’objet ne communique avec les autres types que par des interfaces connues et définies. Cet isolement permet donc de développer facilement d’autres modules pour interagir avec les interfaces déjà utilisées.

## Généralement, on a procédural pour le data scientist et oo pour le développeur

- La POO a pour principal attrait de permettre de proposer une belle API, c’est à dire de créer du code réutilisable et facile à manipuler. 

- Il n’y a rien qu’on puisse faire en POO qu’on ne puisse faire autrement. On va surtout l’utiliser pour donner un style au code.

- En fait, on fait de la POO pour celui qui va utiliser votre code plus tard.

# Procédural != Objet

Paradigme procédural :
- Chaque espace de nom va stocker des variables et des fonctions
- Les données sont stockées dans les variables
- On privilégie les actions par rapport aux données
    - Code = Ensemble de fonctions qui s'échangent des variables et des constantes
    
Paradigme objet :
- Deux catégories d'identificateurs : les instances et les classes
- Les données sont stockées dans des instances
- On privilégie les données par rapport aux actions

Avantage du paradigme objet :
- Regroupement en un seul endroit de l'ensemble des traitements possibles pour une donnée
- Possibilité de réutiliser un objet dans pluseurs applications sans réécriture du code associé
- Construction d'une API plus simple pour l'utilisateur

Inconvénient :
- Une certaine lourdeur de code dans la mise en oeuvre avec une phase de conception plus longue

# Utilisation de l'orienté objet

## Quelques cas classiques

- Construction d'un connecteur pour une base de données
- Construction d'une nouvelle structure de données
- Développement d'une API d'application de nouveaux algorithmes
- Construction d'un outil de scraping web automatisé

## Vous utilisez déjà de la POO lorsque vous utilisez :

- Pandas et Numpy pour la gestion des données
- Scikit-Learn pour l'application de Machine Learning

In [2]:
from sklearn.linear_model import LinearRegression, LogisticRegression

In [3]:
modele_reg = LinearRegression()

In [4]:
modele_logit = LogisticRegression()

In [None]:
modele_logit.fit()
modele_reg.fit()

In [5]:
LinearRegression??

# Bonnes pratiques

Lorsque votre code doit "passer en production" et être industrialisé, l'utilisation d'une POO est plus efficace (même si elle est plus compliqué à mettre en oeuvre).

## Faut-il toujours coder en orienté objet ?

- Si vous êtes développeur pour de l'industrialisation de gros projet, il faut privilégier cette approche
- Si vous êtes data scientist, elle arrive souvent dans un second temps dans une phase de reflexion lors de la pré-industrialisation

Lorsque le projet d'application est clair, l'approche OO s'impose souvent.

# Pourquoi du code développé en OO est-il plus facile à maintenir ?

- La mise en place de tests unitaires est plus simples car les méthodes sont toujours adaptées à un objet spécifique
- On travaille généralement avec des structures similaires dans un projet, on pourra donc utiliser simplement les notions d'héritage et donc factoriser son code (éviter les répétitions inutiles dans différentes parties du code)
- Globalement, une classe est plus facile à documenter qu'une fonction qui est plus souple


# Pourquoi faire de l'orienté objet pour l'industrialisation ?

- C'est l'approche C++ / Java et c'est souvent l'approche privilégié par les développeurs
- Pour des raisons de qualité évoqué plus haut
- Pour simplement créer des API standardisées

# Quelques points supplémentaires

## Attributs de classe, méthodes de classe et méthodes statiques

- attributs de classe : attributs définis en début de classe
- méthodes de classe : méthodes ne travaillent pas sur l'instance `self`. Elle prend comme paramètre `cls`

Pour définir une méthode de classe, on peut utiliser un décorateur spécifique `@classmethod`

- méthodes statiques : méthodes assez proches des méthodes de classe sauf qu'elles ne prennent aucun premier paramètre, ni `self` ni `cls`.

Pour définir une méthode statique, on peut utiliser un décorateur spécifique `@staticmethod`

# Les classes

Nous avons manipuler de nombreux objets de classes variées. Si nous voulons aller plus loin, il va falloir manipuler des classes et savoir les créer.

Une classe est un type permettant de regrouper dans la même structure :
- les informations (champs, propriétés, attributs) relatives à une entité ; 
- les procédures et fonctions permettant de les manipuler (méthodes).

Une classe commence par un constructeur :

In [6]:
class MaClasse:
    
    def __init__(self,nom="Emmanuel",ville="Paris"):
        self.nom= nom
        self.ville=ville
        
    def affiche_client(self):
        print("Ce client s'apelle %s et vit à %s" %(self.nom,self.ville))

Ensuite on peut définir d’autres fonctions dans la classe


On définit ensuite une nouvelle instance et on peut ainsi remplir le nouvel objet


# Les classes

- La programmation orientée objet, c’est un style de programmation qui permet de regrouper au même endroit le comportement (les fonctions) et les données (les structures) qui sont faites pour aller ensemble
- La notion d’objet en Python concerne toutes les structures Python
- L’idée est de créer vos propres objets
- La création d’un objet se fait en deux étapes :
    - Description de l’objet
    - Fabrication de l’objet
- La notion de classe en python représente la description de l’objet
- La deuxième étape se fait uniquement en allouant des informations à l’objet. L’objet obtenu est une instance de la classe


In [7]:
# Une classe va ressembler à :
class MaClasse():
    def __init__(self,val1=0,val2=0):
        self.val1=val1
        self.val2=val2
    
    def methode1(self,param1):
        self.val1+=param1
        print(self.val1)

**Exercice :**
    
Définissez une classe `CompteBancaire()`, qui permette d'instancier des objets tels que `compte1`, `compte2`, etc.

Le constructeur de cette classe initialisera deux attributs d'instance `nom` et `solde`, avec les valeurs par défaut `'A'` et `0`.

Trois autres méthodes sont définies :
- `depot(somme)` permettra d'ajouter une certaine somme au solde
- `retrait(somme)` permettra de retirer une certaine somme du solde
- `affiche()` permettra d'afficher le solde du compte et un message d’alerte en cas de solde négatif. 

# Quelques points supplémentaires
## Utilisation de l'héritage de classe avec pandas

In [8]:
from pandas import DataFrame

class SubclassedDataFrame(DataFrame):

    @property
    def _constructor(self):
        return SubclassedDataFrame
    
    def methode(self):
        return self.mean()
    
    def __str__(self):
        return "Mon DF"

In [10]:
import numpy as np
mon_df=SubclassedDataFrame(data=np.random.random((100,10)))

In [15]:
print(mon_df)

Mon DF


In [16]:
from sklearn.model_selection import train_test_split

In [18]:
train_test_split??

In [17]:
import pandas as pd

In [None]:
pd.read_csv()

In [12]:
type(mon_df)

__main__.SubclassedDataFrame

In [14]:
mon_df.methode()==mon_df.mean()

0    True
1    True
2    True
3    True
4    True
5    True
6    True
7    True
8    True
9    True
dtype: bool

In [25]:
def ma_fonction(**param):
    print(param.values())

In [26]:
ma_fonction(param1=5,param2=6)

dict_values([5, 6])


# Une classe de connexion vers des bases de données

In [1]:
import pymysql

In [4]:
class Connector(object):
    """ Classe de connexion à une base MySQL"""
    
    def __init__(self, host="localhost",
                 user="MyUser",passwd="MyPassword", **autres_arguments):
        self.host = host
        self.user = user
        self.passwd = passwd
        self.create_connection()
        
    def create_connection( self ):
        self.cursor = pymysql.connect(self.host, self.user,self.passwd)
    
    def close_connection( self ):
        self.cursor.close()
    
    def execute( self, sql_statement ):
        self.cursor.Execute( sql_statement )
        return self.cursor.FetchAll()

In [None]:
ma_connexion=Connector(host="",user="")

In [None]:
ma_connexion.execute(...)

# Une classe pour faire du crawling

In [27]:
import requests
from lxml import html

class YellowPage:
    """ Classe pour explorer les pages jaunes """
    URL_TEMPLATE = "https://www.yellowpages.com/search?search_terms={name}&geo_location_terms={state}"

    @classmethod
    def crawl(cls, name, state):
        """ Méthode de classe permettant de renvoyer tous les résultat d'une page de résultat de recherche"""
        page = requests.get(cls.URL_TEMPLATE.format(name=name, state=state)).text
        tree = html.fromstring(page)
        for items in tree.xpath('//div[@class="info"]'):
            name = items.findtext('.//span')
            locality = items.findtext('.//span[@class="locality"]')
            phone = items.findtext('.//div[@class="phones phone primary"]')
            yield (name, locality, phone)

In [28]:
for result in YellowPage.crawl("pizza", "new york"):
    print(result)

(None, None, None)
(None, None, None)
(None, None, None)
("Famous Original Ray's Pizza", 'New York,\xa0', '(212) 956-7297')
("Frankie Boy's Pizza", 'New York,\xa0', '(866) 402-1550')
('Da Noi Midtown Manhattan', 'New York,\xa0', '(347) 955-0067')
('Belmora Pizza & Restaurant', 'New York,\xa0', '(212) 935-2080')
('Famous Famiglia Pizza (Madison)', 'New York,\xa0', '(212) 996-9797')
("Nino's Positano", 'New York,\xa0', '(212) 355-5540')
("Domino's Pizza", 'New York,\xa0', '(212) 222-2000')
('Pizzabolla', 'New York,\xa0', '(212) 586-2000')
('East Broadway Pizza', 'New York,\xa0', '(646) 756-4448')
('La Corsa', 'New York,\xa0', '(212) 860-1133')
('Mj Pizza', 'New York,\xa0', '(212) 996-2866')
('Mariella Pizza', 'New York,\xa0', '(212) 777-1220')
('Columbia Pizza', 'New York,\xa0', '(212) 228-9488')
('Bravo Pizza', 'New York,\xa0', '(212) 253-6090')
('Underground Pizza', 'New York,\xa0', '(212) 425-4442')
('Patzeria Perfect Pizza Inc', 'New York,\xa0', '(212) 575-7646')
('Mariella Pizza', '

# Quelques méthodes particulières (méthodes spéciales)

- `__init__(self, ...)` : le constructeur : méthode d’initialisation nécessairement appelée quand on crée un objet. 
- `__del__(self)` : le destructeur, appelé quand une instance est sur le point d’être détruite.
- `__repr__(self)` : chaîne représentant cet objet et qui devrait correspondre (quand c’est possible) à une expression Python valide pour créer l’objet.
- `__str__(self)` : utilisée par `str()` pour obtenir la représentation sous forme d’une chaîne de caractères lisible de l’objet. Si non définie, retourne le résultat de `__repr__`.
- `__new__(cls, ...)` : méthode implicitement statique qui crée l’objet (et appelle `__init__`).
- `__bool__(self)` : utilisée quand l’objet est considéré comme booléen et avec la fonction prédéfinie `bool()`.
- ...