# La programmation orientée objet en Python

Nous avons déjà vu les notions de base liées aux classes.

La programmation orientée objet (POO) amène certains avantages par rapport à la programmation procédurale.

- Elle permet d’obtenir un code plus réutilisable. En effet, les types d’objets créés peuvent servir de base pour d’autres objets en ne développant que les évolutions nécessaires.

- Elle offre un code plus compréhensible. En effet, chaque objet va contenir ses propriétés et ses méthodes. Il est donc aisé de voir ce qu’une fonction manipule et à quoi correspondent les variables disponibles.

- Elle amène un code modulaire. En effet, chaque type d’objet ne communique avec les autres types que par des interfaces connues et définies. Cet isolement permet donc de développer facilement d’autres modules pour interagir avec les interfaces déjà utilisées.

## Généralement, on a procédural pour le data scientist et oo pour le développeur

- La POO a pour principal attrait de permettre de proposer une belle API, c’est à dire de créer du code réutilisable et facile à manipuler. 

- Il n’y a rien qu’on puisse faire en POO qu’on ne puisse faire autrement. On va surtout l’utiliser pour donner un style au code.

- En fait, on fait de la POO pour celui qui va utiliser votre code plus tard.

# Procédural != Objet

Paradigme procédural :
- Chaque espace de nom va stocker des variables et des fonctions
- Les données sont stockées dans les variables
- On privilégie les actions par rapport aux données
    - Code = Ensemble de fonctions qui s'échangent des variables et des constantes
    
Paradigme objet :
- Deux catégories d'identificateurs : les instances et les classes
- Les données sont stockées dans des instances
- On privilégie les données par rapport aux actions

Avantage du paradigme objet :
- Regroupement en un seul endroit de l'ensemble des traitements possibles pour une donnée
- Possibilité de réutiliser un objet dans pluseurs applications sans réécriture du code associé
- Construction d'une API plus simple pour l'utilisateur

Inconvénient :
- Une certaine lourdeur de code dans la mise en oeuvre avec une phase de conception plus longue

# Utilisation de l'orienté objet

## Quelques cas classiques

- Construction d'un connecteur pour une base de données
- Construction d'une nouvelle structure de données
- Développement d'une API d'application de nouveaux algorithmes
- Construction d'un outil de scraping web automatisé

## Vous utilisez déjà de la POO lorsque vous utilisez :

- Pandas et Numpy pour la gestion des données
- Scikit-Learn pour l'application de Machine Learning

# Bonnes pratiques

Lorsque votre code doit "passer en production" et être industrialisé, l'utilisation d'une POO est plus efficace (même si elle est plus compliqué à mettre en oeuvre).

## Faut-il toujours coder en orienté objet ?

- Si vous êtes développeur pour de l'industrialisation de gros projet, il faut privilégier cette approche
- Si vous êtes data scientist, elle arrive souvent dans un second temps dans une phase de reflexion lors de la pré-industrialisation

Lorsque le projet d'application est clair, l'approche OO s'impose souvent.

# Pourquoi du code développé en OO est-il plus facile à maintenir ?

- La mise en place de tests unitaires est plus simples car les méthodes sont toujours adaptées à un objet spécifique
- On travaille généralement avec des structures similaires dans un projet, on pourra donc utiliser simplement les notions d'héritage et donc factoriser son code (éviter les répétitions inutiles dans différentes parties du code)
- Globalement, une classe est plus facile à documenter qu'une fonction qui est plus souple


# Pourquoi faire de l'orienté objet pour l'industrialisation ?

- C'est l'approche C++ / Java et c'est souvent l'approche privilégié par les développeurs
- Pour des raisons de qualité évoqué plus haut
- Pour simplement créer des API standardisées

# Quelques points supplémentaires

## Attributs de classe, méthodes de classe et méthodes statiques

- attributs de classe : attributs définis en début de classe
- méthodes de classe : méthodes ne travaillent pas sur l'instance `self`. Elle prend comme paramètre `cls`

Pour définir une méthode de classe, on peut utiliser un décorateur spécifique `@classmethod`

- méthodes statiques : méthodes assez proches des méthodes de classe sauf qu'elles ne prennent aucun premier paramètre, ni `self` ni `cls`.

Pour définir une méthode statique, on peut utiliser un décorateur spécifique `@staticmethod`

# Quelques points supplémentaires
## Utilisation de l'héritage de classe avec pandas

In [1]:
from pandas import DataFrame

class SubclassedDataFrame(DataFrame):

    @property
    def _constructor(self):
        return SubclassedDataFrame
    
    def methode(self):
        return self.mean()
    
    def __str__(self):
        return "Mon DF"

In [2]:
data_classic = DataFrame([4,6,8])

In [8]:
print(data_classic)

   0
0  4
1  6
2  8


In [4]:
data=SubclassedDataFrame([4,6,8])

In [5]:
data.mean()

0    6.0
dtype: float64

In [6]:
data.methode()

0    6.0
dtype: float64

In [9]:
# on passe par la méthode __str__
print(data)

Mon DF


In [10]:
data.methode()

0    6.0
dtype: float64

# Une classe de connexion vers des bases de données

In [1]:
class Connector(object):
    """ Classe de connexion à une base MySQL"""
    
    def __init__(self, host="localhost",
                 user="MyUser",passwd="MyPassword", **autres_arguments):
        self.host = host
        self.user = user
        self.passwd = passwd
        
    def create_connection( self ):
        self.cursor = MySQLdb.connect(self.host, self.user,self.passwd)
    
    def close_connection( self ):
        self.cursor.close()
    
    def execute( self, sql_statement ):
        self.cursor.Execute( sql_statement )
        return self.cursor.FetchAll()

In [2]:
ma_connexion = Connector("https://www.stat4decison/base.sqlite",user="emmanuel",
                         passwd="toto")

In [None]:
ma_connexion.create_connection()

# Une classe pour faire du crawling

In [4]:
import requests
from lxml import html

class YellowPage:
    """ Classe pour explorer les pages jaunes """
    URL_TEMPLATE = "https://www.yellowpages.com/search?search_terms={name}&geo_location_terms={state}"

    @classmethod
    def crawl(cls, name, state):
        """ Méthode de classe permettant de renvoyer tous les résultat d'une page de résultat de recherche"""
        page = requests.get(cls.URL_TEMPLATE.format(name=name, state=state)).text
        tree = html.fromstring(page)
        for items in tree.xpath('//div[@class="info"]'):
            name = items.findtext('.//span')
            address = items.findtext('.//span[@class="street-address"]')
            phone = items.findtext('.//div[@class="phones phone primary"]')
            yield (name, address, phone)

In [5]:
for result in YellowPage.crawl("pizza", "california"):
    print(result)

('Lupi Italian Restaurant', None, '(858) 250-0733')
("Mario's Italian Cafes", None, '(442) 274-0854')
("Del's Famous Pizzeria & Italian Restaurant", None, '(805) 936-0859')
('Marechiaros on 2nd', None, '(619) 328-2052')
('Tommaso Ristorante Italiano', None, '(415) 398-9696')
("Cassanova's Pizza", None, '(951) 363-4060')
('17th Street Grill', None, '(657) 229-3966')
('Lamppost Pizza', None, '(530) 274-1444')
('Klondike Pizza', None, '(805) 980-2212')
('Ave 3 Pizza, Subs & Catering', None, '(562) 246-8473')
('Pizza City', None, '(510) 533-8000')
("Buffalo Chip's Pizza", None, '(530) 256-2412')
("Fisherman's Pizzeria", None, '(415) 928-2998')
("Little Toni's Pizzeria Restaurant", None, '(818) 232-9571')
('Massimo Ristorante', None, '(925) 951-0685')
("Papa Joe'sPizza Inc.", None, '(707) 255-6525')
('Arcata Pizza & Deli', None, '(707) 822-4650')
("Papa Joe's Pizza Inc.", None, '(707) 255-6525')
("Fratellino's Italian Restaurant", None, '(714) 257-5774')
("Angelo's And Vinci's Ristorante", 

# Quelques méthodes particulières (méthodes spéciales)

- `__init__(self, ...)` : le constructeur : méthode d’initialisation nécessairement appelée quand on crée un objet. 
- `__del__(self)` : le destructeur, appelé quand une instance est sur le point d’être détruite.
- `__repr__(self)` : chaîne représentant cet objet et qui devrait correspondre (quand c’est possible) à une expression Python valide pour créer l’objet.
- `__str__(self)` : utilisée par `str()` pour obtenir la représentation sous forme d’une chaîne de caractères lisible de l’objet. Si non définie, retourne le résultat de `__repr__`.
- `__new__(cls, ...)` : méthode implicitement statique qui crée l’objet (et appelle `__init__`).
- `__bool__(self)` : utilisée quand l’objet est considéré comme booléen et avec la fonction prédéfinie `bool()`.
- ...