<div class="licence">
<span>Licence CC BY-NC-ND</span>
<span>Thierry Parmentelat &amp; Arnaud Legout</span>
</div>

In [None]:
from plan import plan; plan("classes", "encapsulation")

# pour réutiliser du code en python

* fonctions
  * pas d'état après exécution
* modules
  * garde l'état
  * une seule instance par programme
* **classes**
  * **instances multiples**
  * **chacune garde l'état**
  * **héritage**

### rappel: primer

In [None]:
class MyFirstClass:
    
    def __init__(self, nom, age):
        self.nom = nom
        self.age = age
        
    def __repr__(self):
        return (f"je suis {self.nom}, "
                f"j'ai {self.age} ans")

In [None]:
person = MyFirstClass(
    "Jean Dupont", 25)
person

### programmation orientée objet  
  pourquoi et comment ?

####  deux objectifs 

* modularité
* réutilisabilité

#### deux moyens 

* espaces de nom
* héritage

# avertissement

* la POO est présente dans tous les langages modernes
* cependant l'implémentation *a un impact*
* sur le paradigme présenté au programmeur
* se méfier des habitudes héritées d'autres langages

* C++/Java
  * fort typage statique
  * **impose** l'existence d'une classe *chapeau* 
  * par exemple la classe `Simulable`
* Python
  * on peut parfaitement se passer de la classe `Simulable`
  * pourvu que les classes concrètes
  * disposent des méthodes à run-time
  * c'est le *duck typing*

# modularité

* du code modulaire
  * grouper le code dans une classe
  * grouper les données dans un objet
* c'est là qu'interviennent les espaces de nom
* (comme avec les notions de module et de package)  

# réutilisabilité

* DRY: chaque fonctionnalité écrite une seule fois
* maintenance plus simple
* du code générique
  * ex: un simulateur fait "avancer" une liste d'objets
  * dès qu'un objet explique comment il avance
  * il peut faire partie de la simulation
* c'est là qu'intervient l'héritage

# espaces de nom

* tous les objets qui sont
  * un package
  * un module
  * une classe
  * une instance
* constituent chacun un espace de nom
  * i.e. une association *attribut* → *objet*

# espaces de nom - suite

* permet de lever l'ambigüité en cas d'homonymie
* cf. exemple du C *old-school*
* les espaces de nom sont imbriqués (*nested*)
  * ex. `package.module.classe.methode`
* on peut accéder à tous les objets
  * dès qu'on sait partir d'une variable
  * par exemple un module importé
* l'héritage rend cela dynamique
  * i.e. la résolution est faite à *runtime*

# digression

### deux mondes étanches

* variables 
* attributs

### se mélangent 

* typiquement dans une expression comme `a.b.c.d`

* `a` est une **variable**

* `b`, `c` et `d` sont des **attributs**

## deux mécaniques totalement différentes

### résolution des **variables**

* entièrement **lexical**
* en remontant dans le code
* avec les règles LEGB  
  local, englobant, global, *builtin*

### résolution des **attributs**

* dans le monde des **objets**
* en remontant les espaces de nom
* essentiellement **dynamique**  
  *i.e.* à *runtime*

# héritage

* la **résolution des attributs**
* fournit la **mécanique de base**
  * sur laquelle on a - très peu - élaboré
* pour implémenter l'héritage
* on verra ça en détails plus tard

# ex: une classe et une instance

In [None]:
# une classe sans heritage
# et juste un constructeur
class Point:
    def __init__(self, x, y):
        self.x = x
        self.y = y

In [None]:
point = Point(2, 3)
point.x

## à noter

* comme tous les types, `Point` est une usine à objets
  * cf. `list({1, 2, 3})`
* donc pour créer une instance, on *appelle* cet objet *classe*
* la méthode `__init__` nous permet de définir
  * ce qui est fait lors de la construction de l'objet
  * c'est-à-dire à l'appel de `Point(2, 3)`
* remarquez le premier paramètre `self`

## espaces de nommage

### à ce stade nous avons deux espaces de nom

* la classe `Point`
  * `Point.__init__` : la méthode
* l'instance
  * `point.x` : 2 pour cette instance
  * `point.y`

In [None]:
%load_ext ipythontutor

### la classe et l'instance: deux espaces de nom distinct

In [None]:
%%ipythontutor width=1000
class Point:
    def __init__(self, x, y):
        self.x = x
        self.y = y
        
point = Point(2, 3)

In [None]:
# la classe possède 
# l'attribut '__init__' 
'__init__' in Point.__dict__

In [None]:
# c'est la méthode 
# qu'on a définie
type(Point.__init__)

In [None]:
# par contre elle ne possède
# pas d'attribut x
'x' in Point.__dict__

In [None]:
# l'attribut x se trouve
# bien dans l'instance
'x' in point.__dict__

# ex. de résolution d'attribut

In [None]:
# cas simple sans héritage
# appel d'une méthode
import math

class Vector:
    def __init__(self, x, y):
        self.x = x
        self.y = y
       
    def length(self):
        return math.sqrt(self.x**2 + self.y**2)

In [None]:
vector = Vector(3, 4)
vector.length()

## espaces de nom

* la classe `Vector` a les attributs
  * `__init__`
  * `length`

* l'objet `vector` a les attributs
  * `x` et `y`,
  * mais pas `length` !

In [None]:
%%ipythontutor width=1000 height=400 curInstr=7
import math
class Vector:
    def __init__(self, x, y):
        self.x = x
        self.y = y
    def length(self):
        return math.sqrt(self.x**2 + self.y**2)
   
vector = Vector(2, 2)

pour visualiser la même chose à base d'introspection dans le code

tous les objets ont un attribut `__dict__`

In [None]:
# les attributs 'intéressants' de Vector
[att for att in Vector.__dict__ if '__' not in att or att == '__init__']

In [None]:
# et dans l'instance
list(vector.__dict__)

## résolution d'attribut

* l'objet `vector` ne possède pas en propre l'attribut `length`
* et pourtant on peut écrire `vector.length()` 

* pour évaluer `vector.length()`
* on fait de la résolution d'attributs
  * cherché dans l'instance: pas trouvé
  * cherché dans la classe: oui, on prend ça

## héritage ?

* ce n'est pas encore de l'héritage  
  puisque pour l'instant on n'a qu'une classe
* mais on verra que l'héritage  
  est une simple prolongation de cette logique

# exemple avec héritage

In [None]:
# une classe fille sans aucun contenu
class SubVector(Vector): 
    pass

subvector = SubVector(6, 8)

subvector.length()

In [None]:
%%ipythontutor width=1000 height=400 curInstr=8
import math
class Vector:
    def __init__(self, x, y):
        self.x = x
        self.y = y
    def length(self):
        return math.sqrt(self.x**2 + self.y**2)
class SubVector(Vector):
    pass

subvector = SubVector(6, 8)

* c'est exactement le même mécanisme qui est à l'oeuvre :
* on cherche `length`
  * dans l'instance : non
  * dans la classe : non
  * dans la super-classe : ok, on prend ça

## *Method Resolution Order*

* l'héritage entre les classes
* détermine l'ordre dans lequel sont cherchés les attributs
* en sus de l'instance elle-même
* en anglais *method resolution order*
* ou `mro()` (une méthode de la classe)
* concept surtout utile avec l'héritage multiple
* mais qui me semble pertinent pour illustrer notre propos

In [None]:
SubVector.mro()

### attributs non fonctionnels (≠ méthode)

* on peut utiliser les même concepts
* pour gérer des attributs de donnée (i.e. ≠ méthode)

In [None]:
class Factory:
    # un compteur global à la classe
    all_labels = []

    def __init__(self, label):
        self.label = label
        # ici je pourrais aussi bien écrire 
        # Factory.all_labels.append(label)
        self.all_labels.append(label)

Factory.all_labels

In [None]:
f1 = Factory('premier')
Factory.all_labels

In [None]:
f2 = Factory('second')
Factory.all_labels

In [None]:
%%ipythontutor width=1000 height=400
class Factory:
    all_labels = []
    def __init__(self, label):
        self.label = label
        # ici je pourrais aussi bien écrire 
        # Factory.all_labels.append(label)
        self.all_labels.append(label)
f1 = Factory('premier')
f2 = Factory('second')

## **remarque importante** : lecture ≠ écriture

* le mécanisme de recherche d'attribut qu'on vient de voir 
* ne fonctionne que **pour la lecture des attributs**
* donc ici en partant de l'instance
* on trouve bien l'attribut de la classe

In [None]:
Factory.all_labels is f1.all_labels

In [None]:
f1.all_labels

## **remarque importante** : lecture ≠ écriture

* mais attention lorsqu'on **écrit** un attribut 
  * *i.e.* si l'expression `foo.bar` est à gauche d'une affectation
* alors l'attribut `bar` est créé/écrit **dans l'objet `foo`**
* il n'y a **pas de recherche** dans ce cas !

In [None]:
# ici on va créer un nouvel attribut
# directement dans l'instance
f1.all_labels = 'overridden'
f1.all_labels

In [None]:
f2.all_labels

In [None]:
f1.all_labels

In [None]:
%%ipythontutor width=1000 height=400 curInstr=11
class Factory:
    # un compteur global à la classe
    all_labels = []

    def __init__(self, label):
        self.label = label
        Factory.all_labels.append(label)

f1 = Factory('premier')
f2 = Factory('second')

f1.all_labels = 'overridden'

### lecture ≠ écriture - discussion

* cela ne se remarque pas avec les méthodes 
  * car c'est très rare d'écrire `instance.methode = ...`
* mais du coup, lire et écrire un attribut ne **sont pas symétriques**

ce phénomène exhibe un très lointain rapport
* avec le scope lexical des variables
* et le `UnboundLocalError`

In [None]:
foo = 12

def fun():
    # on peut lire la variable
    # de scope englobant
    print(foo)
fun()

In [None]:
def bar():
    # ou créer une variable
    # dans ce scope
    foo = 13
bar()
print(foo)

In [None]:
def tutu():
    # mais pas les deux
    try:
        print(foo)
        foo = 13
    except UnboundLocalError as e:
        print("OOPS", e)
tutu()

# résumé

* le mécanisme d'annotation des objets par les attributs  
  et de recherche le long d'un chemin
* constitue le coeur de ce qui est à l'oeuvre  
  lorsqu'on fait de la Programmation Objet
* on va le voir sur des exemples plus pratiques
* avec comme avantages
  * la modularité / encapsulation
  * la factorisation de code / réutilisabilité

# encapsulation

* consiste à définir un **ensemble d'opérations**
* qui sont **les seules à travers lesquelles**  
  on peut manipule ces objets
* en préservant de bonnes propriétés / invariants
* (que idéalement on peut prouver)

### dans d'autres langages

* on trouve des mécanismes de protection
* notamment attributs privés ou publics
* visant à éviter les erreurs

### moins le cas en python

* tradition  
  "*we're all consenting adults here*"
* quelques mécanismes *best-effort*  
  notamment noms commençant par `_`
* l'idée reste néanmoins très utile
* on peut arriver à un résultat convaincant

### applications

* par exemple `numpy.ndarray`
  * qui enforce le type des différents composants
* classe d'utilitaires réseau
  * qui conservent l'état de la connexion
  * pour faire ce qu'il faut au bon moment
* ...

### bénéfices

c'est un des premiers bénéfices de la POO

* que de pouvoir grouper les données
* avec les traitements
* dans une unité de programmation
* facilement réutilisable
* pas besoin d'héritage pour tout ça

# code réel

* très souvent, pas de protection particulière
* "we're all consenting adults here"
* l'idée étant de pouvoir remplacer plus tard, si nécessaire,  
  l'attribut par une `property` qui fasse les contrôles

In [None]:
# une jauge a une valeur forcément 
# dans un intervalle fixe
# 
# toutefois en Python on expose typiquement
# un attribut `value` en lecture / écriture
# 
class Gauge:
    def __init__(self, value):
        self.value = value

# le code utilisateur peut lire
# et écrire librement l'objet

En C++ / Java typiquement, on définirait ici 
* un attribut privé `_value`
* deux méthodes *getter/setter*

le code utilisateur accède l'objet uniquement
au travers de ces deux méthodes


# mécanismes Python pour l'encapsulation

* les mécanismes offerts par Python 
  * visibilité des attributs
  * properties

## visibilité des attributs

* pas de vraie notion d'attributs privé/public 
* **toutefois** des conventions de nommage

### PEP8

* `_single_leading_underscore` : 
  * weak "internal use" indicator. E.g. `from M import *` does not import objects whose name starts with an underscore.
  * correspond *en gros* aux champs protégés
  * **enforcé** seulement pour les **modules**
  * dans les classes, cela est juste une indication

### PEP8

* `__double_leading_underscore` : 
  * when naming a class attribute, invokes name mangling  
    (inside class `FooBar`, `__boo` becomes `_FooBar__boo` ; see below).

  * correspond *en gros* aux champs privés

### PEP8 ...

* `__double_leading_and_trailing_underscore__`
  *  "magic" objects or attributes that live in user-controlled namespaces. E.g. `__init__` , `__import__` or `__file__` . 
  * **never invent such names**; only use them as documented.

* `single_trailing_underscore_` : 
  * used by convention to avoid conflicts with Python keyword, e.g.
  * `Tkinter.Toplevel(master, class_='ClassName')`

In [None]:
class Underscore:
    def __init__(self, x): 
        self.x = x
        self._x = x ** 2
        self.__x = x ** 3
u = Underscore(10)

In [None]:
# on peut lire et écrire x
u.x = 2 * u.x

# on peut lire et écrire _x !
u._x = 2 * u._x

In [None]:
# mais même pas lire __x
try:       
    u.__x
except AttributeError as e:
    print(f"OOPS {type(e)}: {e}")

### nommage des attributs et underscores

* le fait de préfixer les attributs d'une classe
  * avec un ou deux underscores
* n'est donc pas très significatif pour le langage
* mais fait passer aux humains
  * le message selon lequel
  * il vaut mieux ne pas y accéder directement

## properties

* on a vu avec la classe Gauge
* la dualité attribut/méthodes d'accès
  * un attribut privé
  * des méthodes pour lire/écrire
* avec les *properties* on a le beurre et l'argent du beurre
  * le code utilisateur a l'impression d'accéder directement aux attributs
  * sauf qu'en fait grâce à la property on peut insérer une couche de logique
  * pour vérifier le bon usage, exactement comme avec des get/set

### properties *vs* getter/setter

dans un langage avec protection "dure" comme C++ ou Java:

* on expose très souvent une API à base de `get/set` 

ce n'est pas du tout le cas en Python:

* on commence avec un attribut 'nu'
* lorsqu'il faut implémenter des contrôles  
  on remplace l'attribut par une property

* tout en préservant l'API

### deux formes pour la même construction

il existe deux syntaxes différentes pour créer une property dans une classe

* **sans décorateur**
  * on écrit le getter et le setter
  * l'attribut est créé comme une `property` à partir des deux
* **avec décorateur**
  * on définit la property avec le décorateur `@property`   
    à partir du getter
  * puis on peut ensuite ajouter le `setter`
  
*NB :* dans les deux cas on peut aussi fournir un *deletter*

### syntaxe sans décorateur

In [None]:
# une classe qui implémente une valeur
# garantie de rester entre 0 et 1000

class Constrained:
    """
    Une jauge qui contraint sa valeur dans un intervalle
    """
    def __init__(self, value):
        # on appelle déjà le setter ici
        self.value = value

    # le getter
    def _get_value(self):
        # la vraie valeur est dans l'attribut _value
        return self._value

    # le setter
    def _set_value(self, value):
        # on vérifie la contrainte
        self._value = min(1000, max(0, value))

    # c'est ici qu'on définit la property `value`
    value = property(fget=_get_value, fset=_set_value, 
                     doc="a constrained value between 0 and 1000")

In [None]:
c1, c2, c3 = Constrained(-12), Constrained(500), Constrained(2000)
c1.value, c2.value, c3.value

In [None]:
# l'API ressemble toujours à une 
# simple utilisation d'attribut
c2.value = 10**6
c2.value

### syntaxe avec décorateur

In [None]:
# pareil avec un décorateur - syntaxe moins agréable IMHO

class ConstrainedDeco:
    """
    Une jauge qui contraint sa valeur dans un intervalle
    """

    def __init__(self, value):
        # on appelle le setter déjà ici
        self.value = value

    # le getter - qui définit la property
    @property
    def value(self):
        """a constrained value between 0 and 1000"""
        return self._value

    # le setter
    @value.setter
    def value(self, value):
        self._value = min(1000, max(0, value))

In [None]:
d1, d2, d3 = ConstrainedDeco(-12), ConstrainedDeco(500), ConstrainedDeco(2000)
d1.value, d2.value, d3.value

In [None]:
d2.value = 10**6
d2.value

## résumé properties

grâce aux *properties*, on peut

* exposer une API simple  
  accès direct aux attributs  
  sans imposer à l'appelant de vilaines périphrases

* en se réservant la possibilité  
  de créer des getters/setters (et deleters)  
  ultérieurement si/lorsque nécessaire


## exercice

* écrire une variante de `Constrained` 
* avec des bornes variables
* passées au constructeur

```
>>> ma_jauge = ConstrainedMinMax(500, min=100, max=200)
>>> ma_jauge.value
    200
```

# dataclasses

depuis Python-3.7, ce mécanisme permet 

* de définir plus rapidement
* une classe comme une simple juxtaposition de données

par contre

* nécessite les *type hints*
* et parce que dispo depuis 3.7, encore assez peu répandu

In [None]:
from dataclasses import dataclass

In [None]:
@dataclass
class Airport:
    airport_id: int
    iata: str
    latitude: float
    longitude: float

In [None]:
nice = Airport(5879, "NCE", 7, 43)

In [None]:
nice

# résumé encapsulation

* deux techniques pour aider à l'encapsulation
  * sous-titrer le rôle des attributs de données
  * utiliser les properies pour contrôler les accès
* en pratique
  * Python est un langage pragmatique
  * on commence presque toujours par la version 'simple'
  * et on ajoute des properties au besoin par la suite