## Les erreurs en Python

Quand on code, si on code suffisamment longtemps on va être confronté à des erreurs:
1. Les erreurs que l'on veut passer sans casser notre programme
2. Les erreurs qui doivent terminer les programme

### Try-Except (finally) 
Quand on a une erreur que l'on veut passer sans casser notre programme.

doc python officielle : https://docs.python.org/3/tutorial/errors.html

In [1]:
try:
    print("Coucou " + "hello")
except:
    print("bouuuu")

Coucou hello


In [2]:
try:
    print(3 + "hello")
except:
    print("bouuuu")

bouuuu


---------

##### Printer l'exception si on veut savoir pourquoi cela n'a pas marché

In [3]:
try:
    print(3 + "hello")
except Exception as e:
    print(e)

unsupported operand type(s) for +: 'int' and 'str'


In [4]:
try:
    print(3 + "hello")
except Exception as e:
    print(repr(e))
print("coucou")

TypeError("unsupported operand type(s) for +: 'int' and 'str'")
coucou


#### Lever l'exception que si c'est bien l'exception que l'on attend qui a été levée

In [5]:
try:
    print(3 + "hello")
except TypeError as e:
    print(e)
print("coucou")

unsupported operand type(s) for +: 'int' and 'str'
coucou


In [7]:
try:
    import un_package_qui_nexiste_pas
    print(3 + "hello")
except TypeError as e:
    print(e)
print(e)
print("Coucou !")

ModuleNotFoundError: No module named 'un_package_qui_nexiste_pas'

In [8]:
try:
    import un_package_qui_nexiste_pas
    print(3 + "hello")
except (TypeError, ModuleNotFoundError) as e:
    print(e)
print("coucou")

No module named 'un_package_qui_nexiste_pas'
coucou


#### Mais pour quoi faire ?

In [9]:
b = 3
while True:
    a = input("renseignez quoi ajouter à b: ")
    try:
        a = float(a)
    except:
        pass
    try:
        print(a + b)
        print("l'école est finie !")
        break
    except TypeError as e:
        #print(e)
        print("On ne peut pas additionner les int et les string, mais la vie continue ☀️ !")

renseignez quoi ajouter à b:  "a"


On ne peut pas additionner les int et les string, mais la vie continue ☀️ !


renseignez quoi ajouter à b:  12


15.0
l'école est finie !


Mais en data science ?

In [12]:
import os

In [13]:
import pandas as pd
from urllib.error import URLError
from IPython.display import display
import os
try:
    df = pd.read_csv("https://raw.githubusercontent.com/pcm-dpc/COVID-19/master/dati-province/dpc-covid19-ita-province-20200225.csv")
    os.mkdir("./data")
    df.to_csv("./data/covid_italie.csv")
    display(df)
except URLError: #imaginons que le csv soit supprimé par l'utilisateur
    df = pd.read_csv("./data/covid_italie.csv")
    print('''Le fichier n'est pas accessible \n 
    - vérifiez votre connection internet \n
    - vérifiez que le fichier est toujours disponible sur Github \n
    Charge les dernières données accédées:''')
    display(df)

Unnamed: 0,data,stato,codice_regione,denominazione_regione,codice_provincia,denominazione_provincia,sigla_provincia,lat,long,totale_casi,note
0,2020-02-25T18:00:00,ITA,13,Abruzzo,66,L'Aquila,AQ,42.351222,13.398438,0,
1,2020-02-25T18:00:00,ITA,13,Abruzzo,67,Teramo,TE,42.658918,13.704400,0,
2,2020-02-25T18:00:00,ITA,13,Abruzzo,68,Pescara,PE,42.464584,14.213648,0,
3,2020-02-25T18:00:00,ITA,13,Abruzzo,69,Chieti,CH,42.351032,14.167546,0,
4,2020-02-25T18:00:00,ITA,13,Abruzzo,979,In fase di definizione/aggiornamento,,,,0,
...,...,...,...,...,...,...,...,...,...,...,...
123,2020-02-25T18:00:00,ITA,5,Veneto,26,Treviso,TV,45.667546,12.245074,1,
124,2020-02-25T18:00:00,ITA,5,Veneto,27,Venezia,VE,45.434905,12.338452,7,
125,2020-02-25T18:00:00,ITA,5,Veneto,28,Padova,PD,45.406930,11.876087,30,
126,2020-02-25T18:00:00,ITA,5,Veneto,29,Rovigo,RO,45.071073,11.790070,0,


Il est normalement conseillé de définir l'erreur(s) levée(s) pour définir l'exception.
Sur une librairie/base de code conséquente, ça facilite le déboguage et permettra au programme de crasher si une erreur non prévue arrive.

Sur de la data science en jupyter notebook ¯\_(ツ)_/¯ (on gagne du temps a ne pas les définir et à priori on fera quelque chose de plus propre en production).


## Les assert

In [14]:
assert 3==3

In [15]:
assert 3 == 4

AssertionError: 

Un assert s'assure qu'une condition est vraie pour que le programme continue.

Mais à quoi ça sert ?:
1. Permet de faire en sorte que le code casse s'il ne se comporte pas comme prévu
2. Permet d'auto-documenter son code 


Utiliser beaucoup d'assert est une bonne chose.   



Il est même souvent utile d'écrire un assert (un test) pour définir ce que l'on veut  que le code fasse, avant d'écrire le code : c'est la base du Test driven development.

Mais à quoi ça peut servir en data science ?  

C'est souvent utile pour tester les données. Par exemple qu'après des manipulations, le nombre d'observation soit égal aux observations espérées (surtout après des merge).

In [16]:
df = pd.read_csv("https://raw.githubusercontent.com/pcm-dpc/COVID-19/master/dati-province/dpc-covid19-ita-province-20200225.csv")

assert len(df)>20 #ici on teste que l'on a au moins 20 lignes dans la table téléchargée

C'est aussi la base des tests unitaire (ou d'intégration) qui permet de faire du CI (jenkins, Travis, Gitlab et Github CI etc).
C'est une des bases importantes du [MLOps](https://en.wikipedia.org/wiki/MLOps)

[travis](https://travis-ci.org/github/adrienpacifico/adrienpacifico.github.io/builds/768587169)

#### Exemple de TDD avec pytest pour faire un mini ci

En TDD on écrit les tests d'abord !

In [13]:
from darts.datasets import TemperatureDataset
df = TemperatureDataset().load().pd_dataframe()
import ipytest
ipytest.autoconfig()    

### Exemple général

In [16]:
%%ipytest

# define the tests

def test_my_func():
    assert my_func(0) == 0
    assert my_func(1) == 0
    assert my_func(2) == 2
    assert my_func(3) == 2
    
    
def my_func(x):
    return x // 2 * 2 

[32m.[0m[32m                                                                                            [100%][0m
[32m[32m[1m1 passed[0m[32m in 0.00s[0m[0m


In [17]:
%%ipytest

import pytest

@pytest.mark.parametrize('input,expected', [
    (0, 0),
    (1, 0),
    (2, 2),
    (3, 2),
])
def test_parametrized(input, expected):
    assert my_func(input) == expected
    
@pytest.fixture
def my_fixture():
    return 42
    
    
def test_fixture(my_fixture):
    assert my_fixture == 42


[32m.[0m[32m.[0m[32m.[0m[32m.[0m[32m.[0m[32m                                                                                        [100%][0m
[32m[32m[1m5 passed[0m[32m in 0.01s[0m[0m


Exemple appliqué :

In [None]:
#On écrit ce que l'on veut que la fonction fasse

def download_or_load(url=None, cache_path="./data"):
    """
    Télécharge un csv via une url en ligne
    À défaut, charge la données correspondante en cache
    """

In [None]:
### test download_or_load si la donnée est disponible
def test_dowload_or_load_if_correct_url():
    """
    1- Crée le dossier /data s'il n'existe pas
    2- Essaye de télécharger un csv via un lien qui marche et retourne 
    """