# Data Analysis - Programming - 2
## Week 9

## Onderwerpen week 9

- error handling in Python

In [52]:
from IPython.display import display, Latex

## Error handling in Python (1)

- je hebt er vast nooit bij stilgestaan,  
  maar computerprogramma's gaan soms de fout in
- er worden drie soorten fouten onderscheiden:
  1. __syntax errors__: fouten die optreden tijdens compileren/parsen  
  In Python krijg je deze fouten (of waarschuwingen)  
  te zien als je Shift+Enter drukt op een cell.  
  Voor studenten zijn dit vaak de vervelendste fouten.  
  Python's meldingen voor compile time errors zijn  
  meestal heel goed te lezen en dit zou snel op te lossen moeten zijn
  2. __logische fouten__
  Een programma met een logische fout lijkt prima te lopen,  
  maar het doet niet wat het bedoeld was te doen.  
  Dit is misschien wel de vervelendste soort:  
  je ziet niet direct een probleem maar je uitkomsten  
  kunnen er, zonder dat je het weet, ver naast zitten!
  3. __runtime errors__: fouten die optreden terwijl het programma draait
  

## Error handling in Python (2)

Voorbeeld van een syntax error

In [53]:
i = 15
for j in range(12)
    print(i * j)

SyntaxError: invalid syntax (<ipython-input-53-2be831138281>, line 2)

- Python vermeldt de fout
- een pijl geeft aan waar de fout optrad
- het bestand en de regel worden genoemd

## Error handling in Python (3)
Syntax errors zijn soms moeilijk te spotten:

Welch-Sattertwaithe vergelijking:
$$
\nu = \frac{
    \big( \frac{s_1^2}{n_1} + \frac{s_2^2}{n_2} \big)^2
}{
    \frac{\big(\frac{s_1^2}{n_1}\big)^2}{n_1 - 1} + 
    \frac{\big(\frac{s_2^2}{n_2}\big)^2}{n_2 - 1}
}
$$

In [54]:
s_1, s_2, n_1, n_2 = 0.5, 0.5, 30, 30
ddof = (
    ((s_1**2 / n_1 + s_2**2 / n_2)**2 / 
    (
        (s_1**2 / n_1)**2 / (n_1 - 1) + 
        (s_2**2 / n_2)**2 / (n_2 - 1)
    )
)
display(Latex(r"$\nu \approx {}$".format(int(ddof))))

SyntaxError: invalid syntax (<ipython-input-54-89492c42d6c5>, line 9)

## Error handling in Python (4)

Voor logische fouten krijg je helaas geen foutmelding!

Chi-kwadraat verdeling:
$$
\chi^2 = \frac{(n - 1) s^2}{\sigma^2}
$$

In [55]:
n, s, sigma = 30, 3, 1
chi2 = ((n - 1) * (s^2)) / (sigma^2)
display(Latex(r"$\chi^2 \approx {:.4f}$".format(chi2)))

<IPython.core.display.Latex object>

In [56]:
# should have been:
n, s, sigma = 30, 3, 1
chi2 = ((n - 1) * (s**2)) / (sigma**2)
display(Latex(r"$\chi^2 \approx {:.4f}$".format(chi2)))

<IPython.core.display.Latex object>

## Error handling in Python (5)

Runtime errors kun je deels voorspellen,  
en op die manier voorkomen:

In [57]:
repetitions = int(input("Geef het gewenste aantal herhalingen:"))

Geef het gewenste aantal herhalingen:


ValueError: invalid literal for int() with base 10: ''

## Error handling in Python (6)

In Python kun je runtime errors afvangen met een try-except-handler:

```python
while True:
    try:
        repetitions = int(input("Geef het gewenste aantal herhalingen:"))
        break
    except ValueError:
        print("Dat is geen geldig aantal herhalingen, probeer opnieuw.")
```

## Error handling in Python (7)

Een try-except-block mag meerdere fouttypen, of zelfs alle fouttypen afvangen:

```python
try:
    f = open('myfile.txt')
    s = f.readline()
    i = int(s.strip())
except OSError as err:
    print("Fout bij openen bestand: {}".format(err))
except ValueError:
    print("Fout bij converteren tekst naar integer.")
except:
    print("Onverwachte fout!")
    raise
```

## Error handling in Python (8)

Idiomatisch voor Python is 'EAFP': easier to ask for forgiveness than permission.  

Vaak is het leesbaarder om fouten af te handelen dan op alle mogelijke problemen te controleren.

Vergelijk de onderstaande voorbeelden (code in een functie):

```python
# LBYL style
s = input("Geef een getal:")
if not isinstance(s, str) or not s.isdigit():
    return None
else:
    return int(s)
```

en:

```python
# EAFP style
s = input("Geef een getal:")
try:
    return int(s)
except (TypeError, ValueError):
    return None
```

Merk op dat het onderstaande voorbeeld als bijkomend voordeel heeft dat ook negatieve integers gelezen kunnen worden.

## Error handling in Python (9)

Soms is het duidelijk beter om fouten af te vangen dan foutcondities te controleren.

Kun je zien wat er mis is met het eerste voorbeeld?


```python
# LBYL style
import os

def read_first_line(filename):
    if os.path.isfile(filename) and os.access(filename):
        return open(filename, "r").readline()
    print("File {} could not be opened for reading!".format(filename))
    return None
```

en:

```python
# LBYL style
import os

def read_first_line(filename):
    try:
        return open(filename, "r").readline()
    except:
        print("File {} could not be opened for reading!".format(filename))
        return None
```

## Error handling in Python (10)

Tips voor foutafhandeling:
- probeer veel voorkomende fouten af te vangen  
en vooral ook netjes af te handelen
- maar probeer niet alles op te vangen:  
laat minder vaak voorkomende fouten aan Python over.
het is beter dat je programma crashed met een 
(door Python gedefinieerde) redelijke foutmelding,  
dan dat je doorploetert met mogelijk foutieve resultaten