# Felhantering

> Errors should never pass silently. Unless explicitly silenced.

Tim Peters, *The Zen of Python*

## Syntaxfel och *exceptions*

### Syntaxfel

Fel som uppst친r n칛r koden 칛r skriven p친 ett s칛tt som Python-tolkaren inte kan tolka.


In [None]:
print('this string is unterminated)

In [None]:
for i in ['forgot', 'the', ':']
    print('so this is a syntax error')

### *Exceptions*

Fel som uppst친r n칛r koden 칛r korrekt rent syntaxm칛ssigt, men 칛nd친 inte kan exekveras.

#### `NameError`

In [None]:
print(undefined_variable)  # pyright: ignore[reportUndefinedVariable]

#### `AttributeError`

In [None]:
a = 42
a.upper()  # pyright: ignore[reportAttributeAccessIssue]

#### `ValueError`

In [None]:
int('fifty three')

#### `TypeError`

In [None]:
1 + '2'  # pyright: ignore[reportOperatorIssue]

#### `IndexError`

In [None]:
[2, 4, 6][4]

`builtins` har alla inbyggda *exceptions*.

In [None]:
[err for err in __builtins__.__dict__.keys() if 'Error' in err]

## `try ... except ... else`

### LBYL vs. EAFP

#### **LBYL**: *Look Before You Leap*
F칬rs칬ker f칬rutsp친 vad som kan g친 fel och bygger logiska system med m친nga `if ... else`-satser.

#### **EAFP**: *Easier to Ask for Forgiveness than Permission*
F칬ruts칛tter att allt 칛r som det ska och hanterar *exceptions* med `try ... except` n칛r de uppst친r.

In [None]:
a = 42
b = '23'

print(a + b)  # pyright: ignore[reportOperatorIssue]

print('This is also important!')

Vi kan tysta *exceptions* med `pass`.

In [None]:
a = 42
b = '23'

try:
    print(a + b)  # pyright: ignore[reportOperatorIssue]
except:
    pass  # Explicitly silenced

print('This is also important!')

Det viktiga 칛r att vi vet vad vi h친ller p친 med. Oftast kommer en tystad *exception* tillbaka och biter oss senare.

In [None]:
a = 42
b = '23'

try:
    s = a + b  # pyright: ignore[reportOperatorIssue]
except:
    pass  # Explicitly silenced


In [None]:
print(s)  # Variable is never defined

In [None]:
a = 42
b = '23'

try:
    print(a + b)  # pyright: ignore[reportOperatorIssue]
except TypeError:
    print(int(a) + int(b))

In [None]:
a = 42
b = 'tjugotre'

try:
    print(a + b)  # pyright: ignore[reportOperatorIssue]
except TypeError:
    print(int(a) + int(b))

In [None]:
a = 42
b = 'tjugotre'

try:
    print(a + b)  # pyright: ignore[reportOperatorIssue]
except TypeError:
    try:
        print(int(a) + int(b))
    except ValueError as e:
        print(e)
        print('How do we handle this situation?')

## Lyfta *exceptions* med `raise`

Vi kan anv칛nda `isinstance` f칬r att kolla om objektet vi hanterar 칛r av en viss datatyp.

In [None]:
a = 42
if not isinstance(a, str):
    raise TypeError('Object must be of type str')
else:
    print(a.upper())

In [None]:
a = 'forty-two'
if not isinstance(a, str):
    raise TypeError('Object must be of type str')
else:
    print(a.upper())

`hasattr` returnerar `True` om ett attribut finns p친 ett visst objekt. Vi 칛ndrar typen av *exception* j칛mf칬rt med exemplena ovan.

In [None]:
a = 'forty-two'
if not hasattr(a, 'upper'):
    raise AttributeError("Object must have attribute 'upper'")
else:
    print(a.upper())

In [None]:
b = 42
if not hasattr(b, 'upper'):
    raise AttributeError("Object must have attribute 'upper'")
else:
    print(a.upper())

### Datatv칛tt med LBYL & EAFP



Vi l칛ser in ett dataset av lite s칛mre kvalitet.^[Jag kan ha r친kat ha s칬nder lite data fr친n SMHI. 游뱡] Det 칛r en lista av dictionaries med nycklarna `date` och `temp`.

`date`-v칛rdena beskriver datum i tv친 olika format.

En del `temp`-v칛rden 칛r  `None`, och dessutom 칛r det blandat mellan `.` och `,` som decimalavgr칛nsare.

Vi ska h칛r nedan se p친 tv친 s칛tt att tv칛tta datan f칬r att p친 sikt kunna g칬ra ett linjediagram 칬ver temperaturerna.

In [None]:
import json
import pandas as pd

temps = json.load(open('data/temps.json'))
temps

#### `date`

In [None]:
# Eftersom vi vet att det 칛r tv친 olika format l칛mpar sig LBYL b칛ttre

import datetime

for row in temps:
    if '-' in row['date']:  # Format YYYY-MM-DD
        y, m, d = [int(x) for x in row['date'].split('-')]
        new_date = datetime.date(y, m, d)
    elif '/' in row['date']:  # Format MM/DD/YY
        m, d, y = [int(x) for x in row['date'].split('/')]
        new_date = datetime.date(2000 + y, m, d)  # L칛gg till 2000 till 친ret f칬r att f친 2024
    else:
        raise Exception(f'Could not parse date {row["date"]}')  # F친nga eventuella undantag
    row['date'] = new_date

In [None]:
temps

#### `temp`

In [None]:
# H칛r 칛r det b칛ttre med EAFP eftersom vi har flera olika saker som kan g친 fel

for row in temps:
    try:
        new_temp = float(row['temp'])
    except TypeError:  # Om v칛rdet 칛r None f친r vi ett TypeError
        new_temp = pd.NA
    except ValueError:  # Om decimalavgr칛nsaren 칛r ett , f친r vi ett ValueError
        new_temp = float(row['temp'].replace(',', '.'))
    except Exception as e:  # F친nga eventuella andra exceptions, lyft dem just nu
        raise e
    row['temp'] = new_temp

In [None]:
temps

In [None]:
df = pd.DataFrame(data=temps)
df = df.dropna(axis=0)
df['temp'] = df.temp.astype(float)
df.plot(kind='line', x='date', y='temp', figsize=(8, 4))

Sen ska vi inte gl칬mma att Pandas 칛r helt underbart och att det vi gjort ovan ocks친 kan g칬ras med fyra rader kod:

In [None]:
df2 = pd.read_json('data/temps.json')
df2['temp'] = df2.temp.str.replace(',', '.').astype(float)
df2.dropna(inplace=True)
df2.plot(kind='line', x= 'date', y='temp', figsize=(8, 4))

### Datatv칛tt med Pandas

Pandas kan automatiskt 칛ndra de olika datumformaten till ett enhetligt format och g칬ra om dem till sin egen `datetime64`-datatyp.

In [None]:
df3 = pd.read_json('data/temps.json')
df3.date

`temp`-kolumnen 칛r av `object`-datatypen och beh칬ver lite hj칛lp att omvandlas till `float`.

In [None]:
df3.temp

Vi kan komma 친t `str`-metoder p친 v칛rdena i en kolumn genom att ange `.str` efter kolumnens namn. D친 kan vi k칬ra `replace()` p친 `temp`-kolumnen och omvandla v칛rdena till `float`. Pandas hanterar automatisk `None`-v칛rden.

In [None]:
df3.temp.str.replace(',', '.').astype(float)

Vi skriver 칬ver v칛rdena i `temp`-kolumnen med de nya.

In [None]:
df3['temp'] = df3.temp.str.replace(',', '.').astype(float)

In [None]:
df3.temp

Nu kan vi droppa raderna med saknade v칛rden.

In [None]:
df3.dropna(inplace=True)


In [None]:
df3

In [None]:
df3.plot(kind='line', x= 'date', y='temp', figsize=(8, 4))