In [4]:
import pandas as pd


 ## Что такое исключение

In [3]:
def show_fruit(fruit):  
    if fruit == "apple":  
        print("Ready to eat")  
    elif fruit == "orange":  
        print("You need to peel first")  
    else:  
        raise ValueError("You need to pass correct fruit")   

In [4]:
show_fruit("apple")  
# => ready to eat  
show_fruit("carrot")  

Ready to eat


ValueError: You need to pass correct fruit

В последней строчке у нас добавилось пояснение, что мы передали какой-то некорректный фрукт. В Python достаточно много встроенных типов исключений. Вы можете посмотреть их в [документации](https://docs.python.org/3/library/exceptions.html) к языку и выбирать подходящий по смыслу для вашей ситуации.

### Задание 2
Определите функцию `check_server`, которая принимает на вход переменную `mode`.
- Если mode имеет значение "memory", программа должна вернуть строку "Memory is ok".
- Если mode имеет значение "connection", программа должна вернуть строку "Connection is ok".
- Для остальных случае программа должна выбросить исключение ValueError.

In [13]:
def check_server(mode):
    if mode=="memory": return("Memory is ok")
    elif mode=="connection":  return("Connection is ok")
    else: raise ValueError()

## Обработка исключений

In [15]:
dictionary = {}  
try:  
    dictionary["no_key"]  
except:  
    print("Oops, key not found")  
  
print("End of program")  
# => Oops, key not found  
# => End of program  

Oops, key not found
End of program


## Осознанная обработка исключений

In [16]:
dictionary = {}  
try:  
    dictionary["no_key"]  
except KeyError:  
    print("Oops, key not found")  

Oops, key not found


In [17]:
dictionary = {}  
try:  
    dictionary["no_key"]  
except IOError:  
    print("Oops, key not found")  

KeyError: 'no_key'

## Иерархия исключений
Исключения в Python имеют иерархию: у нас есть более общие и более специфичные исключения. Вот график исключений:

![](https://lms.skillfactory.ru/assets/courseware/v1/26c252ee13b222ccb175779fdfb154d9/asset-v1:Skillfactory+DST-PRO+15APR2020+type@asset+block/exception_hierarchy.png)

Здесь мы видим, что **KeyError** и **IndexError** являются подмножеством **LookupError**, которая является подмножеством **Exception**. На практике это имеет следующее значение: если мы укажем более верхнеуровневые исключения, то "отловятся" все дочерние, но не наоборот.

In [18]:
# Напишем функцию, которая может обращаться и к спискам, и к словарям  
# при этом не выбрасывая исключение для несуществующих индексов/ключей   
def safe_element(collection, place):  
    try:  
        return(collection[place])  
    except LookupError:  
        print("Key or index not found")  
  

In [19]:
users = ["Pavel", "Elena", "Sergey"]  
safe_element(users, 1)  

'Elena'

In [20]:
safe_element(users, 3)  

Key or index not found


In [21]:
prices = {"apple": 10, "orange": 20}  
safe_element(prices, "apple")  

10

In [22]:
safe_element(prices, "carrot")  

Key or index not found


## Задание 2
Напишите программу, которая реализует безопасное сложение двух объектов **x** и **y**.

Если объекты не могут быть сложены, функция должна:

- Отловить TypeError
- Вывести на экран "Can't sum x and y", где x и y - переданные объекты
- Вернуть 0

```python
safe_sum(1, 2)
# 3
```
.
и

```python
safe_sum(5, 'a')
# => Can't sum 5 and a
# 0 
```
      

In [14]:
def safe_sum(summand1, summand2):
    try:
        return summand1 + summand2
    except TypeError:
        print(f"Can't sum {summand1} and {summand2}")
        print("Can't sum ", repr(summand1), "and", repr(summand2))
        return 0


In [16]:
safe_sum(1, '2')

Can't sum 1 and 2
Can't sum  1 and '2'


0

Детали **try-except**
Мы рассмотрели базовый синтаксис **try-except**, однако у него есть ещё несколько вариаций. Они не часто встречаются на практике, но мы о них расскажем. Иногда в блоке except нам нужен доступ к самому объекту исключения, например, мы хотим получить поясняющее сообщение и вывести его на экран, но при этом продолжить программу дальше. Мы можем это сделать с помощью ключевого слова `as`, за которым идёт имя новой переменной.

```python
try:  
    5/0  
except ZeroDivisionError as zero_error:  
    # здесь в zero_error мы получаем сам объект исключения  
    # print как раз выведет его поясняющее сообщение  
    print(zero_error)  
  
print("Program ends correctly")  
```

In [147]:
try:  
    5/0  
except ZeroDivisionError as zero_error:  
    # здесь в zero_error мы получаем сам объект исключения  
    # print как раз выведет его поясняющее сообщение  
    print(zero_error)  

print("Program ends correctly")  

division by zero
Program ends correctly


Ещё один распространённый подход: мы совершаем какое-то промежуточное действие, а потом перевыбрасываем исключение.
```python
# Пусть у нас есть функция, которая шлёт емейл разработчику об ошибке  
def notify_admin(error):  
    print("Mail to administrator has been sent about", error)  
      
value = "poem"  
try:  
    digitized = int(value)  
except ValueError as digitized_error:  
    notify_admin(digitized_error)  
    raise digitized_error  
```

In [2]:
def notify_admin(error):  
    print("Mail to administrator has been sent about", error)  

value = "poem"  
try:  
    digitized = int(value)  
except ValueError as digitized_error:  
    notify_admin(digitized_error)  
    raise digitized_error  

Mail to administrator has been sent about invalid literal for int() with base 10: 'poem'


ValueError: invalid literal for int() with base 10: 'poem'

Обратите внимание, что в начале ошибки есть уведомление о том, что email отправлен. Еще одна полезная функция: для одного try вы можете писать сразу много except на разные исключения.

```python
try:  
    # открываем файл и считываем строку  
    data_file = open("valuble_data.txt")  
    s = data_file.readline()  
    # пробуем преобразовать её в число  
    i = float(s.strip())  
except OSError as err:  
    # если файла нет или его не удаётся прочитать, мы получил ошибку операционной системы   
    print("OS error: {0}".format(err))  
except ValueError:  
    # если данные не преобразуется в число, мы получим ValueError  
    print("Could not convert data to float")  
```

## Отладка: введение
Для примеров в этом разделе мы будем использовать [датасет](https://lms.skillfactory.ru/assets/courseware/v1/afb771041483f365e873e8625d02f792/asset-v1:Skillfactory+DST-PRO+15APR2020+type@asset+block/imdb.csv) о фильмах с imdb. В датасете указана основная информация: сборы, год выпуска и т.д. Первые строки датасета:

In [106]:
imdb_data = pd.read_csv('./Unit_7_data/imdb.csv')
imdb_data.head(3)

Unnamed: 0,Rank,Title,Genre,Description,Director,Actors,Year,Runtime (Minutes),Rating,Votes,Revenue (Millions),Metascore
0,1,Guardians of the Galaxy,"Action,Adventure,Sci-Fi",A group of intergalactic criminals are forced ...,James Gunn,"Chris Pratt, Vin Diesel, Bradley Cooper, Zoe S...",2014,121,8.1,757074,333.13,76.0
1,2,Prometheus,"Adventure,Mystery,Sci-Fi","Following clues to the origin of mankind, a te...",Ridley Scott,"Noomi Rapace, Logan Marshall-Green, Michael Fa...",2012,124,7.0,485820,126.46,65.0
2,3,Split,"Horror,Thriller",Three girls are kidnapped by a man with a diag...,M. Night Shyamalan,"James McAvoy, Anya Taylor-Joy, Haley Lu Richar...",2016,117,7.3,157606,138.12,62.0


In [None]:
### Задание
В каком году вышел фильм Suicide Squad, информация о котором есть в датасете imdb?

In [9]:
data.Year[data.Title=='Suicide Squad']

4    2016
Name: Year, dtype: int64

## Задание 2
У вас есть функция, которая должна убирать дубликаты из списка и сохранять при этом порядок:

```
remove_dups([1, 12, 4, 1, 4, 8])
# => [1, 12, 4, 8]
```
    
Сейчас она не очень хорошо написана и возвращает исключение: исправьте её

```python
from copy import copy

def remove_dups(values):
    values = copy(values)
    for i in range(len(values)):
        if values[i+1] in values[i:]:
            values.remove(values[i])
    return values
```

In [102]:
def remove_dups(values):
    values = values[::-1]
    for i in range(len(values)-1,0,-1):
        if values[i] in values[:i]:
            values.remove(values[i])
    return values[::-1]

In [104]:
remove_dups([1, 12, 4, 1, 4, 8])

[1, 12, 4, 8]

# Отлов багов
Чтобы поставить программу на паузу в определённом месте, вызовите метод set_trace на этой строчке:

```python
import pdb; pdb.set_trace()  
```
Когда вы запустите программу и интерпретатор дойдёт до этой строчки, у вас откроется интерактивная консоль.

Возможности дебаггера:
- возможно выполнение любого корректного кода в нём: вывести значения любой доступной переменной, метод `locals()` выведет локальные переменные;
- `PP` позволяет вывести словари и их объекты, что упрощает чтение;
- перемещение по коду: `next` выполнит следующую строку, `return` выполнит весь код до конца текущей функции и вернёт интерактивную консоль на следующей строчке, `continue` выйдет из интерактивного режима и продолжит программу.


In [109]:
from collections import Counter  
import pdb  
  
  
def count_genres(column):  
    genres = []  
    # ставим брейкпоинт в этом месте  
    pdb.set_trace()  
    for movie_genres in column:  
        splitted = movie_genres.split(",")  
        genres.extend(splitted)  
    counter = Counter(genres)  
      
    return counter   
   
print(count_genres(imdb_data["Genre"]))  

> [1;32m<ipython-input-109-39f860d5dc7c>[0m(9)[0;36mcount_genres[1;34m()[0m
[1;32m      7 [1;33m    [1;31m# ставим брейкпоинт в этом месте[0m[1;33m[0m[1;33m[0m[1;33m[0m[0m
[0m[1;32m      8 [1;33m    [0mpdb[0m[1;33m.[0m[0mset_trace[0m[1;33m([0m[1;33m)[0m[1;33m[0m[1;33m[0m[0m
[0m[1;32m----> 9 [1;33m    [1;32mfor[0m [0mmovie_genres[0m [1;32min[0m [0mcolumn[0m[1;33m:[0m[1;33m[0m[1;33m[0m[0m
[0m[1;32m     10 [1;33m        [0msplitted[0m [1;33m=[0m [0mmovie_genres[0m[1;33m.[0m[0msplit[0m[1;33m([0m[1;34m","[0m[1;33m)[0m[1;33m[0m[1;33m[0m[0m
[0m[1;32m     11 [1;33m        [0mgenres[0m[1;33m.[0m[0mextend[0m[1;33m([0m[0msplitted[0m[1;33m)[0m[1;33m[0m[1;33m[0m[0m
[0m
ipdb> continue
Counter({'Drama': 501, 'Action': 296, 'Comedy': 277, 'Adventure': 254, 'Thriller': 189, 'Crime': 146, 'Romance': 138, 'Sci-Fi': 117, 'Horror': 117, 'Mystery': 103, 'Fantasy': 100, 'Biography': 80, 'Family': 51, 'Animation':

## Задание
У нас есть функция `group_values(db, value_key, group_key, step)`. Она должна группировать объекты из `db` по ключу `group_key` с шагом `step`. В результат попадает только значение аттрибута `value_key`.

Это похоже на гистограмму, когда мы раскладываем значения по корзинам определённого размера. Скажем, у нас есть пользователи:
```python
   user_db = [
    {"name": "Elena", "age": 19, "salary": 80000},
    {"name": "Sergey", "age": 31, "salary": 160000},
    {"name": "Olga", "age": 33, "salary": 170000},
    {"name": "Vadim", "age": 17, "salary": 45000}
]
```
Мы хотим сгруппировать их зарплаты(**salary**) по возрасту(**age**) с шагом в **10 лет**. Получится
```python
group_values(user_db, "salary", "age", 10)
# => 
# {
#     10: [80000, 45000],
#     30: [160000, 170000]
# }
```
    
Обратите внимание. Функция должна возвращать словарь, по ключам которого расположены списки.
Сейчас функция возвращает что-то не то. Исправьте это, пользуясь **pdb**. Для этого вам нужно скопировать код на свой компьютер и запустить либо в Python, либо в Jupyter. Входной формат именно такой, как указан в примере **user_db**
```python
from collections import defaultdict

def group_values(db, value_key, group_key, step):
    grouped = defaultdict(list) 
    for item in db:
        grouped[item[group_key] % step].append(item[value_key])
    return grouped
```    

In [120]:
   user_db = [
    {"name": "Elena", "age": 19, "salary": 80000},
    {"name": "Sergey", "age": 31, "salary": 160000},
    {"name": "Olga", "age": 33, "salary": 170000},
    {"name": "Vadim", "age": 17, "salary": 45000}
]

In [134]:
from collections import defaultdict

def group_values(db, value_key, group_key, step):
    grouped = defaultdict(list) 
    for item in db:
        grouped[(item[group_key]//step)*step].append(item[value_key])
    return dict(grouped)

In [133]:
group_values(user_db, "salary", "age", 10)

{10: [80000, 45000], 30: [160000, 170000]}

# Автоматическое тестирование
Сложности, которые могут возникнуть  с ручным тестированием, может решить автоматическое тестирование. В разделе отладки мы говорили, что нужно анализировать поток данных: что поступает на вход и получается на выходе; на это и нацелены тесты функций.

Воспользуемся библиотекой `pytest`, которая позволяет определять тесты и используется в крупных проектах. Документацию к библиотеке можно посмотреть [здесь](https://docs.pytest.org/en/latest/). 

Запустилось три теста (collected 3 items), и все три корректно отработали (3 passed):
```python
# Чтобы написать тест, мы должны определить функцию, имя которой начинается на test_  
# после этого мы используем ключевое слово assert, которое проверят, является ли истинным значение сразу за ним  
def test_something():  
    assert True  
      
def test_equal_string():  
    greetings = "Hello, " +  "world"  
    assert greetings == "Hello, world"  
  
def test_numbers():  
    total = 73 + 42  
    assert total == 115  
```

Сами тесты мы пишем в отдельном файле с расширением .py. Тесты (функции) прописываем сами, они обязательно должны начинаться с ключевого слова test (для библиотеки pytest).
Процесс тестирования заключается в том, что мы запускаем файл с расширением .py в котором содержатся наши функции с помощью утилиты pytest в командной строке.
Процесс тестирования можно выполнить и в Jupiter. Для этого вы создаете файл с расширением .py рядом с вашим ноутбуком (файлом в котором вы работаете). Далее заходите в ноутбук и прописываете команду !pytest имя_файла.py - через ! вы показываете, что используете ячейку как терминал.
Однако удобнее всего тесты проводить в PyCharm или VsCode (смотря, где вам привычнее работать). Вы так же создаете в своем проекте файл с тестами-функциями и запускаете этот файл через pytest через командную строку, встроенную в PyCharm.
Если вы все же захотите подробнее познакомиться с темой автоматического тестирования, то предлагаю вам посмотреть видео:
https://www.youtube.com/watch?v=Sxiwo1pAZos

In [136]:
 !pytest test_sample.py

platform win32 -- Python 3.8.8, pytest-6.2.3, py-1.10.0, pluggy-0.13.1
rootdir: C:\Users\Manych\projects\skillfactory_rds\Unit_7
plugins: anyio-2.2.0
collected 3 items

test_sample.py ...                                                       [100%]

..\..\..\anaconda3\lib\site-packages\pyreadline\py3k_compat.py:8
    return isinstance(x, collections.Callable)



У нас две проблемы с данными в столбце:
- численные данные заведены строкой, так что мы не можем выполнять арифметические операции;
- в данных есть пропуски, например, не у всех фильмов есть оценка с metascore.  

Напишем и протестируем функцию, которая это исправляет. Все тесты проходят, всё корректно работает:

In [140]:
!pytest digitize.py

platform win32 -- Python 3.8.8, pytest-6.2.3, py-1.10.0, pluggy-0.13.1
rootdir: C:\Users\Manych\projects\skillfactory_rds\Unit_7
plugins: anyio-2.2.0
collected 3 items

digitize.py ...                                                          [100%]

..\..\..\anaconda3\lib\site-packages\pyreadline\py3k_compat.py:8
    return isinstance(x, collections.Callable)



## Задание
У нас есть четыре функции. Какие из них являются корректными тестами в pytest?
```python
# 1
def apply_test():
    test_str = "quick brown fox"
    assert test_str[::-1] == "xof nworb kciuq" 

# 2
def test_value():
    assert 3 + 3 == 6

# 3
def test_reverse():
    assert not False 

# 4
def test_list:
    assertion 5 in [1, 2, 5]
```

In [143]:
!pytest task.py

platform win32 -- Python 3.8.8, pytest-6.2.3, py-1.10.0, pluggy-0.13.1
rootdir: C:\Users\Manych\projects\skillfactory_rds\Unit_7
plugins: anyio-2.2.0
collected 3 items

task.py ...                                                              [100%]

..\..\..\anaconda3\lib\site-packages\pyreadline\py3k_compat.py:8
    return isinstance(x, collections.Callable)



# Тесты
## Задание 2
Напишите функцию `safe_exec(ext_func)`, которая получает на вход функцию `func` и пробует её выполнить.

Если `func` выбрасывает исключение, то `safe_exec` выводит поясняющее сообщение этого исключения и возвращает 0.

Если func завершается корректно, то мы возращаем результат выполнения функции.

```python
def zero_div():
    return 5/0
safe_exec(zero_div)
=> division by zero
=> 0

def normal_div():
    return 5/1
safe_exec(normal_div)
=> 5
```

In [149]:
def safe_exec(ext_func):
    try:
        return ext_func()
    except Exception as Exc:
        print(Exc)
        return 0

In [150]:
def zero_div():
    return 5/0
def normal_div():
    return 5/1

In [151]:
safe_exec(zero_div)

division by zero


0

In [152]:
safe_exec(normal_div)

5.0