# Что такое исключение

Задание 2

Определите функцию check_server, которая принимает на вход переменную mode.

 - Если mode имеет значение "memory", программа должна вернуть строку "Memory is ok".
 - Если mode имеет значение "connection", программа должна вернуть строку "Connection is ok".
 - Для остальных случае программа должна выбросить исключение ValueError.

In [1]:
def check_server(mode):
    if mode == "memory":
        return "Memory is ok"
    elif mode == "connection":
        return "Connection is ok"
    else:
        raise ValueError

# Иерархия исключений

Иерархия исключений

Исключения в Python имеют иерархию: у нас есть более общие и более специфичные исключения. Вот график исключений:
   
<img src="../images/exception_hierarchy.png" alt="Binary-cross-entropy" width="800" align="center">   
   
Здесь мы видим, что KeyError и IndexError являются подмножеством LookupError, которая является подмножеством Exception. На практике это имеет следующее значение: если мы укажем более верхнеуровневые исключения, то "отловятся" все дочерние, но не наоборот.        

In [2]:
# Напишем функцию, которая может обращаться и к спискам, и к словарям  
# при этом не выбрасывая исключение для несуществующих индексов/ключей   
def safe_element(collection, place):  
    try:  
        return(collection[place])  
    except LookupError:  
        print("Key or index not found")  


users = ["Pavel", "Elena", "Sergey"]  
safe_element(users, 1)  
# => 'Elena'  

safe_element(users, 3)  
# => 'Key or index not found'   
  
prices = {"apple": 10, "orange": 20}  
safe_element(prices, "apple")  
# => 10

safe_element(prices, "carrot")  
# => 'Key or index not found'  

Key or index not found
Key or index not found


**Задание 2**

Напишите программу, которая реализует безопасное сложение двух объектов x и y.

Если объекты не могут быть сложены, функция должна:

 - Отловить TypeError
 - Вывести на экран "Can't sum x and y", где x и y - переданные числа
 - Вернуть 0

In [3]:
def safe_sum(x, y):
    s = 0 
    try:
        s = x + y
    except TypeError:
        print("Can't sum x and y")
    return s

In [4]:
safe_sum(1, 2)

3

In [5]:
safe_sum(5, 'a')

Can't sum x and y


0

# Детали try-except

Мы рассмотрели базовый синтаксис try-except, однако у него есть ещё несколько вариаций. Они не часто встречаются на практике, но мы о них расскажем. Иногда в блоке except нам нужен доступ к самому объекту исключения, например, мы хотим получить поясняющее сообщение и вывести его на экран, но при этом продолжить программу дальше. Мы можем это сделать с помощью ключевого слова 'as', за которым идёт имя новой переменной.

In [6]:
try:  
    5/0  
except ZeroDivisionError as zero_error:  
    # здесь в zero_error мы получаем сам объект исключения  
    # print как раз выведет его поясняющее сообщение  
    print(zero_error)  

print("Program ends correctly")  

division by zero
Program ends correctly


Ещё один распространённый подход: мы совершаем какое-то промежуточное действие, а потом перевыбрасываем исключение.

In [7]:
# Пусть у нас есть функция, которая шлёт емейл разработчику об ошибке  
def notify_admin(error):  
    print("Mail to administrator has been sent about", error)  
      
value = "poem"  
try:  
    digitized = int(value)  
except ValueError as digitized_error:  
    notify_admin(digitized_error)  
    raise digitized_error  

Mail to administrator has been sent about invalid literal for int() with base 10: 'poem'


ValueError: invalid literal for int() with base 10: 'poem'

Обратите внимание, что в начале ошибки есть уведомление о том, что email отправлен. Еще одна полезная функция: для одного try вы можете писать сразу много except на разные исключения.

In [8]:
try:  
    # открываем файл и считываем строку  
    data_file = open("valuble_data.txt")  
    s = data_file.readline()  
    # пробуем преобразовать её в число  
    i = float(s.strip())  
except OSError as err:  
    # если файла нет или его не удаётся прочитать, мы получил ошибку операционной системы   
    print("OS error: {0}".format(err))  
except ValueError:  
    # если данные не преобразуется в число, мы получим ValueError  
    print("Could not convert data to float")  

OS error: [Errno 2] No such file or directory: 'valuble_data.txt'


У try-except есть блоки else и finally; первый выполняется в случае, если мы не встретили исключение в try, и используется в основном для написания чуть более чистого кода. Finally выполняется в любом случае, даже если возникло непредвиденное исключение или выход с помощью return. Обычно используется для корректного освобождения ресурсов, например, закрытия файлов.

**Задание 2**

У вас есть функция, которая должна убирать дубликаты из списка и сохранять при этом порядок:

remove_dups([1, 12, 4, 1, 4, 8])

=> [1, 12, 4, 8]

Сейчас она не очень хорошо написана и возвращает исключение: исправьте её

In [9]:
from copy import copy

def remove_dups(values):
    values_out = []
    for i in range(len(values)):
        print(f'{i} {values[i]} {values_out}')
        if values[i] not in values_out:
            values_out.append(values[i])
    return values_out


In [10]:
remove_dups([1, 12, 4, 1, 4, 8])

0 1 []
1 12 [1]
2 4 [1, 12]
3 1 [1, 12, 4]
4 4 [1, 12, 4]
5 8 [1, 12, 4]


[1, 12, 4, 8]

# Отлов" багов

**Баги** — ошибки в **логике** программы, и они менее очевидны для отладки, чем явные исключения. Вы можете быть уверены, что код работает идеально, а спустя несколько дней обнаружить, что он возвращает неверные ответы. Начинать следует с определения **места ошибки**; так как сообщений об ошибке нет, то задача сводится к нахождению **аномалии** в данных. Для этого отлично подходят **дебаггеры**, и в Python есть встроенный — **pdb**.


Ранее мы использовали print, чтобы выводить переменные перед строкой с ошибкой. **Дебаггеры** решают примерно ту же задачу, только делают это гораздо лучше: они позволяют остановить программу посреди выполнения и посмотреть на её состояние через **интерактивную консоль**.

Чтобы поставить программу на паузу в определённом месте, вызовите метод set_trace на этой строчке:

***import pdb; pdb.set_trace()  ***

Когда вы запустите программу и интерпретатор дойдёт до этой строчки, у вас откроется интерактивная консоль.

**Возможности дебаггера:**

 - возможно выполнение любого корректного кода в нём: вывести значения любой доступной переменной, метод **locals()** выведет локальные переменные;
 - PP позволяет вывести словари и их объекты, что упрощает чтение;
 - перемещение по коду: **next** выполнит следующую строку, **return** выполнит весь код до конца текущей функции и вернёт интерактивную консоль на следующей строчке, **continue** выйдет из интерактивного режима и продолжит программу.

# Использование pdb


В предыдущем блоке мы привели основные команды pdb. Полный список команд выводится по запросу **help** внутри интерактивной сессии pdb, а пока давайте посмотрим работу метода на конкретном примере. Пусть у нас есть следующая функция:

In [15]:
import pandas as pd

imdb_data = pd.read_csv('../data/imdb.csv')
imdb_data.head()

Unnamed: 0,Rank,Title,Genre,Description,Director,Actors,Year,Runtime (Minutes),Rating,Votes,Revenue (Millions),Metascore
0,1,Guardians of the Galaxy,"Action,Adventure,Sci-Fi",A group of intergalactic criminals are forced ...,James Gunn,"Chris Pratt, Vin Diesel, Bradley Cooper, Zoe S...",2014,121,8.1,757074,333.13,76.0
1,2,Prometheus,"Adventure,Mystery,Sci-Fi","Following clues to the origin of mankind, a te...",Ridley Scott,"Noomi Rapace, Logan Marshall-Green, Michael Fa...",2012,124,7.0,485820,126.46,65.0
2,3,Split,"Horror,Thriller",Three girls are kidnapped by a man with a diag...,M. Night Shyamalan,"James McAvoy, Anya Taylor-Joy, Haley Lu Richar...",2016,117,7.3,157606,138.12,62.0
3,4,Sing,"Animation,Comedy,Family","In a city of humanoid animals, a hustling thea...",Christophe Lourdelet,"Matthew McConaughey,Reese Witherspoon, Seth Ma...",2016,108,7.2,60545,270.32,59.0
4,5,Suicide Squad,"Action,Adventure,Fantasy",A secret government agency recruits some of th...,David Ayer,"Will Smith, Jared Leto, Margot Robbie, Viola D...",2016,123,6.2,393727,325.02,40.0


In [16]:
from collections import Counter  
  
# Считаем, сколько фильмов в каждом жанре  
def count_genres(column):  
    genres = []  
    for movie_genres in column:  
        splitted = movie_genres.split(",")  
        genres.extend(splitted)  
    counter = Counter(genres)  
      
    return counter   
   
print(count_genres(imdb_data["Genre"]))  

Counter({'Drama': 501, 'Action': 296, 'Comedy': 277, 'Adventure': 254, 'Thriller': 189, 'Crime': 146, 'Romance': 138, 'Sci-Fi': 117, 'Horror': 117, 'Mystery': 103, 'Fantasy': 100, 'Biography': 80, 'Family': 51, 'Animation': 49, 'History': 26, 'Sport': 18, 'Music': 16, 'War': 13, 'Western': 7, 'Musical': 5})


Мы получили результат, но чтобы лучше понять, как мы это сделали, воспользуемся дебаггером. Для этого поставим вызов **pdb.set_trace()** в начале функции. Вызов дебаггера часто называют брейкпоинтом (breakpoint, точка прерывания), потому что программа ставится на паузу в этой точке.

In [17]:
from collections import Counter  
import pdb  
  

def count_genres(column):  
    genres = []  
    # ставим брейкпоинт в этом месте  
    pdb.set_trace()  
    for movie_genres in column:  
        splitted = movie_genres.split(",")  
        genres.extend(splitted)  
    counter = Counter(genres)  
      
    return counter   
   
print(count_genres(imdb_data["Genre"]))  

> <ipython-input-17-fc391a0a671f>(9)count_genres()
-> for movie_genres in column:
(Pdb) help

Documented commands (type help <topic>):
EOF    c          d        h         list      q        rv       undisplay
a      cl         debug    help      ll        quit     s        unt      
alias  clear      disable  ignore    longlist  r        source   until    
args   commands   display  interact  n         restart  step     up       
b      condition  down     j         next      return   tbreak   w        
break  cont       enable   jump      p         retval   u        whatis   
bt     continue   exit     l         pp        run      unalias  where    

Miscellaneous help topics:
exec  pdb

(Pdb) genres
[]
(Pdb) next
> <ipython-input-17-fc391a0a671f>(10)count_genres()
-> splitted = movie_genres.split(",")
(Pdb) column
0       Action,Adventure,Sci-Fi
1      Adventure,Mystery,Sci-Fi
2               Horror,Thriller
3       Animation,Comedy,Family
4      Action,Adventure,Fantasy
           

**Задание**

У нас есть функция group_values(db, value_key, group_key, step). Она должна группировать объекты из db по ключу group_key с шагом step. В результат попадает только значение аттрибута value_key.

Это похоже на гистограмму, когда мы раскладываем значения по корзинам определённого размера. Скажем, у нас есть пользователи:

user_db = [
    {"name": "Elena", "age": 19, "salary": 80_000},
    {"name": "Sergey", "age": 31, "salary": 160_000},
    {"name": "Olga", "age": 33, "salary": 170_000},
    {"name": "Vadim", "age": 17, "salary": 45_000}
]

Мы хотим сгруппировать их зарплаты(salary) по возрасту(age) с шагом в 10 лет. Получится

group_values(user_db, "salary", "age", 10)

=> 
 {
     10: [80_000, 45_000],
     30: [160_000, 170_000]
 }
 
Сейчас функция возвращает что-то не то. Исправьте это, пользуясь pdb. Для этого вам нужно скопировать код на свой компьютер и запустить либо в Python, либо в Jupyter. Входной формат именно такой, как указан в примере user_db

In [19]:
user_db = [
    {"name": "Elena", "age": 19, "salary": 80_000},
    {"name": "Sergey", "age": 31, "salary": 160_000},
    {"name": "Olga", "age": 33, "salary": 170_000},
    {"name": "Vadim", "age": 17, "salary": 45_000}
]

In [23]:
from collections import defaultdict
import pdb 

def group_values(db, value_key, group_key, step):
    grouped = defaultdict(list) 
    pdb.set_trace()
    for item in db:
        grouped[(item[group_key] // step) * step].append(item[value_key])
    return grouped

In [24]:
group_values(user_db, "salary", "age", 10)

> <ipython-input-23-03833ac43756>(7)group_values()
-> for item in db:
(Pdb) continue


defaultdict(list, {10: [80000, 45000], 30: [160000, 170000]})

# Автоматическое тестирование

Сложности, которые могут возникнуть  с ручным тестированием, может решить автоматическое тестирование. В разделе отладки мы говорили, что нужно анализировать поток данных: что поступает на вход и получается на выходе; на это и нацелены тесты функций.

Воспользуемся библиотекой pytest, которая позволяет определять тесты и используется в крупных проектах. Документацию к библиотеке можно посмотреть здесь. 

Запустилось три теста (collected 3 items), и все три корректно отработали (3 passed):

In [25]:
# Чтобы написать тест, мы должны определить функцию, имя которой начинается на test_  
# после этого мы используем ключевое слово assert, которое проверят, является ли истинным значение сразу за ним  
def test_something():  
    assert True  
      
def test_equal_string():  
    greetings = "Hello, " +  "world"  
    assert greetings == "Hello, world"  

def test_numbers():  
    total = 73 + 42  
    assert total == 115  

In [27]:
!pytest basic_test.py  

platform linux -- Python 3.6.6, pytest-5.2.1, py-1.8.0, pluggy-0.13.0
rootdir: /notebooks/SkillFactory/home_work
plugins: doctestplus-0.4.0, openfiles-0.4.0, arraydiff-0.3, remotedata-0.3.2
[1mcollecting ... [0m[1mcollected 3 items                                                              [0m

basic_test.py [32m.[0m[32m.[0m[32m.[0m[36m                                                        [100%][0m



У нас две проблемы с данными в столбце:

- численные данные заведены строкой, так что мы не можем выполнять арифметические операции;
- в данных есть пропуски, например, не у всех фильмов есть оценка с metascore.

Напишем и протестируем функцию, которая это исправляет. Все тесты проходят, всё корректно работает:

In [None]:
# Функция, которая обращает все строки в числа и подставляет значение по умолчанию, если встречает пропуск.  
def digitize_values(collection, default=0):  
    no_missed = [value if value else default for value in collection]   
    return [float(value) for value in no_missed]  
  
# Мы передаём на вход произвольные параметры и смотрим, что функция корректно работает с ними   
# Проверим, что функция корректно обращает список строк в список чисел  
def test_digitize_convert_to_float():  
    assert digitize_values(["10", "50"])  == [10, 50]  
    assert digitize_values(["70.2", "33.4"]) == [70.2, 33.4]  
      
# Хорошей практикой считается покрывать разные аспекты функции в разных тестах  
# Здесь мы проверим, что функция закрывает пропуски   
def test_digitize_restore_missed():  
    assert digitize_values([""], 10) == [10]  
    assert digitize_values(["20", None], 50) == [20, 50]  
      
# Ещё стоит проверять, что наша функция корректно работает на граничных значениях  
# Например, на пустых данных  
def test_digitize_empty():  
    assert digitize_values([]) == []  

In [30]:
!pytest digitize.py  

platform linux -- Python 3.6.6, pytest-5.2.1, py-1.8.0, pluggy-0.13.0
rootdir: /notebooks/SkillFactory/home_work
plugins: doctestplus-0.4.0, openfiles-0.4.0, arraydiff-0.3, remotedata-0.3.2
collected 3 items                                                              [0m

digitize.py [32m.[0m[32m.[0m[32m.[0m[36m                                                          [100%][0m



**Задание**

У нас есть четыре функции. Какие из них являются корректными тестами в pytest?

N_1
def apply_test():
    test_str = "quick brown fox"
    assert test_str[::-1] == "xof nworb kciuq" 

N_2
def test_value():
    assert 3 + 3 == 6

N_3
def test_reverse():
    assert not False 

N_4
def test_list:
    assertion 5 in [1, 2, 5]

In [33]:
!pytest hometask.py

platform linux -- Python 3.6.6, pytest-5.2.1, py-1.8.0, pluggy-0.13.0
rootdir: /notebooks/SkillFactory/home_work
plugins: doctestplus-0.4.0, openfiles-0.4.0, arraydiff-0.3, remotedata-0.3.2
collected 2 items                                                              [0m

hometask.py [32m.[0m[32m.[0m[36m                                                           [100%][0m



# Типы тестов

Тесты, которые мы написали в предыдущем блоке, называются unit-тестами, потому что они проверяют отдельный блок. Они помогают проверить работу отдельных функций, но остаётся вопрос: корректно ли функции взаимодействуют друг с другом. Для этого есть ещё два типа тестов: интеграционный и приёмочный.

Интеграционные тесты проверяют, что отдельные функции корректно обмениваются данными. Это подобно проверке того, что USB-провод входит в USB-порт. Приёмочные тесты проверяют код в контексте пользователя, например, автоматически прокликивая программу или веб-приложение на популярных сценариях использования продукта.

Тестирование — большая область; есть отдельные курсы на эту тему и даже отдельная профессия QA-инженер, который занимается исключительно тестированием. Мы надеемся, что у вас появилось общее представление о том, зачем нужны тесты и как их делать. Более подробное введение в тестирование есть в книгах Гарри Персиваля и Брайана Оккена.

# Итоги

**Задание**

Напишите функцию safe_exec(ext_func), которая получает на вход функцию func и пробует её выполнить.

Если func выбрасывает исключение, то safe_exec выводит поясняющее сообщение этого исключения и возвращает 0.

Если func завершается корректно, то мы возращаем результат выполнения функции.

def zero_div():
    return 5/0
safe_exec(zero_div)
=> division by zero
=> 0

def normal_div():
    return 5/1
safe_exec(normal_div)
=> 5

In [34]:
def safe_exec(ext_func):
    try:
        return ext_func()
    except Exception as err:
        print(err)
        return 0

In [35]:
def zero_div():
    return 5/0
safe_exec(zero_div)
# division by zero
# 0

division by zero


0

In [36]:
def normal_div():
    return 5/1
safe_exec(normal_div)
# 5

5.0