Тема урока: обработка исключений
Типы ошибок
Работа с кодами возврата
Аннотация. Урок посвящен ошибкам и их типам.

Типы ошибок

Разработка программы на любом языке программирования практически всегда бывает связана с возникновением различного рода ошибок, препятствующих получению желаемого результата.

Обычно выделяют следующие три категории ошибок:

синтаксические – возникают из-за синтаксических погрешностей кода
логические – проявляются вследствие логических неточностей в алгоритме
ошибки времени выполнения, исключения – вызваны некорректными действиями пользователя или системы

Синтаксические ошибки

Синтаксические ошибки являются следствием несоблюдения общепринятого синтаксиса языка. Другими словами, это ошибки, связанные с неправильно набранным кодом. Например пропуск круглой скобки, запятой или двоеточия.

In [1]:
print('Hello, world!'

SyntaxError: incomplete input (3438010775.py, line 1)

In [2]:
def square(num)
    return num ** 2

SyntaxError: expected ':' (427417971.py, line 1)

Синтаксические ошибки легко отлавливаются интерпретатором, который сразу же сообщает программисту о проблеме в написанном коде. 

Логические ошибки

Логические ошибки считаются более сложными в выявлении, поскольку не отлавливаются интерпретатором. Обычно они вызваны определенным недостатком в логике программы, из-за чего результат работы программы отличается от желаемого результата. Возможным решением проблемы является тестирование программы на разных примерах входных данных, для которых известен правильный результат.

In [3]:
def avg(a, b):
    return a + b / 2

описана функция avg(), подсчитывающая среднее значение переданных в нее аргументов. В теле функции допущена логическая ошибка, пропущены скобки, на два должна делиться сумма чисел a и b.

Обратите внимание на то, что приведенная выше функция avg() не всегда работает неверно.

In [4]:
print(avg(0, 7))

3.5


Логические ошибки могут проявлять себя только при определенных условиях. Часто код с логической ошибкой может работать достаточно долго.

Ошибки времени выполнения

Исключения представляют собой еще один вид ошибок, которые проявляются в зависимости от наличия обстоятельств, меняющих ход выполнения программы. Исключения являются ошибками времени выполнения, возникающими в процессе выполнения программы и связанными с некорректностью переданных в программу данных, недоступностью ресурсов и т.д.

In [5]:
num1 = 10
num2 = 0

print(num1 / num2)

ZeroDivisionError: division by zero

Деление на ноль провоцирует исключительную ситуацию, которая приводит к аварийному завершению работы и выводу ошибки на экран. ZeroDivisionError — это название исключения, а division by zero — его краткое описание.

Если мы хотим, чтобы программа работала с широким диапазоном входных данных и внешних условий, то надо учитывать исключения, программа должна их верно обрабатывать.

По умолчанию при обнаружении необработанного исключения Python немедленно останавливает выполнение программы и выводит сообщение об ошибке.

Работа с кодами возврата

В эпоху расцвета процедурного программирования синтаксис работы с исключениями был тривиален и основывался на том, что вернула функция. Если функция возвращала True — все хорошо, если же False — то произошла ошибка. При этом сразу выделились два подхода к работе с ошибками:

подход два в одном — функция возвращает False как для ожидаемой, так и для неожиданной ошибки. Такой подход как правило применялся в API общего назначения и коде пользовательских программ, когда большую часть ошибок можно было смело считать фатальными
подход разделения ошибок, при котором функция возвращает False в случае неожиданной ошибки, а ожидаемую ошибку возвращает отдельным возвращаемым значением (числовым). Такой подход применялся в более надежном коде и подразумевал разделение на ожидаемые ошибки и неожиданные

Для каждой ошибки можно придумать свой код возврата. Коды не должны совпадать с возможными обычными ответами.

Несмотря на то, что язык Python полностью поддерживает работу с исключениями, как с полноценными объектами, мы все же можем встретить следы работы с кодами возврата, которые Python унаследовал от языка C.

Строковый тип данных str содержит два похожих метода find() и index(). Оба метода выполняют одну и ту же работу, а именно ищут позицию первого вхождения подстроки в заданную строку. Однако в случае если подстрока не найдена, то поведение методов отличается. Метод find() использует механизм кодов возврата, в то время как метод index() возбуждает исключение.

In [6]:
text = 'Hello, world!'

print(text.find('w'))
print(text.find('a'))

7
-1


Из-за того, что в строке Hello, world! нет символа a, нам было возвращено значение −1. Это и есть код возврата.

In [7]:
text = 'Hello, world!'

print(text.index('a'))

ValueError: substring not found

При работе с кодами возврата даже простая функция для обработки пользовательских данных обрастает дополнительным кодом, проверкой многих условий и «магическими» кодами возврата. Если функция с кодом возврата находится глубоко в стеке вызовов, то придется сделать так, чтобы ее правильно обрабатывала вся вышестоящая цепочка функций. Каждая из них должна принимать код и возвращать свой.

Примечания

Примечание 1. У работы с исключениями есть преимущества перед кодами возврата. В современных языках программирования, таких как Python, C#, Java, GO и т.д., используются именно исключения.

Примечание 2. Приведем пример незаметной логической ошибки, которая присуща многим реализациям бинарного поиска (или сортировке слиянием). Для реализации алгоритма требуется находить середину некоторого отрезка [low; high]. Обычно это делают так:

In [None]:
mid = (low + high) // 2

Для языка Python такой способ подсчета середины работает нормально, поскольку в Python реализована длинная арифметика. Но, скажем, в языке Java, где стандартные типы данных имеют ограничения, такой способ подсчета середины в некоторых случаях приводит к переполнению, поскольку сумма low + high выходит за размерность типа int

Для решения проблемы можно воспользоваться вот таким приемом:

In [None]:
mid = low + (high - low) // 2

Такая ошибка долгое время находилась в стандартной библиотеке языка Java из-за чего поиск и сортировка на особо больших массивах приводил к возникновению исключения ArrayIndexOutOfBoundsException

Примечание 3. В больших информационных системах у каждой ситуации, у штатной и нештатной, есть свои номера. Наиболее распространенные коды ошибок в сети Интернет:

404 Not Found (не найдено)
503 Service Unavailable (сервис недоступен)

При этом 200 — это код, возвращаемый серверами при успешном выполнении задания.

Примечание 6. Один из способов посмотреть, насколько полезны исключения, предусматривает сравнение кодовых стилей в Python и языках без исключений. Скажем, если мы хотим написать надежную программу на языке C, то обычно должны проверять возвращаемые значения или коды состояния после каждой операции, способной сбиться с пути, и распространять результаты проверок во время выполнения программы:

In [None]:
doStuff()
{
if (doFirstThing() == ERROR)
return ERROR;
if (doNextThing() == ERROR)
    return ERROR;
...
return doLastThing();
}

main()
{
if (doStuff() == ERROR)
    badEnding();
else
    goodEnding();
}

На самом деле реалистичные программы на C часто содержат столько же кода, предназначенного для обнаружения ошибок, сколько и кода для выполнения фактической работы. 

Но в Python нам не придется писать такой код. Мы можем просто помещать произвольно крупные фрагменты программы внутрь обработчиков исключений и писать код, делающий действительную работу, предполагая, что обычно все будет хорошо:

In [None]:
def doStuff():
    doFirstThing()
    doNextThing()
    doLastThing()


try:
    doStuff()
except:
    badEnding()
else:
    goodEnding()

Так как при возникновении исключения управление немедленно передается обработчику, нет нужды снабжать весь код защитой от ошибок, к тому же отсутствуют добавочные накладные расходы в плане производительности, связанные с выполнением всех проверок. Кроме того, поскольку интерпретатор Python выявляет ошибки автоматически, в первую очередь вашему коду часто нет необходимости вообще осуществлять проверки на предмет ошибок. В итоге исключения позволяют почти совершенно игнорировать необычные случаи и избегать написания кода проверки на предмет ошибок, который способен отвлечь от подлинных целей программы.

Ревью кода 😤
Дан файл data.txt. Требовалось написать программу, которая определяет, сколько строк содержится в данном файле, и выводит полученный результат. Программист торопился и написал программу неправильно.

Найдите и исправьте все ошибки, допущенные в этой программе (их ровно 3).

Примечание. Известно, что каждая ошибка затрагивает только одну строку и может быть исправлена без изменения других строк.

In [None]:
total = 0

with open('data.txt', encoding='utf-8') as file:
    for _ in file.readlines():
        total += 1

print(total)

Ревью кода 😠
Требовалось реализовать функцию swapcase_vowels(), которая принимает в качестве аргумента строку, заменяет в ней все гласные латинские буквы на заглавные и возвращает полученную новую строку. Программист торопился и реализовал функцию неправильно.

Найдите и исправьте все ошибки, допущенные в реализации этой функции (их ровно 3).

Примечание. Известно, что каждая ошибка затрагивает только одну строку и может быть исправлена без изменения других строк.

In [None]:
def swapcase_vowels(string):
    vowels = 'aeiouy'
    swapped_string = ''

    for char in string:
        if char in vowels:
            char = char.upper()
        swapped_string += char

    return swapped_string

Ревью кода 😡
Требовалось написать программу, которая принимает на вход два целых числа a и b, каждое на отдельной строке, и выводит список всех целых чисел от a до b включительно, которые делятся на 7 без остатка. Программист торопился и написал программу неправильно.

Найдите и исправьте все ошибки, допущенные в этой программе (их ровно 5).

Примечание. Известно, что каждая ошибка затрагивает только одну строку и может быть исправлена без изменения других строк.

In [None]:
a = int(input())
b = int(input())
numbers = list()

for i in range(a, b + 1):
    if i % 7 == 0:
        numbers.append(i)

print(numbers)

Ревью кода 🤬
Требовалось реализовать функцию get_max_index(), которая принимает в качестве аргумента список различных целых чисел и возвращает индекс наибольшего числа из этого списка (начиная с 0). Программист торопился и реализовал функцию неправильно.

Найдите и исправьте все ошибки, допущенные в реализации этой функции (их ровно 4).

Примечание. Известно, что каждая ошибка затрагивает только одну строку и может быть исправлена без изменения других строк.

In [None]:
def get_max_index(numbers: list):
    max_index = 0
    max_value = numbers[0]

    for index, value in enumerate(numbers): 
        if value > max_value: 
            max_index = index
            max_value = value

    return max_index