<center>
<br />
<h1>Обработка ошибок. Модули. </h1>
<h3>Python</h3>
<br />


# Ошибки в программах

- Синтаксические (написали непонятно что)
- Критические ошибки, несовместимые с жизнью  (выключился компьютер)
- Рядовые ошибки, которые мы хотим уметь обрабатывать (поделили на ноль)

### Синтаксические ошибки
Обнаруживаются компилятором до запуска скрипта

In [8]:
compile('a = 2 * 5 + 3)', '', 'exec')

SyntaxError: invalid syntax (<string>, line 1)

### Исключительные ситуации
Ошибки, которые можно обрабатывать. Это удобно.

In [3]:
[1, 2, 3] + 5

TypeError: can only concatenate list (not "int") to list

In [4]:
[1] * int(1e16)

MemoryError: 

Нужно уметь делать 2 вещи:

+ Создавать исключения и понимать когда они появляются
+ Обрабатывать исключения

Стратегии написания кода, которые позволяют избежать исключения

### Стратегии обработки ошибок :: Look Before You Leap

In [15]:
dict_ = {'key_': 3}
value = 0

In [16]:
if "key" in dict_:
    value += dict_["key"]
    print('done')
else:
    print('not done')

not done


In [6]:
def add(a, b):
    if not isinstance(a, (int, float)):
        return 0

    if not isinstance(b, (int, float)):
        return 0
    
    return a + b

In [17]:
import this

The Zen of Python, by Tim Peters

Beautiful is better than ugly.
Explicit is better than implicit.
Simple is better than complex.
Complex is better than complicated.
Flat is better than nested.
Sparse is better than dense.
Readability counts.
Special cases aren't special enough to break the rules.
Although practicality beats purity.
Errors should never pass silently.
Unless explicitly silenced.
In the face of ambiguity, refuse the temptation to guess.
There should be one-- and preferably only one --obvious way to do it.
Although that way may not be obvious at first unless you're Dutch.
Now is better than never.
Although never is often better than *right* now.
If the implementation is hard to explain, it's a bad idea.
If the implementation is easy to explain, it may be a good idea.
Namespaces are one honking great idea -- let's do more of those!


Это не рекомендуется в питоне

+ Код сложнее
+ Код медленнее

Поскольку чаще функции используются правильно, а не непавильно, хотелось бы чтобы корректные вызовы не сильно замедляли выполнение функции

### Стратегии обработки ошибок :: It's easier to ask for forgiveness than permission

In [24]:
dict_ = {'1': 1}
value = 0

In [25]:
value += dict_['key']

KeyError: 'key'

In [29]:
try:
    value += dict_["key"]
except KeyError:
    print('in except')

in except


In [28]:
value

0

In [8]:
def add(a, b):
    try:
        return a + b
    except TypeError:
        return 0

### try ... except

except (тип исключения или кортеж типов) (имя для перехваченного исключения)

In [32]:
TypeError.__format__

<method '__format__' of 'object' objects>

In [9]:
def dangerous(lst):
    lst[2] += 1
    return lst

try:
    dangerous(['1', '2', '4'])
except TypeError as e:
    print('TypeError in dangerous(..) : {}'.format(e))


TypeError in dangerous(..) : can only concatenate str (not "int") to str


In [10]:
def dangerous(lst):
    lst[2] += 1
    return lst

try:
    dangerous(['1', '2'])
except TypeError as e:
    print('TypeError in dangerous(..) : {}'.format(e))
except IndexError as e:
    print('IndexError in dangerous(..) : {}'.format(e))


IndexError in dangerous(..) : list index out of range


In [33]:
def dangerous(lst):
    lst[2] += 1
    return lst

try:
    dangerous(['1', '2'])
except (TypeError, IndexError) as e:
    print('{} in dangerous(..) : {}'.format(e.__class__.__name__, e))



IndexError in dangerous(..) : list index out of range


except сопоставляет исключения с переданными ему типами с помощью isinstance

### raise
генерирует исключение

In [12]:
raise TypeError('whatever')

TypeError: whatever

## Встроенные исключения :: Иерархия

Можно raise-ить все что угодно, что отнаследовано от BaseException

In [34]:
issubclass(Exception, BaseException)

True

In [13]:
issubclass(TypeError, BaseException)

True

In [14]:
issubclass(TypeError, Exception)

True

При этом не все, что отнаследовано от BaseEexception, является ошибкой. Плохой паттерн, когда ошибки на самом деле контролируют выполнение кода, но в питоне в несколькоих местах он реализован

In [15]:
issubclass(KeyboardInterrupt, BaseException)

True

In [16]:
issubclass(KeyboardInterrupt, Exception)

False

In [17]:
BaseException.__subclasses__()

[Exception, GeneratorExit, SystemExit, KeyboardInterrupt]

### Вывод - не делать так

In [18]:
try:
    # code
except:
    # handling

IndentationError: expected an indented block (<ipython-input-18-8bde34e14932>, line 3)

### А так можно

In [19]:
try:
    # code
except Exception:
    # handling

IndentationError: expected an indented block (<ipython-input-19-36f45a23f410>, line 3)

## Встроенные исключения :: AssertionError

In [36]:
assert 1 == 2, "Math still works!"

AssertionError: Math still works!

AssertionError генерируется, как правило, из-за ошибки программиста, перехватывать его не нужно

Ставить assert-ы в своих функциях - полезно

## Встроенные исключения :: NameError, AttributeError, LookupError

In [37]:
no_such_name

NameError: name 'no_such_name' is not defined

In [38]:
object().no_such_name

AttributeError: 'object' object has no attribute 'no_such_name'

In [22]:
LookupError.__subclasses__()

[IndexError,
 KeyError,
 encodings.CodecRegistryError,
 jinja2.exceptions.TemplateNotFound,
 jedi.evaluate.stdlib.NotInStdLib]

## Встроенные исключения :: ValueError, TypeError

ValueError - стоит пользоваться, если непонятно что вызывать.  В примере ниже объясняется неплохо, но в общем случае тяжело

In [23]:
"test string".split("")

ValueError: empty separator

In [39]:
2 + '3'

TypeError: unsupported operand type(s) for +: 'int' and 'str'

## Полный список исключений лучше посмотреть в документации

In [41]:
from math import log

In [25]:
Exception.__subclasses__()

[TypeError,
 StopAsyncIteration,
 StopIteration,
 ImportError,
 OSError,
 EOFError,
 RuntimeError,
 NameError,
 AttributeError,
 SyntaxError,
 LookupError,
 ValueError,
 AssertionError,
 ArithmeticError,
 SystemError,
 ReferenceError,
 BufferError,
 MemoryError,
 locale.Error,
 sre_constants.error,
 sre_parse.Verbose,
 subprocess.SubprocessError,
 tokenize.TokenError,
 tokenize.StopTokenizing,
 runpy._Error,
 copy.Error,
 zlib.error,
 _lzma.LZMAError,
 shutil.RegistryError,
 inspect.EndOfBlock,
 struct.error,
 traitlets.traitlets.TraitError,
 argparse.ArgumentError,
 argparse.ArgumentTypeError,
 traitlets.config.loader.ConfigError,
 traitlets.config.configurable.ConfigurableError,
 traitlets.config.application.ApplicationError,
 pydoc.ErrorDuringImport,
 bdb.BdbQuit,
 pygments.util.OptionError,
 pdb.Restart,
 pexpect.exceptions.ExceptionPexpect,
 termios.error,
 ptyprocess.ptyprocess.PtyProcessError,
 IPython.utils.process.FindCmdError,
 IPython.utils.path.HomeDirError,
 IPython.core.p

## Пользовательские исключения
Достаточно пронаследоаться от класса Exception

Лучше групировать свои исключения за одним базовым классом, чтобы пользовтель вашей библиотеки мог пеерехватить их все и только их

In [44]:
class ShoeError(Exception):
    pass

class WrongFootError(ShoeError):
    def __str__(self):
        return 'Try another one!'
    
# except ShoeError as e:
#     do_sth()
raise WrongFootError()

WrongFootError: Try another one!

Основные эксепшены просто хранят внутри себя args и все

In [47]:
class UntiedShoelaceError(ShoeError):
    def __init__(self, shoe, *args):
        super().__init__(*args)
        self.shoe = shoe
        
    def __str__(self):
        return '{} shoe laces are untied.'.format(self.shoe)

raise UntiedShoelaceError('Right', 1, 2, 3)

UntiedShoelaceError: Right shoe laces are untied.

### Структура объекта исключения

In [50]:
try:
    raise TypeError('this', 'is', 'test')
except TypeError as e:
    caught = e
    
caught.args

('this', 'is', 'test')

In [51]:
caught.__traceback__

<traceback at 0x7fc5ca5b5188>

Объект исключения удаляется при выходи из эксепшена из-за бэктрейса, который может быть довольно большим

In [52]:
import traceback

traceback.print_tb(caught.__traceback__)

  File "<ipython-input-50-94d12f8fb924>", line 2, in <module>
    raise TypeError('this', 'is', 'test')


Внутри исключеения хранятся args и traceback

## Несколько деталей :: raise без аргументов

In [25]:
def broken():
    raise Banana
    
try:
    broken()
except Exception as e:
    print('Billy was here!')
    raise  
    # поднимает исключение, которое было отловлено
    

Billy was here!


NameError: name 'Banana' is not defined

## Несколько деталей :: else в except

In [66]:
import random 

def maybe_broken():
    if random.random() > 0.5:
        raise ValueError('waisted')
    else:
        return 42
    
try:
    maybe_broken()
except ValueError as e:
     print('Unfortunate!')
else:
     print('Fortunate!')

print('Done')
    

Unfortunate!
Done


## Несколько деталей :: finally

In [70]:
import random 

def maybe_broken():
    if random.random() > 0.5:
        raise ValueError('waisted')
    else:
        return 42
    
try:
    maybe_broken()
except TypeError as e:  # заметьте, что здесь ловится другое исключение
     print('Unfortunate!')
else:
     print('Fortunate!')
finally:
    print('Done')  # выполняется всегда в самом конце, нужно например для освобожения ресурсов
    

Done


ValueError: waisted

## Несколько деталей :: exception chain

Есть цепочка exception-ов, которые позволяют сохранять последовательность эксепшенов, вылетающих при обработке других эксепшенов (уровень вложенности ограничен, но 3-4 исключения точно поддерживается)

In [29]:
import random 

def broken(*args):
    if args:
        raise ValueError('too many args, i can\'t handle it')

try:
    broken(1)
except ValueError as e:  # note the wrong type of exception in except
    raise TypeError('I don\'t know what to do!')
    

TypeError: I don't know what to do!

# Менеджеры контекста

In [71]:
with open('07.Errors_and_Modules.ipynb') as f:
    print(f.readlines()[:3])

['{\n', ' "cells": [\n', '  {\n']


## Позволяют выразить уже знакомый pattern

In [None]:
r = resource
try:
    use_resource(r)
finally:
    release_resource(r)

In [None]:
with aquire_resource() as r:
    use_resource(r)

## Протокол контекстного менеджера

In [81]:
class File():
    def __init__(self, filename, mode):
        print('File.__init__')
        self.filename = filename
        self.mode = mode

    def __enter__(self):
        print('File.__enter__')
        self.open_file = open(self.filename, self.mode)
        return self.open_file

    def __exit__(self, *args):
        print('File.__exit__', args)
        self.open_file.close()
        return True

# все что угодно, у чего поддержаны __enter__ и  __exit__ 
with File('testmodule.py', 'r') as f:
    f.no_such_name()
    print(f.readlines()[:3])

File.__init__
File.__enter__
File.__exit__ (<class 'AttributeError'>, AttributeError("'_io.TextIOWrapper' object has no attribute 'no_such_name'"), <traceback object at 0x7fc5ca5c32c8>)


In [None]:
# with torch.no_grad():
#     predictions = network(x)
    

In [82]:
f.closed

True

- \_\_enter\_\_ -- инициализирует контекст, например открывает файл, то что он вернет запишется в переменную стоящую после as 
- \_\_exit\_\_ -- вызывается при выходе из контекста, принимает три обьекта - Тип исключения, Обьект исключения и traceback.  (== результат работы sys.exc_info) метод должен вернуть True/False в зависимости от того хочет ли он подавить исключение или нет

## В жизни
Контекстные менеджеры удобны, поэтому добавлены в стандартную билиотеку в нескольких местах .  Помимо вышеназванного файла есть  Lock в threading, как и  zipfile.ZipFiles. subprocess.Popen, tarfile.TarFile, telnetlib.Telnet, pathlib.Path, tempfile.TemporaryFile... 

По сути большинство обьектов требующих какого-то закрытия после работы обернуты в контекстные менеджеры. А должны все.

### Полушуточный пример

In [83]:
class Tag(object):
    def __init__(self, name):
        self.name = name
    def __enter__(self):
        print('<{}>'.format(self.name))
    def __exit__(self, *args):
        print('</{}>'.format(self.name))

        
with Tag('p'):
    print('Awesome paragraph')


<p>
Awesome paragraph
</p>


Cерьезное использоание этой штуки я не видел

In [84]:
from contextlib import ContextDecorator

class makeparagraph(ContextDecorator):
    def __enter__(self):
        print('<p>')
        return self

    def __exit__(self, *exc):
        print('</p>')
        return False

@makeparagraph()
def emit_html():
    print('Hi again!')

emit_html()

<p>
Hi again!
</p>


###  redirect_stdout

In [None]:
try:
    do_large_fn()
except Exception as e:
    pass

In [86]:
from contextlib import redirect_stdout
import sys

with redirect_stdout(sys.stderr):
    print('test')

test


## supress

In [85]:
from contextlib import suppress

with suppress(ValueError, TypeError):
    print(2 + '3')

# Модули

 - Модуль это файл с расширением .py

 - Модули можно импортировать командой import

 - При импорте модуль выполняется

 - Каждый модуль при импорте создаёт своё пространство имен, атрибуты которого соответствуют именам определенным в файле

 - Повторная попытка импорта ни к чему ни приведет


### import

In [1]:
!cat testmodule.py

"testmodule doc"

def test():
    print('Hi')
    
var = 'foo'

print('i am testmodule')

if __name__ == "__main__":
    print('tetstmodule main')

In [2]:
import testmodule

i am testmodule


In [3]:
testmodule.__name__

'testmodule'

In [4]:
testmodule.__file__

'/Users/alexandermarkov/Documents/Work/HSE/python/seminars/testmodule.py'

In [5]:
testmodule.__doc__  # первая строка 

'testmodule doc'

In [7]:
import numpy
import numpy as np

from numpy import absolute 
from numpy import absolute  as abs
from numpy import * # don't do this

In [8]:
absolute

<ufunc 'absolute'>

In [9]:
abs

<ufunc 'absolute'>

### import :: правила хорошего тона

- Все импорты в начале модуля
- Сначала import потом from ... import 
- Сортируйте импорты в лексикографическом порядке
- Помните что в момент импорта модкль выполняется

# Регулярные выражения

Более мощный способ взаимодействия со строками, живут в модуле re

__.__ 	Любой символ <br />
__[789]__ Любой символ из набора <br / >
__\d__ 	Цифра [0-9]<br />
__\D__ 	Не Цифра [^0-9]<br />
__\s__ 	Пробельный символ [ \t\n\r\f\v]<br />
__\S__ 	Не пробельный символ [^ \t\n\r\f\v]<br />
__\w__ 	Цифра или буква [a-zA-Z0-9_]<br />
__\W__ 	Не цифра или буква [^a-zA-Z0-9]<br />

### Quantifiers -- повторяют предыдущее выражение нужное число раз

__\d\*__   0 чисел или больше <br />
__\w+__    1 буква или больше <br />
__a{1, 3}__  от одной до 3 букв <br />

### Примеры: 


\+\d{1, 3}\(\d{3}) \d{3}\-\d{2}\-\d{2} -- один из форматов мобильного телефона

[-\_\w]+@[\w\_-]+\\.\w{,3} --- имейл (простая версия)

### Операции

In [10]:
import re 

txt = "This is agent 007, his name is James Bond 008"
result = re.search('\d{3}', txt)
result

<re.Match object; span=(14, 17), match='007'>

In [11]:
result.start(), result.end(),  result.group()

(14, 17, '007')

### Другие операции

- search
- match
- split
- sub 
- findall