### Занятие 5, Best practice 

### Содержание

* PEP8
* Ошибки и исключения
* Контекстные менеджеры
* Функции dir и help, документирование
* Работа с путями: os.path
* Использование virtualenv, conda env, docker
* Использование системы контроля версий

### PEP8

Вопрос: Что такое PEP8?
    
Ответ: ![](Python05-best_practices_extra/pep8.jpeg) 

Рекомендуется читать в [оригинале](https://www.python.org/dev/peps/pep-0008/)

Вопрос: Зачем нужен PEP8?
    
Ответ: код читается намного больше раз, чем пишется. Pекоммендации о стиле написания кода направлены на то, чтобы улучшить читабельность кода и сделать его согласованным между большим числом проектов.

In [1]:
import this # кстати, это PEP 20

The Zen of Python, by Tim Peters

Beautiful is better than ugly.
Explicit is better than implicit.
Simple is better than complex.
Complex is better than complicated.
Flat is better than nested.
Sparse is better than dense.
Readability counts.
Special cases aren't special enough to break the rules.
Although practicality beats purity.
Errors should never pass silently.
Unless explicitly silenced.
In the face of ambiguity, refuse the temptation to guess.
There should be one-- and preferably only one --obvious way to do it.
Although that way may not be obvious at first unless you're Dutch.
Now is better than never.
Although never is often better than *right* now.
If the implementation is hard to explain, it's a bad idea.
If the implementation is easy to explain, it may be a good idea.
Namespaces are one honking great idea -- let's do more of those!


Вопрос: Когда следует игнорировать стандарт PEP8?

Ответ: Когда основная цель (улучшение читабельности кода) не может быть достигнута, следуя рекомендациям стандарта

![](seminar6_iter_and_best_practice/read_code_joke.jpg) 

####   1. PEP8: форматирование кода

**Отступы**

Используйте 4 пробела на один уровень отступа. 

**Максимальная длина строки**

Ограничьте максимальную длину строки 79 символами.

Для более длинных блоков текста с меньшими структурными ограничениями (строки документации или комментарии), длину строки следует ограничить 72 символами.



**Перенос строки**

Предпочтительный способ переноса длинных строк — использование подразумевающегося продолжения строки между обычными, квадратными и фигурными скобками. В случае необходимости можно добавить еще одну пару скобок вокруг выражения, но часто лучше выглядит обратный слэш. Постарайтесь сделать правильные отступы для перенесённой строки.

In [None]:
with open('/path/to/some/file/you/want/to/read') as file_1, \
     open('/path/to/some/file/being/written', 'w') as file_2:
    file_2.write(file_1.read())

In [3]:
# Correct:

# Add 4 spaces (an extra level of indentation) to distinguish arguments from the rest.
def long_function_name(
        var_one, var_two, var_three,
        var_four):
    print(var_one)
    
# Aligned with opening delimiter.
foo = long_function_name(var_one, var_two,
                         var_three, var_four)

# Hanging indents should add a level.
foo = long_function_name(
    var_one, var_two,
    var_three, var_four)

NameError: name 'var_one' is not defined

In [None]:
# Wrong:

# Arguments on first line forbidden when not using vertical alignment.
foo = long_function_name(var_one, var_two,
    var_three, var_four)

# Further indentation required as indentation is not distinguishable.
def long_function_name(
    var_one, var_two, var_three,
    var_four):
    print(var_one)

In [4]:
my_list = [
    1, 2, 3,
    4, 5, 6,
    ]
result = some_function_that_takes_arguments(
    'a', 'b', 'c',
    'd', 'e', 'f',
    )

my_list = [
    1, 2, 3,
    4, 5, 6,
]
result = some_function_that_takes_arguments(
    'a', 'b', 'c',
    'd', 'e', 'f',
)

NameError: name 'some_function_that_takes_arguments' is not defined

In [None]:
# Wrong:
# operators sit far away from their operands
income = (gross_wages +
          taxable_interest +
          (dividends - qualified_dividends) -
          ira_deduction -
          student_loan_interest)

In [None]:
# Correct:
# easy to match operators with operands
income = (gross_wages
          + taxable_interest
          + (dividends - qualified_dividends)
          - ira_deduction
          - student_loan_interest)

**Пустые строки**

* Отделяйте функции (верхнего уровня, не функции внутри функций) и определения классов двумя пустыми строчками.

* Определения методов внутри класса отделяйте одной пустой строкой.

* Дополнительные отступы строками могут быть изредка использованы для выделения группы логически связанных функций. Пустые строки могут быть пропущены, между несколькими выражениями, записанными в одну строку, например, «заглушки» функций.

* Используйте (без энтузиазма) пустые строки в коде функций, чтобы отделить друг от друга логические части.


**Пробелы в выражениях и инструкциях**

1. Избегайте использование пробелов сразу после или перед скобками 

In [None]:
# Correct:
spam(ham[1], {eggs: 2})

# Wrong:
spam( ham[ 1 ], { eggs: 2 } )

In [None]:
# Correct:
foo = (0,)

# Wrong:
bar = (0, )


2. Избегайте использование пробелов перед запятой, точкой с запятой, двоеточием

In [None]:
# Correct:
if x == 4: print x, y; x, y = y, x
    
# Wrong:
if x == 4 : print x , y ; x , y = y , x

3. Избегайте использование пробелов перед открывающей скобкой, после которой начинается список аргументов при вызове функци

In [None]:
# Correct:
spam(1)

# Wrong:
spam (1)

4. Избегайте использование пробелов сразу перед открывающей скобкой, после которой следует индекс или срез

In [None]:
# Correct:
dct['key'] = lst[index]

# Wrong:
dct ['key'] = lst [index]

5.  Избегайте использование более одного пробела вокруг оператора присваивания (или любого другого) для того, чтобы выровнять его с другим таким же оператором на соседней строке:

In [None]:
# Correct:
x = 1
y = 2
long_variable = 3

# Wrong:
x             = 1
y             = 2
long_variable = 3

6. Вседа окружайте эти бинарные операторы одним пробелом с каждой стороны: присваивание (=, +=, -= и прочие), сравнения (==, <, >, !=, <>, <=, >=, in, not in, is, is not), логические операторы (and, or, not). Ставьте пробелы вокруг арифметических операций. Если используются операторы с разным приоритетом, то лучше выделять пробелами операцию с наименьшим приоритетом

In [None]:
# Correct:
i = i + 1
submitted += 1
x = x*2 - 1
hypot2 = x*x + y*y
c = (a+b) * (a-b)

# Wrong:
i=i+1
submitted +=1
x = x * 2 - 1
hypot2 = x * x + y * y
c = (a + b) * (a - b)

7. Не используйте пробелы для отделения знака =, когда он употребляется для обозначения аргумента-ключа (keyword argument) или значения параметра по умолчанию

In [None]:
# Correct:
def complex(real, imag=0.0):
    return magic(r=real, i=imag)

# Wrong:
def complex(real, imag = 0.0):
    return magic(r = real, i = imag)

8. Не используйте составные инструкции (несколько команд в одной строке).

In [None]:
# Correct:
if foo == 'blah':
    do_blah_thing()
do_one()
do_two()
do_three()

# Wrong:
if foo == 'blah': do_blah_thing()
do_one(); do_two(); do_three()

**Комментарии**

* Старайтесь писать код так, чтобы к нему требовались минимальные комментарии
* Комментарии, которые противоречат коду, хуже, чем отсутствие комментариев. Следите за актуальностью комментариев
* Желательно придерживаться английского языка при написании комментариев
* Комментарий не должен быть очевидным

* Однострочные комментарии начинаются со знака решетки и пробела

In [None]:
# Wrong:
x = x + 1                 # Increment x

# Correct:
x = x + 1                 # Compensate for border

**Блок комментариев**

* Блок комментариев обычно объясняет код (весь, или только некоторую часть), идущий после блока, и должен иметь тот же отступ, что и сам код. Каждая строчка такого блока должна начинаться с символа # и одного пробела после него (если только сам текст комментария не имеет отступа).

* Абзацы внутри блока комментариев лучше отделять строкой, состоящей из одного символа #.
* Отдельный вид комментариев - документирование (PEP 257 -- Docstring Conventions)

In [5]:
def func():
    """ Обозначение функции
    """
    pass

In [None]:
func()

**Импорты**

Импортирование разных модулей должно быть на разных строчках

In [None]:
# Correct:
import os
import sys

# Wrong:
import sys, os

# Correct:
from subprocess import Popen, PIPE

Старайтесь избегать импортов с *

In [None]:
# Wrong:
from numpy import *

# Correct:
import numpy as np

Импортирование всегда нужно делать сразу после комментариев к модулю и строк документации, перед объявлением глобальных переменных и констант.

Группируйте импорты в следующем порядке:

* импорты стандартной библиотеки
* импорты сторонних библиотек
* импорты модулей текущего проекта

Вставляйте пустую строку между каждой группой импортов.



#### 2. PEP-8: названия переменных

**Главное правило**: Называйте переменные таким образом, чтобы для понимания кода, не требовался комментарий

* Не используйте в качестве имён встроенные (built-in) функции (list, id и т.д.) и ключевые слова
* Не рекомендуется использовать литеры l, o , I в качестве переменных. 
* Вообще лучше отказаться от использования однобуквенных наименований

Стили именования переменных:
* b (одиночная маленькая буква)
* B (одиночная заглавная буква)
* lowercase (слово в нижнем регистре)
* lower_case_with_underscores (слова из маленьких букв с подчеркиваниями)
* UPPERCASE (заглавные буквы)
* UPPERCASE_WITH_UNDERSCORES (слова из заглавных букв с подчеркиваниями)
* CapitalizedWords (слова с заглавными буквами, или CapWords, или CamelCase 5. Иногда называется StudlyCaps). 
* mixedCase (отличается от CapitalizedWords тем, что первое слово начинается с маленькой буквы)
* Capitalized_Words_With_Underscores (слова с заглавными буквами и подчеркиваниями)

Ещё существует стиль, в котором имена, принадлежащие одной логической группе, имеют один короткий префикс

**Правила именования переменных**

![](Python05-best_practices_extra/naming.jpeg)

**Подчеркивания**

* Имена переменной или метода, начинающиеся с подчеркивания, например, _var, предназначены для внутреннего использования
* Имена переменной или метода, заканчивающегося  подчеркиванием, например, var_, используют для избежания конфликта с ключевыми словами языка
* Двойное подчеркивание в начале переменной, например, \__var, используется для сокрытия приватных переменных при наследовании (name mangling) 


* Имена переменной или метода с двумя подчеркиваниями в начале и в конце, например, \__var__' (dunder var), так называемые magic methods
* Одиночное подчеркивание используется для несущественных переменных

In [6]:
for _ in range(3):
    print('Hello')

Hello
Hello
Hello


In [7]:
print(_)

2


In [8]:
car = ('red', 'auto', 12, 3812.4)
color, _, _, mileage = car
print(_)

12


**Общие соображения**

* Разделяйте логику между функциями и классами
* Если код вашего класса или функции занимает 1000 строк, скорее всего вы что-то делаете не так
* Избегайте дублирования кода
* Максимально переиспользуйте код

Вопрос: Как начать следовать PEP8?

Ответ: 
- Включить проверку кода на соотвествие PEP8 в вашей любимой IDE или использовать пакет [pep8](https://pypi.org/project/pep8/)
- Использовать линтеры([pylint](https://pypi.org/project/pylint/), [flake8](https://pypi.org/project/flake8/)) для соблюдения стандарта кода и поиска ошибок.
- Использовать [black](https://pypi.org/project/black/) и [isort](https://pypi.org/project/isort/) для прямого форматирования кода.

### Ошибки и исключения

**Виды ошибок**:
* Синтаксические
* Критические ошибки, не позволяющие продолжить работу
* Рядовые ошибки, с которыми программа может продолжить работу

**Что такое исключения?**
* Исключения - специальный механизм python для работы с ошибками
* Прерывают нормальный ход исполнения программы и сообщают об исключительной ситуации
* Дают возможность обработать ошибку и восстановить программу

**Примеры исключительных ситуаций**

* Парсинг логов
* Файл не существует
* В словаре нет нужного ключа
* ...

**[Иерархия исключений](https://docs.python.org/3/library/exceptions.html)**

![](seminar6_iter_and_best_practice/hierarchy.jpeg)

**Синтаксис исключений**

**try...except**

In [9]:
filename='123'
try:
    df = open(filename, 'r')
except FileNotFoundError:
    print("File %s does not exist" % filename)

File 123 does not exist


**try...except...except**

In [10]:
filename='123'
try:
    df = open(filename, 'r')
except FileNotFoundError:
    print("File %s does not exist" % filename)
except Exception as e:
    print(e)

File 123 does not exist


In [11]:
filename='123'
try:
    df = open(filename, 'r')
except (TypeError, MemoryError) as e:
    print('TypeError or MemoryError')
except FileNotFoundError:
    print("File %s does not exist" % filename)

File 123 does not exist


**try...except...else...finally**

In [13]:
filename='123'
try:
    x=1
    df = open(filename, 'r')
except FileNotFoundError:
    print("File %s does not exist" % filename)
else:
    print('Everything is ok')
finally:
    print('Finally block')

File 123 does not exist
Finally block


**Стратегии обработки ошибок**

* Look before you leap
* It's easier to ask for forgiveness than permission

In [None]:
import os

if os.path.exists(filename):
    df = open(filename, 'r')
else:
    ...

**Как бросить исключение**

In [14]:
raise ValueError('Positive integer expected')

ValueError: Positive integer expected

In [15]:
raise 123 # должно быть наследником BaseException

TypeError: exceptions must derive from BaseException

In [16]:
try:
    raise RuntimeError('Crash')
except:
    print('Unknown error')
    raise

Unknown error


RuntimeError: Crash

In [17]:
raise

RuntimeError: No active exception to reraise

**AssertionError**

Используется в случае, если мы хотим, чтобы при не выполнении условий программа сломалась

In [18]:
assert 3 == 1+2, 'No error'

assert 3 == 2, 'No error'

AssertionError: No error

**Как сделать кастомное исключение**

In [57]:
class SalaryNotInRangeError(Exception):
    """Exception raised for errors in the input salary.

    Attributes:
        salary -- input salary which caused the error
        message -- explanation of the error
    """

    def __init__(self, salary, message="Salary is not in (5000, 15000) range"):
        self.salary = salary
        self.message = message
        super().__init__(self.message)

    def __str__(self):
        return f'{self.salary} -> {self.message}'


salary = 100000 # int(input("Enter salary amount: "))
if not 5000 < salary < 15000:
    raise SalaryNotInRangeError(salary)

SalaryNotInRangeError: 100000 -> Salary is not in (5000, 15000) range

**Лучшие практики**

* Старайтесь максимально конкретизировать исключения в Except
* Простое написание 'except:' также перехватит и SystemExit, и KeyboardInterrupt, что породит проблемы, например, сложнее будет завершить программу нажатием control+C. Если вы действительно собираетесь перехватить все исключения, пишите 'except Exception:'.

In [None]:
try:
    import platform_specific_module
except ImportError:
    platform_specific_module = None

In [None]:
# Wrong:
try:
    i=1
except:
    pass

In [27]:
# Wrong:
try:
    i=1
except BaseException:
    pass

Ограничьтесь использованием чистого 'except:' в двух случаях:

1. Если обработчик исключения выводит пользователю всё о случившейся ошибке (например, traceback)

2. Если нужно выполнить некоторый код после перехвата исключения, а потом вновь «бросить» его для обработки где-то в другом месте. Обычно же лучше пользоваться конструкцией 'try...finally'.

Постарайтесь заключать в каждую конструкцию try...except минимум кода, чтобы легче отлавливать ошибки.

In [19]:
try: 
    value = collection[key] 
except KeyError: 
    return key_not_found(key) 
else: 
    return handle_value(value) 

try: 
    # Здесь много действий!
    return handle_value(collection[key]) 
except KeyError: 
    # Здесь также перехватится KeyError, сгенерированный handle_value() 
    return key_not_found(key) 

SyntaxError: 'return' outside function (<ipython-input-19-84f144f811ba>, line 4)

Так как исключения являются классами, к исключениями применяется стиль именования классов. Однако вы можете добавить Error в конце имени (если конечно исключение действительно является ошибкой).

### Контекстные менеджеры

In [20]:
f = open('hello.txt', 'w')
f.write('hello')
f.close()

In [None]:
f = open('hello.txt', 'w')
try:
    f.write('hello')
finally:
    f.close()

In [None]:
with open('hello.txt', 'w') as f:
    f.write('hello')

In [None]:
with first() as f, second() as s:
    do(f,s)
    
#same
with first() as f:
    with second as s:
        do(f,s)

**Интерфейс контекстного менеджера**

In [None]:
class ManagedFile:
    def __init__(self, name):
        self.name = name
        
    def __enter__(self):
        self.file = open(self.name, 'w')
    return self.file
        
    def __exit__(self, exc_type, exc_val, exc_tb):
        if self.file:
            self.file.close()
        if exc_value is not None:
            return True

**Семантика**

In [None]:
with acquire_resource() as resource:
    use(resource)

In [None]:
manager = acquire_resource()
resource = manager.__enter__()
try:
    use(resource)
finally:
    exc_type, exc_valur, traceback = sys.ext_info()
    supress = manager.__exit__(exc_type, exc_valur, traceback)
    if exc_value is not none and not suppress:
        raise exc_value

sys.exc_info() - возвращает кортеж из трех значений, которые дают информацию об исключениях, обрабатывающихся в данный момент.

In [4]:
class Indenter:
    def __init__(self):
        self.level = 0
    
    def __enter__(self):
        self.level += 1
        return self
    
    def __exit__(self, exc_type, exc_val, exc_tb):
        self.level -= 1
    
    def print(self, text):
        print(' ' * self.level + text)

In [6]:
with Indenter() as indent:
    indent.print('hi!')
    with indent:
        indent.print('hello')
        with indent:
            indent.print('bonjour')
    indent.print('hey')

 hi!
  hello
   bonjour
 hey


Менеджеры контекста должны вызываться через отдельные функции или методы всякий раз, когда они делают что-то, кроме получения и освобождения ресурсов:

In [None]:
# Correct:
with conn.begin_transaction():
    do_stuff_in_transaction(conn)
    
# Wrong:
with conn:
    do_stuff_in_transaction(conn)

### Функции dir и help, документирование

In [21]:
import numpy as np
dir(np.random)

['BitGenerator',
 'Generator',
 'MT19937',
 'PCG64',
 'PCG64DXSM',
 'Philox',
 'RandomState',
 'SFC64',
 'SeedSequence',
 '__RandomState_ctor',
 '__all__',
 '__builtins__',
 '__cached__',
 '__doc__',
 '__file__',
 '__loader__',
 '__name__',
 '__package__',
 '__path__',
 '__spec__',
 '_bounded_integers',
 '_common',
 '_generator',
 '_mt19937',
 '_pcg64',
 '_philox',
 '_pickle',
 '_sfc64',
 'beta',
 'binomial',
 'bit_generator',
 'bytes',
 'chisquare',
 'choice',
 'default_rng',
 'dirichlet',
 'exponential',
 'f',
 'gamma',
 'geometric',
 'get_state',
 'gumbel',
 'hypergeometric',
 'laplace',
 'logistic',
 'lognormal',
 'logseries',
 'mtrand',
 'multinomial',
 'multivariate_normal',
 'negative_binomial',
 'noncentral_chisquare',
 'noncentral_f',
 'normal',
 'pareto',
 'permutation',
 'poisson',
 'power',
 'rand',
 'randint',
 'randn',
 'random',
 'random_integers',
 'random_sample',
 'ranf',
 'rayleigh',
 'sample',
 'seed',
 'set_state',
 'shuffle',
 'standard_cauchy',
 'standard_exponen

In [22]:
help(np.random.randint)

Help on built-in function randint:

randint(...) method of numpy.random.mtrand.RandomState instance
    randint(low, high=None, size=None, dtype=int)
    
    Return random integers from `low` (inclusive) to `high` (exclusive).
    
    Return random integers from the "discrete uniform" distribution of
    the specified dtype in the "half-open" interval [`low`, `high`). If
    `high` is None (the default), then results are from [0, `low`).
    
    .. note::
        New code should use the ``integers`` method of a ``default_rng()``
        instance instead; please see the :ref:`random-quick-start`.
    
    Parameters
    ----------
    low : int or array-like of ints
        Lowest (signed) integers to be drawn from the distribution (unless
        ``high=None``, in which case this parameter is one above the
        *highest* such integer).
    high : int or array-like of ints, optional
        If provided, one above the largest (signed) integer to be drawn
        from the distributi

In [58]:
def kos_root():
    """Return the pathname of the KOS root directory."""
    global _kos_root
    if _kos_root: return _kos_root
    
def function(a, b):
    """function(a, b) -> list"""
    
def compl(real=0.0, imag=0.0):
    """Form a complex number.

    Keyword arguments:
    real -- the real part (default 0.0)
    imag -- the imaginary part (default 0.0)

    """
    if imag == 0.0 and real == 0.0: return complex_zero
    ...
    


In [59]:
print(compl.__doc__)

Form a complex number.

    Keyword arguments:
    real -- the real part (default 0.0)
    imag -- the imaginary part (default 0.0)

    


In [60]:
help(compl)

Help on function compl in module __main__:

compl(real=0.0, imag=0.0)
    Form a complex number.
    
    Keyword arguments:
    real -- the real part (default 0.0)
    imag -- the imaginary part (default 0.0)



In [23]:
class AClass:
    c = 'class attribute'
    """This is AClass.c's docstring."""

    def __init__(self):
        """Method __init__'s docstring."""

        self.i = 'instance attribute'
        """This is self.i's docstring."""

    def f(x):
        """Function f's docstring."""
        return x**2

    f.a = 1
    """Function attribute f.a's docstring."""

In [24]:
help(AClass)

Help on class AClass in module __main__:

class AClass(builtins.object)
 |  Methods defined here:
 |  
 |  __init__(self)
 |      Method __init__'s docstring.
 |  
 |  f(x)
 |      Function f's docstring.
 |  
 |  ----------------------------------------------------------------------
 |  Data descriptors defined here:
 |  
 |  __dict__
 |      dictionary for instance variables (if defined)
 |  
 |  __weakref__
 |      list of weak references to the object (if defined)
 |  
 |  ----------------------------------------------------------------------
 |  Data and other attributes defined here:
 |  
 |  c = 'class attribute'



In [None]:
AClass()

### Работа с путями: os.path

In [26]:
import os

In [27]:
path = os.path.join('first', 'second', '1.txt')
print(path)

if not os.path.exists(path):
    os.makedirs(path)

first\second\1.txt


In [28]:
file_path = os.path.join(path, '1.txt')

In [29]:
os.path.basename(file_path)

'1.txt'

In [30]:
os.path.dirname(file_path)

'first\\second\\1.txt'

In [31]:
dirname = '.'

In [32]:
[f for f  in os.listdir(dirname) if os.path.isfile(os.path.join(dirname, f))]

['hello.txt', 'seminar6_best_practices.ipynb']

In [43]:
help(os.path)

Help on module ntpath:

NAME
    ntpath - Common pathname manipulations, WindowsNT/95 version.

DESCRIPTION
    Instead of importing this module directly, import os and refer to this
    module as os.path.

FUNCTIONS
    abspath(path)
        Return the absolute version of a path.
    
    basename(p)
        Returns the final component of a pathname
    
    commonpath(paths)
        Given a sequence of path names, returns the longest common sub-path.
    
    commonprefix(m)
        Given a list of pathnames, returns the longest common leading component
    
    dirname(p)
        Returns the directory component of a pathname
    
    exists(path)
        Test whether a path exists.  Returns False for broken symbolic links
    
    expanduser(path)
        Expand ~ and ~user constructs.
        
        If user or $HOME is unknown, do nothing.
    
    expandvars(path)
        Expand shell variables of the forms $var, ${var} and %var%.
        
        Unknown variables are left unch

### Использование virtualenv, conda env, docker

![](seminar6_iter_and_best_practice/pandas_joke.jpg) 

Со временем использование глобального Python ведет к аду с зависимостями.
Для того, чтобы изолировать своё окружение используются следующие инструменты:

* virtualenv
* conda env
* docker

 [virtualenv-cheatsheet](https://aaronlelevier.github.io/virtualenv-cheatsheet/)
    
[conda environments](https://docs.conda.io/projects/conda/en/latest/user-guide/tasks/manage-environments.html)

[docker](https://ru.wikipedia.org/wiki/Docker)

### Использование системы контроля версий

![](seminar6_iter_and_best_practice/git.png) 

#### Литература

* Читайте документацию, PEP-ы
* Dan Bader, Python Tricks 
https://realpython.com/products/python-tricks-book/
