### Курс "Python для исследователя", осень 2022

### Занятие 6, лучшие практики 

### Содержание

* PEP8
* Ошибки и исключения
* Контекстные менеджеры
* Функции dir и help, документирование
* Работа с путями: os.path
* Использование virtualenv, conda env, docker
* Статический анализ кода

### PEP8

Вопрос: Что такое PEP8?
    
Ответ: ![](Python06-best_practices_extra/pep8.jpeg) 

Рекомендуется читать в [оригинале](https://www.python.org/dev/peps/pep-0008/)

Вопрос: Зачем нужен PEP8?
    
Ответ: код читается намного больше раз, чем пишется. Pекоммендации о стиле написания кода направлены на то, чтобы улучшить читабельность кода и сделать его согласованным между большим числом проектов.

In [None]:
import this # кстати, это PEP 20

### Перевод на русский:

    Красивое лучше, чем уродливое.
    Явное лучше, чем неявное.
    Простое лучше, чем сложное.
    Сложное лучше, чем запутанное.
    Плоское лучше, чем вложенное.
    Разреженное лучше, чем плотное.
    Читаемость имеет значение.
    Особые случаи не настолько особые, чтобы нарушать правила.
    При этом практичность важнее безупречности.
    Ошибки никогда не должны замалчиваться.
    Если они не замалчиваются явно.
    Встретив двусмысленность, отбрось искушение угадать.
    Должен существовать один и, желательно, только один очевидный способ сделать это.
    Хотя он поначалу может быть и не очевиден, если вы не голландец.
    Сейчас лучше, чем никогда.
    Хотя никогда зачастую лучше, чем прямо сейчас.
    Если реализацию сложно объяснить — идея плоха.
    Если реализацию легко объяснить — идея, возможно, хороша.
    Пространства имён — отличная штука! Будем делать их больше!


Вопрос: Когда следует игнорировать стандарт PEP8?

Ответ: Когда основная цель (улучшение читабельности кода) не может быть достигнута, следуя рекомендациям стандарта

![](Python06-best_practices_extra/read_code_joke.jpg) 

####   1. PEP8: форматирование кода

**Отступы**

Используйте 4 пробела на один уровень отступа. 

**Максимальная длина строки**

Ограничьте максимальную длину строки 79 символами.

Для более длинных блоков текста с меньшими структурными ограничениями (строки документации или комментарии), длину строки следует ограничить 72 символами.



**Перенос строки**

Предпочтительный способ переноса длинных строк — использование подразумевающегося продолжения строки между обычными, квадратными и фигурными скобками. В случае необходимости можно добавить еще одну пару скобок вокруг выражения, но часто лучше выглядит обратный слэш. Постарайтесь сделать правильные отступы для перенесённой строки.

In [None]:
with open('/path/to/some/file/you/want/to/read') as file_1, \
     open('/path/to/some/file/being/written', 'w') as file_2:
    file_2.write(file_1.read())

In [None]:
# Correct:

# Aligned with opening delimiter.
foo = long_function_name(var_one, var_two,
                         var_three, var_four)

# Add 4 spaces (an extra level of indentation) to distinguish arguments from the rest.
def long_function_name(
        var_one, var_two, var_three,
        var_four):
    print(var_one)

# Hanging indents should add a level.
foo = long_function_name(
    var_one, var_two,
    var_three, var_four)

In [None]:
# Wrong:

# Arguments on first line forbidden when not using vertical alignment.
foo = long_function_name(var_one, var_two,
    var_three, var_four)

# Further indentation required as indentation is not distinguishable.
def long_function_name(
    var_one, var_two, var_three,
    var_four):
    print(var_one)

In [None]:
my_list = [
    1, 2, 3,
    4, 5, 6,
    ]
result = some_function_that_takes_arguments(
    'a', 'b', 'c',
    'd', 'e', 'f',
    )

my_list = [
    1, 2, 3,
    4, 5, 6,
]
result = some_function_that_takes_arguments(
    'a', 'b', 'c',
    'd', 'e', 'f',
)

Следует помещать операторы на одну строку с последующими операндами

In [None]:
# Wrong:
# operators sit far away from their operands
income = (gross_wages +
          taxable_interest +
          (dividends - qualified_dividends) -
          ira_deduction -
          student_loan_interest)

In [None]:
# Correct:
# easy to match operators with operands
income = (gross_wages
          + taxable_interest
          + (dividends - qualified_dividends)
          - ira_deduction
          - student_loan_interest)

**Пустые строки**

* Отделяйте функции (верхнего уровня, не функции внутри функций) и определения классов двумя пустыми строчками.

* Определения методов внутри класса отделяйте одной пустой строкой.

* Дополнительные отступы строками могут быть изредка использованы для выделения группы логически связанных функций.

* Используйте (без энтузиазма) пустые строки в коде функций, чтобы отделить друг от друга логические части.


**Пробелы в выражениях и инструкциях**

1. Избегайте использование пробелов сразу после или перед скобками 

In [None]:
# Correct:
spam(ham[1], {eggs: 2})

# Wrong:
spam( ham[ 1 ], { eggs: 2 } )

In [None]:
# Correct:
foo = (0,)

# Wrong:
bar = (0, )


2. Избегайте использование пробелов перед запятой, точкой с запятой, двоеточием

In [None]:
# Correct:
if x == 4: print x, y; x, y = y, x
    
# Wrong:
if x == 4 : print x , y ; x , y = y , x

3. Избегайте использование пробелов перед открывающей скобкой, после которой начинается список аргументов при вызове функци

In [None]:
# Correct:
spam(1)

# Wrong:
spam (1)

4. Избегайте использование пробелов сразу перед открывающей скобкой, после которой следует индекс или срез

In [None]:
# Correct:
dct['key'] = lst[index]

# Wrong:
dct ['key'] = lst [index]

5.  Избегайте использование более одного пробела вокруг оператора присваивания (или любого другого) для того, чтобы выровнять его с другим таким же оператором на соседней строке:

In [None]:
# Correct:
x = 1
y = 2
long_variable = 3

# Wrong:
x             = 1
y             = 2
long_variable = 3

6. Вседа окружайте эти бинарные операторы одним пробелом с каждой стороны: присваивание (=, +=, -= и прочие), сравнения (==, <, >, !=, <>, <=, >=, in, not in, is, is not), логические операторы (and, or, not). Ставьте пробелы вокруг арифметических операций. Если используются операторы с разным приоритетом, то лучше выделять пробелами операцию с наименьшим приоритетом

In [None]:
# Correct:
i = i + 1
submitted += 1
x = x*2 - 1
hypot2 = x*x + y*y
c = (a+b) * (a-b)

# Wrong:
i=i+1
submitted +=1
x = x * 2 - 1
hypot2 = x * x + y * y
c = (a + b) * (a - b)

7. Не используйте пробелы для отделения знака =, когда он употребляется для обозначения аргумента-ключа (keyword argument) или значения параметра по умолчанию

In [None]:
# Correct:
def complex(real, imag=0.0):
    return magic(r=real, i=imag)

# Wrong:
def complex(real, imag = 0.0):
    return magic(r = real, i = imag)

8. Не используйте составные инструкции (несколько команд в одной строке).

In [None]:
# Correct:
if foo == 'blah':
    do_blah_thing()
do_one()
do_two()
do_three()

# Wrong:
if foo == 'blah': do_blah_thing()
do_one(); do_two(); do_three()

**Комментарии**

* Старайтесь писать код так, чтобы к нему требовались минимальные комментарии
* Комментарии, которые противоречат коду, хуже, чем отсутствие комментариев. Следите за актуальностью комментариев
* Желательно придерживаться английского языка при написании комментариев
* Комментарий не должен быть очевидным

* Однострочные комментарии начинаются со знака решетки и пробела

In [None]:
# Wrong:
x = x + 1                 # Increment x

# Correct:
x = x + 1                 # Compensate for border

**Блок комментариев**

* Блок комментариев обычно объясняет код (весь, или только некоторую часть), идущий после блока, и должен иметь тот же отступ, что и сам код. Каждая строчка такого блока должна начинаться с символа # и одного пробела после него (если только сам текст комментария не имеет отступа).

* Абзацы внутри блока комментариев лучше отделять строкой, состоящей из одного символа #.
* Отдельный вид комментариев - документирование (PEP 257 -- Docstring Conventions)

**Импорты**

Импортирование разных модулей должно быть на разных строчках

In [None]:
# Correct:
import os
import sys

# Wrong:
import sys, os

# Correct:
from subprocess import Popen, PIPE

Старайтесь избегать импортов с *

In [None]:
# Wrong:
from numpy import *

# Correct:
import numpy as np

Импортирование всегда нужно делать сразу после комментариев к модулю и строк документации, перед объявлением глобальных переменных и констант.

Группируйте импорты в следующем порядке:

* импорты стандартной библиотеки
* импорты сторонних библиотек
* импорты модулей текущего проекта

Вставляйте пустую строку между каждой группой импортов.



#### 2. PEP-8: названия переменных

**Главное правило**: Называйте переменные таким образом, чтобы для понимания кода, не требовался комментарий

* Не используйте в качестве имён встроенные (built-in) функции (list, id и т.д.) и ключевые слова
* Не рекомендуется использовать литеры l, o , I в качестве переменных. 
* Вообще лучше отказаться от использования однобуквенных наименований

Стили именования переменных:
* b (одиночная маленькая буква)
* B (одиночная заглавная буква)
* lowercase (слово в нижнем регистре)
* lower_case_with_underscores (слова из маленьких букв с подчеркиваниями)
* UPPERCASE (заглавные буквы)
* UPPERCASE_WITH_UNDERSCORES (слова из заглавных букв с подчеркиваниями)
* CapitalizedWords (слова с заглавными буквами, или CapWords, или CamelCase 5. Иногда называется StudlyCaps). 
* mixedCase (отличается от CapitalizedWords тем, что первое слово начинается с маленькой буквы)
* Capitalized_Words_With_Underscores (слова с заглавными буквами и подчеркиваниями)

Ещё существует стиль, в котором имена, принадлежащие одной логической группе, имеют один короткий префикс

**Правила именования переменных**

![](Python06-best_practices_extra/naming.jpeg)

**Подчеркивания**

* Имена переменной или метода, начинающиеся с подчеркивания, например, _var, предназначены для внутреннего использования
* Имена переменной или метода, заканчивающегося  подчеркиванием, например, var_, используют для избежания конфликта с ключевыми словами языка
* Двойное подчеркивание в начале переменной, например, \__var, используется для сокрытия приватных переменных при наследовании (name mangling) 


* Имена переменной или метода с двумя подчеркиваниями в начале и в конце, например, \_\_var\_\_, так называемые magic methods
* Одиночное подчеркивание используется для несущественных переменных

In [None]:
for _ in range(3):
    print('Hello')

In [None]:
print(_)

In [None]:
car = ('red', 'auto', 12, 3812.4)
color, _, _, mileage = car
print(_)

**Общие соображения**

* Разделяйте логику между функциями и классами
* Если код вашего класса или функции занимает 1000 строк, скорее всего вы что-то делаете не так
* Избегайте дублирования кода
* Максимально переиспользуйте код

Вопрос: Как начать следовать PEP8?

Ответ: Включить проверку кода на соотвествие PEP8 в вашей любимой IDE или использовать пакет [pep8](https://pypi.org/project/pep8/)

![](Python06-best_practices_extra/harry.jpg)

# Вопросы?

### Ошибки и исключения

**Виды ошибок**:
* Синтаксические
* Критические ошибки, не позволяющие продолжить работу
* Рядовые ошибки, с которыми программа может продолжить работу

**Что такое исключения?**
* Исключения - специальный механизм python для работы с ошибками
* Прерывают нормальный ход исполнения программы и сообщают об исключительной ситуации
* Дают возможность обработать ошибку и восстановить программу

**Примеры исключительных ситуаций**

* Файл не существует
* В словаре нет нужного ключа
* Деление на ноль
* ...

**[Иерархия исключений](https://docs.python.org/3/library/exceptions.html)**

![](Python06-best_practices_extra/hierarchy.jpeg)

**Синтаксис исключений**

**try...except**

In [None]:
filename='123'
try:
    df = open(filename, 'r')
except FileNotFoundError:
    print("File %s does not exist" % filename)

**try...except...except**

In [None]:
filename='123'
try:
    df = open(filename, 'r')
except FileNotFoundError:
    print("File %s does not exist" % filename)
except Exception as e:
    print(e)

In [None]:
filename='123'
try:
    df = open(filename, 'r')
except (TypeError, MemoryError) as e:
    print('TypeError or MemoryError')
except FileNotFoundError:
    print("File %s does not exist" % filename)

**try...except...else...finally**

In [None]:
filename='123'
try:
    x=1
    #df = open(filename, 'r')
except FileNotFoundError:
    print("File %s does not exist" % filename)
else:
    print('Everything is ok')
finally:
    print('Finally block')

**Стратегии обработки ошибок**

* Look before you leap
* It's easier to ask for forgiveness than permission

In [None]:
import os

if os.path.exists(filename):
    df = open(filename, 'r')
else:
    ...

**Как бросить исключение**

In [None]:
raise ValueError('Positive integer expected')

In [None]:
raise 123 # должно быть наследником BaseException

In [None]:
try:
    raise RuntimeError('Crash')
except:
    print('Unknown error')
    raise

In [None]:
raise

**AssertionError**

Используется в случае, если мы хотим, чтобы при не выполнении условий программа сломалась

In [None]:
assert 3==1+2, 'No error'

assert 3==2, 'Error'

In [None]:
x = 1

assert isinstance(x, list), 'Error'

**Как сделать кастомное исключение**

In [None]:
class SalaryNotInRangeError(Exception):
    """Exception raised for errors in the input salary.

    Attributes:
        salary -- input salary which caused the error
        message -- explanation of the error
    """

    def __init__(self, salary, message="Salary is not in (5000, 15000) range"):
        self.salary = salary
        self.message = message
        super().__init__(self.message)

    def __str__(self):
        return f'{self.salary} -> {self.message}'


salary = 100000 # int(input("Enter salary amount: "))
if not 5000 < salary < 15000:
    raise SalaryNotInRangeError(salary)

**Лучшие практики**

* Старайтесь максимально конкретизировать исключения в Except
* Простое написание 'except:' также перехватит и SystemExit, и KeyboardInterrupt, что породит проблемы, например, сложнее будет завершить программу нажатием control+C. Если вы действительно собираетесь перехватить все исключения, пишите 'except Exception:'.

In [None]:
try:
    import platform_specific_module
except ImportError:
    platform_specific_module = None

In [None]:
# Wrong:
try:
    i=1
except:
    pass

In [None]:
# Wrong:
try:
    i=1
except BaseException:
    pass

Ограничьтесь использованием чистого 'except:' в двух случаях:

1. Если обработчик исключения выводит пользователю всё о случившейся ошибке (например, traceback)

2. Если нужно выполнить некоторый код после перехвата исключения, а потом вновь «бросить» его для обработки где-то в другом месте. Обычно же лучше пользоваться конструкцией 'try...finally'.

Постарайтесь заключать в каждую конструкцию try...except минимум кода, чтобы легче отлавливать ошибки.

In [None]:
try: 
    value = collection[key] 
except KeyError: 
    return key_not_found(key) 
else: 
    return handle_value(value) 

try: 
    # Здесь много действий!
    return handle_value(collection[key]) 
except KeyError: 
    # Здесь также перехватится KeyError, сгенерированный handle_value() 
    return key_not_found(key) 

Так как исключения являются классами, к исключениями применяется стиль именования классов. Однако вы можете добавить Error в конце имени (если конечно исключение действительно является ошибкой).

### Контекстные менеджеры

In [None]:
f = open('hello.txt', 'w')
f.write('hello')
f.close()

In [None]:
f = open('hello.txt', 'w')
try:
    f.write('hello')
finally:
    f.close()

In [None]:
with open('hello.txt', 'w') as f:
    f.write('hello')

In [None]:
with first() as f, second() as s:
    do(f,s)
    
#same
with first() as f:
    with second as s:
        do(f,s)

**Интерфейс контекстного менеджера**

In [None]:
class ManagedFile:
    def __init__(self, name):
        self.name = name
 
    def __enter__(self):
        self.file = open(self.name, 'w')
        return self.file
 
    def __exit__(self, exc_type, exc_val, exc_tb):
        if self.file:
            self.file.close()
        if exc_value is not None:
            return True

**Семантика**

In [None]:
with acquire_resource() as resource:
    use(resource)

In [None]:
manager = acquire_resource()
resource = manager.__enter__()
try:
    use(resource)
finally:
    exc_type, exc_valur, traceback = sys.ext_info()
    supress = manager.__exit__(exc_type, exc_valur, traceback)
    if exc_value is not none and not suppress:
        raise exc_value

sys.exc_info() - возвращает кортеж из трех значений, которые дают информацию об исключениях, обрабатывающихся в данный момент.

In [None]:
class Indenter:
    def __init__(self):
        self.level = 0
    
    def __enter__(self):
        self.level += 1
        return self
    
    def __exit__(self, exc_type, exc_val, exc_tb):
        self.level -= 1
    
    def print(self, text):
        print(' ' * self.level + text)

In [None]:
with Indenter() as indent:
    indent.print('hi!')
    with indent:
        indent.print('hello')
        with indent:
            indent.print('bonjour')
    indent.print('hey')

Менеджеры контекста должны вызываться через отдельные функции или методы всякий раз, когда они делают что-то, кроме получения и освобождения ресурсов:

In [None]:
# Correct:
with conn.begin_transaction():
    do_stuff_in_transaction(conn)
    
# Wrong:
with conn:
    do_stuff_in_transaction(conn)

### Функции dir и help, документирование

Встроенная функция dir() позволяет получить список аттрибутов объекта (модуля, класса)

In [None]:
import numpy as np
dir(np.random)

Встроенная функция help() позволяет напечатать документацию данного объекта (модуля, класса, функции).

In [None]:
help(np.random.randint)

Задокументировать объект можно с помощью так называемых "docstring" - строковых литералов, идущих сразу после объявления объекта.

In [None]:
def compl(real=0.0, imag=0.0):
    """Form a complex number.

    Keyword arguments:
    real -- the real part (default 0.0)
    imag -- the imaginary part (default 0.0)
    """
    if imag == 0.0 and real == 0.0: return complex_zero
    ...

In [None]:
print(compl.__doc__)

In [None]:
help(compl)

In [None]:
class AClass:
    """This is AClass's docstring."""
    
    c = 'class attribute'

    def __init__(self):
        """Method __init__'s docstring."""

        self.i = 'instance attribute'
        """This is self.i's docstring."""

    def f(x):
        """Function f's docstring."""
        return x**2

In [None]:
help(AClass)

### \_\_file\_\_

\_\_file\_\_ - абсолютный путь к данному модулю.

Знать этот путь бывает чрезвычайно полезно при отладке программ: из правильного ли места вы импортируете модуль?

In [None]:
import numpy as np
np.__file__

### Работа с путями: os.path

join() - правильное (с точки зрения платформы) объединение путей

exists() - проверка существования файла

basename() - собственное имя файла или папки

isfile() - является ли данный объект файлом?

isdir() - является ли данный объект директорией?

In [None]:
import os

In [None]:
path = os.path.join('first', 'second', '1')
print(path)

if not os.path.exists(path):
    os.makedirs(path)

In [None]:
!ls first/second/

In [None]:
file_path = os.path.join(path, '1')

In [None]:
print(file_path)

In [None]:
os.path.basename(file_path)

In [None]:
# file_path.split("/")[-1] # Тоже самое, но только для *nix

In [None]:
!ls

In [None]:
dirname = '.'

In [None]:
[f for f  in os.listdir(dirname) if os.path.isfile(os.path.join(dirname, f))]

In [None]:
[f for f  in os.listdir(dirname) if os.path.isdir(os.path.join(dirname, f))]

In [None]:
help(os.path)

### Использование virtualenv, conda env, docker

Со временем использование глобального Python ведет к аду с зависимостями.
Для того, чтобы изолировать своё окружение используются следующие инструменты:

* virtualenv
* conda env
* docker

 [virtualenv-cheatsheet](https://aaronlelevier.github.io/virtualenv-cheatsheet/)
    
[conda environments](https://docs.conda.io/projects/conda/en/latest/user-guide/tasks/manage-environments.html)

[docker](https://ru.wikipedia.org/wiki/Docker)

### Статический анализ кода

https://pylint.org/

Статический анализатор __pylint__ позволяет:

* Проверить код на соответствие стандарту (например, PEP-8)
* Найти некоторые ошибки
* Дать советы по рефакторингу кода

pylint myfile.py

#### Литература

* Читайте документацию, PEP-ы
* Dan Bader, Python Tricks 
https://realpython.com/products/python-tricks-book/
