### Курс "Python для исследователя", осень 2024

### Занятие 6, лучшие практики 

### Содержание

* PEP8
* Ошибки и исключения
* Контекстные менеджеры
* Функции dir и help, документирование
* Работа с путями: os.path
* Использование virtualenv, conda env, docker
* Статический анализ кода
* Анализ аргументов командной строки с помощью модуля Argparse

### PEP8

Вопрос: Что такое PEP8?
    
Ответ: ![](Python06-best_practices_extra/pep8.jpeg) 

Рекомендуется читать в [оригинале](https://www.python.org/dev/peps/pep-0008/)

Вопрос: Зачем нужен PEP8?
    
Ответ: код читается намного больше раз, чем пишется. Pекоммендации о стиле написания кода направлены на то, чтобы улучшить читабельность кода и сделать его согласованным между большим числом проектов.

In [1]:
import this # кстати, это PEP 20

The Zen of Python, by Tim Peters

Beautiful is better than ugly.
Explicit is better than implicit.
Simple is better than complex.
Complex is better than complicated.
Flat is better than nested.
Sparse is better than dense.
Readability counts.
Special cases aren't special enough to break the rules.
Although practicality beats purity.
Errors should never pass silently.
Unless explicitly silenced.
In the face of ambiguity, refuse the temptation to guess.
There should be one-- and preferably only one --obvious way to do it.
Although that way may not be obvious at first unless you're Dutch.
Now is better than never.
Although never is often better than *right* now.
If the implementation is hard to explain, it's a bad idea.
If the implementation is easy to explain, it may be a good idea.
Namespaces are one honking great idea -- let's do more of those!


### Перевод на русский:

    Красивое лучше, чем уродливое.
    Явное лучше, чем неявное.
    Простое лучше, чем сложное.
    Сложное лучше, чем запутанное.
    Плоское лучше, чем вложенное.
    Разреженное лучше, чем плотное.
    Читаемость имеет значение.
    Особые случаи не настолько особые, чтобы нарушать правила.
    При этом практичность важнее безупречности.
    Ошибки никогда не должны замалчиваться.
    Если они не замалчиваются явно.
    Встретив двусмысленность, отбрось искушение угадать.
    Должен существовать один и, желательно, только один очевидный способ сделать это.
    Хотя он поначалу может быть и не очевиден, если вы не голландец.
    Сейчас лучше, чем никогда.
    Хотя никогда зачастую лучше, чем прямо сейчас.
    Если реализацию сложно объяснить — идея плоха.
    Если реализацию легко объяснить — идея, возможно, хороша.
    Пространства имён — отличная штука! Будем делать их больше!


Вопрос: Когда следует игнорировать стандарт PEP8?

Ответ: Когда основная цель (улучшение читабельности кода) не может быть достигнута, следуя рекомендациям стандарта

![](Python06-best_practices_extra/read_code_joke.jpg) 

####   1. PEP8: форматирование кода

**Отступы**

Используйте 4 пробела на один уровень отступа. 

**Максимальная длина строки**

Ограничьте максимальную длину строки 79 символами.

Для более длинных блоков текста с меньшими структурными ограничениями (строки документации или комментарии), длину строки следует ограничить 72 символами.



**Перенос строки**

Предпочтительный способ переноса длинных строк — использование подразумевающегося продолжения строки между обычными, квадратными и фигурными скобками. В случае необходимости можно добавить еще одну пару скобок вокруг выражения, но часто лучше выглядит обратный слэш. Постарайтесь сделать правильные отступы для перенесённой строки.

```python
with open('/path/to/some/file/you/want/to/read') as file_1, \
     open('/path/to/some/file/being/written', 'w') as file_2:
    file_2.write(file_1.read())
```

```python
# Correct:

# Aligned with opening delimiter.
foo = long_function_name(var_one, var_two,
                         var_three, var_four)

# Add 4 spaces (an extra level of indentation) to distinguish arguments from the rest.
def long_function_name(
        var_one, var_two, var_three,
        var_four):
    print(var_one)

# Hanging indents should add a level.
foo = long_function_name(
    var_one, var_two,
    var_three, var_four)
```

```python
# Wrong:

# Arguments on first line forbidden when not using vertical alignment.
foo = long_function_name(var_one, var_two,
    var_three, var_four)

# Further indentation required as indentation is not distinguishable.
def long_function_name(
    var_one, var_two, var_three,
    var_four):
    print(var_one)
```

```python
my_list = [
    1, 2, 3,
    4, 5, 6,
    ]
result = some_function_that_takes_arguments(
    'a', 'b', 'c',
    'd', 'e', 'f',
    )

my_list = [
    1, 2, 3,
    4, 5, 6,
]
result = some_function_that_takes_arguments(
    'a', 'b', 'c',
    'd', 'e', 'f',
)
```

Следует помещать операторы на одну строку с последующими операндами

```python
# Wrong:
# operators sit far away from their operands
income = (gross_wages +
          taxable_interest +
          (dividends - qualified_dividends) -
          ira_deduction -
          student_loan_interest)
```

```python
# Correct:
# easy to match operators with operands
income = (gross_wages
          + taxable_interest
          + (dividends - qualified_dividends)
          - ira_deduction
          - student_loan_interest)
```

**Пустые строки**

* Отделяйте функции (верхнего уровня, не функции внутри функций) и определения классов двумя пустыми строчками.

* Определения методов внутри класса отделяйте одной пустой строкой.

* Дополнительные отступы строками могут быть изредка использованы для выделения группы логически связанных функций.

* Используйте (без энтузиазма) пустые строки в коде функций, чтобы отделить друг от друга логические части.


**Пробелы в выражениях и инструкциях**

1. Избегайте использование пробелов сразу после или перед скобками 

```python
# Correct:
spam(ham[1], {eggs: 2})

# Wrong:
spam( ham[ 1 ], { eggs: 2 } )
```

```python
# Correct:
foo = (0,)

# Wrong:
bar = (0, )
```

2. Избегайте использование пробелов перед запятой, точкой с запятой, двоеточием

```python
# Correct:
if x == 4: print x, y; x, y = y, x
    
# Wrong:
if x == 4 : print x , y ; x , y = y , x
```

3. Избегайте использование пробелов перед открывающей скобкой, после которой начинается список аргументов при вызове функци

```python
# Correct:
spam(1)

# Wrong:
spam (1)
```

4. Избегайте использование пробелов сразу перед открывающей скобкой, после которой следует индекс или срез

```python
# Correct:
dct['key'] = lst[index]

# Wrong:
dct ['key'] = lst [index]
```

5.  Избегайте использование более одного пробела вокруг оператора присваивания (или любого другого) для того, чтобы выровнять его с другим таким же оператором на соседней строке:

```python
# Correct:
x = 1
y = 2
long_variable = 3

# Wrong:
x             = 1
y             = 2
long_variable = 3
```

6. Вседа окружайте эти бинарные операторы одним пробелом с каждой стороны: присваивание (=, +=, -= и прочие), сравнения (==, <, >, !=, <>, <=, >=, in, not in, is, is not), логические операторы (and, or, not). Ставьте пробелы вокруг арифметических операций. Если используются операторы с разным приоритетом, то лучше выделять пробелами операцию с наименьшим приоритетом

```python
# Correct:
i = i + 1
submitted += 1
x = x*2 - 1
hypot2 = x*x + y*y
c = (a+b) * (a-b)

# Wrong:
i=i+1
submitted +=1
x = x * 2 - 1
hypot2 = x * x + y * y
c = (a + b) * (a - b)
```

7. Не используйте пробелы для отделения знака =, когда он употребляется для обозначения аргумента-ключа (keyword argument) или значения параметра по умолчанию

```python
# Correct:
def complex(real, imag=0.0):
    return magic(r=real, i=imag)

# Wrong:
def complex(real, imag = 0.0):
    return magic(r = real, i = imag)
```

8. Не используйте составные инструкции (несколько команд в одной строке).

```python
# Correct:
if foo == 'blah':
    do_blah_thing()
do_one()
do_two()
do_three()

# Wrong:
if foo == 'blah': do_blah_thing()
do_one(); do_two(); do_three()
```

**Комментарии**

* Старайтесь писать код так, чтобы к нему требовались минимальные комментарии
* Комментарии, которые противоречат коду, хуже, чем отсутствие комментариев. Следите за актуальностью комментариев
* Желательно придерживаться английского языка при написании комментариев
* Комментарий не должен быть очевидным

* Однострочные комментарии начинаются со знака решетки и пробела

```python
# Wrong:
x = x + 1                 # Increment x

# Correct:
x = x + 1                 # Compensate for border
```

**Блок комментариев**

* Блок комментариев обычно объясняет код (весь, или только некоторую часть), идущий после блока, и должен иметь тот же отступ, что и сам код. Каждая строчка такого блока должна начинаться с символа # и одного пробела после него (если только сам текст комментария не имеет отступа).

* Абзацы внутри блока комментариев лучше отделять строкой, состоящей из одного символа #.
* Отдельный вид комментариев - документирование (PEP 257 -- Docstring Conventions)

**Импорты**

Импортирование разных модулей должно быть на разных строчках

```python
# Correct:
import os
import sys

# Wrong:
import sys, os

# Correct:
from subprocess import Popen, PIPE
```

Старайтесь избегать импортов с *

```python
# Wrong:
from numpy import *

# Correct:
import numpy as np
```

Импортирование всегда нужно делать сразу после комментариев к модулю и строк документации, перед объявлением глобальных переменных и констант.

Группируйте импорты в следующем порядке:

* импорты стандартной библиотеки
* импорты сторонних библиотек
* импорты модулей текущего проекта

Вставляйте пустую строку между каждой группой импортов.



#### 2. PEP-8: названия переменных

**Главное правило**: Называйте переменные таким образом, чтобы для понимания кода не требовался комментарий

* Не используйте в качестве имён встроенные (built-in) функции (list, id и т.д.) и ключевые слова
* Не рекомендуется использовать литеры l, o , I в качестве переменных. 
* Вообще лучше отказаться от использования однобуквенных наименований

Стили именования переменных:
* b (одиночная маленькая буква)
* B (одиночная заглавная буква)
* lowercase (слово в нижнем регистре)
* lower_case_with_underscores (слова из маленьких букв с подчеркиваниями)
* UPPERCASE (заглавные буквы)
* UPPERCASE_WITH_UNDERSCORES (слова из заглавных букв с подчеркиваниями)
* CapitalizedWords (слова с заглавными буквами, или CapWords, или CamelCase 5. Иногда называется StudlyCaps). 
* mixedCase (отличается от CapitalizedWords тем, что первое слово начинается с маленькой буквы)
* Capitalized_Words_With_Underscores (слова с заглавными буквами и подчеркиваниями)

Ещё существует стиль, в котором имена, принадлежащие одной логической группе, имеют один короткий префикс

**Правила именования переменных**

![](Python06-best_practices_extra/naming.jpeg)

**Подчеркивания**

* Имена переменной или метода, начинающиеся с подчеркивания, например, _var, предназначены для внутреннего использования
* Имена переменной или метода, заканчивающегося  подчеркиванием, например, var_, используют для избежания конфликта с ключевыми словами языка
* Двойное подчеркивание в начале переменной, например, \__var, используется для сокрытия приватных переменных при наследовании (name mangling) 


* Имена переменной или метода с двумя подчеркиваниями в начале и в конце, например, \_\_var\_\_, так называемые magic methods
* Одиночное подчеркивание используется для несущественных переменных

In [2]:
for _ in range(3):
    print('Hello')

Hello
Hello
Hello


In [3]:
print(_)

2


In [4]:
car = ('red', 'auto', 12, 3812.4)
color, _, _, mileage = car
print(_)

12


**Общие соображения**

* Разделяйте логику между функциями и классами
* Если код вашего класса или функции занимает 1000 строк, скорее всего вы что-то делаете не так
* Избегайте дублирования кода
* Максимально переиспользуйте код

Вопрос: Как начать следовать PEP8?

Ответ: Включить проверку кода на соотвествие PEP8 в вашей любимой IDE или использовать пакет [pep8](https://pypi.org/project/pep8/)

![](Python06-best_practices_extra/harry.jpg)

# Вопросы?

### Ошибки и исключения

**Виды ошибок**:
* Синтаксические
* Критические ошибки, не позволяющие продолжить работу
* Рядовые ошибки, с которыми программа может продолжить работу

**Что такое исключения?**
* Исключения - специальный механизм python для работы с ошибками
* Прерывают нормальный ход исполнения программы и сообщают об исключительной ситуации
* Дают возможность обработать ошибку и восстановить программу

**Примеры исключительных ситуаций**

* Файл не существует
* В словаре нет нужного ключа
* Деление на ноль
* ...

**[Иерархия исключений](https://docs.python.org/3/library/exceptions.html)**

![](Python06-best_practices_extra/hierarchy.jpeg)

**Синтаксис исключений**

**try...except**

In [5]:
filename='123'
try:
    df = open(filename, 'r')
except FileNotFoundError:
    print("File %s does not exist" % filename)

File 123 does not exist


**try...except...except**

In [6]:
filename='123'
try:
    df = open(filename, 'r')
except FileNotFoundError:
    print("File %s does not exist" % filename)
except Exception as e:
    print(e)

File 123 does not exist


In [7]:
filename='123'
try:
    df = open(filename, 'r')
except (TypeError, MemoryError) as e:
    print('TypeError or MemoryError')
except FileNotFoundError:
    print("File %s does not exist" % filename)

File 123 does not exist


**try...except...else...finally**

In [8]:
filename='123'
try:
    x=1
    #df = open(filename, 'r')
except FileNotFoundError:
    print("File %s does not exist" % filename)
else:
    print('Everything is ok')
finally:
    print('Finally block')

Everything is ok
Finally block


**Стратегии обработки ошибок**

* Look before you leap
* It's easier to ask for forgiveness than permission

In [9]:
import os

if os.path.exists(filename):
    df = open(filename, 'r')
else:
    ...

**Как бросить исключение**

In [10]:
raise ValueError('Positive integer expected')

ValueError: Positive integer expected

In [11]:
raise 123 # должно быть наследником BaseException

TypeError: exceptions must derive from BaseException

In [12]:
try:
    raise RuntimeError('Crash')
except:
    print('Unknown error')
    raise

Unknown error


RuntimeError: Crash

In [13]:
raise

RuntimeError: No active exception to reraise

**AssertionError**

Используется в случае, если мы хотим, чтобы при не выполнении условий программа сломалась

In [14]:
assert 3==1+2, 'No error'

assert 3==2, 'Error'

AssertionError: Error

In [15]:
x = 1

assert isinstance(x, list), 'Error'

AssertionError: Error

**Как сделать кастомное исключение**

In [16]:
class SalaryNotInRangeError(Exception):
    """Exception raised for errors in the input salary.

    Attributes:
        salary -- input salary which caused the error
        message -- explanation of the error
    """

    def __init__(self, salary, message="Salary is not in (5000, 15000) range"):
        self.salary = salary
        self.message = message
        super().__init__(self.message)

    def __str__(self):
        return f'{self.salary} -> {self.message}'


salary = 100000 # int(input("Enter salary amount: "))
if not 5000 < salary < 15000:
    raise SalaryNotInRangeError(salary)

SalaryNotInRangeError: 100000 -> Salary is not in (5000, 15000) range

**Лучшие практики**

* Старайтесь максимально конкретизировать исключения в Except
* Простое написание 'except:' также перехватит и SystemExit, и KeyboardInterrupt, что породит проблемы, например, сложнее будет завершить программу нажатием control+C. Если вы действительно собираетесь перехватить все исключения, пишите 'except Exception:'.

In [17]:
try:
    import platform_specific_module
except ImportError:
    platform_specific_module = None

In [18]:
# Wrong:
try:
    i=1
except:
    pass

In [19]:
# Wrong:
try:
    i=1
except BaseException:
    pass

Ограничьтесь использованием чистого 'except:' в двух случаях:

1. Если обработчик исключения выводит пользователю всё о случившейся ошибке (например, traceback)

2. Если нужно выполнить некоторый код после перехвата исключения, а потом вновь «бросить» его для обработки где-то в другом месте. Обычно же лучше пользоваться конструкцией 'try...finally'.

Постарайтесь заключать в каждую конструкцию try...except минимум кода, чтобы легче отлавливать ошибки.

```python
try: 
    value = collection[key] 
except KeyError: 
    return key_not_found(key) 
else: 
    return handle_value(value) 

try: 
    # Здесь много действий!
    return handle_value(collection[key]) 
except KeyError: 
    # Здесь также перехватится KeyError, сгенерированный handle_value() 
    return key_not_found(key)
```

Так как исключения являются классами, к исключениями применяется стиль именования классов. Однако вы можете добавить Error в конце имени (если конечно исключение действительно является ошибкой).

### Контекстные менеджеры

In [20]:
f = open('hello.txt', 'w')
f.write('hello')
f.close()

In [21]:
f = open('hello.txt', 'w')
try:
    f.write('hello')
finally:
    f.close()

In [22]:
with open('hello.txt', 'w') as f:
    f.write('hello')

```python
with first() as f, second() as s:
    do(f,s)
    
#same
with first() as f:
    with second as s:
        do(f,s)
```

**Интерфейс контекстного менеджера**

In [24]:
class ManagedFile:
    def __init__(self, name):
        self.name = name
 
    def __enter__(self):
        self.file = open(self.name, 'w')
        return self.file
 
    def __exit__(self, exc_type, exc_val, exc_tb):
        if self.file:
            self.file.close()
        if exc_value is not None:
            return True

**Семантика**

```python
with acquire_resource() as resource:
    use(resource)
```

```python
manager = acquire_resource()
resource = manager.__enter__()
try:
    use(resource)
finally:
    exc_type, exc_valur, traceback = sys.ext_info()
    supress = manager.__exit__(exc_type, exc_valur, traceback)
    if exc_value is not none and not suppress:
        raise exc_value
```

sys.exc_info() - возвращает кортеж из трех значений, которые дают информацию об исключениях, обрабатывающихся в данный момент.

In [26]:
class Indenter:
    def __init__(self):
        self.level = 0
    
    def __enter__(self):
        self.level += 1
        return self
    
    def __exit__(self, exc_type, exc_val, exc_tb):
        self.level -= 1
    
    def print(self, text):
        print(' ' * self.level + text)

In [27]:
with Indenter() as indent:
    indent.print('hi!')
    with indent:
        indent.print('hello')
        with indent:
            indent.print('bonjour')
    indent.print('hey')

 hi!
  hello
   bonjour
 hey


Менеджеры контекста должны вызываться через отдельные функции или методы всякий раз, когда они делают что-то, кроме получения и освобождения ресурсов:

```python
# Correct:
with conn.begin_transaction():
    do_stuff_in_transaction(conn)
    
# Wrong:
with conn:
    do_stuff_in_transaction(conn)
```

### Функции dir и help, документирование

Встроенная функция dir() позволяет получить список аттрибутов объекта (модуля, класса)

In [28]:
import numpy as np
dir(np.random)

['BitGenerator',
 'Generator',
 'MT19937',
 'PCG64',
 'PCG64DXSM',
 'Philox',
 'RandomState',
 'SFC64',
 'SeedSequence',
 '__RandomState_ctor',
 '__all__',
 '__builtins__',
 '__cached__',
 '__doc__',
 '__file__',
 '__loader__',
 '__name__',
 '__package__',
 '__path__',
 '__spec__',
 '_bounded_integers',
 '_common',
 '_generator',
 '_mt19937',
 '_pcg64',
 '_philox',
 '_pickle',
 '_sfc64',
 'beta',
 'binomial',
 'bit_generator',
 'bytes',
 'chisquare',
 'choice',
 'default_rng',
 'dirichlet',
 'exponential',
 'f',
 'gamma',
 'geometric',
 'get_bit_generator',
 'get_state',
 'gumbel',
 'hypergeometric',
 'laplace',
 'logistic',
 'lognormal',
 'logseries',
 'mtrand',
 'multinomial',
 'multivariate_normal',
 'negative_binomial',
 'noncentral_chisquare',
 'noncentral_f',
 'normal',
 'pareto',
 'permutation',
 'poisson',
 'power',
 'rand',
 'randint',
 'randn',
 'random',
 'random_integers',
 'random_sample',
 'ranf',
 'rayleigh',
 'sample',
 'seed',
 'set_bit_generator',
 'set_state',
 'shuf

Встроенная функция help() позволяет напечатать документацию данного объекта (модуля, класса, функции).

In [29]:
help(np.random.randint)

Help on method randint in module numpy.random.mtrand:

randint(low, high=None, size=None, dtype=<class 'int'>) method of numpy.random.mtrand.RandomState instance
    randint(low, high=None, size=None, dtype=int)
    
    Return random integers from `low` (inclusive) to `high` (exclusive).
    
    Return random integers from the "discrete uniform" distribution of
    the specified dtype in the "half-open" interval [`low`, `high`). If
    `high` is None (the default), then results are from [0, `low`).
    
    .. note::
        New code should use the `~numpy.random.Generator.integers`
        method of a `~numpy.random.Generator` instance instead;
        please see the :ref:`random-quick-start`.
    
    Parameters
    ----------
    low : int or array-like of ints
        Lowest (signed) integers to be drawn from the distribution (unless
        ``high=None``, in which case this parameter is one above the
        *highest* such integer).
    high : int or array-like of ints, optional

Задокументировать объект можно с помощью так называемых "docstring" - строковых литералов, идущих сразу после объявления объекта.

In [30]:
def compl(real=0.0, imag=0.0):
    """Form a complex number.

    Keyword arguments:
    real -- the real part (default 0.0)
    imag -- the imaginary part (default 0.0)
    """
    if imag == 0.0 and real == 0.0: return complex_zero
    ...

In [31]:
print(compl.__doc__)

Form a complex number.

    Keyword arguments:
    real -- the real part (default 0.0)
    imag -- the imaginary part (default 0.0)
    


In [32]:
help(compl)

Help on function compl in module __main__:

compl(real=0.0, imag=0.0)
    Form a complex number.
    
    Keyword arguments:
    real -- the real part (default 0.0)
    imag -- the imaginary part (default 0.0)



In [33]:
class AClass:
    """This is AClass's docstring."""
    
    c = 'class attribute'

    def __init__(self):
        """Method __init__'s docstring."""

        self.i = 'instance attribute'
        """This is self.i's docstring."""

    def f(x):
        """Function f's docstring."""
        return x**2

In [34]:
help(AClass)

Help on class AClass in module __main__:

class AClass(builtins.object)
 |  This is AClass's docstring.
 |  
 |  Methods defined here:
 |  
 |  __init__(self)
 |      Method __init__'s docstring.
 |  
 |  f(x)
 |      Function f's docstring.
 |  
 |  ----------------------------------------------------------------------
 |  Data descriptors defined here:
 |  
 |  __dict__
 |      dictionary for instance variables
 |  
 |  __weakref__
 |      list of weak references to the object
 |  
 |  ----------------------------------------------------------------------
 |  Data and other attributes defined here:
 |  
 |  c = 'class attribute'



### \_\_file\_\_

\_\_file\_\_ - абсолютный путь к данному модулю.

Знать этот путь бывает чрезвычайно полезно при отладке программ: из правильного ли места вы импортируете модуль?

In [35]:
import numpy as np
np.__file__

'/home/vladimir/miniconda3/lib/python3.11/site-packages/numpy/__init__.py'

### Работа с путями: os.path

join() - правильное (с точки зрения платформы) объединение путей

exists() - проверка существования файла

basename() - собственное имя файла или папки

isfile() - является ли данный объект файлом?

isdir() - является ли данный объект директорией?

In [36]:
import os

In [37]:
path = os.path.join('first', 'second', '1')
print(path)

if not os.path.exists(path):
    os.makedirs(path)

first/second/1


In [38]:
!ls first/second/

1


In [39]:
file_path = os.path.join(path, '1')

In [40]:
print(file_path)

first/second/1/1


In [41]:
os.path.basename(file_path)

'1'

In [42]:
# file_path.split("/")[-1] # Тоже самое, но только для *nix

In [43]:
!ls

first			Python02-basics2.ipynb
hello.txt		Python03-OOP_extra
knn.ipynb		Python03-OOP.ipynb
knn_reference.ipynb	Python04-Numpy_extra
main			Python04-Numpy.ipynb
my_b_none.txt		Python05-pandas_extra
my_b.npy		Python05-pandas.ipynb
my_b.txt		Python06-best_practices_extra
naivebayes_test.ipynb	Python06-best_practices.ipynb
naivebayes_test.py	README.md
Python01-basics_extra	scores1.txt
Python01-basics.ipynb	scores.txt
Python02-basics2_extra	ver0_naive_bayes_classifier_02.ipynb


In [44]:
dirname = '.'

In [45]:
[f for f  in os.listdir(dirname) if os.path.isfile(os.path.join(dirname, f))]

['knn.ipynb',
 'Python02-basics2.ipynb',
 'naivebayes_test.py',
 'Python04-Numpy.ipynb',
 'knn_reference.ipynb',
 'Python03-OOP.ipynb',
 'Python01-basics.ipynb',
 'README.md',
 'my_b.txt',
 'Python05-pandas.ipynb',
 'hello.txt',
 'scores1.txt',
 'my_b.npy',
 'naivebayes_test.ipynb',
 'scores.txt',
 'main',
 'my_b_none.txt',
 'Python06-best_practices.ipynb',
 'ver0_naive_bayes_classifier_02.ipynb']

In [46]:
[f for f  in os.listdir(dirname) if os.path.isdir(os.path.join(dirname, f))]

['Python02-basics2_extra',
 'first',
 'Python03-OOP_extra',
 'Python04-Numpy_extra',
 'Python01-basics_extra',
 'Python05-pandas_extra',
 'Python06-best_practices_extra',
 '.git',
 '.ipynb_checkpoints']

In [47]:
help(os.path)

Help on module posixpath:

NAME
    posixpath - Common operations on Posix pathnames.

MODULE REFERENCE
    https://docs.python.org/3.11/library/posixpath.html
    
    The following documentation is automatically generated from the Python
    source files.  It may be incomplete, incorrect or include features that
    are considered implementation detail and may vary between Python
    implementations.  When in doubt, consult the module reference at the
    location listed above.

DESCRIPTION
    Instead of importing this module directly, import os and refer to
    this module as os.path.  The "os.path" name is an alias for this
    module on Posix systems; on other systems (e.g. Windows),
    os.path provides the same operations in a manner specific to that
    platform, and is an alias to another module (e.g. ntpath).
    
    Some of this can actually be useful on non-Posix systems too, e.g.
    for manipulation of the pathname component of URLs.

FUNCTIONS
    abspath(path)
       

### Использование virtualenv, conda env, docker

Со временем использование глобального Python ведет к аду с зависимостями.
Для того, чтобы изолировать своё окружение используются следующие инструменты:

* venv
* conda env
* docker

[venv](https://docs.python.org/3/library/venv.html)
    
[conda environments](https://docs.conda.io/projects/conda/en/latest/user-guide/tasks/manage-environments.html)

[docker](https://ru.wikipedia.org/wiki/Docker)

### Статический анализ кода

https://pylint.org/

Статический анализатор __pylint__ позволяет:

* Проверить код на соответствие стандарту (например, PEP-8)
* Найти некоторые ошибки
* Дать советы по рефакторингу кода

pylint myfile.py

## Анализ аргументов командной строки с помощью модуля Argparse
#### Немного истории

Давным-давно, когда графические пользовательские интерфейсы ещё не были развиты (или вовсе не существовали) и основным интерфейсом вызова программ была командная строка, люди захотели унифицировать и стандартизировать вид параметров для разных программ, чтобы пользователь при работе с ними находился в знакомой ему среде, держал в памяти меньше особенностей работы с той или иной программой и совершал меньше ошибок. (На самом деле, люди захотели переносимости программ между операционными системами, а унификация на параметры - следствие этого).

Результатом этой работы стал ряд стандартов, самый распространённый из которых - POSIX (Portable Operating System Interface, читается "позикс"), разработанный сообществом IEEE. POSIX нацелен на портируемость программ между различными операционными системами и определяет системные и пользовательские программные интерфейсы (API), а также поведение оболочек командной строки (они же shell'ы) и интерфейсы вызова программ. Первая версия POSIX была выпущена в 1988 году, а последняя (текущая) - в 2024.

Интересно, что ранние версии POSIX (до 2001 года) включали в себя спецификацию языка ANSI C. Более современные версии POSIX (после 2001 года) ориентированы на C99 и включает только заголовочные файлы и спецификацю системных интерфейсов.

Так, например, стандартная программа на языке си выглядит следующим образом:

```c
int main(int argc, char **argv)
{
	return 0;
}
```

Здесь *argc* - количество аргументов командной строки, а *argv* - массив строк, каждая из которых представляет собой параметр, переданный программе. argv[0] - всегда содержит имя исполняемого файла текущей программы. Например, при вызове ./main первый элемент массива (т.е. argv[0]) будет содержать строку "./main".

Обратите внимание, что возвращаемое значение программы (также известное как код возврата или exit code) тоже регламетировано POSIX. В случае успеха (отсутствия ошибок) программа обязательно должна вернуть значение 0. Значение, отличное от нуля, сигнализирует о том, что что-то пошло не так, но конкретные значения стандартом не определены. Сразу после выполнения программы код возврата содержится в переменной оболочки *\$?*. Например, вызов *echo "$?"* напечатает 0 (или какой-то код ошибки). Это позволяет автоматизировать анализ вызовов программ в скриптах.

#### Стандартизация аргументов

POSIX рекомендует придерживаться следующих правил для аргументов командной строки:

+ Аргументы являются опциями, если они начинаются с одного дефиса ('-').
+ Если опции не принимают аргументы, то их можно объединять следующим образом: '-abc' эквивалентно '-a -b -c'
+ Имя опции - один буквенно-цифорвой (alphanumeric) символ, т.е. латинская буква или арабская цифра. Регистр имеет значение, т.е. '-a' и '-A' - разные опции.
+ Опция может требовать параметр. Параметр можно передавать в опцию после пробела или без него: '-o param' эквивалентно '-oparam'.
+ При вызове программы, опции обычно идут перед аргументами, не являющимися опциями.
+ Аргумент '--' говорит о том, что опции закончились. Любые последующие аргументы рассматриваются как не-опции, даже если они начинаются с дефиса.
+ Опции могут следовать в любом порядке и их интерпретация осущетвляется программой.

GNU расширяет эти соглашения, добавляя длинные опций. Длинная опция состоит из двух символов дефиса и имени, которое может содержать буквенно-цифровые символы и дефисы. Обычно, название опций содержит от одного до трёх слов, разделённых одинарными дефисами. Разработчик программы может давать длинным опциям короткие аналоги (но соответствующие короткие аналоги должны быть уникальными).

Чтобы передать длинной опции параметр, используется следующий синтаксис: '--name=value'.

Например, так выглядят аргументы команды *cat*:

```
Usage: cat [OPTION]... [FILE]...
Concatenate FILE(s) to standard output.

With no FILE, or when FILE is -, read standard input.

  -A, --show-all           equivalent to -vET
  -b, --number-nonblank    number nonempty output lines, overrides -n
  -e                       equivalent to -vE
  -E, --show-ends          display $ at end of each line
  -n, --number             number all output lines
  -s, --squeeze-blank      suppress repeated empty output lines
  -t                       equivalent to -vT
  -T, --show-tabs          display TAB characters as ^I
  -u                       (ignored)
  -v, --show-nonprinting   use ^ and M- notation, except for LFD and TAB
      --help     display this help and exit
      --version  output version information and exit

Examples:
  cat f - g  Output f's contents, then standard input, then g's contents.
  cat        Copy standard input to standard output.
```

Источник: https://www.gnu.org/software/libc/manual/html_node/Argument-Syntax.html

#### Аргументы в Python

Как это всё относится к Python? Значения, аналогичные сишным argc/argv, в Python хранятся в переменной sys.argv. Это список строк, которые содержат аргументы вызова программы. Необходимость в argc отсутствует, так как мы всегда можем получить число аргументов с помощью len(sys.argv).

Продемонстрируем это на примере простой программы (python06_example1.py):

```python
import sys

def main():
	print(sys.argv)

if __name__ == '__main__':
	main()
	sys.exit(0)

```

Вызовем программу следующим образом:
```
python Python06-best_practices_extra/python06_example1.py param1 param2 param3 "multi word param4" multi\ word\ param5
```

Программа напечатает следующее:
```['Python06-best_practices_extra/python06_example1.py', 'param1', 'param2', 'param3', 'multi word param4', 'multi word param5']```

В полной аналогии с программой на си, первым элементом списка является имя исполняемого скрипта (относительно текущей директории), после чего следуют аргументы его вызова.
Аргументы, содержащие пробелы, можно окружать кавычками (одинарными или двойными), либо пробелы можно экранировать обратным слэшем. Вызов sys.exit() позволяет установить код возврата. По-умолчанию, python возвращает 0, то есть вызывать sys.exit(0) не обязательно.

#### Анализ аргументов в Python

Одним из наиболее удобных и мощных способов анализа аргументов является модуль *argparse*.

Для его использования необходимо создать объект класса ArgumentParser, настроить его и распарсить аргументы с его помощью:

```python
import argparse
parser = argparse.ArgumentParser()
parser.parse_args()
```

Добавить аргумент можно с помощью метода add_argument(name or flags..., *[, action][, nargs][, const][, default][, type][, choices][, required][, help][, metavar][, dest][, deprecated]), который имеет следующие параметры (здесь только основные, больше - в документации):

+ name or flags - Название аргумента или имена опций, например, 'foo' or '-f', '--foo'.
+ default - Значение по-умолчанию (когда при вызове программы этот аргумент не передаётся).
+ type - Тип, в который конвертируется параметр этого аргумента.
+ choices - Список возможных значений, которые может принимать параметр этого аргумента.
+ required - Является ли этот аргумент обязательным при вызове программы.
+ help - Короткое описание аргумента.

Рассмотрим следующую программу (python06_example2.py):
```python
import argparse

def main():
    parser = argparse.ArgumentParser()
    parser.add_argument('--epochs', '-e', help='Number of training epochs', type=int, default=100, required=True)
    parser.add_argument('--opt', help='Optimizer algorithm', type=str, choices=['sgd', 'adam'])
    parser.add_argument('--learning-rate', help='Learning rate', type=float, default=1e-3)
    args = parser.parse_args()

    print(f"Epochs number: {args.epochs}")
    print(f"Optimizer: {args.opt}")
    print(f"Learning rate: {args.learning_rate}")

if __name__ == '__main__':
    main()
```

Argparse позволяет автоматически создавать документацию на интерфейс вызова программы. Следующий текст будет напечатан при вызове *python Python06-best_practices_extra/python06_example2.py --help*:

```
usage: python06_example2.py [-h] --epochs EPOCHS [--opt {sgd,adam}] [--learning-rate LEARNING_RATE]

options:
  -h, --help            show this help message and exit
  --epochs EPOCHS, -e EPOCHS
                        Number of training epochs
  --opt {sgd,adam}      Optimizer algorithm
  --learning-rate LEARNING_RATE
                        Learning rate
```

При вызове *python Python06-best_practices_extra/python06_example2.py* программа напечатает следующее (так как не задан обязательный аргумент --epochs):
```
usage: python06_example2.py [-h] --epochs EPOCHS [--opt {sgd,adam}] [--learning-rate LEARNING_RATE]
python06_example2.py: error: the following arguments are required: --epochs/-e
```

При вызове *python Python06-best_practices_extra/python06_example2.py --epochs=100 --opt rmsprop* программа напечатает следующее (так как параметр 'rmpsprop' не допускается для аргумента opt):
```
usage: python06_example2.py [-h] --epochs EPOCHS [--opt {sgd,adam}] [--learning-rate LEARNING_RATE]
python06_example2.py: error: argument --opt: invalid choice: 'rmsprop' (choose from 'sgd', 'adam')
```

При вызове *python Python06-best_practices_extra/python06_example2.py --epochs=100 --opt sgd --learning-rate=3e-4* программа напечатает следующее:
```
Epochs number: 100
Optimizer: sgd
Learning rate: 0.0003
```

В дальнейшем, поля объекта args можно использовать в ходе работы программы (в данном случае, это гиперпараметры модели машинного обучения).

#### Литература

* Читайте документацию, PEP-ы
* Dan Bader, Python Tricks 
https://realpython.com/products/python-tricks-book/


### Домашнее задание

Задание состоит в том, чтобы имплементировать класс Matrix в файле matrix.py, учтя рекомендации pylint.
Для проверки кода следует использовать команду pylint matrix.py.
Pylint должен показывать 10 баллов.
Кроме того, следует добавить поддержку исключений в отмеченных местах.
Для проверки корректности алгоритмов следует сравнить результаты с соответствующими функциями numpy.

Для сдачи задания необходимо прислать файл matrix.py.

Проверка будет вестись преподавателем и оценки будут выставлены позднее.

Проверка будет осуществляться на следующем окружении:
+ pylint 3.3.1
+ astroid 3.3.5