# Лекция 3. Основы функционального программирования

При написании кода достаточно часто часть действий повторяется. Это может быть небольшой блок на 3-5 строк, а может быть и достаточно большая последовательность действий.

Копировать код — плохая затея. Так как, если потом понадобится обновить одну из копий, надо будет обновлять и другие.

Вместо этого, надо создать специальный блок кода с именем - функцию. И каждый раз, когда код надо повторить, достаточно вызвать функцию. Функция позволяет не только назвать какой-то блок кода, но и сделать его более абстрактным за счет параметров. Параметры дают возможность передавать разные исходные данные для выполнения функции. И, соответственно, получать разный результат, в зависимости от входящих параметров.

После разделения кода на функции, достаточно быстро наступает момент, когда необходимо использовать функцию в другом скрипте. Конечно же, копирование функции так же неудобно, как и копирование обычного кода. Для повторного использования кода из другого скрипта Python используются модули.

# Функции

Функция - это блок кода, выполняющий определенные действия:

* у функции есть имя, с помощью которого можно запускать этот блок кода сколько угодно раз
     * запуск кода функции называется вызовом функции
* при создании функции, как правило, определяются параметры функции.
    * параметры функции определяют, какие аргументы функция может принимать
    * функциям можно передавать аргументы
    * соответственно, код функции будет выполняться с учетом указанных аргументов

**Зачем нужны функции?**

Как правило, задачи, которые решает код, очень похожи и часто имеют что-то общее.

Например, при работе с конфигурационными файлами каждый раз надо выполнять такие действия:

* открытие файла
* удаление (или пропуск) строк, начинающиеся со знака восклицания (для Cisco)
* удаление (или пропуск) пустых строк
* удаление символов перевода строки в конце строк
* преобразование полученного результата в список

Дальше действия могут отличаться в зависимости от того, что нужно делать.

Часто получается, что есть кусок кода, который повторяется. Конечно, его можно копировать из одного скрипта в другой. Но это очень неудобно, так как при внесении изменений в код нужно будет обновить его во всех файлах, в которые он скопирован.

Гораздо проще и правильней вынести этот код в функцию (это может быть и несколько функций).

И тогда будет производиться вызов этой функции - в этом файле или каком-то другом.

## Создание функций

Создание функции: 

* функции создаются с помощью зарезервированного слова `def`
* за `def` следуют имя функции и круглые скобки
* внутри скобок могут указываться параметры, которые функция принимает
* после круглых скобок идет двоеточие и с новой строки, с отступом, идет блок кода, который выполняет функция
* первой строкой, опционально, может быть комментарий, так называемая docstring
* в функциях может использоваться оператор `return`
     * он используется для прекращения работы функции и выхода из нее
    * чаще всего, оператор return возвращает какое-то значение
    
Пример функции:

```
def configure_intf(intf_name, ip, mask):
    print('interface', intf_name)
    print('ip address', ip, mask)
```

Функция configure_intf создает конфигурацию интерфейса с указанным именем и IP-адресом. У функции есть три параметра: `intf_name`, `ip`, `mask`. При вызове функции в эти параметры попадут реальные данные.

> Когда функция создана, она ещё ничего не выполняет. Только при вызове функции действия, которые в ней перечислены, будут выполняться. 

### Вызов функции

При вызове функции нужно указать её имя и передать аргументы, если нужно.

> Параметры - это переменные, которые используются при создании функции. Аргументы - это фактические значения (данные), которые передаются функции при вызове.


Функция configure_intf ожидает при вызове три значения, потому что она была создана с тремя параметрами:

In [None]:
def configure_intf(intf_name, ip, mask):
    print('interface', intf_name)
    print('ip address', ip, mask)

configure_intf('F0/0', '10.1.1.1', '255.255.255.0')

Текущий вариант функции configure_intf выводит команды на стандартный поток вывода, команды можно увидеть, но при этом результат функции нельзя сохранить в переменную.

Если же попытаться записать в переменную результат функции configure_intf, в переменной окажется значение `None`.

Чтобы функция могла возвращать какое-то значение, надо использовать оператор `return`.

### Оператор `return`

Оператор return используется для возврата какого-то значения, и в то же время он завершает работу функции. Функция может возвращать любой объект Python. По умолчанию, функция всегда возвращает `None`.

Для того, чтобы функция configure_intf возвращала значение, которое потом можно, например, присвоить переменной, надо использовать оператор `return`:

In [None]:
def configure_intf(intf_name, ip, mask):
    config = f'interface {intf_name}\nip address {ip} {mask}'
    return config

result = configure_intf('Fa0/0', '10.1.1.1', '255.255.255.0')
print(result)

Теперь в переменой result находится строка с командами для настройки интерфейса.

В реальной жизни практически всегда функция будет возвращать какое-то значение. Вместе с тем можно использовать выражение print, чтобы дополнительно выводить какие-то сообщения.

Ещё один важный аспект работы оператора `return`: после `return`, функция завершает работу, а значит выражения, которые идут после `return`, не выполняются.

Например, в функции ниже, строка «Конфигурация готова» не будет выводиться, так как она стоит после `return`:

In [None]:
def configure_intf(intf_name, ip, mask):
    config = f'interface {intf_name}\nip address {ip} {mask}'
    return config
    print('Конфигурация готова')

configure_intf('Fa0/0', '10.1.1.1', '255.255.255.0')

Функция может возвращать несколько значений. В этом случае, они пишутся через запятую после оператора `return`. При этом фактически функция возвращает кортеж:

In [None]:
def configure_intf(intf_name, ip, mask):
    config_intf = f'interface {intf_name}\n'
    config_ip = f'ip address {ip} {mask}'
    return config_intf, config_ip

result = configure_intf('Fa0/0', '10.1.1.1', '255.255.255.0')
type(result)
intf, ip_addr = configure_intf('Fa0/0', '10.1.1.1', '255.255.255.0')

### Документация (docstring)

Первая строка в определении функции - это docstring, строка документации. Это комментарий, который используется как описание функции.

Лучше не лениться писать краткие комментарии, которые описывают работу функции. Например, описать, что функция ожидает на вход, какого типа должны быть аргументы и что будет на выходе. Кроме того, лучше написать пару предложений о том, что делает функция. Это очень поможет, когда через месяц-два вы будете пытаться понять, что делает функция, которую вы же написали.

In [None]:
def configure_intf(intf_name, ip, mask):
    '''
    Функция генерирует конфигурацию интерфейса
    '''
    config_intf = f'interface {intf_name}\n'
    config_ip = f'ip address {ip} {mask}'
    return config_intf, config_ip

configure_intf?

## Пространства имен. Области видимости

У переменных в Python есть область видимости. В зависимости от места в коде, где переменная была определена, определяется и область видимости, то есть, где переменная будет доступна.

При использовании имен переменных в программе, Python каждый раз ищет, создает или изменяет эти имена в соответствующем пространстве имен. Пространство имен, которое доступно в каждый момент, зависит от области, в которой находится код.

У Python есть правило **LEGB**, которым он пользуется при поиске переменных.

Например, если внутри функции выполняется обращение к имени переменной, Python ищет переменную в таком порядке по областям видимости (до первого совпадения):

* **L** (local) - в локальной (внутри функции)
* **E** (enclosing) - в локальной области объемлющих функций (это те функции, внутри которых находится наша функция)
* **G** (global) - в глобальной (в скрипте)
* **B** (built-in) - во встроенной (зарезервированные значения Python)

Соответственно, есть локальные и глобальные переменные:

* локальные переменные:
    * переменные, которые определены внутри функции
    * эти переменные становятся недоступными после выхода из функции
* глобальные переменные:
    * переменные, которые определены вне функции
    * эти переменные „глобальны“ только в пределах модуля
    * например, чтобы они были доступны в другом модуле, их надо импортировать

Пример локальной intf_config:

In [None]:
def configure_intf(intf_name, ip, mask):
    intf_config = f'interface {intf_name}\nip address {ip} {mask}'
    return intf_config

intf_config

Обратите внимание, что переменная intf_config недоступна за пределами функции. Для того чтобы получить результат функции, надо вызвать функцию и присвоить результат в переменную.

## Параметры и аргументы функций

Цель создания функции, как правило, заключается в том, чтобы вынести кусок кода, который выполняет определенную задачу, в отдельный объект. Это позволяет использовать этот кусок кода многократно, не создавая его заново в программе.

Как правило, функция должна выполнять какие-то действия с входящими значениями и на выходе выдавать результат.

При работе с функциями важно различать:

* параметры - это переменные, которые используются при создании функции.
* аргументы - это фактические значения (данные), которые передаются функции при вызове.

Параметры бывают обязательные и необязательные.

Обязательные:

```
def f(a, b):
    pass
```

Необязательные (со значением по умолчанию):

```
def f(a=None):
    pass

```
В этом случае `a` - передавать необязательно.

Аргументы бывают позиционные и ключевые.

```
def summ(a, b):
    return a + b
```

Позиционные:

```
summ(1, 2)
```

Ключевые:

```
summ(a=1, b=2)
```

Независимо от того как параметры созданы, при вызове функции им можно передавать значения и как ключевые и как позиционные аргументы. При этом обязательные параметры надо передать в любом случае, любым способом (позиционными или ключевыми), а необязательные можно передавать, можно нет. Если передавать, то тоже любым способом.

Подробнее типы параметров и аргументов будут рассматриваться позже.

Для того, чтобы функция могла принимать входящие значения, ее нужно создать с параметрами.

В данном случае, у функции два параметра: `username и password`.

Функция проверяет пароль и возвращает `False`, если проверки не прошли и `True` если пароль прошел проверки:

In [None]:
def check_passwd(username, password):
    if len(password) < 8:
        print('Пароль слишком короткий')
        return False
    elif username in password:
        print('Пароль содержит имя пользователя')
        return False
    else:
        print(f'Пароль для пользователя {username} прошел все проверки')
        return True

### Типы параметров функции

При создании функции можно указать, какие аргументы нужно передавать обязательно, а какие нет. Соответственно, функция может быть создана с:

* обязательными параметрами
* необязательными параметрами (опциональными, параметрами со значением по умолчанию)

#### Обязательные параметры

**Обязательные параметры** - определяют, какие аргументы нужно передать функции обязательно. При этом, их нужно передать ровно столько, сколько указано параметров функции (нельзя указать большее или меньшее количество)

Функция с обязательными параметрами:

In [None]:
def check_passwd(username, password):
    if len(password) < 8:
        print('Пароль слишком короткий')
        return False
    elif username in password:
        print('Пароль содержит имя пользователя')
        return False
    else:
        print(f'Пароль для пользователя {username} прошел все проверки')
        return True

#### Необязательные параметры (параметры со значением по умолчанию)

При создании функции можно указывать значение по умолчанию для параметра таким образом: `def check_passwd(username, password, min_length=8)`. В этом случае, параметр `min_length` указан со значением по умолчанию и может не передаваться при вызове функции.

Пример функции `check_passw`d с параметром со значением по умолчанию:

In [None]:
def check_passwd(username, password, min_length=8):
    if len(password) < min_length:
        print('Пароль слишком короткий')
        return False
    elif username in password:
        print('Пароль содержит имя пользователя')
        return False
    else:
        print(f'Пароль для пользователя {username} прошел все проверки')
        return True

Так как у параметра `min_length` есть значение по умолчанию, соответствующий аргумент можно не указывать при вызове функции, если значение по умолчанию подходит.

### Типы аргументов функции

При вызове функции аргументы можно передавать двумя способами:

* как позиционные - передаются в том же порядке, в котором они определены при создании функции. То есть, порядок передачи аргументов определяет, какое значение получит каждый аргумент
* как ключевые - передаются с указанием имени аргумента и его значения. В таком случае, аргументы могут быть указаны в любом порядке, так как их имя указывается явно.

Позиционные и ключевые аргументы могут быть использоваться одновременно при вызове функции. При этом сначала должны идти позиционные аргументы, а только потом - ключевые.

#### Позиционные аргументы

Позиционные аргументы при вызове функции надо передать в правильном порядке (поэтому они и называются позиционные).

Если при вызове функции поменять аргументы местами, скорее всего, возникнет ошибка, в зависимости от конкретной функции.

#### Ключевые аргументы

Ключевые аргументы:

* передаются с указанием имени аргумента
* за счет этого они могут передаваться в любом порядке

Если передать оба аргумента как ключевые, можно передавать их в любом порядке.

> Обратите внимание, что всегда сначала должны идти позиционные аргументы, а затем ключевые. Если сделать наоборот, возникнет ошибка.

В реальной жизни зачастую намного понятней и удобней указывать флаги (параметры со значениями `True`/`False`) или числовые значения как ключевой аргумент. Если задать хорошее название параметра, то по его имени сразу будет понятно, что именно он делает.

Посмотрим на разные способы передачи аргументов на примере функции `check_passwd`:

In [None]:
def check_passwd(username, password, min_length=8, check_username=True):
    if len(password) < min_length:
        print('Пароль слишком короткий')
        return False
    elif check_username and username in password:
        print('Пароль содержит имя пользователя')
        return False
    else:
        print(f'Пароль для пользователя {username} прошел все проверки')
        return True

# Позиционные аргументы:
check_passwd('user', '12345', True)

# Ключевые аргументы:
# check_passwd(password='12345', check_username=True, username='user', min_length=4)

# Комбинированное использование:
# check_passwd('user', '12345user', check_username=True)

### Аргументы переменной длины

Иногда необходимо сделать так, чтобы функция принимала не фиксированное количество аргументов, а любое. Для такого случая в Python можно создавать функцию со специальным параметром, который принимает аргументы переменной длины. Такой параметр может быть как ключевым, так и позиционным.

> Даже если вы не будете использовать этот прием в своих скриптах, есть большая вероятность, что вы встретите его в чужом коде.

#### Позиционные аргументы переменной длины

Параметр, который принимает позиционные аргументы переменной длины, создается добавлением перед именем параметра звездочки. Имя параметра может быть любым, но по договоренности чаще всего используют имя `*args`

Пример функции:

```
def sum_arg(a, *args):
    print(a, args)
    return a + sum(args)
```

Функция `sum_arg` создана с двумя параметрами:

* параметр `a`
    * если передается как позиционный аргумент, должен идти первым
    * если передается как ключевой аргумент, то порядок не важен
* параметр `*args` - ожидает аргументы переменной длины
    * сюда попадут все остальные аргументы в виде кортежа
    * эти аргументы могут отсутствовать

Вызов функции с разным количеством аргументов:

In [None]:
def sum_arg(a, *args):
    print(a, args)
    return a + sum(args)

sum_arg(1, 10, 20, 30)

#### Ключевые аргументы переменной длины

Параметр, который принимает ключевые аргументы переменной длины, создается добавлением перед именем параметра двух звездочек. Имя параметра может быть любым, но, по договоренности, чаще всего, используют имя `**kwargs` (от keyword arguments).

Пример функции:

```
def sum_arg(a, **kwargs):
    print(a, kwargs)
    return a + sum(kwargs.values())
```

Функция `sum_arg` создана с двумя параметрами:

* параметр `a`
    * если передается как позиционный аргумент, должен идти первым
    * если передается как ключевой аргумент, то порядок не важен
* параметр `**kwargs` - ожидает ключевые аргументы переменной длины
    * сюда попадут все остальные ключевые аргументы в виде словаря
    * эти аргументы могут отсутствовать

Вызов функции с разным количеством ключевых аргументов:

In [None]:
def sum_arg(a, **kwargs):
    print(a, kwargs)
    return a + sum(kwargs.values())

sum_arg(a=10, b=10, c=20, d=30)

### Распаковка аргументов

В Python выражения `*args` и `**kwargs` позволяют выполнять ещё одну задачу - распаковку аргументов.

До сих пор мы вызывали все функции вручную. И соответственно передавали все нужные аргументы.

В реальности, как правило, данные необходимо передавать в функцию программно. И часто данные идут в виде какого-то объекта Python.

#### Распаковка позиционных аргументов

Например, при форматировании строк часто надо передать методу `format` несколько аргументов. И часто эти аргументы уже находятся в списке или кортеже. Чтобы их передать методу `format`, приходится использовать индексы таким образом:

In [None]:
items = [1,2,3]

print('One: {}, Two: {}, Three: {}'.format(items[0], items[1], items[2]))

Вместо этого, можно воспользоваться распаковкой аргументов и сделать так:

In [None]:
items = [1,2,3]

print('One: {}, Two: {}, Three: {}'.format(*items))

Еще один пример - функция `config_interface`:

```
def config_interface(intf_name, ip_address, mask):
    interface = f'interface {intf_name}'
    no_shut = 'no shutdown'
    ip_addr = f'ip address {ip_address} {mask}'
    result = [interface, no_shut, ip_addr]
    return result
```

Функция ожидает такие аргументы:

* `intf_name` - имя интерфейса
* `ip_address` - IP-адрес
* `mask` - маска

Функция возвращает список строк для настройки интерфейса.

Допустим, нужно вызвать функцию и передать ей информацию, которая была получена из другого источника, к примеру, из БД.

Например, список `interfaces_info`, в котором находятся параметры для настройки интерфейсов:

```
interfaces_info = [['Fa0/1', '10.0.1.1', '255.255.255.0'],
                   ['Fa0/2', '10.0.2.1', '255.255.255.0'],
                   ['Fa0/3', '10.0.3.1', '255.255.255.0'],
                   ['Fa0/4', '10.0.4.1', '255.255.255.0'],
                   ['Lo0', '10.0.0.1', '255.255.255.255']]
```

Если пройтись по списку в цикле и передавать вложенный список как аргумент функции, возникнет ошибка.

Ошибка вполне логичная: функция ожидает три аргумента, а ей передан 1 аргумент - список.

В такой ситуации пригодится распаковка аргументов. Достаточно добавить `*` перед передачей списка как аргумента, и ошибки уже не будет.

Python сам „распакует“ список `info` и передаст в функцию элементы списка как аргументы.

> Таким же образом можно распаковывать и кортеж.

In [None]:
def config_interface(intf_name, ip_address, mask):
    interface = f'interface {intf_name}'
    no_shut = 'no shutdown'
    ip_addr = f'ip address {ip_address} {mask}'
    result = [interface, no_shut, ip_addr]
    return result

interfaces_info = [['Fa0/1', '10.0.1.1', '255.255.255.0'],
                   ['Fa0/2', '10.0.2.1', '255.255.255.0'],
                   ['Fa0/3', '10.0.3.1', '255.255.255.0'],
                   ['Fa0/4', '10.0.4.1', '255.255.255.0'],
                   ['Lo0', '10.0.0.1', '255.255.255.255']]

for info in interfaces_info:

# Без распаковки:
    print(config_interface(info))

# С распаковкой:
    # print(config_interface(*info))

#### Распаковка ключевых аргументов
Аналогичным образом можно распаковывать словарь, чтобы передать его как ключевые аргументы.

Функция `check_passwd` и список словарей `username_passwd`, в которых указано имя пользователя и пароль.

Если передать словарь функции `check_passwd`, возникнет ошибка. Если добавить `**` перед передачей словаря функции, функция нормально отработает.

In [None]:
def check_passwd(username, password, min_length=8, check_username=True):
    if len(password) < min_length:
        print('Пароль слишком короткий')
        return False
    elif check_username and username in password:
        print('Пароль содержит имя пользователя')
        return False
    else:
        print(f'Пароль для пользователя {username} прошел все проверки')
        return True

username_passwd = [{'username': 'cisco', 'password': 'cisco'},
                   {'username': 'root', 'password': 'rootpass'},
                   {'username': 'user', 'password': '123456789'}]

for data in username_passwd:

# Без распаковки:
    check_passwd(data)

# С распаковкой:
    # check_passwd(**data)

Python распаковывает словарь и передает его в функцию как ключевые аргументы. Запись `check_passwd(**data)` превращается в вызов вида `check_passwd(username='cisco', password='cisco')`.

#### Аргументы, которые можно передавать только как ключевые

Аргументы, которые указаны после `*` можно передавать только как ключевые при вызове функции.


Например, в этой функции аргументы `min_length` и `check_username` можно передавать только как ключевые. При передаче их как позиционных, возникнет исключение.

In [None]:
def check_passwd(username, password, *, min_length=8, check_username=True):
    if len(password) < min_length:
        print('Пароль слишком короткий')
        return False
    elif check_username and username in password:
        print('Пароль содержит имя пользователя')
        return False
    else:
        print(f'Пароль для пользователя {username} прошел все проверки')
        return True

check_passwd('user', '12345', min_length=3)

## Распространенные проблемы/нюансы работы с функциями

### Список/словарь в который собираются данные в функции, создан за пределами функции

Очень часто в решении заданий встречается такой нюанс: функция должна собрать какие-то данные в список/словарь и список создан вне функции. Тогда вроде как функция работает правильно, но при этом тест не проходит. Это происходит потому что в таком варианте функция работает неправильно и каждый вызов добавляет элементы в тот же список:

In [None]:
result = []

def func(items):
    for i in items:
        result.append(i*100)
    return result

func([1, 2, 3])

Исправить это можно переносом строки создания списка в функцию:

In [None]:
def func(items):
    result = []
    for i in items:
        result.append(i*100)
    return result

func([1, 2, 3])

Всё, что относится к функции лучше всегда писать внутри функции. Тест тут не проходит потому что внутри файла задания функция вызывается первый раз - всё правильно, а потом тест вызывает её второй раз и там вдруг в два раза больше данных чем нужно.

### Значения по умолчанию в параметрах создаются во время создания функции

Пример функции, которая должна выводить текущую дату и время при каждом вызове:

In [None]:
from datetime import datetime
import time

def print_current_datetime(ptime=datetime.now()):
    print(f">>> {ptime}")

for i in range(3):
    print("Имитируем долгое выполнение...")
    time.sleep(1)
    print_current_datetime()

Так как `datetime.now()` указано в значении по умолчанию, это значение создается во время создания функции и в итоге при каждом вызове время одно и то же. Для корректного вывода, надо вызывать `datetime.now()` в теле функции:

In [None]:
from datetime import datetime
import time

def print_current_datetime():
    print(f">>> {datetime.now()}")

for i in range(3):
    print("Имитируем долгое выполнение...")
    time.sleep(1)
    print_current_datetime()

Второй пример где этот нюанс может привести к неожиданным результатам, если о нем не знать - изменяемые типы данных в значении по умолчанию.

Например, использование списка в значении по умолчанию:

In [None]:
def add_item(item, data=[]):
    data.append(item)
    return data

add_item(1)

В этом случае список `data` создается один раз - при создании функции и при вызове функции, данные добавляются в один и тот же список. В итоге все повторные вызовы будут добавлять элементы.

Если нужно сделать так, чтобы параметр data был необязательным и по умолчанию создавался пустой список, надо сделать так:

In [None]:
def add_item(item, data=None):
    if data is None:
        data = []
    data.append(item)
    return data

add_item(1)

# Полезные функции

В этой главе рассматриваются такие функции:

* `print`
* `sorted`
* `enumerate`
* `zip`
* `all`, `any`
* `lambda`
* `map`, `filter`

## Функция `print`

Функция `print` уже не раз использовалась в книге, но до сих пор не рассматривался ее полный синтаксис:

```
print(*items, sep=' ', end='\n', file=sys.stdout, flush=False)
```

Функция `print` выводит все элементы, разделяя их значением `sep`, и завершает вывод значением `end`.

Все элементы, которые передаются как аргументы, конвертируются в строки.

### `sep`

Параметр `sep` контролирует то, какой разделитель будет использоваться между элементами.

По умолчанию используется пробел. Можно изменить значение `sep` на любую другую строку.

> Обратите внимание на то, что все аргументы, которые управляют поведением функции `print`, надо передавать как ключевые, а не позиционные.

In [None]:
print(1, 2, 3)
print(1, 2, 3, sep='|')
print(1, 2, 3, sep=f"\n{'-' * 10}\n")

### `end`

Параметр `end` контролирует то, какое значение выведется после вывода всех элементов. По умолчанию используется перевод строки. Можно изменить значение `end` на любую другую строку.

In [None]:
print(1, 2, 3)
print(1, 2, 3, end='\n'+'-'*10)

### `file`

Параметр `file` контролирует то, куда выводятся значения функции `print`. По умолчанию все выводится на стандартный поток вывода - `sys.stdout`.

Python позволяет передавать `file` как аргумент любой объект с методом `write(string)`. За счет этого с помощью `print` можно записывать строки в файл:

In [None]:
f = open('result.txt', 'w')

for num in range(10):
    print(f'Item {num}', file=f)

f.close()

### `flush`

По умолчанию при записи в файл или выводе на стандартный поток вывода вывод буферизируется. Параметр `flush` позволяет отключать буферизацию.

Пример скрипта, который выводит число от 0 до 10 каждую секунду:

In [None]:
import time

for num in range(10):
    print(num)
    time.sleep(1)

Теперь, аналогичный скрипт, но числа будут выводиться в одной строке:

In [None]:
import time

for num in range(10):
    print(num, end=' ')
    time.sleep(1)

Числа не выводятся по одному в секунду, а выводятся все через 10 секунд.

Это связано с тем, что при выводе на стандартный поток вывода `flush` выполняется после перевода строки.

Чтобы скрипт отрабатывал как нужно, необходимо установить `flush` равным `True`

In [None]:
import time

for num in range(10):
    print(num, end=' ', flush=True)
    time.sleep(1)

## Функция `sorted`

Функция `sorted` возвращает новый отсортированный список, который получен из итерируемого объекта, который был передан как аргумент. Функция также поддерживает дополнительные параметры, которые позволяют управлять сортировкой.

Первый аспект, на который важно обратить внимание - `sorted` всегда возвращает список.

In [None]:
list_of_words = ['one', 'two', 'list', '', 'dict']
tuple_of_words = ('one', 'two', 'list', '', 'dict')
set_of_words = {'one', 'two', 'list', '', 'dict'}
string_to_sort = 'long string'
dict_for_sort = {
    'id': 1,
    'name': 'London',
    'IT_VLAN': 320,
    'User_VLAN': 1010,
    'Mngmt_VLAN': 99,
    'to_name': None,
    'to_id': None,
    'port': 'G1/0/11'
}

print(sorted(list_of_words), end='\n'+'-'*10)
print(sorted(tuple_of_words), end='\n'+'-'*10)
print(sorted(set_of_words), end='\n'+'-'*10)
print(sorted(string_to_sort), end='\n'+'-'*10)
print(sorted(dict_for_sort))

### `reverse`

Флаг `reverse` позволяет управлять порядком сортировки. По умолчанию сортировка будет по возрастанию элементов.

Указав флаг `reverse`, можно поменять порядок:

In [None]:
list_of_words = ['one', 'two', 'list', '', 'dict']
sorted(list_of_words)
# sorted(list_of_words, reverse=True)

### `key`

С помощью параметра `key` можно указывать, как именно выполнять сортировку. Параметр `key` ожидает функцию, с помощью которой должно быть выполнено сравнение.

Например, таким образом можно отсортировать список строк по длине строки:

In [None]:
list_of_words = ['one', 'two', 'list', '', 'dict']
sorted(list_of_words, key=len)

Параметру `key` можно передавать любые функции, не только встроенные. Также тут удобно использовать анонимную функцию `lambda`.

С помощью параметра `key` можно сортировать объекты не по первому элементу, а по любому другому. Но для этого надо использовать или функцию `lambda`, или специальные функции из модуля `operator`.

Например, чтобы отсортировать список кортежей из двух элементов по второму элементу, надо использовать такой прием:

In [None]:
from operator import itemgetter

list_of_tuples = [('IT_VLAN', 320),
    ('Mngmt_VLAN', 99),
    ('User_VLAN', 1010),
    ('DB_VLAN', 11)]

sorted(list_of_tuples, key=itemgetter(1))

### Пример сортировки разных объектов

Сортировка выполняется по первому элементу, например, по первому символу в списке строк, если он одинаковый, по второму и так далее. Сортировка выполняется по коду Unicode символа. Для символов из одного алфавита, это значит что сортировка по сути будет по алфавиту.

Пример сортировки списка строк:

In [None]:
data = ["test1", "test2", "text1", "text2"]

sorted(data)

Некоторые данные будут сортироваться неправильно, например, список IP-адресов:

In [None]:
ip_list = ["10.1.1.1", "10.1.10.1", "10.1.2.1", "10.1.11.1"]

sorted(ip_list)

Это происходит потому используется лексикографическая сортировка. Чтобы в данном случае сортировка была нормальной, надо или использовать отдельный модуль с натуральной сортировкой (модуль `natsort`) или сортировать, например, по двоичному/десятичному значению адреса.

Пример сортировки IP-адресов по двоичному значению. Сначала создаем функцию, которая преобразует IP-адреса в двоичный формат:

In [None]:
def bin_ip(ip):
    octets = [int(o) for o in ip.split(".")]
    return ("{:08b}"*4).format(*octets)

ip_list = ["10.1.1.1", "10.1.10.1", "10.1.2.1", "10.1.11.1"]

sorted(ip_list, key=bin_ip)

## `enumerate`
Иногда, при переборе объектов в цикле `for`, нужно не только получить сам объект, но и его порядковый номер. Это можно сделать, создав дополнительную переменную, которая будет расти на единицу с каждым прохождением цикла. Однако, гораздо удобнее это делать с помощью итератора `enumerate`.

Базовый пример:

In [None]:
list1 = ['str1', 'str2', 'str3']

for position, string in enumerate(list1):
    print(position, string)

`enumerate` умеет считать не только с нуля, но и с любого значение, которое ему указали после объекта:

In [None]:
list1 = ['str1', 'str2', 'str3']

for position, string in enumerate(list1, 100):
    print(position, string)

## Функция `zip`

Функция `zip`:

* на вход функции передаются последовательности
* `zip` возвращает итератор с кортежами, в котором n-ый кортеж состоит из n-ых элементов последовательностей, которые были переданы как аргументы
например, десятый кортеж будет содержать десятый элемент каждой из переданных последовательностей
* если на вход были переданы последовательности разной длины, то все они будут отрезаны по самой короткой последовательности
* порядок элементов соблюдается

> Так как `zip` - это итератор, для отображения его содержимого используется `list`

Пример использования `zip`:

In [None]:
a = [1, 2, 3]
b = [100, 200, 300]

list(zip(a, b))

Использование `zip` со списками разной длины:

In [None]:
a = [1, 2, 3, 4, 5]
b = [10, 20, 30, 40, 50]
c = [100, 200, 300]

list(zip(a, b, c))

### Использование `zip` для создания словаря

Пример использования `zip` для создания словаря:

In [None]:
d_keys = ['hostname', 'location', 'vendor', 'model', 'IOS', 'IP']
d_values = ['london_r1', '21 New Globe Walk', 'Cisco', '4451', '15.4', '10.255.0.1']

r1 = dict(zip(d_keys,d_values))

## Функция `all`

Функция `all` возвращает `True`, если все элементы истинные (или объект пустой).

In [None]:
all([False, True, True])

Например, с помощью `all` можно проверить, все ли октеты в IP-адресе являются числами:

In [None]:
ip = '10.0.1.1'

all(i.isdigit() for i in ip.split('.'))

## Функция `any`

Функция `any` возвращает `True`, если хотя бы один элемент истинный.

In [None]:
any([False, True, True])

## Анонимная функция (лямбда-выражение)

В Python лямбда-выражение позволяет создавать анонимные функции - функции, которые не привязаны к имени.

В анонимной функции:

* может содержаться только одно выражение
* могут передаваться сколько угодно аргументов

Стандартная функция:

In [None]:
def sum_arg(a, b): return a + b

sum_arg(1, 2)

Аналогичная анонимная функция, или лямбда-функция:

In [None]:
sum_arg = lambda a, b: a + b

sum_arg(1, 2)

Обратите внимание, что в определении лямбда-функции нет оператора `return`, так как в этой функции может быть только одно выражение, которое всегда возвращает значение и завершает работу функции.

Лямбда-функцию удобно использовать в выражениях, где требуется написать небольшую функцию для обработки данных.

Например, в функции `sorted` лямбда-выражение можно использовать для указания ключа для сортировки:

In [None]:
list_of_tuples = [('IT_VLAN', 320),
    ('Mngmt_VLAN', 99),
    ('User_VLAN', 1010),
    ('DB_VLAN', 11)]

sorted(list_of_tuples, key=lambda x: x[1])

Также лямбда-функция пригодится в функциях `map` и `filter`, которые будут рассматриваться далее.

## Функция `map`

Функция `map` применяет функцию к каждому элементу последовательности и возвращает итератор с результатами.

Например, с помощью `map` можно выполнять преобразования элементов. Перевести все строки в верхний регистр:

In [None]:
list_of_words = ['one', 'two', 'list', '', 'dict']

list(map(str.upper, list_of_words))

> `str.upper("aaa")` делает то же самое что `"aaa".upper()`.

Конвертация в числа:

In [None]:
list_of_str = ['1', '2', '5', '10']

list(map(int, list_of_str))

Вместе с `map` удобно использовать лямбда-выражения:

In [None]:
vlans = [100, 110, 150, 200, 201, 202]

list(map(lambda x: 'vlan {}'.format(x), vlans))

Если функция, которую использует `map()`, ожидает два аргумента, то передаются два списка:

In [None]:
nums = [1, 2, 3, 4, 5]
nums2 = [100, 200, 300, 400, 500]

list(map(lambda x, y: x*y, nums, nums2))

### List comprehension вместо `map`

Как правило, вместо `map` можно использовать list comprehension. Чаще всего, вариант с list comprehension более понятный, а в некоторых случаях даже быстрее.

[Ответ Alex Martelli со сравнением map и list comprehension](https://stackoverflow.com/questions/1247486/list-comprehension-vs-map/1247490#1247490)

При использовании одинаковых функций:

```
$ python -m timeit -s'xs=range(10)' 'map(hex, xs)'
100000 loops, best of 3: 4.86 usec per loop
$ python -m timeit -s'xs=range(10)' '[hex(x) for x in xs]'
100000 loops, best of 3: 5.58 usec per loop
```

При использовании лямбда-функций:

```
$ python -m timeit -s'xs=range(10)' 'map(lambda x: x+2, xs)'
100000 loops, best of 3: 4.24 usec per loop
$ python -m timeit -s'xs=range(10)' '[x+2 for x in xs]'
100000 loops, best of 3: 2.32 usec per loop
```

Но `map` может быть эффективней в том случае, когда надо сгенерировать большое количество элементов, так как `map` - итератор, а list comprehension генерирует список.

Примеры, аналогичные приведенным выше, в варианте с list comprehension:

In [None]:
list_of_words = ['one', 'two', 'list', '', 'dict']

[word.upper() for word in list_of_words]

In [None]:
list_of_str = ['1', '2', '5', '10']

[int(i) for i in list_of_str]

In [None]:
vlans = [100, 110, 150, 200, 201, 202]

[f'vlan {x}' for x in vlans]

In [None]:
nums = [1, 2, 3, 4, 5]
nums2 = [100, 200, 300, 400, 500]

[x * y for x, y in zip(nums, nums2)]

## Функция `filter`

Функция `filter` применяет функцию ко всем элементам последовательности и возвращает итератор с теми объектами, для которых функция вернула `True`.

Например, вернуть только те строки, в которых находятся числа:

In [None]:
list_of_strings = ['one', 'two', 'list', '', 'dict', '100', '1', '50']

list(filter(str.isdigit, list_of_strings))

Из списка чисел оставить только нечетные:

In [None]:
list(filter(lambda x: x % 2 == 1, [10, 111, 102, 213, 314, 515]))

### List comprehension вместо `filter`

Как правило, вместо `filter` можно использовать list comprehension.

Примеры, аналогичные приведенным выше, в варианте с list comprehension:

In [None]:
list_of_strings = ['one', 'two', 'list', '', 'dict', '100', '1', '50']

[s for s in list_of_strings if s.isdigit()]

In [None]:
nums = [10, 111, 102, 213, 314, 515]

[n for n in nums if n % 2 == 1]

# Модули

Модуль в Python - это обычный текстовый файл с кодом Python и расширением `.py`. Он позволяет логически упорядочить и сгруппировать код.

Разделение на модули может быть, например, по такой логике:

* разделение данных, форматирования и логики кода
* группировка функций и других объектов по функционалу

Модули хороши тем, что позволяют повторно использовать уже написанный код и не копировать его (например, не копировать когда-то написанную функцию).

## Импорт модуля

В Python есть несколько способов импорта модуля:

* `import module`
* `import module as`
* `from module import object`
* `from module import *`

### `import module`

Вариант `import module`:

```
import os
```

После импорта модуль `os` появился в выводе `dir()`. Это значит, что он теперь в текущем именном пространстве.

Чтобы вызвать какую-то функцию или метод из модуля `os`, надо указать `os`. и затем имя объекта:

In [None]:
import os

os.getlogin()

Этот способ импорта хорош тем, что объекты модуля не попадают в именное пространство текущей программы. То есть, если создать функцию с именем `getlogin()`, она не будет конфликтовать с аналогичной функцией модуля `os`.

### `import module as`

Конструкция `import module as` позволяет импортировать модуль под другим именем (как правило, более коротким):

```
import subprocess as sp
```

### `from module import object`
Вариант `from module import object` удобно использовать, когда из всего модуля нужны только одна-две функции:

```
from os import getlogin, getcwd
```

Теперь эти функции доступны в текущем именном пространстве. Их можно вызывать без имени модуля:


In [None]:
from os import getlogin, getcwd

getlogin()

### `from module import *`
Вариант `from module import *` импортирует все имена модуля в текущее именное пространство:

```
from os import *
```

Такой вариант импорта лучше не использовать. При таком импорте по коду непонятно, что какая-то функция взята, например, из модуля `os`. Это заметно усложняет понимание кода.

## Создание своих модулей
Модуль - это файл с расширением `.py` и кодом Python.

Пример создания своих модулей и импорта функции из одного модуля в другой.

Файл `check_ip_function.py`:

```
import ipaddress


def check_ip(ip):
    try:
        ipaddress.ip_address(ip)
        return True
    except ValueError as err:
        return False


ip1 = '10.1.1.1'
ip2 = '10.1.1'

print('Проверка IP...')
print(ip1, check_ip(ip1))
print(ip2, check_ip(ip2))
```

В файле `check_ip_function.py` создана функция `check_ip`, которая проверяет, что аргумент является IP-адресом. Тут проверка выполняется с помощью модуля `ipaddress`.

Функция `ipaddress.ip_address` сама проверяет правильность IP-адреса и генерирует исключение `ValueError`, если адрес не прошел проверку. Функция `check_ip` возвращает `True`, если адрес прошел проверку и `False` - если нет.

Второй скрипт импортирует функцию `check_ip` и использует ее для того чтобы из списка адресов отобрать только те, которые прошли проверку:

In [None]:
from check_ip_function import check_ip


def return_correct_ip(ip_addresses):
    correct = []
    for ip in ip_addresses:
        if check_ip(ip):
            correct.append(ip)
    return correct

print('Проверка списка IP-адресов')
ip_list = ['10.1.1.1', '8.8.8.8', '2.2.2']
correct = return_correct_ip(ip_list)
print(correct)

Обратите внимание, что выведена не только информация из скрипта `get_correct_ip.py`, но и информация из скрипта `check_ip_function.py`. Так происходит из-за того, что любая разновидность `import` выполняет весь скрипт. То есть, даже когда импорт выглядит как from `check_ip_function import check_ip`, выполняется весь скрипт `check_ip_function.py`, а не только функция `check_ip`. В итоге будут выводиться все сообщения импортируемого скрипта.

Сообщения из импортируемого скрипта не страшны, они мешают и только, хуже когда скрипт выполнял что-то типа подключения к оборудованию и при импорте функции из него, придется ждать пока это подключение выполнится.

В Python есть возможность указать, что некоторые строки не должны выполняться при импорте.

## `if __name__ == "__main__"`
Достаточно часто скрипт может выполняться и самостоятельно, и может быть импортирован как модуль другим скриптом. Так как импорт скрипта запускает этот скрипт, часто надо указать, что какие-то строки не должны выполняться при импорте.

В предыдущем примере было два скрипта:` check_ip_function.py` и `get_correct_ip.py`. И при запуске `get_correct_ip.py`, отображались `print` из `check_ip_function.py`.

В Python есть специальный прием, который позволяет указать, что какой-то код не должен выполняться при импорте: все строки, которые находятся в блоке `if __name__ == '__main__'` не выполняются при импорте.

Переменная `__name__` - это специальная переменная, которая будет равна `"__main__"`, только если файл запускается как основная программа, и выставляется равной имени модуля при импорте модуля. То есть, условие `if __name__ == '__main__'` проверяет, был ли файл запущен напрямую.

Как правило, в блок `if __name__ == '__main__'` заносят все вызовы функций и вывод информации на стандартный поток вывода. То есть, в скрипте `check_ip_function_no_output.py` в этом блоке будет все, кроме импорта и функции `return_correct_ip`:

```
import ipaddress


def check_ip(ip):
    try:
        ipaddress.ip_address(ip)
        return True
    except ValueError as err:
        return False


if __name__ == '__main__':
    ip1 = '10.1.1.1'
    ip2 = '10.1.1'

    print('Проверка IP...')
    print(ip1, check_ip(ip1))
    print(ip2, check_ip(ip2))
```

Скрипт `get_correct_ip.py` остается без изменений:

In [None]:
from check_ip_function_no_output import check_ip


def return_correct_ip(ip_addresses):
    correct = []
    for ip in ip_addresses:
        if check_ip(ip):
            correct.append(ip)
    return correct


print('Проверка списка IP-адресов')
ip_list = ['10.1.1.1', '8.8.8.8', '2.2.2']
correct = return_correct_ip(ip_list)
print(correct)

Теперь вывод содержит только информацию из скрипта `get_correct_ip.py`.

В целом, лучше привыкнуть писать весь код, который вызывает функции и выводит что-то на стандартный поток вывода, внутри блока `if __name__ == '__main__'`.

## Пути поиска модулей

При импорте модуля, Python сначала ищет модуль в стандартной библиотеке. Если модуль не найден в стандартной библиотеке, поиск модуля идет в каталогах, которые указаны `в sys.path`.

Содержимое `sys.path` состоит из:

* текущего каталога
* каталогов, которые указаны в переменной `PYTHONPATH`
* пути по умолчанию (зависят от установки Python)

Пути поиска модулей хранятся в переменной `sys.path`:

In [None]:
import sys

sys.path

### Добавление своих скриптов в пути поиска модулей

Добавить свой скрипт в пути поиска модулей нужно в том случае, если этот скрипт нужно использовать в других скриптах, которые находятся в разных каталогах.

Для добавления модулей в пути поиска есть несколько вариантов:

* Переместить скрипт в каталог `site-packages`
* Создать специальный файл с расширением `pth` в каталоге `site-packages` и написать в этом файлы пути поиска модулей

Конкретный путь каталога `site-packages` зависит от версии Python и того используете ли вы виртуальное окружение. Если переместить туда скрипт, его можно будет импортировать из любого другого скрипта.

Так как переносить файлы не всегда удобно, есть второй вариант - файлы `pth`. Для этого варианта надо создать файл с любым именем в каталоге `site-packages`, например, `my_scripts.pth` и написать в нем пути к нужным скриптам.

## Рекомендации по поводу расположения функций в коде

В [PEP8](https://peps.python.org/pep-0008/) нет рекомендаций по этому поводу.

Если скрипт в одном файле, обычно порядок такой:

1. shebang, file encoding
2. docstring модуля
3. импорт (модули стандартной библиотеки, сторонние модули, свои скрипты)
4. константы
5. все функции в условно произвольном порядке, тут уже надо самостоятельно решить как удобнее
6. функции/код для создания CLI если есть
7. асто, если есть код который надо писать глобально создают функцию main
8. `if __name__ == "__main__"`: и вызов функции `main` или глобального кода, который вызывает функции

При этом среди функций обычно выбирают для себя какой-то порядок, чтобы он был плюс-минус однотипным в разных файлах. Например, сначала пишутся общие функцие, которые не зависят от других функций в файле, потом те что зависят. При этом обычно есть какой-то порядок выполнения действий: подключились на оборудование и считали вывод, парсим его, записали результат в файл - тогда соблюдаем этот порядок в функциях.

# Итераторы, итерируемые объекты и генераторы

## Итерируемый объект

Итерация - это общий термин, который описывает процедуру взятия элементов чего-то по очереди.

В более общем смысле, это последовательность инструкций, которая повторяется определенное количество раз или до выполнения указанного условия.

Итерируемый объект (iterable) - это объект, который способен возвращать элементы по одному. Кроме того, это объект, из которого можно получить итератор.

Примеры итерируемых объектов:

* все последовательности: список, строка, кортеж
* словари
* файлы

В Python за получение итератора отвечает функция `iter()`:

In [None]:
lista = [1, 2, 3]

iter(lista)

Функция `iter()` отработает на любом объекте, у которого есть метод `__iter__` или метод `__getitem__`.

Метод `__iter__` возвращает итератор. Если этого метода нет, функция `iter()` проверяет, нет ли метода `__getitem__` - метода, который позволяет получать элементы по индексу.

Если метод `__getitem__` есть, возвращается итератор, который проходится по элементам, используя индекс (начиная с 0).

На практике использование метода `__getitem__` означает, что все последовательности элементов - это итерируемые объекты. Например, список, кортеж, строка. Хотя у этих типов данных есть и метод `__iter__`.

## Итераторы

Итератор (iterator) - это объект, который возвращает свои элементы по одному за раз.

С точки зрения Python - это любой объект, у которого есть метод `__next__`. Этот метод возвращает следующий элемент, если он есть, или возвращает исключение `StopIteration`, когда элементы закончились.

Кроме того, итератор запоминает, на каком объекте он остановился в последнюю итерацию.

В Python у каждого итератора присутствует метод `__iter__` - то есть, любой итератор является итерируемым объектом. Этот метод просто возвращает сам итератор.

Пример создания итератора из списка:

In [None]:
numbers = [1, 2, 3]

i = iter(numbers)

print(next(i))
print(next(i))
print(next(i))
print(next(i))

После того, как элементы закончились, возвращается исключение `StopIteration`.

Для того, чтобы итератор снова начал возвращать элементы, его надо заново создать.

Аналогичные действия выполняются, когда цикл `for` проходится по списку:

In [None]:
numbers = [1, 2, 3]

for item in numbers:
    print(item)

Когда мы перебираем элементы списка, к списку сначала применяется функция `iter()`, чтобы создать итератор, а затем вызывается его метод `__next__` до тех пор, пока не возникнет исключение `StopIteration`.

Итераторы полезны тем, что они отдают элементы по одному. Например, при работе с файлом это полезно тем, что в памяти будет находиться не весь файл, а только одна строка файла.

### Файл как итератор

Один из самых распространенных примеров итератора - файл.

Если открыть файл обычной функцией open, мы получим объект, который представляет файл:

In [None]:
f = open('r1.txt')

f.__next__()
f.__next__()

for line in f:
    print(line.rstrip())

При работе с файлами, использование файла как итератора не просто позволяет перебирать файл построчно - в каждую итерацию загружена только одна строка. Это очень важно при работе с большими файлами на тысячи и сотни тысяч строк, например, с лог-файлами.

Поэтому при работе с файлами в Python чаще всего используется конструкция вида:

In [None]:
with open('r1.txt') as f:
    for line in f:
        print(line.rstrip())

## Генератор (generator)

Генераторы - это специальный класс функций, который позволяет легко создавать свои итераторы. В отличие от обычных функций, генератор не просто возвращает значение и завершает работу, а возвращает итератор, который отдает элементы по одному.

Обычная функция завершает работу, если:

* встретилось выражение `return`
* закончился код функции (это срабатывает как выражение `return None`)
* возникло исключение

После выполнения функции управление возвращается, и программа выполняется дальше. Все аргументы, которые передавались в функцию, локальные переменные, все это теряется. Остается только результат, который вернула функция.

Функция может возвращать список элементов, несколько объектов или возвращать разные результаты в зависимости от аргументов, но она всегда возвращает какой-то один результат.

Генератор же генерирует значения. При этом значения возвращаются по запросу, и после возврата одного значения выполнение функции-генератора приостанавливается до запроса следующего значения. Между запросами генератор сохраняет свое состояние.

Python позволяет создавать генераторы двумя способами:

* генераторное выражение
* функция-генератор (`yield`)

Ниже пример генераторного выражения, а по функциям-генераторам (`yield`) - в отдельной лекции

### generator expression (генераторное выражение)

Генераторное выражение использует такой же синтаксис, как list comprehensions, но возвращает итератор, а не список.

Генераторное выражение выглядит точно так же, как list comprehensions, но используются круглые скобки:

In [None]:
genexpr = (x**2 for x in range(10000))

print(next(genexpr))
print(next(genexpr))
print(next(genexpr))