# Python и инструменты машинного обучения


<img src="https://www.python.org/static/community_logos/python-logo-master-v3-TM.png" align="right" style="height: 200px;"/>

# Занятие 3. Функции, генераторы, итераторы


# Функции в Python

## Что такое функция?

**Функция (подпрограмма)** — фрагмент программного кода, к которому можно обратиться из другого места программы.

Функции позволяют группировать и обобщать программный код, который может позднее использоваться произвольное число раз. Они являются законченными подпрограммами, поэтому у нее есть свои "ввод" и "вывод" — параметры (аргументы) и возвращаемое значение.

## Основной синтаксис

Объявление функции в Python выглядит следующим образом:

```python
def function_name(args):
    something()
    return something_else
```

Разберем отдельные элементы:
- `def` - ключевое слово, показывает, что начинается объявление (definition) функции
- `function_name` - имя функции, по которому мы сможем ее вызывать
- `args` - аргументы, которые принимает наша функция (эти переменные доступны только внутри функции!). В обычном Python не указываются типы принимаемых аргументов (по-умолчанию принимаются все).
- `something()` - произвольные команды, выполняемые при вызове нашей функции
- `return` - ключевое слово, указывающее что будет возвращать функция. Может отсутствовать, тогда функция ничего не вернет, а точнее вернет ничего - `None`.

Например, создадим простейшую функцию, которая возвращать сумму двух ее аргументов:

In [None]:
def sum_of_two_args(a, b):
    summ = a + b
    print("Function received a =", a, "b =", b)
    return summ

Чтобы вызвать функцию, нужно указать ее имя, а затем в круглых скобках передать аргументы, с которыми мы хотим ее вызвать. Аргументы в функцию можно передавать двумя способами:

- по позиции - просто перечисляем значения аргументов, в таком случае первый указанный при вызове функции аргумент будет соотнесен с первым указанным при объявлении функции аргументов: 

In [None]:
sum_of_two_args(10, 19)  # при вызове функции в переменную a запишется 10, в b - 19

Function received a = 10 b = 19


29

- по ключу - необходимо явно указать какому аргументу мы хотим присвоить значение:

In [None]:
sum_of_two_args(b=19, a=10)  # необязательно перечислять аргументы в том же порядке

Function received a = 10 b = 19


29

Можно смешивать способы указания аргументов, например, `a` указать с помощью позиции, а `b` - с помощью ключ:

In [None]:
sum_of_two_args(10, b=19)

Function received a = 10 b = 19


29

**Но** нужно помнить правило - сначала аргументы по позиции, затем по ключам:

In [None]:
sum_of_two_args(b=19, 10)

SyntaxError: ignored

In [None]:
sum_of_two_args(19, a=10)

TypeError: ignored

In [None]:
sum_of_two_args(a=10)

TypeError: ignored

Если не указать скобки, но Python будет рассматривать функцию как объект ("переменную"):

In [None]:
sum_of_two_args

<function __main__.sum_of_two_args(a, b)>

## Аргументы по-умолчанию

Для аргумента можно задать значение по-умолчанию. Тогда если при вызове функции не было передано значение, оно будет установлено по-умолчанию:

In [None]:
def sum_of_two_args_verbose(a: int, b: int, verbose: bool=False):
    """
    This function returns sum of two arguments
    """
    summ = a + b
    if verbose:
        print("Function received a =", a, "b =", b)
    return summ

In [None]:
sum_of_two_args_verbose(10, 19)

29

In [None]:
sum_of_two_args_verbose(10, 19, verbose=True)

Function received a = 10 b = 19


29

In [None]:
sum_of_two_args_verbose(10, 19, True)

Function received a = 10 b = 19


29

In [None]:
sum_of_two_args_verbose(10, 19)

29

Как было сказано ранее, функция по-умолчанию принимает любые типы данных, поэтому можем передать в нашу функцию и `str`:

In [None]:
sum_of_two_args_verbose('10', "19", verbose=False)

'1019'

In [None]:
help(sum_of_two_args_verbose)

Help on function sum_of_two_args_verbose in module __main__:

sum_of_two_args_verbose(a: int, b: int, verbose: bool = False)
    This function returns sum of two arguments



## Возвращаемое значение

Как было сказано ранее, функция в Python может ничего не возвращать, если в теле функции отсутствует команда `return`: 

In [None]:
def sum_of_two_args_none(a, b):
    summ = a + b
    print("Result:", summ)

In [None]:
result = sum_of_two_args_none(15, 10)
print(result, type(result))

Result: 25
None <class 'NoneType'>


В других языках программирования такие функции, которые ничего не возвращают, называют процедурам, но в Python такого разделения нет.

Функции в Python могут возвращать и несколько значений:

In [None]:
def sum_of_three_args(a, b, c):
    return a + b, b + c, a + c
    #return (a + b, b + c, a + c)

In [None]:
result1, result2, result3 = sum_of_three_args(10, 20, 30)
print(result1, result2, result3)

30 50 40


По сути такая функция возвращает кортеж из нескольких элементов, а затем мы выполняем операцию множественного присовения. Проверим:

In [None]:
result = sum_of_three_args(10, 20, 30)
print(result, type(result))

(30, 50, 40) <class 'tuple'>


Может быть только один `return`:

In [None]:
def sum_of_three_args_multi_return(a, b, c):
    print("Before 1st return")
    return a + b, b + c, a + c
    print("Before 2nd return")
    return 2*(a + b), 2*(b + c), 2*(a + c)

In [None]:
sum_of_three_args_multi_return(1, 2, 3)

Before 1st return


(3, 5, 4)

In [None]:
def sum_of_three_args_condition(a, b, c):
    if a > b:
        print("Before 1st return")
        return a + b, b + c, a + c
    else:
        print("Before 2nd return")
        return 2*(a + b), 2*(b + c), 2*(a + c)

In [None]:
sum_of_three_args_condition(3, 2, 3)

Before 1st return


(5, 5, 6)

In [None]:
def sum_of_three_args_condition_alter(a, b, c):
    if a > b:
        print("Before 1st return")
        return [a + b, b + c, a + c]
    print("Before 2nd return")
    return 2*(a + b), 2*(b + c), 2*(a + c)

In [None]:
a, b, c = sum_of_three_args_condition_alter(3, 2, 3)

Before 1st return


In [None]:
print(a, b, c)

5 5 6


## Передача аргументов при вызове функции

**Вопрос** - при вызове функции аргументы передаются в нее по ссылке (работаем с тем же объектом в памяти) или по значению (копируем объект)?

In [None]:
a = [1]
b = [2, 3]

In [None]:
sum_of_two_args(a, b)

Function received a = [1] b = [2, 3]


[1, 2, 3]

**Ответ** - изменяемые аргументы передаются по ссылке, неизменяемые передаются по значению.

Рассмотрим пример. Создадим функцию, которая принимает 2 аргумента (число и словарь) и меняет их внутри себя:

In [None]:
def get_my_hero_team(team, number):
    number = 10
    team['Chuck'] = 'Norris'
    team['Sylvester'] = 'Stallone'

Проверим работу такой функции:

In [None]:
number = 5  # immutable == неизменяемый
hero_team = {'Bruce': 'Willis', 'Chuck': 'Lorre'}  # mutable == изменяемый

get_my_hero_team(hero_team, number)

Посмотрим как поменялись значения наших переменных `number_value` и `hero_team`:

In [None]:
number

5

In [None]:
hero_team

{'Bruce': 'Willis', 'Chuck': 'Norris', 'Sylvester': 'Stallone'}

Как видим, `number_value` не изменился (значит передался по значению), а `hero_team` изменился (передался по ссылке).

## Переменное число аргументов

Функции в Python могут принимать при вызове не только фиксированное, но и переменное число элементов.

Для этого используется **операторы распаковки** `*` и `**`, которые распаковывают список / кортеж и словарь. Продемонстрируем это на примере:

In [None]:
test_list = ['1', 1, False, [3], -5+1j]

print(test_list)

print(*test_list)
print(test_list[0], test_list[1], test_list[2], test_list[3], test_list[4])

['1', 1, False, [3], (-5+1j)]
1 1 False [3] (-5+1j)
1 1 False [3] (-5+1j)


Т.е. оператор распаковки `*` преобразует список / кортеж в набор позиционных аргументов.

Оператор распаковки `**` действует аналогично для словаря, но преобразует его в набор ключевых аргументов.

In [None]:
test_dict = {"sep": "\n", 'end': 'END OF PRINT'}

print("Hello, world!", "This is my first program!", **test_dict)

print()
print("Hello, world!", "This is my first program!", sep="\n", end='END OF PRINT')

Hello, world!
This is my first program!END OF PRINT
Hello, world!
This is my first program!END OF PRINT

Оператор распаковки также применяют, когда количество возвращаемых переменных функцией неизвестно или переменно:

In [None]:
def echo(input_list):
    return input_list

In [None]:
test_list = [1, 1, 2, 3, 5, 8, 13]
print(echo(test_list))

[1, 1, 2, 3, 5, 8, 13]


In [None]:
result_first, result_second, *result_other = echo(test_list)
print(result_first, result_second, result_other)

1 1 [2, 3, 5, 8, 13]


В `result_other` может попасть и 0 переменных:

In [None]:
test_list_shorter = test_list[:2]

result_first, *result_other = echo(test_list_shorter)
print(result_first, result_other)

1 [1]


Однако, остальные переменные обязательно должны быть заполнены:

In [None]:
test_list_shortest = test_list[:1]

result_first, result_second, *result_other = echo(test_list_shortest)
print(result_first, result_second, result_other)

ValueError: ignored

Операторы распаковки можно использовать и при объявлении функции, чтобы она могла принимать произвольное количество аргументов

Рассмотрим пример оператора `*` и позиционных аргументов:

In [None]:
def sum_many(*custom):
    print("Input elements:", custom, type(custom))
    if len(custom) > 0:
        print("First element:", custom[0])
    return sum(custom)

In [None]:
sum_many(1, 2, 3)

Input elements: (1, 2, 3) <class 'tuple'>
First element: 1


6

In [None]:
sum_many(1, 2, 3, 4, 5, 6, 7, 8)

Input elements: (1, 2, 3, 4, 5, 6, 7, 8) <class 'tuple'>
First element: 1


36

In [None]:
sum_many()

Input elements: () <class 'tuple'>


0

Аналогично и для оператора `**` и ключевых аргументов:

In [None]:
def print_keyword_args(**kwargs):
    print("Input kwargs:", kwargs)
    print("Answer:", kwargs.get("answer", "Not Found"))

In [None]:
print_keyword_args(a=1, b=[2], answer=42)

Input kwargs: {'a': 1, 'b': [2], 'answer': 42}
Answer: 42


In [None]:
print_keyword_args(a=1, b=2)

Input kwargs: {'a': 1, 'b': 2}
Answer: Not Found


Таким образом, можем объявить функцию, которая принимает любое количество любых аргументов:

In [None]:
def uberfunc(*args, **kwargs):
    print('args =', args, 'kwargs =', kwargs)

In [None]:
uberfunc()

args = () kwargs = {}


In [None]:
uberfunc(1, 2, 3, a=4)

args = (1, 2, 3) kwargs = {'a': 4}


In [None]:
uberfunc(answer=42)

args = () kwargs = {'answer': 42}


Таким образом, порядок объявления аргументов при создании функции выглядит следующим образом:

`def foo([positional_args, [positional_args_with_default, [*pos_args_name, [keyword_only_args, [**kw_args_name]]]]])`

In [None]:
def foo(a, b=10, *args, c, d=10, **kwargs):
    print(args)
    print(sum(kwargs.values()))
    return a + b + sum(args) + c + d + sum(kwargs.values())

In [None]:
arg1, arg2 = 10, 10

In [None]:
result = foo(10, 20, arg1, arg2, c=10, arg3=10, arg4=10)
print(f'result = {result}')

(10, 10)
20
result = 90


In [None]:
result = foo(10, arg1, arg2, c=10, arg3=10, arg4=10)
print(f'result = {result}')

(10,)
20
result = 70


In [None]:
result = foo(10, c=10, arg3=10, arg4=10)
print(f'result = {result}')

()
20
result = 60


In [None]:
sample_dct = {'arg3': 25, 'arg4': 25, 'd': 25}
sample_dct

{'arg3': 25, 'arg4': 25, 'd': 25}

In [None]:
result = foo(10, arg1, arg2, c=10, **sample_dct)
print(f'result = {result}')

(10,)
50
result = 115


In [None]:
def foo1(a, b=10, *name_for_pos_args, c, d=10, **name_for_kwargs):
    print(name_for_pos_args)
    print(sum(name_for_kwargs.values()))
    print("d =", d)
    return a + b + sum(name_for_pos_args) + c + d + sum(name_for_kwargs.values())

foo1(10, 10, arg1, arg2, c=10, **sample_dct)

(10, 10)
50
d = 25


125

In [None]:
sample_dct = {'arg3': 25, 'arg4': 25, 'd': 25, 'c': 25}
sample_dct

{'arg3': 25, 'arg4': 25, 'd': 25, 'c': 25}

In [None]:
foo1(10, 10, arg1, arg2, c=10, **sample_dct)

TypeError: ignored

[Звездочки в питоне - как они используются](https://tproger.ru/translations/asterisks-in-python-what-they-are-and-how-to-use-them/)

## Рекурсия

Функция называется **рекурсивной**, если в ходе своего исполнения она вызывает саму себя.

`n! = 1 * 2 * 3 * ... * n`

`factorial(n) = n * factorial(n-1)`

Рассмотрим рекурсию на примере одного из простейших алгоритмов сортировки.

Общая идея алгоритма:
1. Текущий список = входной список
2. Найти минимальный элемент в текущем списке
3. Удалить минимальный элемент из текущего списка, получим новый список
4. Повторить п. 2-3 для нового списка, тогда `sorted_input_list = [min_elem] + sorted_current_list`

In [None]:
def easy_sort(x):
    if len(x) == 1:
        return x  # при вызове return функция возвращает значение и ее выполнение завершается
    first = min(x)
    x.remove(first)
    print("Min:", first, "rest:", x)
    result = [first] + easy_sort(x)
    print("Result:", result)
    return result

Проверим его работу:

In [None]:
easy_sort([4, 2, 3, 1, 7, 5])

Min: 1 rest: [4, 2, 3, 7, 5]
Min: 2 rest: [4, 3, 7, 5]
Min: 3 rest: [4, 7, 5]
Min: 4 rest: [7, 5]
Min: 5 rest: [7]
Result: [5, 7]
Result: [4, 5, 7]
Result: [3, 4, 5, 7]
Result: [2, 3, 4, 5, 7]
Result: [1, 2, 3, 4, 5, 7]


[1, 2, 3, 4, 5, 7]

Важным моментом любой рекурсивной функции является условие остановки - иначе функция будет бесконечно вызывать саму себя.

На практике - перед новым вызовом функции Python запоминает текущее состояние предыдущего (родительского) вызова и помещает его в стек вызовов в память компьютера.

В этом и заключается опасность рекурсии - память ограничена, поэтому и глубина рекурсии (сколько функций внутри функций внутри функций... можно вызвать).

В Python имеется жесткий лимит на глубину рекурсии во избежании заполнения памяти:

In [None]:
import sys
sys.getrecursionlimit()

1000

In [None]:
def easy_sort_nonrec(x):
    result = []
    while len(x) > 0:
        first = min(x)
        result.append(first)
        x.remove(first)
    
    return result

In [None]:
easy_sort_nonrec([4, 2, 3, 1, 7, 5])

[1, 2, 3, 4, 5, 7]

In [None]:
def easy_sort_nonrec(x):
    def summ(a, b):
        return a, b 
    result = []
    while len(x) > 0:
        first = min(x)
        result.append(first)
        x.remove(first)
    
    return result

Еще один интересный пример рекурсивной функции - [функция Акермана](https://ru.wikipedia.org/wiki/%D0%A4%D1%83%D0%BD%D0%BA%D1%86%D0%B8%D1%8F_%D0%90%D0%BA%D0%BA%D0%B5%D1%80%D0%BC%D0%B0%D0%BD%D0%B0). Рекомендую ознакомиться с ней самостоятельно:

In [None]:
def ackermann(m, n):
    if m == 0:
        return n + 1
    if n == 0:
        return ackermann(m - 1, 1)
    return ackermann(m - 1, ackermann(m, n - 1))

In [None]:
print(ackermann(1, 3))
print(ackermann(2, 3))
print(ackermann(3, 4))

## Анонимные функции

**Анонимная функция** - особый вид функций, которые объявляются в месте использования и не получают уникального идентификатора (имени) для доступа к ним. 

Реализована в Python как **лямбда-функция**. Лямбда-функция может принимать любое кол-во аргументов, но имеет только одно выражение, которое и возвращает при вызове.

Основной синтаксис лямбда-функции выглядит следующим образом:

```python
lambda x: command()
```

Помимо отсутствия имени, отличительной чертой лямбда-функции является то, что она содержит в себе только одно выражение, которое и будет возвращать при вызове.

Создадим анонимную функцию и запишем ее в переменную:

In [None]:
f_lambda = lambda x: print(x, end='EOL')

Проверим, что мы действительно создали функцию:

In [None]:
type(f_lambda)

function

Проверим как работает наша лямбда-функция:

In [None]:
f_lambda("Hello!")

Hello!EOL

Записав нашу лямбда-функцию в переменную мы ей как бы дали имя, на практике так не делают - это лишь демонстрация.

Созданная нами функция полностью эквивалентна следующей обычной (именованной) функции:

In [None]:
def f(x):
    return print(x, end='EOL')

In [None]:
f("Hello!")

Hello!EOL

Как и обычная функция, лямбда-функция может принимать на вход несколько аргументов, указывать значения по-умолчанию:

In [None]:
(lambda x, y=4: x + y)(10, 13000)

13010

In [None]:
(lambda x, y=4: x + y)(10)

14

In [None]:
(lambda x, y=4, *args: x + y + sum(args))(10, 13000, 4, 100)

13114

В примерах выше мы сразу создали и вызвали лямбда-функцию.

### Применения лямбда-функций

**Зачем нужны лямбда-функции?** Некоторые функции принимают в качестве аргумента не обычную переменную, например, числовую или строку, а другую функцию. Эта переданная функция-аргумент используется для каких-либо вычислений внутри и обычно является достаточно простой.

Ярким примером такой функции является функция `sorted`. Она используется для сортировки контейнеров по возрастанию и по умолчанию для этого она сравнивает элементы контейнера между собой.

In [None]:
test_list = [3, 14, 15, 2, 73]

In [None]:
sorted(test_list)

[2, 3, 14, 15, 73]

Иногда в качестве элементов нашего сортируемого контейнера используются других контейнеры, например, кортежи и списки. Часто в таких случаях мы хотим выполнить нестандартную лексикографическую сортировку, а, например, сортировку по какому-либо конкретному индексу контейнера-элемента.

Разберем это на примере. Пусть имеем список `customer_data`, который содержит пары элементов (кортеж из двух элементов) "имя клиента", "полученный доход".

In [None]:
customer_data = [("ivan", 2), ("george", 4), ("carl", 1), ("liz", 20), ("vlad", 10)]

Попробуем отсортировать этот список стандартным способом:

In [None]:
sorted(customer_data)

[('carl', 1), ('george', 4), ('ivan', 2), ('liz', 20), ('vlad', 10)]

Сортировка выполнилась в первую очередь по первому полю (как и полагается лексикографически). Но нам бы хотелось отсортировать список по доходу с клиентов. 

Здесь нам поможет один из необязательных аргументов функции `sorted` - `key`. Он принимает на вход функцию (не путать со значением/результатом функции), которая принимает один аргумент - элемент списка, и возвращает одно значение, по которому и будет выполняться сортировка.

В таких случаях, когда функция используется лишь один раз для небольшой работы, и применяют лямбда-функции. Выполним сортировку с использованием аргумента `key`:

In [None]:
sorted(customer_data, key=lambda x: x[1])  # сортируем по элементу с индексом 1

[('carl', 1), ('ivan', 2), ('george', 4), ('vlad', 10), ('liz', 20)]

Это эквивалентно созданию именованной функции и ее указания в аргументах:

In [None]:
def lambda_f(x):
    return x[1]

In [None]:
sorted(customer_data, key=lambda_f)  # указываем имя функции, не вызывая ее

[('carl', 1), ('ivan', 2), ('george', 4), ('vlad', 10), ('liz', 20)]

Как видим, получили сортировку по элементу с индексом 1, но хотелось бы иметь сортировку по убыванию. Здесь нам может помочь другой аргумент - `reverse`, который позволяет выполнить сортировку по убыванию (в обратном порядке).

In [None]:
sorted(customer_data, key=lambda x: x[1], reverse=True)

[('liz', 20), ('vlad', 10), ('george', 4), ('ivan', 2), ('carl', 1)]

Еще один способ выполнить сортировку по полю 1 по убыванию - изменить нашу лямбда-фукнцию:

In [None]:
sorted(customer_data, key=lambda x: -x[1])

[('liz', 20), ('vlad', 10), ('george', 4), ('ivan', 2), ('carl', 1)]

Аналогично можно использовать и встроенные функции. Например, если хотим отсортировать список кортежей по минимальному элементу каждого кортежа:

In [None]:
list_of_tuples = [(10, 2), (100, 4), (-13, -1), (42, 20)]

In [None]:
sorted(list_of_tuples, key=min)

[(-13, -1), (10, 2), (100, 4), (42, 20)]

Еще одним примером встроенной функции, которая в качестве аргументов принимает другую функцию, является функция `map`.

Функция `map` позволяет применить одну функцию ко всем элементам контейнера:

In [None]:
list(map(lambda x: x ** 2, [1,2,3]))

[1, 4, 9]

Функция `map` возвращает результат в специальном служебном типе данных, поэтому преобразуем его в список.

Один из частых сценариев применения функции `map` - считывание набора чисел, вводимых из строки.

Предположим, мы считали строку в переменную `input_str`:

In [None]:
input_str = "123 456 123778 8898"

Затем можем разбить строку эту строку на отдельные элементы по пробелу:

In [None]:
input_str_list = input_str.split(' ')
input_str_list

['123', '456', '123778', '8898']

Остается лишь преобразовать элементы из строкового типа в целочисленный:

In [None]:
list(map(int, input_str_list))

[123, 456, 123778, 8898]

Эта операция эквивалентна:

In [None]:
result = []
for item in input_str_list:
    result.append(int(item))
result

[123, 456, 123778, 8898]

# Генераторы

Циклы позволяют удобно проходить по контейнерам и обрабатывать нужным нам образом их элементы, которые хранятся в оперативной. 

Но, к сожалению, это не всегда возможно. Какие могут быть причины:
- очень большой размер файла (десятки гигабайт) - мы хотим как-либо обработать его строки и проанализировать их содержимое, но не получится загрузить в оперативную память
- не можем сразу получить необходимые данные - данные могут передаваться непрерывным потоком, и нам необходимо этот поток данных как-либо преобразовать и выделить его полезные свойства

В таких случаях нам на помощь приходит *генератор*.



**Генератор** — это объект ("тип данных"), который сразу при создании не вычисляет значения всех своих элементов. Он хранит в памяти только последний вычисленный элемент, правило перехода к следующему и условие, при котором получение новых элементов прерывается.

Вычисление следующего значения происходит лишь с помощью функции `next()`, т.е. лишь по необходимости. Предыдущее значение при этом теряется. Поэтому вычисления с помощью генераторов называются ленивыми.

В этом и заключается отличие от привычных нам контейнеров (списков, кортежей) - они хранят в памяти все свои элементы, и удалить их можно только программно.

Генераторы можно создавать несколькими способами:
- генераторные выражения
- генераторные функции
- генераторные объекты

## Генераторные выражения

Самый простой способ создания генераторов - **генераторное выражение**. Оно требует контейнера, из элементов которых будут высчитываться. По синтаксису, генераторное выражение очень похоже на list comprehension, только окружено не квадратными, а круглыми скобками:

```python
(<expression> for <item_variable> in <container>)
```

Познакомимся с ними поближе на примере генератора квадратов:

In [None]:
genexpr = (i**2 for i in range(1, 5))

In [None]:
type(genexpr)

generator

Для получения элементов из него воспользуемся функцией `next`:

In [None]:
next(genexpr)

1

Попробуем снова получить элемент:

In [None]:
next(genexpr)

4

Получили следующий элемент. Попробуем и дальше получать элементы:

In [None]:
next(genexpr)

9

In [None]:
next(genexpr)

16

In [None]:
next(genexpr)

StopIteration: ignored

Получили ошибку `StopIteration`. Эта ошибка является служебной, используется в цикле `for` для остановки его работы. Теперь посмотрим как генератор работает с циклом `for`:

In [None]:
for item in (i**2 for i in range(1, 5)):
    print(item)

1
4
9
16


Сравним память, используемую list comprehension и генераторным выражением. Для этого нам пригодится функция `getsizeof` из модуля системных функций `sys`:

In [None]:
from sys import getsizeof

help(getsizeof)

Help on built-in function getsizeof in module sys:

getsizeof(...)
    getsizeof(object, default) -> int
    
    Return the size of object in bytes.



Память, используемая list comprehension квадратов чисел до 1 000 000:

In [None]:
getsizeof([item ** 2 for item in range(1_000_000)])

8697472

Память, используемая генераторным выражением для аналогичной задачи:

In [None]:
getsizeof((item ** 2 for item in range(1_000_000)))

128

Как видим, экономия памяти очевидна.

## Генераторные функции

Генераторные выражения - упрощенный способ создания **генераторных функций**.

Генераторная функция отличается от обычной функции тем, что вместо команды `return` для возврата значения в ней используется `yield` - `return` завершает работу функции, а `yield` лишь приостанавливает её до следующего вызова генераторной функции.

При первом вызове метода `next()` выполняется код функции с первой команды до `yield`. При втором `next()` и последующих до конца генератора — код со следующей после `yield` команды и до тех пор, пока `yield` не встретится снова.

Рассмотрим работу функции-генератора на примере. Создадим функцию-генератор для создания квадратов чисел со смещением:

In [None]:
def gen_fn(n):
    shift = 0
    for i in range(n):
        yield i ** 2 + shift
        shift += 1

Проверим тип созданной функции:

In [None]:
type(gen_fn)

function

Сама по себе генераторная функция не является генератором,  но может создавать их при вызове:

In [None]:
gen = gen_fn(5)
type(gen)

generator

Проверим как работает с нашим новым генератором цикл `for`:

In [None]:
for i in gen:
    print(i)

0
2
6
12
20


С помощью генераторных функций можно создавать бесконечные генераторы, которые могут порождать новые элементы без остановки.

Создадим генератор, который возвращает кубы натуральных чисел:

In [None]:
def cubes():
    i = 0
    while True:
        yield i ** 3
        i += 1

Можем проверить его работу, запустив в цикле, но предварительно добавить счетчик для ручной остановки цикла:

In [None]:
counter = 0
for item in cubes():
    print(item, end=' ')
    counter += 1
    if counter == 15:
        break

0 1 8 27 64 125 216 343 512 729 1000 1331 1728 2197 2744 

# Итераторы

Минутка формальных определений в Python.

**Итерируемый (iterable)** объект (переменная) - объект (переменная), от которого встроенная функция `iter()` может получить *итератор*.

**Итератор** - объект (переменная), который позволяет получить элемент с помощью функции `next()`.

Их взаимосвязь можно описать схематично:

![iters](https://pythonist.ru/wp-content/uploads/2020/10/1513840561502_6-1024x318.png)

Сами того не осознавая, мы сталкивались с ними повсеместно, например, при работе со списком в цикле

In [None]:
test_list = ['Hello', 'world!']

In [None]:
test_list_iterator = test_list.__iter__()
print(test_list_iterator)

<list_iterator object at 0x7fd47d90eed0>


In [None]:
test_list_iterator.__next__()

'Hello'

In [None]:
test_list_iterator.__next__()

'world!'

In [None]:
test_list_iterator.__next__()

StopIteration: ignored

Итоговая картина взаимосвязей этих сущностей указана на картинке:

![iters_schema](https://baikov.dev/iterators-and-generators-python/img/iterator-generator.png)

`from collections.abc import Iterable, Iterator`

In [None]:
from collections.abc import Iterable, Iterator

list_example = ['Alice', 'Bob', 'Charlie']
iterator1 = iter(list_example)  # iterable.__iter__()
iterator2 = iter(list_example)

In [None]:
print(list_example)  # ['Alice', 'Bob', 'Charlie']
print(isinstance(list_example, Iterable)) # True

['Alice', 'Bob', 'Charlie']
True
<list_iterator object at 0x7ff2a0ca5550>
True


In [None]:
print(iterator1)
print(isinstance(iterator1, Iterator)) # True

# Здесь начинается следующая тема

# Аттрибуты

In [None]:
print?

In [None]:
print(print.__doc__)
print(type(print.__doc__))

In [None]:
dir(foo)

In [None]:
def foo(*args, **kwargs):
    'Function which prints arguments.'
    print('args =', args, 'kwargs =', kwargs)

print(*dir(foo), sep=' ')
print(foo.__name__)
print(foo.__doc__) # documentation
print(foo.__module__)

#### Аттрибуты как статические переменные

In [None]:
def get_next_id():
    if not hasattr(get_next_id, 'value'):
        get_next_id.value = 0
    
    get_next_id.value += 1
    return get_next_id.value

print(get_next_id())
print(get_next_id())
print(get_next_id())
print('get_next_id.value =', get_next_id.value)

#### Где хранятся аргументы по умолчанию?

In [None]:
def foo(a = 'Hello', b = 1):
    print(a, b)

print('Defaults: ', foo.__defaults__)
foo()

foo.__defaults__ = ('Hello', 'world!')
print('Defaults: ', foo.__defaults__)
foo()

#### Почему не стоит использовать mutable аргументы по умолчанию

In [None]:
def foo(a, b=[]):
    b.append(a)
    print(*b)
    
foo('Hello')
foo('the')
foo('wonderful')
foo('world!')

In [None]:
def foo(a):
    b=[]
    b.append(a)
    print(*b)
    
foo('Hello')
foo('the')
foo('wonderful')
foo('world!')

## Полезные инструменты

In [None]:
del range

In [None]:
# Функция filter - возвращает фильтр-объект (генератор)
res = [y for y in filter(lambda x: x > 0, range(-5, 6))]

print(res)

In [None]:
import functools

#help(functools.reduce) # == Apply a function of two arguments cumulatively to the items of a sequence

print(functools.reduce(lambda x,y: x*y, res))

In [None]:
print(functools.reduce(lambda x,y: x*y, range(1, 6)))

In [None]:
value = 1

def f_0():
    value = 2

    def f_1():
        value = 3

        def f_2():
            nonlocal value
            print(value)
        
        f_2()

    f_1()

f_0()
# print(value)