# Практикум по программированию на языке Python

## <font color='lilac'>Занятие 2: Функции, итераторы и генераторы</font>

#### Мурат Апишев (mel-lain@yandex.ru)
#### Москва, 2025

### <font color='lilac'>Функции range и enumerate</font>

In [2]:
r = range(2, 10, 3)
print(type(r))

for e in r:
    print(e, end=' ')

<class 'range'>
2 5 8 

In [3]:
for index, element in enumerate(list('abcdef')):
    print(index, element, end='   ')

0 a   1 b   2 c   3 d   4 e   5 f   

### <font color='lilac'>Функция zip</font>

In [4]:
z = zip([1, 2, 3], 'abc')
print(type(z))

for a, b in z:
    print(a, b, end='  ')

<class 'zip'>
1 a  2 b  3 c  

In [5]:
for e in zip('abcdef', 'abc'):
    print(e)

('a', 'a')
('b', 'b')
('c', 'c')


In [6]:
for a, b, c, d in zip('abc', [1,2,3], [True, False, None], 'xyz'):
    print(a, b, c, d)

a 1 True x
b 2 False y
c 3 None z


### <font color='lilac'>Определение собственных функций</font>

In [7]:
def function(arg_1, arg_2=None):
    print(arg_1, arg_2)

function(10)
function(10, 20)

10 None
10 20


Функция - это тоже объект, её имя - просто символическая ссылка:

In [8]:
f = function
f(10)

print(function is f)

10 None
True


### <font color='lilac'>Определение собственных функций</font>

In [9]:
retval = f(10)
print(retval)

10 None
None


In [10]:
def factorial(n):
    return n * factorial(n - 1) if n > 1 else 1  # recursion

print(factorial(1))
print(factorial(2))
print(factorial(4))

1
2
24


### <font color='lilac'>Передача аргументов в функцию</font>

Параметры в Python всегда передаются по ссылке

In [11]:
def function(scalar, lst):
    scalar += 10
    print(f'Scalar in function: {scalar}')

    lst.append(None)
    print(f'Scalar in function: {lst}')

In [12]:
s, l = 5, []
function(s, l)

print(s, l)

Scalar in function: 15
Scalar in function: [None]
5 [None]


### <font color='lilac'>Передача аргументов в функцию</font>

In [14]:
def f(a, *args):
    print(type(args))
    print([v for v in [a] + list(args)])
    
f(10, 2, 6, 8)

<class 'tuple'>
[10, 2, 6, 8]


In [17]:
def f(*args, a):
    print([v for v in [a] + list(args)])
    print()

f(2, 6, 8, a=10)

[10, 2, 6, 8]



In [18]:
def f(a, *args, **kw):
    print(type(kw))
    print([v for v in [a] + list(args) + [(k, v) for k, v in kw.items()]])

f(2, *(6, 8), **{'arg1': 1, 'arg2': 2})

<class 'dict'>
[2, 6, 8, ('arg1', 1), ('arg2', 2)]


### <font color='lilac'>Спецификация позиционности параметров</font>

- Начиная с версии 3.8 в Python появилась возможность явно запрещать передачу параметров по имени или позиции
- Мотивация - дать возможность запрета именованных параметров там, где это нужно (это позволяет эмулировать C-подобные функции)
- Часть встроенных функций самого языка и раньше имели такое свойство, например, `math.exp`:

In [19]:
import math
#help(math.exp) -> ... exp(x, /) ...

In [33]:
print(math.exp(5))
#print(math.exp(x=5)) -> TypeError: math.exp() takes no keyword arguments

148.4131591025766


Синтаксис заголовка функции:

In [34]:
def func(positional_only_parameters, /, positional_or_keyword_parameters, *, keyword_only_parameters): pass

In [35]:
def f(a, b, /, c, *, d): pass
#f(1, 2, 3, 4) -> TypeError: func() takes 3 positional arguments but 4 were given
#f(a=1, b=2, c=3, d=4) -> TypeError: func() got some positional-only arguments passed as keyword arguments: 'a, b'
f(1, 2, 4, d=3) # OK
f(1, 2, d=4, c=3) # OK

### <font color='lilac'>Области видимости переменных</font>

В Python есть 4 основных уровня видимости:

- Встроенная (buildins) - на этом уровне находятся все встроенные объекты (функции, классы исключений и т.п.)
- Глобальная в рамках модуля (global) - всё, что определяется в коде модуля на верхнем уровне
- Объемлющей функции (enclosed) - всё, что определено в функции верхнего уровня
- Локальной функции (local) - всё, что определено в функции нижнего уровня


Есть ещё области видимости переменных циклов, списковых включений и т.п.

### <font color='lilac'>Правило разрешения области видимости LEGB при чтении</font>

In [36]:
def outer_func(x):
    def inner_func(x):
        return len(x)
    return inner_func(x)

In [37]:
print(outer_func([1, 2]))

2


Кто определил имя `len`?

- на уровне вложенной функции такого имени нет, смотрим выше
- на уровне объемлющей функции такого имени нет, смотрим выше
- на уровне модуля такого имени нет, смотрим выше
- на уровне builtins такое имя есть, используем его

### <font color='lilac'>На builtins можно посмотреть</font>

In [38]:
import builtins

counter = 0
lst = []
for name in dir(builtins):
    if name[0].islower():
        lst.append(name)
        counter += 1
    
    if counter == 5:
        break

lst

['abs', 'aiter', 'all', 'anext', 'any']

Кстати, то же самое можно сделать более pythonic кодом:

In [39]:
list(filter(lambda x: x[0].islower(), dir(builtins)))[: 5]

['abs', 'aiter', 'all', 'anext', 'any']

### <font color='lilac'>Локальные и глобальные переменные</font>

In [40]:
x = 2
def func():
    print('Inside: ', x)  # read
    
func()
print('Outside: ', x)

Inside:  2
Outside:  2


In [41]:
x = 2
def func():
    x += 1  # write
    print('Inside: ', x)
    
func()  # UnboundLocalError: local variable 'x' referenced before assignment
print('Outside: ', x)

UnboundLocalError: cannot access local variable 'x' where it is not associated with a value

In [42]:
x = 2
def func():
    x = 3
    x += 1
    print('Inside: ', x)
    
func()
print('Outside: ', x)

Inside:  4
Outside:  2


### <font color='lilac'>Ключевое слово global</font>

In [43]:
x = 2
def func():
    global x
    x += 1  # write
    print('Inside: ', x)
    
func()
print('Outside: ', x)

Inside:  3
Outside:  3


In [44]:
x = 2
def func(x):
    x += 1
    print('Inside: ', x)
    return x
    
x = func(x)
print('Outside: ', x)

Inside:  3
Outside:  3


### <font color='lilac'>Ключевое слово nonlocal</font>

In [45]:
a = 0
def out_func():
    b = 10
    def mid_func():
        c = 20
        def in_func():
            global a
            a += 100
            
            nonlocal c
            c += 100
            
            nonlocal b
            b += 100

            print(a, b, c)
            
        in_func()
    mid_func()

out_func()

100 110 120


__Главный вывод:__ не надо злоупотреблять побочными эффектами при работе с переменными верхних уровней

### <font color='lilac'>Пример вложенных функций: замыкания</font>

- В большинстве случаев вложенные функции не нужны, плоская иерархия будет и проще, и понятнее
- Одно из исключений - фабричные функции (замыкания)

In [46]:
def function_creator(n):
    def function(x):
        return x ** n

    return function

f = function_creator(5)
f(2)

32

Объект-функция, на который ссылается `f`, хранит в себе значение `n`

### <font color='lilac'>Анонимные функции</font>

- `def` - не единственный способ объявления функции
- `lambda` создаёт анонимную (lambda) функцию


Такие функции часто используются там, где синтаксически нельзя записать определение через `def`

In [47]:
def func(x): return x ** 2
func(6)

36

In [48]:
lambda_func = lambda x: x ** 2  # should be an expression
lambda_func(6)

36

In [49]:
def func(x): print(x)
func(6)

6


In [50]:
lambda_func = lambda x: print(x ** 2)  # as print is function in Python 3.*
lambda_func(6)

36


### <font color='lilac'>Встроенная функция sorted</font>

In [51]:
lst = [5, 2, 7, -9, -1]

In [52]:
def abs_comparator(x):
    return abs(x)

print(sorted(lst, key=abs_comparator))

[-1, 2, 5, 7, -9]


In [53]:
sorted(lst, key=lambda x: abs(x))

[-1, 2, 5, 7, -9]

In [54]:
sorted(lst, key=lambda x: abs(x), reverse=True)

[-9, 7, 5, 2, -1]

### <font color='lilac'>Встроенная функция filter</font>

In [55]:
lst = [5, 2, 7, -9, -1]

In [56]:
f = filter(lambda x: x < 0, lst)  # True condition
type(f)  # iterator

filter

In [57]:
list(f)

[-9, -1]

### <font color='lilac'>Встроенная функция map</font>

In [58]:
lst = [5, 2, 7, -9, -1]

In [59]:
m = map(lambda x: abs(x), lst)
type(m)  # iterator

map

In [60]:
list(m)

[5, 2, 7, 9, 1]

### <font color='lilac'>Ещё раз сравним два подхода</font>

Напишем функцию скалярного произведения в императивном и функциональном стилях:

In [61]:
def dot_product_imp(v, w):
    result = 0
    for i in range(len(v)):
        result += v[i] * w[i]
    return result

In [62]:
dot_product_func = lambda v, w: sum(map(lambda x: x[0] * x[1], zip(v, w)))

In [63]:
print(dot_product_imp([1, 2, 3], [4, 5, 6]))
print(dot_product_func([1, 2, 3], [4, 5, 6]))

32
32


### <font color='lilac'>Функция reduce</font>

`functools` - стандартный модуль с другими функциями высшего порядка.

Рассмотрим пока только функцию `reduce`:

In [64]:
from functools import reduce

lst = list(range(1, 10))

reduce(lambda x, y: x * y, lst)

362880

### <font color='lilac'>Итераторы</font>

- __Итерабельный объект (iterable)__ - источник данных для итерирования
- __Итератор (iterator)__ - объект-абстракция, извлекающий из источника элемент за элементом и знающий только о том объекте, на котором он в текущий момент остановился


- Итераторы используются для итерирования по последовательностям, при этом:
    - последовательности могут быть неиндексируемыми (например, `set`)
    - в процессе работы элементы могут фильтроваться или преобразовываться
    - итераторы работают лениво


- В Python для итераторов есть две встроенные функции:
    - `iter(x: iterable)` - создаёт итератор для переданной последовательности
    - `next(x: iterator)` - выполняет шаг итерации для переданного итератора

### <font color='lilac'>Итераторы</font>

In [65]:
r = iter([1, 2, 3])

print(next(r), next(r), next(r))
#next(r) -> StopIteration

print(type(r))

1 2 3
<class 'list_iterator'>


Итераторы можно получать вызовами стандартных функций:

In [66]:
r = enumerate([1, 2, 3])

print(next(r), next(r), next(r))
#next(r) -> StopIteration

(0, 1) (1, 2) (2, 3)


### <font color='lilac'>Итераторы и цикл for</font>

Цикл `for` использует итераторы вместо индексов. Как выглядит `for` снаружи:

In [67]:
for e in {1, 2, 3}:
    print(e, end=' ')

1 2 3 

Как он работает на самом деле:

In [68]:
iterator = iter({1, 2, 3})
while True:
    try:
        i = next(iterator)
        print(i, end=' ')
    except StopIteration:
        break

1 2 3 

### <font color='lilac'>Итераторы</font>

Примеры встроенных функций, возвращающих итераторы:

- `enumerate`
- `zip`
- `open`
- `reversed`
- `map` (похож на генератор, но метод `send` не реализует)
- `filter`

Вызов `iter` от итератора вернет тот же самый итератор:

In [69]:
i = iter([1, 2, 3])

print(next(i), next(iter(i)), next(i))

1 2 3


### <font color='lilac'>Генераторы</font>

- __Генератор__ - подтип итератора
- В генераторе есть внутреннее изменяемое состояние в виде локальных переменных, которое он хранит автоматически
- В генератор можно посылать данные между итерациями (метод `send`)
- Генераторы можно создавать с помощью генераторных выражений или описывать функциями, в которых `return` заменяется на `yield`

Пример генератора, полученного с помощью выражения:

In [55]:
gen = (x**2 for x in range(5))

print(next(gen), next(gen))
print(type(gen))

0 1
<class 'generator'>


### <font color='lilac'>Ключевое слово yield</font>

- `yield` - это слово, по смыслу похожее на `return`
- Но используется в функциях, возвращающих генераторы
- При вызове такой функции тело не выполняется, функция только возвращает генератор
- В первых запуск функция будет выполняться от начала и до `yield`
- После выхода состояние функции сохраняется
- На следующий вызов будет проводиться итерация цикла и возвращаться следующее значение
- И так далее, пока не кончится цикл каждого `yield` в теле функции
- После этого генератор станет пустым

### <font color='lilac'>Пример функции-генератора</font>

In [70]:
def my_range(n):
    yield 'You really want to run this generator?'

    i = -1
    while i < n:
        i += 1
        yield i

In [71]:
gen = my_range(3)
while True:
    try:
        print(next(gen), end='   ')
    except StopIteration:  # we want to catch this type of exceptions
        break

You really want to run this generator?   0   1   2   3   

In [72]:
for e in my_range(3):
    print(e, end='   ')

You really want to run this generator?   0   1   2   3   

### <font color='lilac'>Генераторы и метод send</font>

- Выражение `yield x` выполняет две вещи:
    1. Возвращает вызывающему генератор коду значение `x`
    2. Возвращает на уровне кода генератора значение `None`


- Расширенный протокол генератора содержит метод `send`, получающий на вход произвольный объект `y`
- В случае вызова `send(y)` выполняется то же, что и при `next`, но `yield` вернет на уровне кода генератора не `None`, а `y`

In [73]:
def create_gen():
    for x in range(5):
        y = yield x
        print(f'y = {y}', end='   ')

In [74]:
gen = create_gen()

print(next(gen), end=' | ')
print(next(gen), end=' | ')

print(gen.send(10), end=' | ')
print(next(gen), end=' | ')

0 | y = None   1 | y = 10   2 | y = None   3 | 

### <font color='lilac'>Итераторы и функция range</font>

Результат работы `range` не является итератором, хотя и выполняет его роль:

In [75]:
print('__next__' in dir(zip([], [])))
print('__next__' in dir(range(3)))

True
False


__Особенности объектов__ `range`:
- как и итераторы, выполняются лениво
- являются неизменяемыми (могут быть ключами словаря)
- имеют полезные атрибуты (`len`, `index`, `__getitem__`)
- по ним можно итерироваться многократно

### <font color='lilac'>Модуль itetools</font>

- Модуль представляет собой набор инструментов для работы с итераторами и последовательностями
- Содержит три основных типа итераторов:
    - бесконечные итераторы
    - конечные итераторы
    - комбинаторные итераторы

- Позволяет эффективно решать небольшие задачи вида:
    - итерирование по бесконечному потоку
    - слияние в один список вложенных списков
    - генерация комбинаторного перебора сочетаний элементов последовательности
    - аккумуляция и агрегация данных внутри последовательности

### <font color='lilac'>Модуль itetools: примеры</font>

In [76]:
from itertools import count

for i in count(start=0):
    print(i, end='  ')
    if i == 5:
        break

0  1  2  3  4  5  

In [77]:
from itertools import cycle
 
count = 0
for item in cycle('XYZ'):
    if count > 4:
        break
    print(item, end='  ')
    count += 1

X  Y  Z  X  Y  

### <font color='lilac'>Модуль itetools: примеры</font>

In [107]:
from itertools import accumulate

for i in accumulate(range(1, 5), lambda x, y: x * y):
    print(i, end='  ')

1  2  6  24  

In [78]:
from itertools import chain

for i in chain([1, 2], [3], [4]):
    print(i, end='  ')

1  2  3  4  

### <font color='lilac'>Модуль itetools: примеры</font>

In [79]:
from itertools import groupby
 
vehicles = [('Ford', 'Taurus'), ('Dodge', 'Durango'),
            ('Chevrolet', 'Cobalt'), ('Ford', 'F150'),
            ('Dodge', 'Charger'), ('Ford', 'GT')]
 
sorted_vehicles = sorted(vehicles)
 
for key, group in groupby(sorted_vehicles, lambda x: x[0]):
    for maker, model in group:
        print('{model} is made by {maker}'.format(model=model, maker=maker))
    
    print ("**** END OF THE GROUP ***\n")

Cobalt is made by Chevrolet
**** END OF THE GROUP ***

Charger is made by Dodge
Durango is made by Dodge
**** END OF THE GROUP ***

F150 is made by Ford
GT is made by Ford
Taurus is made by Ford
**** END OF THE GROUP ***



### <font color='lilac'>Аннотации типов</font>

- Python - язык со строгой динамической типизацией
- Динамическая типизация удобна при разработке, но может приводить к ошибкам при росте объёма и сложности кода
- Для борьбы с этим можно использовать аннотирование функций (Python 3.5+) и переменных (Python 3.6+)
- Существуют решения для статической проверки типов на основе аннотаций
- Для аннотирования можно использовать doc-строки, это громоздкий и плохо подходящий для проверки способ

In [80]:
def print_1(obj: int):
    """
    Parameters
    ----------
    x: int
    -------
    """
    print(obj)

def print_2(obj: int) -> None:
    print(obj)

- Аннотации не делают типизацию статической, они играют только информационную роль:

In [81]:
print_1('str')
print_2('str')

str
str


### <font color='lilac'>Аннотации типов</font>

- Для аннотирования типов параметров `*args` и `**kwargs` можно указать тип одного элемента:

In [83]:
def my_print(*args: str, **kwargs: int) -> None:
    print(args, kwargs)

- Аннотация типов переменных производится аналогично (и тоже только для информирования):

In [84]:
a: int = True
type(a)

bool

### <font color='lilac'>Аннотации типов</font>

- Аннотировать можно не только простые, но и контейнерные типы
- В Python 3.9 эта возможность поддерживается на уровне имен типов:

In [85]:
def my_print(obj: list[int]) -> None:
    print(obj)

- До Python 3.9 такой синтаксис был недопустим, можно было только указать тип контейнера, без типа элементов:

In [86]:
def my_print(obj: list) -> None:
    print(obj)

#def my_print(obj: list[int]):
#TypeError: 'type' object is not subscriptable

- В лекциях будет использоваться аннотирование с generic-типами из модуля `typing`, чтобы код выполнялся на Python 3.8

### <font color='lilac'>Аннотации типов</font>

- Для полного аннотирования контейнерных типов можно использовать их Generic-версии модуль `typing`:

In [87]:
from typing import List

def my_print(obj: list[int]) -> None:
    print(obj)

- Модуль `typing` содержит много полезных классов и полезен для аннотирования в т.ч. и в Python 3.9+
- Аннотации типов функций и переменных будет рассматриваться подробнее и шире в дальнейших занятиях
- Аннотирование в лекциях будет присутствовать в нужных местах, в прочих оно будет опускаться для краткости
- На практике использование аннотаций типов во всём проекте является рекомендуемым подходом