# Лекция 13 "Введение в функциональное программирование. Часть 2."

### Финансовый университет при Правительстве РФ, лектор С.В. Макрушин

## Map / Filter / Reduce

![](MFR_emj.png)

### Map

Встроенная функция map() позволяет применить функцию к каждому элементу последовательности. Функция имеет следующий формат: 

`mар(<Функция>, <Последовательность1>[, ... , <ПоследовательностьN>])`

Функция возвращает объект, nоддерживающий итерацию, а не список.

![](map_.jpg)

In [11]:
squared = lambda x: x**2

In [12]:
list(range(10))

[0, 1, 2, 3, 4, 5, 6, 7, 8, 9]

In [13]:
m1 = map(squared, range(10))
m1

<map at 0x19e123528c8>

In [14]:
list(m1)

[0, 1, 4, 9, 16, 25, 36, 49, 64, 81]

In [15]:
ls0 = list(zip(range(10), range(0, 100, 10)))
ls0

[(0, 0),
 (1, 10),
 (2, 20),
 (3, 30),
 (4, 40),
 (5, 50),
 (6, 60),
 (7, 70),
 (8, 80),
 (9, 90)]

In [16]:
list(map(sum, ls0))

[0, 11, 22, 33, 44, 55, 66, 77, 88, 99]

In [17]:
# альтернативное решение - генератор списков:
[sum(i) for i in ls0]

[0, 11, 22, 33, 44, 55, 66, 77, 88, 99]

Функции `map()` можно передать несколько nоследовательностей. В этом случае в функцию 
обратного вызова будут передаваться сразу несколько элементов, расположенных в nоследовательностях на одинаковом смещении. 

![](map2_.jpg)

In [18]:
ls1 = list(range(10))
ls2 = list(range(0, 100, 10))
ls3 = list(range(0, 1000, 100))

In [19]:
ls1, ls2, ls3

([0, 1, 2, 3, 4, 5, 6, 7, 8, 9],
 [0, 10, 20, 30, 40, 50, 60, 70, 80, 90],
 [0, 100, 200, 300, 400, 500, 600, 700, 800, 900])

In [20]:
list(map(lambda x, y: x + y, ls1, ls2))

[0, 11, 22, 33, 44, 55, 66, 77, 88, 99]

In [21]:
# аналог - генератор списков:
[x + y for x, y in zip(ls1, ls2)]

[0, 11, 22, 33, 44, 55, 66, 77, 88, 99]

In [22]:
import operator as op

In [23]:
list(map(op.add, ls1, ls2))

[0, 11, 22, 33, 44, 55, 66, 77, 88, 99]

In [24]:
list(map(lambda x, y, z: x + y + z, ls1, ls2, ls3))

[0, 111, 222, 333, 444, 555, 666, 777, 888, 999]

In [25]:
list(map(sum, ls1, ls2, ls3))

TypeError: sum expected at most 2 arguments, got 3

In [27]:
sum(1, 2, 3)

TypeError: sum expected at most 2 arguments, got 3

In [28]:
sum((1, 2, 3))

6

In [30]:
def f(*a):
    return sum(a)

In [31]:
sum2 = lambda *a: sum(a)

In [32]:
sum2(1, 2, 3)

6

In [35]:
list(map(sum2, ls1, ls2, ls3, ls1))

[0, 112, 224, 336, 448, 560, 672, 784, 896, 1008]

In [36]:
# решение, которое может показаться подходящим, но выполняет другую задачу:
list(map(sum, [ls1, ls2, ls3]))

[45, 450, 4500]

In [23]:
list(zip(ls1, ls2, ls3, ls1))

[(0, 0, 0, 0),
 (1, 10, 100, 1),
 (2, 20, 200, 2),
 (3, 30, 300, 3),
 (4, 40, 400, 4),
 (5, 50, 500, 5),
 (6, 60, 600, 6),
 (7, 70, 700, 7),
 (8, 80, 800, 8),
 (9, 90, 900, 9)]

In [38]:
list(map(sum, zip(ls1, ls2, ls3, ls1)))

[0, 112, 224, 336, 448, 560, 672, 784, 896, 1008]

In [29]:
# что, если функция ожидает позиционные аргументы? Пример:
list(map(print, zip(ls1, ls2, ls3, ls1)))

(0, 0, 0, 0)
(1, 10, 100, 1)
(2, 20, 200, 2)
(3, 30, 300, 3)
(4, 40, 400, 4)
(5, 50, 500, 5)
(6, 60, 600, 6)
(7, 70, 700, 7)
(8, 80, 800, 8)
(9, 90, 900, 9)


[None, None, None, None, None, None, None, None, None, None]

In [40]:
list(map(print, ls1, ls2, ls3, ls1))

0 0 0 0
1 10 100 1
2 20 200 2
3 30 300 3
4 40 400 4
5 50 500 5
6 60 600 6
7 70 700 7
8 80 800 8
9 90 900 9


[None, None, None, None, None, None, None, None, None, None]

In [41]:
lsz = list(zip(ls1, ls2, ls3, ls1))
lsz

[(0, 0, 0, 0),
 (1, 10, 100, 1),
 (2, 20, 200, 2),
 (3, 30, 300, 3),
 (4, 40, 400, 4),
 (5, 50, 500, 5),
 (6, 60, 600, 6),
 (7, 70, 700, 7),
 (8, 80, 800, 8),
 (9, 90, 900, 9)]

In [47]:
import itertools as itl

In [45]:
print(*lsz[0])

0 0 0 0


In [48]:
list(itl.starmap(print, lsz))

0 0 0 0
1 10 100 1
2 20 200 2
3 30 300 3
4 40 400 4
5 50 500 5
6 60 600 6
7 70 700 7
8 80 800 8
9 90 900 9


[None, None, None, None, None, None, None, None, None, None]

### Filter

Функция `filter()` nозволяет выполнить проверку элементов последовательности. Формат функции: 

`filtеr(<Функция>, <Последовательность>)`

Если в nервом nараметре вместо названия функции указать значение `None`, то каждый элемент nоследовательности будет nроверен на соответствие значению `True`. Если элемент в логическом контексте возвращает значение `False`, то он не будет добавлен в возвращаемый результат. Функция возвращает объект, поддерживающий итерацию, а не список.

![](filter_.jpg)

In [3]:
import random
random.seed(42)

In [4]:
lr1 = [random.randint(-100, 100) for _ in range(20)]
lr1

[63,
 -72,
 -94,
 89,
 -30,
 -38,
 -43,
 -65,
 88,
 -74,
 73,
 89,
 39,
 -78,
 51,
 8,
 -92,
 -93,
 -77,
 -45]

In [51]:
list(filter(lambda x: x % 3 == 0, lr1))

[63, -72, -30, 39, -78, 51, -93, -45]

In [52]:
# аналог - генератор списков:
[i for i in lr1 if i % 3 == 0]

[63, -72, -30, 39, -78, 51, -93, -45]

In [53]:
lr2 = [random.randint(-1, 1) for _ in range(20)]
lr2

[-1, 1, 1, -1, 1, -1, 1, 1, 1, 1, 0, -1, 0, 1, 0, -1, -1, 1, 0, 0]

In [54]:
# первый параметр None имеет особую семантику:
list(filter(None, lr2))

[-1, 1, 1, -1, 1, -1, 1, 1, 1, 1, -1, 1, -1, -1, 1]

In [57]:
# последовательное примененеие преобразований:
list(map(op.abs, filter(lambda x: x % 3 == 0, range(-10,10))))

[9, 6, 3, 0, 3, 6, 9]

In [58]:
%%timeit
[i for i in lr1 if i % 3 == 0]

3.72 µs ± 190 ns per loop (mean ± std. dev. of 7 runs, 100000 loops each)


In [59]:
%%timeit
list(filter(lambda x: x%3 == 0, lr1))

8.73 µs ± 2.36 µs per loop (mean ± std. dev. of 7 runs, 100000 loops each)


### Reduce

In [6]:
import functools as ft

In [7]:
from functools import reduce

`functools.reduce(funct, iterable[, initializer])`

Вычисляет функцию от двух элементов последовательно для элементов последовательности слева направо таким образом, что результатом вычисления становится единственное значение, которое становится первым аргументом для следующей итерации применения `funct`. 

In [8]:
# Пример: 
reduce(lambda x, y: x + y, [1, 2, 3, 4, 5]) # вычисляется как ((((1+2)+3)+4)+5)

15

Левый аргумент функции `funct` (аргумента `reduce`) - это аккумулированное значение, правый аргумент - очередное значение из списка.

Если передан необязательный аргумент `initializer`, то он используется в качестве левого аргумента при первом применении 
функции (исходного аккумулированного значения).

Если `initializer` не перередан, а последовательность имеет только одно значение, то возвращается это значенние.

![](reduce_.jpg)

In [64]:
ls4 = list(range(10, 20))
ls4

[10, 11, 12, 13, 14, 15, 16, 17, 18, 19]

In [65]:
reduce(op.add, ls4)

145

In [66]:
reduce(op.add, ls4, 1000)

1145

In [67]:
def add_verbose(x, y):
    print(f"add(x={x}, y={y}) -> {x+y}")
    return x + y

In [68]:
reduce(add_verbose, ls4)

add(x=10, y=11) -> 21
add(x=21, y=12) -> 33
add(x=33, y=13) -> 46
add(x=46, y=14) -> 60
add(x=60, y=15) -> 75
add(x=75, y=16) -> 91
add(x=91, y=17) -> 108
add(x=108, y=18) -> 126
add(x=126, y=19) -> 145


145

In [69]:
reduce(add_verbose, ls4, 1000)

add(x=1000, y=10) -> 1010
add(x=1010, y=11) -> 1021
add(x=1021, y=12) -> 1033
add(x=1033, y=13) -> 1046
add(x=1046, y=14) -> 1060
add(x=1060, y=15) -> 1075
add(x=1075, y=16) -> 1091
add(x=1091, y=17) -> 1108
add(x=1108, y=18) -> 1126
add(x=1126, y=19) -> 1145


1145

In [70]:
st = "This is a test".split()
st

['This', 'is', 'a', 'test']

In [74]:
reduce(lambda n, s: n + len(s), ['This', 'is', 'a', 'test'], 0) 

11

In [75]:
def f2_verbose(n, s):
    print(f'n: {n}, s: {s}, len(s): {len(s)}')
    return n + len(s)

In [79]:
reduce(f2_verbose, ['This', 'is', 'a', 'test'], 0) 

n: 0, s: This, len(s): 4
n: 4, s: is, len(s): 2
n: 6, s: a, len(s): 1
n: 7, s: test, len(s): 4


11

In [80]:
reduce(lambda n, s: n + len(s), "This is a test".split(), 0) 

11

In [83]:
reduce(lambda s1, s2: s1 + s2, "This is a test".split(), "") 

'Thisisatest'

## Итераторы

Итерируемый тип данных - это такой тип, который может возвращать свои элементы по одному. Любой объект, имеющий метод `__iter__()`, или любая последовательность (то есть объект, имеющий метод `__getitem__()`, принимающий целочисленный аргумент со значением от 0 и выше), является итерируемым и может предоставлять итератор. 

Итератор - это объект, имеющий метод `__next__()`, который при каждом вызове возвращает очередной элемент и возбуждает исключение `StopIteration` после исчерпания всех элементов. 

In [84]:
ls5 = [1, 2, 5, 3, 4, 8]

In [85]:
product = 1 

itr = iter(ls5) # iter() вызывает ls5.__iter__() (ls5 - значение итерируемого типа, itr - итератор )
while True: 
    try: 
        i = next(itr) # next вызывает itr.__next__()
        product *= i
    except StopIteration: 
        break 
product

960

In [87]:
product = 1 

for i in ls5: 
    product *= i 
print(product) 

960


In [88]:
# другой способ:
reduce(op.mul, ls5)

960

К итерируемым типам могут применяться встроенные функции: `all()`, `аnу()`, `len()`, `min()`, `max()`, `sum()`: 

In [89]:
len(ls5), min(ls5), max(ls5), sum(ls5)

(6, 1, 8, 23)

In [90]:
ls6 = [i % 2 == 0 for i in ls5]
ls6

[False, True, False, False, True, True]

In [91]:
all(ls6), any(ls6)

(False, True)

In [94]:
reduce(op.and_, ls6)

False

## Модуль itertools

In [71]:
import itertools as itl

https://docs.python.org/3.6/library/itertools.html

http://www.ilnurgi1.ru/docs/python/modules/itertools.html

`itertools.islice(iterable, [start, ]stop[, step])`

Создает итератор, воспроизводящий элементы, которые вернула бы операция извлечения среза `iterable[start:stop:step]`. Первые `start` элементов пропускаются и итерации прекращаются по достижении позиции, указанной в аргументе `stop`. В необязательном аргументе `step` передается шаг выборки элементов. 

В отличие от срезов, в аргументах `start`, `stop` и `step` не допускается использовать отрицательные значения. Если аргумент `start` опущен, итерации начинаются с 0. Если аргумент `step` опущен, по умолчанию используется шаг 1.

In [95]:
itl.islice('ABCDEFG', 5)

<itertools.islice at 0x19e1240a958>

In [96]:
list(itl.islice('ABCDEFG', 5))

['A', 'B', 'C', 'D', 'E']

In [97]:
list(itl.islice('ABCDEFG', 2, 5))

['C', 'D', 'E']

In [98]:
list(itl.islice('ABCDEFG', 2, 8, 2))

['C', 'E', 'G']

#### Бесконечные итераторы

`itertools.cycle(iterable)`

Создает итератор, который в цикле многократно выполняет обход элементов в объекте `iterable`. За кулисами создает копию элементов в объекте `iterable`. Эта копия затем используется для многократного обхода элементов в цикле.

In [99]:
list(itl.islice(itl.cycle('ABCD'), 10))

['A', 'B', 'C', 'D', 'A', 'B', 'C', 'D', 'A', 'B']

`itertools.count(start=0, step=1)`

Создает итератор, который воспроизводит упорядоченную и непрерывную последовательность целых чисел, начиная со `start`. Если аргумент `start` опущен, в качестве первого значения возвращается число 0. (Обратите внимание, что этот итератор не поддерживает длинные целые числа. По достижении значения `sys.maxint` счетчик переполнится и итератор продолжит воспроизводить значения, начиная с `-sys.maxint - 1`.)

In [100]:
list(itl.islice(itl.count(7), 10))

[7, 8, 9, 10, 11, 12, 13, 14, 15, 16]

`itertools.repeat(object[, times])`

Создает итератор, который многократно воспроизводит объект `object`. В необязательном аргументе `times` передается количество повторений. Если этот аргумент не задан, количество повторений будет бесконечным.

In [78]:
list(itl.islice(itl.repeat('a'), 10))

['a', 'a', 'a', 'a', 'a', 'a', 'a', 'a', 'a', 'a']

In [101]:
['a']*10

['a', 'a', 'a', 'a', 'a', 'a', 'a', 'a', 'a', 'a']

In [102]:
list(itl.repeat('a', 10))

['a', 'a', 'a', 'a', 'a', 'a', 'a', 'a', 'a', 'a']

Примеры использования других итераторов:

In [103]:
# accumulate - cоздает последовательность с накопленной суммой:
list(itl.accumulate([1, 2, 3, 4, 5, 6]))

[1, 3, 6, 10, 15, 21]

In [104]:
list(itl.accumulate(itl.repeat(3, 10)))

[3, 6, 9, 12, 15, 18, 21, 24, 27, 30]

In [105]:
# chain - создает итератор по цепочке элементов, склеенных из последовательности итерируемых объектов:
list(itl.chain([1, 2, 3], [4, 5, 6], [7, 8, 9]))

[1, 2, 3, 4, 5, 6, 7, 8, 9]

In [106]:
# chain.from_iterable - аналог chain(), но принимает одну последовательность,
# каждый элемент которой считается отдельной последовательностью:
list(itl.chain.from_iterable(['abc', 'def']))

['a', 'b', 'c', 'd', 'e', 'f']

In [107]:
# zip_longest - альтернатива zip, итерируемся до конца самой длинной последовательности:
list(itl.zip_longest('abcd', 'def'))

[('a', 'd'), ('b', 'e'), ('c', 'f'), ('d', None)]

In [108]:
# обычный zip работает так:
list(zip('abcd', 'def'))

[('a', 'd'), ('b', 'e'), ('c', 'f')]

In [82]:
# производит фильтрацию последовательности, указанной в первом параметре:
list(itl.compress('ABCDEF', [1, 0, 1, 0, 1, 1]))

['A', 'C', 'E', 'F']

In [109]:
# возвращает объект-итератор, который выбрасывает элементы, предшествующие элементу,
# для которого функция, указанная в первом параметре, впервые вернет False:
list(itl.dropwhile(lambda x: x < 5, [1, 4, 6, 4, 1]))

[6, 4, 1]

Комбинаторные итераторы:

In [111]:
# Декартово произведение:
print(list(itl.product('ABCD', repeat=2)))

[('A', 'A'), ('A', 'B'), ('A', 'C'), ('A', 'D'), ('B', 'A'), ('B', 'B'), ('B', 'C'), ('B', 'D'), ('C', 'A'), ('C', 'B'), ('C', 'C'), ('C', 'D'), ('D', 'A'), ('D', 'B'), ('D', 'C'), ('D', 'D')]


In [101]:
# Перестановки:
print(list(itl.permutations('ABCD', 2)))

[('A', 'B'), ('A', 'C'), ('A', 'D'), ('B', 'A'), ('B', 'C'), ('B', 'D'), ('C', 'A'), ('C', 'B'), ('C', 'D'), ('D', 'A'), ('D', 'B'), ('D', 'C')]


In [112]:
# Сочетания:
print(list(itl.combinations('ABCD', 2)))

[('A', 'B'), ('A', 'C'), ('A', 'D'), ('B', 'C'), ('B', 'D'), ('C', 'D')]


## Функции-генераторы

Функция-генератор, или метод-генератор - это функция, или метод, содержащая выражение `yield`. В результате обращения 
к функции-генератору возвращается итератор. Значения из итератора извлекаются по одному, с помощью его метода `__next__()`. При каждом вызове метода `__next__()` он возвращает результат вычисления выражения `yield`. (Если выражение отсутствует, возвращается значение `None`.) Когда функция-генератор  завершается или выполняет инструкцию `return`, возбуждается  исключение `StopIteration`. 

На практике очень редко приходится вызывать метод `__next__()` или обрабатывать исключение `StopIteration`. Обычно функция-генератор используется в качестве итерируемого объекта. 

In [113]:
# Создает и возвращает список 
def letter_range_l(a, z): 
    result = [] 
    while ord(a) < ord(z): 
        result.append(a) 
        a = chr(ord(a) + 1) 
    return result 

In [114]:
letter_range_l('a','o')

['a', 'b', 'c', 'd', 'e', 'f', 'g', 'h', 'i', 'j', 'k', 'l', 'm', 'n']

In [115]:
for l in letter_range_l('a', 'o'):
    print(l, end=', ')

a, b, c, d, e, f, g, h, i, j, k, l, m, n, 

In [116]:
# Возвращает каждое значение по требованию 
def letter_range_g(a, z): 
    while ord(a) < ord(z): 
        yield a 
        a = chr(ord(a) + 1) 

In [118]:
for l in letter_range_g('a', 'o'):
    print(l, end=', ')

a, b, c, d, e, f, g, h, i, j, k, l, m, n, 

In [119]:
list(letter_range_g('a', 'o'))

['a', 'b', 'c', 'd', 'e', 'f', 'g', 'h', 'i', 'j', 'k', 'l', 'm', 'n']

In [120]:
g1 = letter_range_g('a', 'c')
g1

<generator object letter_range_g at 0x0000019E1241B7C8>

In [121]:
next(g1)

'a'

In [122]:
next(g1)

'b'

In [123]:
next(g1)

StopIteration: 

In [113]:
list(letter_range_g('a', 'o'))

['a', 'b', 'c', 'd', 'e', 'f', 'g', 'h', 'i', 'j', 'k', 'l', 'm', 'n']

Кроме функций-генераторов cуществует возможность создавать еще и __выражения-генераторы__.  Синтаксически они очень похожи на генераторы списков, единственное отличие состоит в том, что они заключаются не в квадратные скобки, а в круглые. 

`(expression for item in iterable)` 

`(expression for item in iterable if condition)`

При передаче выражений-генераторов в качестве аргументов функции круглые скобки могут опускаться.

In [126]:
# функция-генератор, возвращающая из словаря пары ключ-значение в порядке убывания ключа
def items_in_key_order(d): 
    for key in sorted(d, reverse=True): 
        yield key, d[key] 

In [127]:
d1 = dict(zip(['ac','vg','ddxf','c','ff', 'bfafakl'], range(6)))
d1

{'ac': 0, 'vg': 1, 'ddxf': 2, 'c': 3, 'ff': 4, 'bfafakl': 5}

In [128]:
list(items_in_key_order(d1))

[('vg', 1), ('ff', 4), ('ddxf', 2), ('c', 3), ('bfafakl', 5), ('ac', 0)]

In [129]:
[(key, d1[key]) for key in sorted(d1, reverse=True)]

[('vg', 1), ('ff', 4), ('ddxf', 2), ('c', 3), ('bfafakl', 5), ('ac', 0)]

In [130]:
go = ((key, d1[key]) for key in sorted(d1, reverse=True))
go

<generator object <genexpr> at 0x0000019E12433248>

In [131]:
list(go)

[('vg', 1), ('ff', 4), ('ddxf', 2), ('c', 3), ('bfafakl', 5), ('ac', 0)]

In [132]:
list(((key, d1[key]) for key in sorted(d1, reverse=True)))

[('vg', 1), ('ff', 4), ('ddxf', 2), ('c', 3), ('bfafakl', 5), ('ac', 0)]

In [133]:
# При передаче выражений-генераторов в качестве аргументов функции круглые скобки можно опустить:
list((key, d1[key]) for key in sorted(d1, reverse=True))

[('vg', 1), ('ff', 4), ('ddxf', 2), ('c', 3), ('bfafakl', 5), ('ac', 0)]

In [134]:
items_in_key_order(d1)

<generator object items_in_key_order at 0x0000019E124333C8>

In [135]:
g2 = ((key, d1[key]) for key in sorted(d1, reverse=True))
g2

<generator object <genexpr> at 0x0000019E124334C8>

In [136]:
next(g2)

('vg', 1)

In [137]:
next(g2)

('ff', 4)

Благодаря отложенным вычислениям в генераторах (функциях и выражениях) можно экономить ресурсы и создавать генераторы бесконечных последовательностей.

In [138]:
# бесконечный генератор четвертей:
def quarters(next_quarter=0.0): 
    while True: 
        yield next_quarter 
        next_quarter += 0.25 

In [139]:
result = [] 
for x in quarters(): 
    result.append(x) 
    if x >= 5.0: 
        break 
result

[0.0,
 0.25,
 0.5,
 0.75,
 1.0,
 1.25,
 1.5,
 1.75,
 2.0,
 2.25,
 2.5,
 2.75,
 3.0,
 3.25,
 3.5,
 3.75,
 4.0,
 4.25,
 4.5,
 4.75,
 5.0]

In [140]:
list(itl.islice(quarters(10.0), 30))

[10.0,
 10.25,
 10.5,
 10.75,
 11.0,
 11.25,
 11.5,
 11.75,
 12.0,
 12.25,
 12.5,
 12.75,
 13.0,
 13.25,
 13.5,
 13.75,
 14.0,
 14.25,
 14.5,
 14.75,
 15.0,
 15.25,
 15.5,
 15.75,
 16.0,
 16.25,
 16.5,
 16.75,
 17.0,
 17.25]