Функции, объединяющие и разделяющие данные

К этой категории относятся следующие функции:

chain()
chain.from_iterable()
zip_longest()
tee()

Функция chain()

Функция chain() возвращает итератор, который последовательно генерирует элементы всех переданных итерируемых объектов.

Аргументы функции:

*iterables — итерируемые объекты

In [1]:
from itertools import chain

chain_iter1 = chain('ABC', 'DEF')
print(*chain_iter1)

chain_iter2 = chain(enumerate('ABC'))
print(*chain_iter2)

for i in chain([1, 2, 3], ['a', 'b', 'c'], ('Timur', 29, 'Male', 'Teacher')):
    print(i, end=' ')

A B C D E F
(0, 'A') (1, 'B') (2, 'C')
1 2 3 a b c Timur 29 Male Teacher 

Функция chain() упрощает обработку нескольких итерируемых объектов, не требуя предварительного конструирования объединенного списка.

Функция chain() примерно эквивалентна следующему коду:

In [None]:
def chain(*iterables):
    for it in iterables:
        for element in it:
            yield element

Функция chain.from_iterable()

Функция chain.from_iterable() принимает в качестве аргумента итерируемый объект, содержащий другие итерируемые объекты и возвращает итератор, который генерирует элементы всех вложенных итерируемых объектов.

Аргументы функции:

iterable — итерируемый объект, содержащий другие итерируемые объекты

In [2]:
from itertools import chain

chain_iter1 = chain.from_iterable(['ABC', 'DEF'])  # передаем список
print(*chain_iter1)

chain_iter2 = chain.from_iterable(enumerate('ABC'))
print(*chain_iter2)

for i in chain.from_iterable(['Timur', '29', 'Male', 'Teacher']):
    print(i, end=' ')

A B C D E F
0 A 1 B 2 C
T i m u r 2 9 M a l e T e a c h e r 

Обратите внимание на то, что все вложенные в iterable объекты должны быть итерируемыми.

In [3]:
from itertools import chain

for i in chain.from_iterable(('Timur', 29, 'Male', 'Teacher')):  # 29 - не итерируемый объект    
    print(i, end=' ')

T i m u r 

TypeError: 'int' object is not iterable

Функция chain.from_iterable() примерно эквивалентна следующему коду:

In [4]:
def from_iterable(iterables):
    for it in iterables:
        for element in it:
            yield element

Функция zip_longest()

Как мы уже знаем, встроенная функция zip() возвращает итератор, объединяющий элементы нескольких итерируемых объектов в кортежи. При этом функция zip() прекращает работу, как только исчерпывается самый короткий итерируемый объект. Чтобы обеспечить обработку всех входных элементов, когда итерируемые объекты имеют разные длины, используется функция zip_longest().

Аргументы функции:

*iterables — итерируемые объекты
fillvalue — заполнитель, по умолчанию имеет значение None

In [1]:
from itertools import zip_longest

print(*zip([1, 2, 3], ['a', 'b', 'c', 'd', 'e']))
print(*zip_longest([1, 2, 3], ['a', 'b', 'c', 'd', 'e']))  # fillvalue=None
print(*zip_longest([1, 2, 3], ['a', 'b', 'c', 'd', 'e'], fillvalue='*'))
print(*zip_longest(['a', 'b', 'c', 'd', 'e'], [1, 2, 3], fillvalue=777))

(1, 'a') (2, 'b') (3, 'c')
(1, 'a') (2, 'b') (3, 'c') (None, 'd') (None, 'e')
(1, 'a') (2, 'b') (3, 'c') ('*', 'd') ('*', 'e')
('a', 1) ('b', 2) ('c', 3) ('d', 777) ('e', 777)


Функция tee()

Функция tee() позволяет создать несколько независимых итераторов на основе одного и того же итерируемого объекта.

Аргументы функции:

iterable — итерируемый объект
n — количество создаваемых итераторов, по умолчанию имеет значение 2

Итераторы, возвращаемые функцией tee(), могут быть использованы c целью передачи одного и того же набора данных нескольким алгоритмам для их параллельной обработки.

In [2]:
from itertools import tee

iter1, iter2 = tee([1, 'a', 2, 'b', 3, 'c'])  # по умолчанию n=2

print(*iter1)
print(*iter2)

1 a 2 b 3 c
1 a 2 b 3 c


In [8]:
from itertools import tee

result = tee(range(2, 7), 5)  # функция tee() возвращает кортеж с нужными итераторами
print(type(result))
for i, e in enumerate(result):
    print(f'{i + 1}.', *e)

<class 'tuple'>
1. 2 3 4 5 6
2. 2 3 4 5 6
3. 2 3 4 5 6
4. 2 3 4 5 6
5. 2 3 4 5 6


Семантика функции tee() аналогична семантике утилиты tee в Unix, которая повторяет значения, читаемые из входного потока, и записывает их в именованный файл или стандартный вывод.

Новые итераторы, созданные функцией tee(), разделяют данные c исходным итерируемым объектом, и поэтому после их создания исходный итерируемый объект не должен изменяться.

In [9]:
from itertools import tee

data = (i for i in range(10))  # используем генераторное выражение

iter1, iter2 = tee(data)

print(next(data))  # изменяем data                        

print(*iter1)
print(*iter2)

0
1 2 3 4 5 6 7 8 9
1 2 3 4 5 6 7 8 9


Если исходный итерируемый объект является итератором, то значения, уже обработанные им ранее, не будут возвращаться вновь созданными итераторами.

Аналогичный результат получим, если в качестве итерируемого объекта передать список, а затем его изменить.

In [10]:
from itertools import tee

data = [1, 2, 3, 4, 5]

iter1, iter2 = tee(data)

data.append(6)

print(*iter1)
print(*iter2)

1 2 3 4 5 6
1 2 3 4 5 6


Для выполнения функции tee() может потребоваться значительное количество дополнительной памяти, в зависимости от того, сколько данных необходимо сохранить.

In [None]:
# Примерный вид функции
from collections import deque


def tee(iterable, n=2):
    it = iter(iterable)
    # Инициализируются n очередей (deque), в которые будут сохраняться элементы.
    deques = [deque() for _ in range(n)]

    def gen(d):
        while True:
            if not d:  # Если очередь пуста, загружаем из основного итератора
                try:
                    item = next(it)
                    for q in deques:
                        q.append(item)
                except StopIteration:
                    return
            # Возвращает элементы по yield d.popleft(), обеспечивая независимость копий.
            yield d.popleft()

    return tuple(gen(d) for d in deques)

Функция pairwise()

Функция pairwise() возвращает итератор, содержащий последовательные перекрывающиеся пары в виде кортежей, взятые из исходного итерируемого объекта.

Аргументы функции:

iterable — итерируемый объект

In [11]:
from itertools import pairwise

print(*pairwise('ABCDEFG'))
print(*pairwise([1, 2, 3, 4, 5]))

('A', 'B') ('B', 'C') ('C', 'D') ('D', 'E') ('E', 'F') ('F', 'G')
(1, 2) (2, 3) (3, 4) (4, 5)


Функция pairwise() примерно эквивалентна следующему коду:

In [None]:
def pairwise(iterable):
    a, b = tee(iterable)
    next(b, None)
    return zip(a, b)

Функция pairwise() была добавлена только в Python 3.10.

In [21]:
from itertools import tee

iters = tee([1, 2, 3], 3)
for i in iters:
    print(list(i))

[1, 2, 3]
[1, 2, 3]
[1, 2, 3]


In [None]:
# Если передать в map несколько последовательностей (ну или итераторов), map будет поочерёдно дёргать элементы из этих последовательностей (сначала первые элементы всех последовательностей, затем вторые и т.д.) и передавать их в качестве аргументов в указанную функцию. Здесь главное, чтобы количество последовательностей совпадало с количеством аргументов, которые функция принимает.

from itertools import tee

iters = tee([1, 2, 3], 3)

totals = map(lambda a, b, c: a + b + c, *iters)

print(next(totals))
print(next(totals))

Функция sum_of_digits()
Реализуйте функцию sum_of_digits(), которая принимает один аргумент:

iterable — итерируемый объект, элементами которого являются натуральные числа
Функция должна возвращать единственное число — сумму цифр всех чисел, присутствующих в итерируемом объекте iterable.

Примечание 1. Рассмотрим набор чисел 
13,20,41,2,2,5 из первого теста. Сумма цифр всех представленных чисел будет равна:
1+3+2+0+4+1+2+2+5=20

In [46]:
from typing import Iterable
from itertools import chain


def sum_of_digits(iterable: Iterable) -> int:
    it = map(lambda x: str(x), iterable)
    chai = chain.from_iterable(it)
    result = sum(list(map(lambda x: int(x), chai)))
    return result


def sum_of_digits(iterable):
    tmp = map(str, iterable)
    return sum(map(int, chain.from_iterable(tmp)))


print(sum_of_digits([13, 20, 41, 2, 2, 5]))

print(sum_of_digits((1, 2, 3, 4, 5, 6, 7, 8, 9, 10)))

print(sum_of_digits([123456789]))

20
46
45


Функция is_rising()
Реализуйте функцию is_rising(), которая принимает один аргумент:

iterable — итерируемый объект, элементами которого являются числа
Функция должна возвращать True, если элементы итерируемого объекта расположены строго по возрастанию, или False в противном случае.

Примечание 1. Гарантируется, что итерируемый объект, передаваемый в функцию, не является множеством, а также содержит не менее двух элементов.

In [131]:
from typing import Iterable
from itertools import chain, pairwise


def is_rising(iterable: Iterable) -> bool:
    # st = map(str, iterable)
    # nm = map(int, chain(st))
    # pairs = pairwise(nm)
    # result = all(a < b for a, b in pairs)
    # result = all(a < b for a, b in pairwise(map(int, chain(map(str, iterable)))))
    return all(a < b for a, b in pairwise(map(int, chain(map(str, iterable)))))

def is_rising(iterable):
    return all(a < b for a, b in pairwise(iterable))

print(is_rising([1, 2, 3, 4, 5]))

iterator = iter([1, 1, 1, 2, 3, 4])
print(is_rising(iterator))

iterator = iter(list(range(100, 200)))
print(is_rising(iterator))

True
False
True


Функция max_pair()
Реализуйте функцию max_pair(), которая принимает один аргумент:

iterable — итерируемый объект, элементами которого являются числа
Функция должна возвращать единственное число — максимальную сумму двух соседних чисел итерируемого объекта iterable.

Примечание 1. Рассмотрим список чисел 
1,8,2,4,3 из первого теста. Из данной последовательности можно получить следующие пары соседних элементов: 1 и 8, 8 и 2, 2 и 4, 4 и 3. Максимальную сумму имеет вторая пара — 10.

Примечание 2. Гарантируется, что итерируемый объект, передаваемый в функцию, не является множеством, а также содержит не менее двух элементов.

In [163]:
from typing import Iterable
from itertools import pairwise

def max_pair(iterable: Iterable) -> int:
    pairs = list(map(lambda i: i[0] + i[1], pairwise(iterable)))    
    # return sum(list(pairs))
    return max(pairs)

def max_pair(iterable):
    return max(map(sum, pairwise(iterable)))

# print(max_pair([1, 8, 2, 4, 3]))
# 
# iterator = iter([1, 2, 3, 4, 5])
# print(max_pair(iterator))
# 
# iterator = iter([0, 0, 0, 0, 0, 0, 0, 0, 0])
# print(max_pair(iterator))

iterator = iter([5, 6, 4, 3, 2, 2])
print(max_pair(iterator))

11


Функция ncycles()
Реализуйте функцию ncycles(), которая принимает два аргумента в следующем порядке:

iterable — итерируемый объект
times — натуральное число
Функция должна возвращать итератор, генерирующий последовательность элементов итерируемого объекта iterable, зацикленных times раз.

Примечание 1. Элементы итерируемого объекта в возвращаемом функцией итераторе должны располагаться в своем исходном порядке.

Примечание 2. Гарантируется, что итерируемый объект, передаваемый в функцию, не является множеством.

In [207]:
from typing import Iterable
from itertools import tee, chain

def ncycles(iterable: Iterable, times: int) -> Iterable:
    return chain.from_iterable(tee(iterable, times))


print(*ncycles([1, 2, 3, 4], 3))

iterator = iter('bee')
print(*ncycles(iterator, 4))

iterator = iter([1])
print(*ncycles(iterator, 10))

iterator = ncycles(iter('b'), 1)
print(next(iterator))

1 2 3 4 1 2 3 4 1 2 3 4
b e e b e e b e e b e e
1 1 1 1 1 1 1 1 1 1
b


In [198]:
data = [1, 2, 3, 4]
t = tee(data, 3)
out = list(chain.from_iterable(i for i in t))
print(*out)

1 2 3 4 1 2 3 4 1 2 3 4


Функция grouper()
Реализуйте функцию grouper(), которая принимает два аргумента в следующем порядке:

iterable — итерируемый объект
n — натуральное число
Функция должна возвращать итератор, генерирующий последовательность, элементами которой являются объединенные в кортежи по n элементов соседние элементы итерируемого объекта iterable. Если у элемента не достаточно соседей, то ими становится значение None.

Примечание 1. Элементы итерируемого объекта в возвращаемом функцией итераторе должны располагаться в своем исходном порядке.

Примечание 2. Гарантируется, что итерируемый объект, передаваемый в функцию, не является множеством.

In [249]:
from typing import Iterable
from itertools import zip_longest, repeat

def grouper(iterable: Iterable, n: int) -> Iterable:
    a = [iter(iterable)]*n
    return zip_longest(*a, fillvalue=None)

def grouper(iterable, n):
    return zip_longest(*repeat(iter(iterable), n))

numbers = [1, 2, 3, 4, 5, 6]
print(*grouper(numbers, 2))

iterator = iter([1, 2, 3, 4, 5, 6, 7])
print(*grouper(iterator, 3))

iterator = iter([1, 2, 3])
print(*grouper(iterator, 5))

(1, 2) (3, 4) (5, 6)
(1, 2, 3) (4, 5, 6) (7, None, None)
(1, 2, 3, None, None)
