# Модуль itertools

Встроенный модуль itertools включает в себя множество функций, предназначенных для создания итераторов.

## Функции, порождающие данные 
Все функции данной категории по умолчанию порождают бесконечные итераторы.

### count(begin, step)

In [1]:
from itertools import count 
# count(begin, step)

In [2]:
count1 = count(10,10) # бесконечные числа от begin с шагом step

In [14]:
next(count1)

120

In [15]:
# аналогично
def my_count(start=0, step=1):
    n = start
    while True:
        yield n
        n += step   # тут после yield выполняются команды!

### cycle(iterable)

In [16]:
from itertools import cycle

In [17]:
data = ['зима','весна','лето','осень']
cycle_word = cycle(data) # цикличный перебор элементов

In [34]:
next(cycle_word)

'зима'

In [35]:
# аналогично
def my_cycle(iterable):
    saved = []
    for element in iterable:
        yield element
        saved.append(element)
    while saved:
        for element in saved:
            yield element

### repeat(obj,time)

In [36]:
from itertools import repeat
# repeat(obj, time)

In [37]:
repeat_hello = repeat('привет!') # параметр time - необязательный ограничитель

In [45]:
next(repeat_hello)

'привет!'

In [46]:
# аналогично
def my_repeat(object, times=None):
    if times is None:
        while True:
            yield object
    else:
        for i in range(times):
            yield object

### starmap(func,data)

In [47]:
from itertools import starmap

In [48]:
def func(el):
    if type(el)!=type('s'):
        return el+el
    return el + '-' + el

In [49]:
data = [(10,),(20,),('hello',),(30,),('go',)]

In [50]:
starmap1 = starmap(func,data) # применяет функцию к данным

In [51]:
print(*starmap1)

20 40 hello-hello 60 go-go


Функция starmap() используется вместо map() в том случае, когда элементами итерируемого объекта являются другие итерируемые объекты, скажем, кортежи, и каждый элемент этих кортежей должен быть передан в функцию function в качестве самостоятельного аргумента.

### accumulate(data)

In [52]:
from itertools import accumulate

Функция accumulate() возвращает итератор с накопленными суммами или результатами функции func; аргументы функции: iterable — итерируемый объект, func — функция для двух аргументов (по умолчанию operator.add), initial — начальное значение (по умолчанию None); функция работает аналогично reduce(), но генерирует все промежуточные результаты, а не только конечный.

In [53]:
data = [1,10,100,1000,10000,7]

In [54]:
data_new = accumulate(data)

In [56]:
print(*data_new)




In [57]:
import operator

In [58]:
print(list(accumulate(data)))
print(list(accumulate(data, operator.mul)))
print(list(accumulate(data, max)))
print(list(accumulate(data, min)))

[1, 11, 111, 1111, 11111, 11118]
[1, 10, 1000, 1000000, 10000000000, 70000000000]
[1, 10, 100, 1000, 10000, 10000]
[1, 1, 1, 1, 1, 1]


In [59]:
print(list(accumulate([1, 2, 3, 4, 5], initial=100)))

[100, 101, 103, 106, 110, 115]


## Функции, фильтрующие данные

### dropwhile(predicate,iterable)

Функция dropwhile из модуля itertools в Python используется для создания итератора, который отбрасывает элементы из итерации до тех пор, пока условие, заданное функцией, не станет ложным. После этого все оставшиеся элементы возвращаются как есть, без проверки условия*

In [60]:
from itertools import dropwhile

In [64]:
data = [10,20,30,40,50,60,70,80,90,1,2,3,50]

In [65]:
filtered_data = dropwhile(lambda x: x<50, data) # отбрасывать всё, пока выполняется

In [66]:
print(*filtered_data)

50 60 70 80 90 1 2 3 50


### takewhile(predicate,iterable)

In [67]:
from itertools import takewhile

In [68]:
data = [10,20,30,40,50,60,70,80,90,1,2,3]

In [69]:
filtered_data = takewhile(lambda x: x<50, data) # брать всё, пока выполняется

In [70]:
print(*filtered_data)

10 20 30 40


### filterfalse(predicate, iterable)

In [75]:
from itertools import filterfalse
# как filter только наоборот?

In [72]:
data = [10,20,30,40,50,60,70,80,90,1,2,3]

In [73]:
filtered_data = filterfalse(lambda x: x not in [20,50,70], data)  # отбирает, где не сработало условие

In [74]:
print(*filtered_data)

20 50 70


### compress(iterable, mask)

In [76]:
from itertools import compress

In [77]:
data = [10,20,30,40,50]

In [78]:
filtered_data = compress(data, (1,0,0,1,0))  # аналогично [True, False, False, True, False]

In [79]:
print(*filtered_data)

10 40


- Если длина маски меньше длины data, то элементы, которые не покрыты маской, просто игнорируются.
- Если маска длиннее, чем data, лишние элементы маски также игнорируются.

###  islice(iterable, start=0, stop, step=1)

Функция islice из модуля itertools в Python позволяет извлекать срезы из итерируемых объектов (например, списков, строк, файлов и т. д.) без необходимости полностью материализовать их в память. Это особенно полезно для работы с большими данными или бесконечными итераторами.

In [86]:
from itertools import islice

In [87]:
data = [10,20,30,40,50]

In [88]:
filtered_data = islice(data,3)

In [89]:
print(*filtered_data)

10 20 30


In [90]:
filtered_data = islice(data,1,None,2)

In [91]:
print(*filtered_data)

20 40


## Функции, объединяющие и разделяющие данные

### chain(*iterables)

Используется для последовательного объединения нескольких итерируемых объектов (например, списков, строк, кортежей и т. д.) в один итератор. Этот итератор будет итерироваться по каждому переданному объекту в том порядке, в котором они переданы.

In [92]:
from itertools import chain

In [93]:
data_numbers = [1,2,10,33,77,100]
data_words = ['fox','dog','cat']

chain1 = chain(data_numbers, data_words)
chain1

<itertools.chain at 0x1a6ada00700>

In [94]:
print(*chain1)

1 2 10 33 77 100 fox dog cat


In [95]:
mix_data = [[1,2],[3,4,5],[6,[7],[8,9,[10]]]]

In [96]:
line_data = chain.from_iterable(mix_data) 

In [97]:
print(*line_data)

1 2 3 4 5 6 [7] [8, 9, [10]]


### zip_longest(*iterables, fill_value)

функция zip() возвращает итератор, объединяющий элементы нескольких итерируемых объектов в кортежи. При этом функция zip() прекращает работу, как только исчерпывается самый короткий итерируемый объект. Чтобы обеспечить обработку всех входных элементов, когда итерируемые объекты имеют разные длины, используется функция zip_longest()

In [98]:
from itertools import zip_longest

In [99]:
data1 = [10,20,30,40,50]
data2 = ['A','B','C']
data3 = ['hello']
data4 = [1,2,3,4]

In [100]:
print(*zip(data1, data2,data3,data4))

(10, 'A', 'hello', 1)


In [101]:
print(*zip_longest(data1, data2,data3,data4, fillvalue=None))

(10, 'A', 'hello', 1) (20, 'B', None, 2) (30, 'C', None, 3) (40, None, None, 4) (50, None, None, None)


### tee()
позволяет создать несколько независимых итераторов на основе одного и того же итерируемого объекта.

In [102]:
from itertools import tee

In [103]:
data = ['fire','water','stone']

In [104]:
iter1, iter2 = tee(data)

In [106]:
print(*iter1)
print(*iter2)

fire water stone
fire water stone


In [107]:
iter3 = tee(data)
print(*iter3)

<itertools._tee object at 0x000001A6ADAAE240> <itertools._tee object at 0x000001A6ADAAECC0>


### pairwise(iterable)

In [112]:
from itertools import pairwise  # проверь версию!

ImportError: cannot import name 'pairwise' from 'itertools' (unknown location)

In [109]:
import sys
print(sys.version)

3.9.18 (main, Sep 11 2023, 14:09:26) [MSC v.1916 64 bit (AMD64)]


In [110]:
!python --version


Python 3.9.18


## Функции, группирующие данные

In [None]:
from itertools import groupby

In [None]:
data = [1,1,2,2,2,3,3,3,3,2,2,2,1,4,5,5,5,5]

In [None]:
print(*groupby(data))

![image.png](attachment:image.png)

In [None]:
for key, it in groupby(data):
    print(key,":",*it)

In [None]:
# лучше отсортировать 
for key, it in groupby(sorted(data)):
    print(key,":",*it)

In [None]:
# использование параметра key
age_list = [14,16,23,35,17,36,29,54,11,6,18,12,22,21,15,61]

for key, it in groupby(age_list, lambda age: age>=18):
    print(key,":",*it)

In [None]:
# лучше сортировать по этому же ключу
for key, it in groupby(sorted(age_list,key=lambda age: age>=18), lambda age: age>=18):
    print(key,":",*it)

### Функции, порождающие комбинаторные данные

In [None]:
from itertools import permutations

In [None]:
s = '123333'
s = set(s)
s = sorted(s)
for t in permutations(s):
    print(''.join(t))

In [None]:
from itertools import combinations
a = [1,2,3,4]
print(*combinations(a,3))

In [None]:
from itertools import combinations_with_replacement
a = [1,2,3,4]
print(*combinations_with_replacement(a,3))

In [None]:
from itertools import product

In [None]:
a = [1,2,3]
b = ['a', 'b', 'c']
d = [True, False]

In [None]:
print(*product(a,b))

In [None]:
print(*product(a,d))

In [None]:
print(*product(d,repeat=2)) # то же что и print(*product(d,d))