# Модуль itertools

### itertools.islice

Проблема:

In [None]:
xs = [1, 2, 3, 4, 5, 6, 7, 8, 9]
list(zip(xs[::2], xs[1::2]))  # копирует списки дважды

Функция **`islice`** обобщает понятие слайса на произвольный итератор:

In [None]:
from itertools import islice

xs = range(10)
list(islice(xs, 3))       # ≡ xs[:3]

In [None]:
list(islice(xs, 3, None)) # ≡ xs[3:]

In [None]:
list(islice(xs, 3, 8, 2)) # ≡ xs[3:8:2]

Прелесть функций из модуля **`itertools`** в том, что с помощью них легко выражаются самые разнообразные операции над последовательностями.

**Вопрос:** Как будет выглядеть функция `drop`, “выкидывающая” префикс длины n из переданного ей итератора?

### Бесконечные итераторы

Для удобства реализуем родственника функции `drop`: функцию `take`, которая строит список из более, чем `n` первых элементов переданного ей итератора.

In [None]:
def take(n, iterable):
    return list(islice(iterable, n))

take(3, range(10))

Названия бесконечных итераторов говорят сами за себя:

In [None]:
from itertools import count, cycle, repeat

take(5, count(0, 5))

In [None]:
take(5, cycle([1, 2, 3]))

In [None]:
take(5, repeat(42))

In [None]:
take(5, repeat(42, 2)) # не совсем ∞

### itertools.dropwhile и itertools.takewhile

Функции `dropwhile` и `takewhile` обобщают логику функций `drop` и `take` на произвольный предикат.

Обратите внимание, что обе функции возвращают итератор, а не список, как реализованная нами функция `take`:

In [None]:
from itertools import dropwhile, takewhile
list(dropwhile(lambda x: x < 5, range(10)))

In [None]:
it = takewhile(lambda x: x < 5, range(10))
it

In [None]:
list(it)

### itertools.chain

В модуле `itertools` реализован уже знакомый нам генератор `chain`, который конкатенирует произвольное число итераторов:

In [None]:
from itertools import chain
take(5, chain(range(2), range(5, 10)))

Сконкатенировать итератор итераторов **(!!!)** можно с помощью метода `chain.from_iterable`:

In [None]:
it = (range(x, x ** x) for x in range(2, 5))
take(10, chain.from_iterable(it))

**Вопрос** Чем отличаются эти два подхода:
* `chain.from_iterable(it)` 
* `chain(*it)`

### itertools.tee

Функция `tee` создаёт `n` независимых копий переданного ей итератора:

In [None]:
from itertools import tee

it = range(3)
a, b, c = tee(it, 3)
list(a), list(b), list(c)

Использовать `it` после копирования не рекомендуется, потому что в этом случае скопированные итераторы `a`, `b`, `c` могут пропустить элемент:

In [None]:
it = iter(range(3))
a, b, c = tee(it, 3)
used = list(it)
list(a), list(b), list(c)

**Вопрос** Что изменится, если убрать вызов функции `iter` из второго примера?

### Комбинаторные итераторы

В модуле `itertools` в виде итераторов реализованы полезные комбинаторные операции.

Декартово произведение итераторов:

In [None]:
import itertools

list(itertools.product("AB", repeat=2))

In [None]:
list(itertools.product("AB", repeat=3))

Перестановки элементов итератора:

In [56]:
list(itertools.permutations("AB"))

[('A', 'B'), ('B', 'A')]

Сочетания (с повторениями и без) из элементов итератора:

In [None]:
from itertools import combinations, combinations_with_replacement

list(combinations("ABC", 2))

In [None]:
list(combinations_with_replacement("ABC", 2))

### Комбинаторные итераторы и замена вложенным циклам for

In [None]:
def hamming(word1, word2):
    return sum(map(lambda ch1, ch2: ch1 != ch2, word1, word2))
    
def build_graph(words):
    n = len(words)
    g = [[0] * n for _ in range(n)]
    
    for u, v in itertools.combinations(range(n), 2):
        print('Iteration:', u, v)
        if len(words[u]) != len(words[v]):
            continue
        g[u][v] = hamming(words[u], words[v])
    return g

g = build_graph(['abc', 'word', 'lord', 'lost'])

print('Result:', g)

Другая вариация:

In [None]:
def build_graph(words):
    n = len(words)
    g = [[0] * n for _ in range(n)]
    
    for (u, word1), (v, word2) in itertools.permutations(enumerate(words), 2):
        print('Iteration:', u, v)
        if len(word1) != len(word2):
            continue
        g[u][v] = hamming(word1, word2)
    return g

g = build_graph(['abc', 'word', 'lord', 'lost'])

print('Result:', g)

### Модуль itertools: резюме

Модуль `itertools` предоставляет обширный набор компонент для реализации операций над последовательностями.

Мы обсудили:
* `islice`,
* бесконечные итераторы `count, cycle, repeat`,
* `chain`,
* `tee`,
* комбинаторные итераторы `product, permutations,combinations и combinations_with_replacement`.

В нём ещё очень много полезного ;-)