## Модуль itertools и генераторы

Это задача из области `комбинаторики`. Можно написать комбинирующую программу самостоятельно, но в Python, в [модуле itertools](https://docs.python.org/3/library/itertools.html), есть готовая функция, которая позволяет комбинировать любые последовательности объектов.

Название модуля составлено из слов *iter* и *tools*, где *tools* — это «инструменты», а *iter* указывает на то, что функции этого модуля возвращают итерируемые объекты.

In [1]:
from itertools import permutations

places = ('Gale', 'Jezero', 'Gusev', 'Meridiani', 'Elysium')

# Получим все возможные комбинации элементов кортежа places...
combinations = permutations(places)
# ...и проитерируемся по объекту с этими комбинациями:
for travel_path in combinations:
    print(travel_path)

('Gale', 'Jezero', 'Gusev', 'Meridiani', 'Elysium')
('Gale', 'Jezero', 'Gusev', 'Elysium', 'Meridiani')
('Gale', 'Jezero', 'Meridiani', 'Gusev', 'Elysium')
('Gale', 'Jezero', 'Meridiani', 'Elysium', 'Gusev')
('Gale', 'Jezero', 'Elysium', 'Gusev', 'Meridiani')
('Gale', 'Jezero', 'Elysium', 'Meridiani', 'Gusev')
('Gale', 'Gusev', 'Jezero', 'Meridiani', 'Elysium')
('Gale', 'Gusev', 'Jezero', 'Elysium', 'Meridiani')
('Gale', 'Gusev', 'Meridiani', 'Jezero', 'Elysium')
('Gale', 'Gusev', 'Meridiani', 'Elysium', 'Jezero')
('Gale', 'Gusev', 'Elysium', 'Jezero', 'Meridiani')
('Gale', 'Gusev', 'Elysium', 'Meridiani', 'Jezero')
('Gale', 'Meridiani', 'Jezero', 'Gusev', 'Elysium')
('Gale', 'Meridiani', 'Jezero', 'Elysium', 'Gusev')
('Gale', 'Meridiani', 'Gusev', 'Jezero', 'Elysium')
('Gale', 'Meridiani', 'Gusev', 'Elysium', 'Jezero')
('Gale', 'Meridiani', 'Elysium', 'Jezero', 'Gusev')
('Gale', 'Meridiani', 'Elysium', 'Gusev', 'Jezero')
('Gale', 'Elysium', 'Jezero', 'Gusev', 'Meridiani')
('Gale', 'El

Посмотрим, сколько получилось маршрутов и как они выглядят. Для этого применим функцию `enumerate()` — она получает на вход коллекцию и возвращает итерируемый объект — коллекцию кортежей; каждый кортеж состоит из двух элементов: индекса элемента и его значения.

In [1]:
from itertools import permutations

places = ('Gale', 'Jezero', 'Gusev', 'Meridiani', 'Elysium')

# Получим все возможные комбинации элементов кортежа places...
combinations = permutations(places)
# ...и проитерируемся по объекту с этими комбинациями:
for path_index, travel_path in enumerate(combinations):
    print(path_index, travel_path)

0 ('Gale', 'Jezero', 'Gusev', 'Meridiani', 'Elysium')
1 ('Gale', 'Jezero', 'Gusev', 'Elysium', 'Meridiani')
2 ('Gale', 'Jezero', 'Meridiani', 'Gusev', 'Elysium')
3 ('Gale', 'Jezero', 'Meridiani', 'Elysium', 'Gusev')
4 ('Gale', 'Jezero', 'Elysium', 'Gusev', 'Meridiani')
5 ('Gale', 'Jezero', 'Elysium', 'Meridiani', 'Gusev')
6 ('Gale', 'Gusev', 'Jezero', 'Meridiani', 'Elysium')
7 ('Gale', 'Gusev', 'Jezero', 'Elysium', 'Meridiani')
8 ('Gale', 'Gusev', 'Meridiani', 'Jezero', 'Elysium')
9 ('Gale', 'Gusev', 'Meridiani', 'Elysium', 'Jezero')
10 ('Gale', 'Gusev', 'Elysium', 'Jezero', 'Meridiani')
11 ('Gale', 'Gusev', 'Elysium', 'Meridiani', 'Jezero')
12 ('Gale', 'Meridiani', 'Jezero', 'Gusev', 'Elysium')
13 ('Gale', 'Meridiani', 'Jezero', 'Elysium', 'Gusev')
14 ('Gale', 'Meridiani', 'Gusev', 'Jezero', 'Elysium')
15 ('Gale', 'Meridiani', 'Gusev', 'Elysium', 'Jezero')
16 ('Gale', 'Meridiani', 'Elysium', 'Jezero', 'Gusev')
17 ('Gale', 'Meridiani', 'Elysium', 'Gusev', 'Jezero')
18 ('Gale', 'Elysium

> Функция `permutations()` не так проста: она не создаёт сразу все возможные варианты, а вычисляет каждый вариант только тогда, когда он запрошен программой, — например, на очередной итерации цикла. Это позволяет здорово экономить оперативную память.

Чтобы вычислить все возможные варианты и потом перебрать их, на обработку входного массива из ста элементов просто не хватит оперативной памяти. И даже если бы оперативная память была безгранична, функция вычисляла бы все комбинации очень долго.

Функция `permutations()` не создаёт все комбинации сразу, а генерирует их в тот момент, когда они запрошены программой. Объекты, которые ведут себя подобным образом, в Python называются **генераторами**. Они предоставляют нужное значение только тогда, когда оно понадобится, а не хранят всю последовательность. Это позволяет задействовать минимальное количество оперативной памяти.

Для любого маршрута потребуется четыре перемещения от точки к точке: `movements = len(places) - 1`. Создаём цикл с количеством итераций, равным количеству перемещений, и  попарно находим расстояния между точками:

* Gusev — Meridiani,

* Meridiani — Gale,

* Gale — Jezero,

* Jezero — Elysium.

Из `current_path` получаем первое название и следующее за ним:

In [5]:
current_path = ('Gusev', 'Meridiani', 'Gale', 'Jezero', 'Elysium')
movements = len(places) - 1

for movement_index in range(movements):
    current_place = current_path[movement_index]
    next_place = current_path[movement_index + 1]
    print(current_place, next_place)

Gusev Meridiani
Meridiani Gale
Gale Jezero
Jezero Elysium


На первой итерации цикла `current_place` — это `'Gusev'`, а `next_place` — это `'Meridiani'`. Чтобы получить расстояние между ними, надо:

1. В кортеже `distances` найти строку со всеми расстояниями от Gusev.

2. В этой строке найти элемент, в котором записано расстояние от Gusev до Meridiani.

Для начала получим индексы элементов `'Gusev'` и `'Meridiani'` в кортеже `places`. Найти индекс элемента по его значению можно методом `index()`:

In [None]:
places = ('Gale', 'Jezero', 'Gusev', 'Meridiani', 'Elysium')

current_place_index = places.index('Gusev')
next_place_index = places.index('Meridiani')

# current_place_index = 2
# next_place_index = 3

Вместо строк подставим переменные `current_place` и `next_place`, ведь в цикле будут подставляться разные значения:

In [None]:
current_place_index = places.index(current_place)
next_place_index = places.index(next_place)

Теперь в кортеже `distances` надо найти элемент, в котором записаны расстояния от `Gusev` до `Meridiani` (эти названия сейчас хранятся в `current_place` и `next_place`).

In [None]:
# Получаем кортеж, где хранятся все расстояния от Gusev до других точек:
gusev_distances = distances[current_place_index] 
# (2230, 5280, 0, 6715, 2540)

Расстояние от `Gusev` до `Meridiani` в этом кортеже указано под тем же индексом, под которым хранится значение `Meridiani` в кортеже `places`. Этот индекс записан в `next_place_index`:

In [None]:
# Получаем кортеж, где хранятся все расстояния от Gusev до других точек:
gusev_distances = distances[current_place_index] 

# Из этого кортежа получаем расстояние Gusev - Meridiani:
gusev_meridiani_path = gusev_distances[next_place_index]
# 6715

Получить расстояние от `current_place` до `next_place` можно одним выражением:

In [None]:
distance = distances[current_place_index][next_place_index]

***
## Запишем всё в коде:

In [7]:
# Обрабатываем один из маршрутов:
current_path = ('Gusev', 'Meridiani', 'Gale', 'Jezero', 'Elysium')

# Кортеж с названиями:
places = ('Gale', 'Jezero', 'Gusev', 'Meridiani', 'Elysium')

# Расстояния между точками:
distances = (
    (0, 3570, 2230, 6430, 600),  # Расстояния от Gale.
    (3570, 0, 5280, 4530, 3315),  # Расстояния от Jezero.
    (2230, 5280, 0, 6715, 2540),  # Расстояния от Gusev.
    (6430, 4530, 6715, 0, 6400),  # Расстояния от Meridiani.
    (600, 3315, 2540, 6400, 0),  # Расстояния от Elysium.
)
# Количество перемещений между точками.
movements = len(places) - 1

# Общая длина пути: будем суммировать полученные расстояния
# для каждой пары current_place - next_place.
current_path_length = 0

# Для каждого перемещения от одной точки к другой:
for movement_index in range(movements):
    # Текущая точка.
    current_place = current_path[movement_index]
    # Следующая точка.
    next_place = current_path[movement_index + 1]
    # Индекс текущей точки в кортеже places:
    current_place_index = places.index(current_place)
    # Индекс следующей точки в кортеже places:
    next_place_index = places.index(next_place)
    # Расстояние между текущей и следующей точкой:
    distance = distances[current_place_index][next_place_index]
    # Добавляем расстояние между двумя точками к общему пути.
    current_path_length += distance

print(current_path_length)

20030


***
## Поиск минимального значения

In [None]:
# Кортеж с названиями:
places = ('Gale', 'Jezero', 'Gusev', 'Meridiani', 'Elysium')

# Расстояния между точками:
distances = (
    (0, 3570, 2230, 6430, 600),
    (3570, 0, 5280, 4530, 3315),
    (2230, 5280, 0, 6715, 2540),
    (6430, 4530, 6715, 0, 6400),
    (600, 3315, 2540, 6400, 0),
)
# Количество перемещений между точками.
movements = len(places) - 1

# Цикл, перебирающий все возможные маршруты:
for current_path in permutations(places):
    current_path_length = 0
    # Цикл, вычисляющий расстояние для отдельного маршрута:
    for movement_index in range(movements):
        ...

Внешний цикл будет перебирать все маршруты и вычислять протяжённость каждого из них. Остаётся выбрать наименьшее значение из всех полученных; обозначим его переменной `min_path_length`. 

Решить эту задачу можно двумя способами:

1. Сохранять все расстояния в массив, а в самом конце работы программы найти в этом массиве минимальное значение при помощи функции `min()`.

2. На каждом шаге сравнивать текущий результат `current_path_length` с имеющимся `min_path_length` при помощи функции `min()` и меньшее значение сохранять в `min_path_length`: 

In [None]:
min_path_length = min(current_path_length, min_path_length)

Для реализации первого варианта потребуется создать список — изменяемую коллекцию, а это дополнительный расход памяти. Для списка из 120 элементов памяти потребуется немного, но если входной массив вырастет, то расход памяти может оказаться вполне значимым. 

Второй вариант выглядит предпочтительнее, но при первой итерации по внешнему циклу возникнет проблема: протяжённость первого маршрута будет не с чем сравнить, ведь предыдущего значения `min_path_length` не существует. 

Можно установить `min_path_length = None` и выполнить дополнительную проверку:

In [None]:
min_path_length = None

for current_path in permutations(places):
    current_path_length = ... # Здесь считаем длину маршрута.
    if min_path_length is None:  # Если так, то это первая итерация цикла.
        min_path_length = current_path_length 
    else:
        min_path_length = min(current_path_length, min_path_length)

При таком подходе на каждой итерации внешнего цикла придётся выполнять заведомо ненужную проверку `if`-`else`. Это лишняя операция, и лучше обойтись без неё.

Из модуля `sys` можно импортировать константу `maxsize` — она хранит число, определяющее технические пределы для некоторых вычислений: например, длина последовательности не может быть больше, чем `maxsize`. 

In [None]:
from sys import maxsize

print(maxsize)

9223372036854775807


Если перед выполнением внешнего цикла присвоить переменной `min_path_length` значение `maxsize`, то на первой итерации цикла выражение `min_path_length = min(current_path_length, min_path_length)` отработает без ошибок!

In [None]:
from sys import maxsize

min_path_length = maxsize

for current_path in permutations(places):
    current_path_length = ... # Здесь считаем длину маршрута.
    min_path_length = min(current_path_length, min_path_length)

***
## Объединяем код в одну программу

In [9]:
from itertools import permutations
from sys import maxsize


def travel_salesman_problem(places, distances):
    movements = len(places) - 1
    min_path_length = maxsize
    for current_path in permutations(places):
        current_path_length = 0
        for movement_index in range(movements):
            current_place = current_path[movement_index]
            next_place = current_path[movement_index + 1]
            current_place_index = places.index(current_place)
            next_place_index = places.index(next_place)
            distance = distances[current_place_index][next_place_index]
            current_path_length += distance
        min_path_length = min(current_path_length, min_path_length)

    return min_path_length


if __name__ == '__main__':
    # Добавляем к названиям переменных суффикс _example,
    # чтобы имена переменных в функции отличались от глобальных переменных.
    places_example = ('Gale', 'Jezero', 'Gusev', 'Meridiani', 'Elysium')
    distances_example = (
        (0, 3570, 2230, 6430, 600),
        (3570, 0, 5280, 4530, 3315),
        (2230, 5280, 0, 6715, 2540),
        (6430, 4530, 6715, 0, 6400),
        (600, 3315, 2540, 6400, 0),
    )
    min_path_length_example = travel_salesman_problem(
        places_example, distances_example
    )
    print(min_path_length_example)

10675


Самый короткий путь — 10 675 километров. Но расстояния недостаточно: нужно понять, в каком порядке надо объезжать заданные точки. Допишем несколько строк кода.

In [10]:
from itertools import permutations
from sys import maxsize


def travel_salesman_problem(places, distances):
    movements = len(places) - 1
    # Вводим переменную для хранения самого короткого маршрута.
    min_path = None
    min_path_length = maxsize
    for current_path in permutations(places):
        current_path_length = 0
        for movement_index in range(movements):
            current_place = current_path[movement_index]
            next_place = current_path[movement_index + 1]
            current_place_index = places.index(current_place)
            next_place_index = places.index(next_place)
            distance = distances[current_place_index][next_place_index]
            current_path_length += distance
        # Если полученное расстояние меньше самого короткого пути...
        if current_path_length < min_path_length:
            # ...назначаем полученное расстояние самым коротким.
            min_path_length = current_path_length
            # Запоминаем самый короткий маршрут.
            min_path = current_path
    # Вместо одного значения возвращаем кортеж с двумя значениями: 
    # расстоянием и самым коротким маршрутом.
    return min_path_length, min_path


if __name__ == '__main__':
    places_example = ('Gale', 'Jezero', 'Gusev', 'Meridiani', 'Elysium')
    distances_example = (
        (0, 3570, 2230, 6430, 600),
        (3570, 0, 5280, 4530, 3315),
        (2230, 5280, 0, 6715, 2540),
        (6430, 4530, 6715, 0, 6400),
        (600, 3315, 2540, 6400, 0),
    )
    min_path_length_example, min_path_example = travel_salesman_problem(
        places_example, distances_example
    )
    print(min_path_length_example, min_path_example)

10675 ('Gusev', 'Gale', 'Elysium', 'Jezero', 'Meridiani')
