***
## Ключ сортировки

Признак, по которому элементы сравниваются и сортируются, называют ключом сортировки.

Когда потребовалось упорядочить вольеры по номерам, служитель зоопарка сортировал таблицу по номеру вольера: номер был ключом сортировки.

Но сортировать можно и по содержимому второй колонки — и тогда ключом сортировки стали бы строки, содержащие названия и имена зверей. Результат такой сортировки будет отличаться от сортировки по номерам вольеров.

Задача — отсортировать массив по длине слов, обозначающих числа. Создаём вспомогательный массив: набор ключей, где значения элементов — это длины слов.

```py
# Длины слов "ноль", "один", "два", "три", "четыре" - и так до двенадцати.
# В элементе с индексом [0] хранится длина слова "ноль", 
# в остальных элементах соблюдается тот же принцип.
digit_lengths = [4, 4, 3, 3, 6, 4, 5, 4, 6, 6, 6, 11, 10]

# Массив, который надо отсортировать:
cards = [2, 9, 11, 7, 1]
```

Логика программы будет такой:

1. Сортирующая функция берёт очередной элемент массива `cards` (например, это `2`) и спрашивает: «А каково значение ключа сортировки для этого элемента?»

2. Специальная функция ищет в массиве `digit_lengths` элемент под индексом `[2]` и возвращает его значение: `digit_lengths[2]` — это `3`.

3. Весь дальнейший алгоритм сортировки выполняется как и прежде (например, как при сортировке вставками), но для поиска и сравнения используются значения из массива `digit_lengths`.

В итоге с точки зрения алгоритма не меняется почти ничего: просто для сравнения в него передаётся другой ключ сортировки.

Чтобы функция сортировки могла получить значение ключа из `digit_lengths`, создадим дополнительную функцию, которая будет искать нужное значение ключа. Придётся немного изменить и саму функцию сортировки. 

***
## Функция, возвращающая значение ключа сортировки

Дополним алгоритм сортировки вставками новой функцией: из массива `digit_lengths` она будет возвращать длину слова, обозначающего число.

In [1]:
# Длины слов "ноль", "один", "два", "три", "четыре" - и так до двенадцати.
digit_lengths = [4, 4, 3, 3, 6, 4, 5, 4, 6, 6, 6, 11, 10]

def card_strength(idx):
    # Получаем количество букв для числа idx.
    return digit_lengths[idx]

# Проверим.
# Сколько букв в слове, означающем число 7?
print(card_strength(7))
# Будет напечатано: 4.

4


In [1]:
def insertion_sort(arr):
    # Проходим по всем элементам массива, начиная со второго.
    for i in range(1, len(arr)):
        # Сохраняем текущий элемент в переменную current.
        current = arr[i]
        # Сохраняем индекс предыдущего элемента 
        # в переменную prev (от previous - предыдущий).
        prev = i - 1
        # Сравниваем current с предыдущим элементом 
        # и двигаем предыдущий элемент на одну позицию вправо, 
        # пока он больше current и не достигнуто начало массива.
        while prev >= 0 and arr[prev] > current:
            arr[prev + 1] = arr[prev]
            prev -= 1
        # Вставляем current в отсортированную часть массива на нужное место.
        arr[prev + 1] = current 
        print(f'Шаг {i}, отсортировано элементов: {i + 1}, {arr}')

***
В сортирующую функцию добавляем новый параметр `key`: теперь, помимо массива, функция `insertion_sort_by_key()` должна принимать в аргументы функцию `card_strength()`. С её помощью будут получены значения ключа сортировки.

В тех местах кода, где при сортировке выполняется сравнение элементов, заменяем значения этих элементов на значения ключа, полученного посредством функции `card_strength()`.

Таким образом, выражение `arr[prev] > current` нужно заменить на `key(arr[prev]) > key(current)`:

In [4]:
# Длины слов "ноль", "один", "два", "три", "четыре" - и так до двенадцати.
digit_lengths = [4, 4, 3, 3, 6, 4, 5, 4, 6, 6, 6, 11, 10]


def card_strength(idx):
    # Получаем количество букв для числа idx.
    return digit_lengths[idx]


# Добавляем в функцию параметр key,
# в него будет передана функция, получающая значение ключа сортировки.
def insertion_sort_by_key(arr, key):
    for i in range(1, len(arr)):
        current = arr[i]
        prev = i - 1
        # При сравнении элементов вызываем функцию, переданную в параметр key, 
        # она вернёт значение ключа.
        while prev >= 0 and key(arr[prev]) > key(current):
            arr[prev + 1] = arr[prev]
            prev -= 1
        arr[prev + 1] = current


cards = [2, 9, 11, 7, 1]
# При вызове сортировки передаём в параметры функцию,
# возвращающую значение ключа.
insertion_sort_by_key(cards, card_strength)
# Для контроля - напечатаем результат:
print(cards)

[2, 7, 1, 9, 11]


In [5]:
# Длины слов "ноль", "один", "два", "три", "четыре" - и так до двенадцати.
digit_lengths = [4, 4, 3, 3, 6, 4, 5, 4, 6, 6, 6, 11, 10]

# Функцию card_strength() удаляем!
# def card_strength(idx):
#     return digit_lengths[idx]


# Параметр key убираем!
def insertion_sort_by_key(arr):
    for i in range(1, len(arr)):
        current = arr[i]
        prev = i - 1
        # Вот тут напрямую получаем ключ из digit_lengths - и всё работает!
        while prev >= 0 and digit_lengths[arr[prev]] > digit_lengths[current]:
            arr[prev + 1] = arr[prev]
            prev -= 1
        arr[prev + 1] = current


cards = [2, 9, 11, 7, 1]
# При вызове сортировки никакую функцию не передаём в аргументы!
insertion_sort_by_key(cards)
print(cards)

[2, 7, 1, 9, 11]


Если значения ключей явно описаны в функции-сортировщике, такая функция может сортировать лишь по заданному набору ключей (по длине слов из массива `digit_lengths` в нашем случае). Никакие другие ключи применить не получится.

Если функция-сортировщик принимает на вход функцию, возвращающую значения ключей, то одной и той же функцией можно сортировать по разным ключам. Функция получается универсальной!

In [2]:
digit_lengths = [4, 4, 3, 3, 6, 4, 5, 4, 6, 6, 6, 11, 10]

# Массив с другим набором ключей: это цвета карт.
card_colors = [
    'Аметистовый',   # [0]
    'Чёрный',        # [1]
    'Белый',         # [2]
    'Жёлтый',        # [3] 
    'Синий',         # [4]
    'Фиолетовый',    # [5]
    'Коричневый',    # [6]
    'Зелёный',       # [7]
    'Розовый',       # [8]
    'Серо-голубой',  # [9]
    'Бобровый',      # [10]
    'Коралловый',    # [11]
    'Ванильный'      # [12]
]


def card_strength(idx):
    # Получаем количество букв для числа idx.
    return digit_lengths[idx]


# Добавляем функцию, передающую значения ключей из массива card_colors:
def card_background(idx):
    # Получаем название цвета для карты idx.
    return card_colors[idx]


def insertion_sort_by_key(arr, key):
    for i in range(1, len(arr)):
        current = arr[i]
        prev = i - 1
        while prev >= 0 and key(arr[prev]) > key(current):
            arr[prev + 1] = arr[prev]
            prev -= 1
        arr[prev + 1] = current


cards = [2, 9, 11, 7, 1]
# Сортируем по длине слов:
insertion_sort_by_key(cards, card_strength)
# Печатаем результат:
print('По длине слов:', cards)

# Вызываем ту же функцию, но сортируем по названиям цветов:
insertion_sort_by_key(cards, card_background)
# Печатаем результат:
print('По цветам:', cards)

По длине слов: [2, 7, 1, 9, 11]
По цветам: [2, 7, 11, 9, 1]


In [12]:
...
insertion_sort_by_key(cards, lambda x: digit_lengths[x])
print('По длине слов:', cards)
insertion_sort_by_key(cards, lambda x: card_colors[x])
print('По цветам:', cards)

По длине слов: [2, 7, 1, 9, 11]
По цветам: [2, 7, 11, 9, 1]


***
## Встроенная в Python сортировка по ключу

В стандартную функцию сортировки `sorted()` тоже можно передать функцию для вычисления ключа. 

Результат будет таким же, как в функции `insertion_sort_by_key()`:

In [13]:
digit_lengths = [4, 4, 3, 3, 6, 4, 5, 4, 6, 6, 6, 11, 10]


def card_strength(idx):
    return digit_lengths[idx]


cards = [2, 9, 11, 7, 1]
# В параметр key передаём функцию, возвращающую значения ключей.
result = sorted(cards, key=card_strength)
print(result)

[2, 7, 1, 9, 11]


В функцию сортировки можно передать и лямбда-функцию:

In [14]:
digit_lengths = [4, 4, 3, 3, 6, 4, 5, 4, 6, 6, 6, 11, 10]
cards = [2, 9, 11, 7, 1]
# В параметр key передаём лямбда-функцию, возвращающую значения ключей.
result = sorted(cards, key=lambda x: digit_lengths[x])
print(result)

[2, 7, 1, 9, 11]


***
## Сортировка списка кортежей

Подобным образом — по разным ключам — можно сортировать и список из кортежей. Создадим список `cards`, где элементы — это кортежи, а каждый кортеж состоит из числа, написанного на карте, и цвета этой карты.

В этом случае прямо в параметры сортирующей функции передаём ключ сортировки — индекс того элемента кортежа, по которому должна проводиться сортировка. 

Немного поменяем код:

In [15]:
# В аргумент key будем передавать не функцию, а индекс того элемента кортежа,
# который будет ключом сортировки.
def insertion_sort_by_key(arr, key):
    for i in range(1, len(arr)):
        current = arr[i]
        prev = i - 1
        # Вместо вызова функции указываем нужный элемент кортежа.
        while prev >= 0 and arr[prev][key] > current[key]:
            arr[prev + 1] = arr[prev]
            prev -= 1
        arr[prev + 1] = current


cards = [
    (2, 'Белый'),
    (9, 'Серо-голубой'),
    (11, 'Коралловый'),
    (7, 'Зелёный'),
    (1, 'Чёрный')
]
# Сортируем по названию цвета (по второму элементу кортежа):
insertion_sort_by_key(cards, 1)
print('По цвету:', cards)

# Сортируем по числу на карте (по первому элементу кортежа):
insertion_sort_by_key(cards, 0)
print('По числу:', cards)

По цвету: [(2, 'Белый'), (7, 'Зелёный'), (11, 'Коралловый'), (9, 'Серо-голубой'), (1, 'Чёрный')]
По числу: [(1, 'Чёрный'), (2, 'Белый'), (7, 'Зелёный'), (9, 'Серо-голубой'), (11, 'Коралловый')]


Чтобы провернуть подобный трюк со встроенной в Python функцией `sorted()`, можно создать дополнительную функцию, которая будет возвращать второй элемент кортежа:

In [None]:
def second_element(card_and_length):
    return card_and_length[1]

cards = [
    (2, 'Белый'),
    (9, 'Серо-голубой'),
    (11, 'Коралловый'),
    (7, 'Зелёный'),
    (1, 'Чёрный')
]
result = sorted(cards, key=second_element)
print(result)

[(2, 'Белый'), (7, 'Зелёный'), (11, 'Коралловый'), (9, 'Серо-голубой'), (1, 'Чёрный')]


А можно прямо в параметрах вызова написать анонимную лямбда-функцию: она сделает всё то же самое, но отдельную функцию создавать не потребуется.

In [22]:
cards = [
    (2, 'Белый'),
    (9, 'Серо-голубой'),
    (11, 'Коралловый'),
    (7, 'Зелёный'),
    (1, 'Чёрный')
]
result = sorted(cards, key=lambda second_element: second_element[1])
print(result)

[(2, 'Белый'), (7, 'Зелёный'), (11, 'Коралловый'), (9, 'Серо-голубой'), (1, 'Чёрный')]
