# Сортировки

https://github.com/Klimkou/CS_SEPMP_2023/blob/main/Lectures/Lecture%2011.pdf

### Merge sort

![image.png](attachment:bf678999-0c13-4f9b-93ea-b38c99a2c147.png)

https://habrastorage.org/getpro/habr/upload_files/21f/1a3/ec0/21f1a3ec016004112fbb9180f76067dd.gif

1. Если в рассматриваемом массиве один элемент, то он уже
отсортирован — алгоритм завершает работу.
2. Иначе массив разбивается на две части пополам, которые
сортируются рекурсивно.
3. После сортировки двух частей массива к ним применяется
процедура слияния, которая по двум отсортированным
частям получает исходный отсортированный массив.

Достоинства:

устойчивая

Недостатки:

требуется дополнительно O(n)

Пускай T(n)
 — время сортировки массива длины n
, тогда для сортировки слиянием справедливо T(n)=2T(n/2)+O(n)

In [1]:
def merge_sort(nums): 
    if len(nums) > 1:  # из пункта 1 помним, если в массиве 1 элемент, то он уже отсортирован
        mid = len(nums)//2
        left = nums[:mid] 
        right = nums[mid:]
        left = merge_sort(left)  
        right = merge_sort(right)  

        i = j = k = 0

        while i < len(left) and j < len(right): 
            if left[i] < right[j]: 
                nums[k] = left[i] 
                i+=1
                '''
                два отсортированных подмассива превратим в
                один отсортированный массив nums. i для left, j для right и k для nums. 
                Сравним элементы в left и right и копируем меньший элемент в nums.
                '''
            else: 
                nums[k] = right[j] 
                j+=1
            k+=1
#добавим оставшиеся элементы из left и right в nums
        while i < len(left): 
            nums[k] = left[i] 
            i+=1
            k+=1

        while j < len(right): 
            nums[k] = right[j] 
            j+=1
            k+=1
 
    return nums 


![image.png](attachment:bcd7f2c2-9f2d-477e-8146-52f8185fcb81.png)

![image.png](attachment:42fea599-8d59-420a-9906-afcb421ed373.png)

![image.png](attachment:7704823d-3917-4018-9e06-0b3dc2228261.png)

Ну а другая боковая ветвь аналогично)

In [2]:
nums = [9, 7, 6, 15, 16, 5, 10, 11]

merge_sort(nums)
print(nums)

[5, 6, 7, 9, 10, 11, 15, 16]


### Буквенные символы

Немного вспомним основы.

In [3]:
print("apple" > "banana")

False


In [4]:
print("apple" < "banana")

True


In [5]:
print("apple" == "Apple")

False


In [6]:
print("apple" > "Apple")

True


In [7]:
print(ord("A"))

65


латинская «А» имеет значение 65, в то время как значение строчной «а» равно 97. 

In [8]:
print(chr(97))

a


порядковое значение в символ

![image.png](attachment:16afe664-dc4d-4799-8c80-a2b92eaa206f.png)

In [9]:
fruits = ['banana', 'apple', 'grape', 'orange']
merge_sort(fruits)
print(fruits)

['apple', 'banana', 'grape', 'orange']


### Sorted and Sort

In [10]:
A = "abdce"
print(sorted(list(A)))
print(list(A))

['a', 'b', 'c', 'd', 'e']
['a', 'b', 'd', 'c', 'e']


In [11]:
print(sorted(A, reverse = True))

['e', 'd', 'c', 'b', 'a']


In [12]:
names = ['Olga', 'Helen', 'Ann']
sorted_words = sorted(names, key=len)
print(sorted_words)  

['Ann', 'Olga', 'Helen']


In [13]:
def my_char(s):
    return s[-2]

names = ['Olga', 'Helen', 'Ann']
sorted_words = sorted(names, key=my_char)
print(sorted_words)  

['Helen', 'Olga', 'Ann']


In [14]:
numbers = [1, -3, 2, -6, -5]
sorted_numbers = sorted(numbers, key=abs)
print(sorted_numbers)

[1, 2, -3, -5, -6]


Функция sorted() — это универсальный метод сортировки. В качестве обязательного параметра она принимает любой итерируемый объект и возвращает отсортированный список, созданный из его элементов. Эта функция не меняет исходный объект, а создаёт новый.

Для сортировки элементов списка существует метод списков .sort(). В отличие от функции sorted(), он изменяет сам список, в котором он вызван, и не возвращает никакого значения

In [19]:
B = ['O', 'l', 'g', 'a']
B.sort()
print(B)

['O', 'a', 'g', 'l']


In [20]:
num = [9, 7, 6, 15, 16, 5, 10, 11]
num.sort()
print(num)

[5, 6, 7, 9, 10, 11, 15, 16]


Словарь

Если мы применим функцию sorted() к словарю, то получим отсортированный список ключей

In [21]:
original_dict = {'b': 1, 'a': 2, 'c': 3}

sorted_items = sorted(original_dict)
print(sorted_items)  

['a', 'b', 'c']


Отсортировать словарь можно с помощью функции sorted() совместно с методом словаря .items(). Этот метод возвращает ключи и значения словаря в виде набора кортежей.

In [22]:
original_dict = {'b': 1, 'a': 2, 'c': 3}

# Сортировка словаря по ключам
sorted_items = sorted(original_dict.items())
print(sorted_items)  # [('a', 2), ('b', 1), ('c', 3)]

# Преобразование обратно в словарь
sorted_dict = dict(sorted_items)
print(sorted_dict)  # {'a': 2, 'b': 1, 'c': 3}

[('a', 2), ('b', 1), ('c', 3)]
{'a': 2, 'b': 1, 'c': 3}


### Сортировка пузырьком

![image.png](attachment:ee177187-d9b5-46eb-b6d0-bda43e3a04f7.png)

https://habrastorage.org/getpro/habr/upload_files/132/1a8/c2d/1321a8c2d653c5b4fdca906baff445a5.gif

In [23]:
nums = [5, 1, 4, 2, 8]
n = 1
while n < len(nums):
   for i in range(len(nums) - n):
       if nums[i] > nums[i + 1]:
           print(f"Было {nums}")
           nums[i], nums[i + 1] = nums[i + 1], nums[i]
           print(f"Стало {nums}")
           print(f"Номер прохода по массиву {n}")
   n += 1
print(f"Итоговая версия {nums}")

Было [5, 1, 4, 2, 8]
Стало [1, 5, 4, 2, 8]
Номер прохода по массиву 1
Было [1, 5, 4, 2, 8]
Стало [1, 4, 5, 2, 8]
Номер прохода по массиву 1
Было [1, 4, 5, 2, 8]
Стало [1, 4, 2, 5, 8]
Номер прохода по массиву 1
Было [1, 4, 2, 5, 8]
Стало [1, 2, 4, 5, 8]
Номер прохода по массиву 2
Итоговая версия [1, 2, 4, 5, 8]


In [30]:
fruits = ['banana', 'apple', 'grape', 'orange']
n = 1
while n < len(fruits):
   for i in range(len(fruits) - n):
       if fruits[i] > fruits[i + 1]:
           print(f"Было {fruits}")
           fruits[i], fruits[i + 1] = fruits[i + 1], fruits[i]
           print(f"Стало {fruits}")
           print(f"Номер прохода по массиву {n}")
   n += 1
print(f"Итоговая версия {fruits}")

Было ['banana', 'apple', 'grape', 'orange']
Стало ['apple', 'banana', 'grape', 'orange']
Номер прохода по массиву 1
Итоговая версия ['apple', 'banana', 'grape', 'orange']


### Сортировка вставками

Сортировка вставками последовательно берет каждый элемент и вставляет его в нужную позицию в уже отсортированной части массива. Обратите внимание! строит конечный массив по одному элементу за раз.

![image.png](attachment:e880fa1e-4ab1-4adf-9739-b49c32437132.png)

https://habrastorage.org/getpro/habr/upload_files/fcc/ea3/8f3/fccea38f39ce8c98392ccccabe6711d6.gif

In [34]:
def insertion_sort(nums):
    for i in range(1, len(nums)):
        key = nums[i] # переменная, чтобы содержать значение
        j = i - 1 # переменная чтобы обратиться к отсортированной части

        
        # Далее перемещаем элементы nums[0..i-1], которые больше key, на одну позицию вперед
        while j >= 0 and nums[j] > key:
            nums[j + 1] = nums[j]
            j -= 1 #вычитаю, чтобы дойти до самого низа отсортированной части
        nums[j + 1] = key # тут вспоминаем просто, что j+1=i то есть то, что нам и нужно было расположить
        print(nums)
    return nums
    

num = [4,1,3,2]
sorted_num = insertion_sort(num)
print(sorted_num)

[1, 4, 3, 2]
[1, 3, 4, 2]
[1, 2, 3, 4]
[1, 2, 3, 4]


### Сортировка выбором

Сортировка выбором последовательно находит минимальный элемент из несортированной части массива и перемещает его в начало.

![image.png](attachment:f7a30631-320b-4938-9002-57ef47a9ce4e.png)

https://habrastorage.org/getpro/habr/upload_files/6e1/ea1/8c7/6e1ea18c7121582805e1bba9af3a9096.gif

In [35]:
def selection_sort(nums):
    for i in range(len(nums)):
        min_idx = i  # Изначально минимальный элемент — текущий элемент
        for j in range(i + 1, len(nums)):
            if nums[j] < nums[min_idx]:
                min_idx = j
        print(f"До шага {nums}")
        nums[i], nums[min_idx] = nums[min_idx], nums[i] 
        print(f"После шага {nums}")
    return nums

num = [7, 10, 5, 3, 8, 4, 2, 9, 6]
sorted_num = selection_sort(num)

До шага [7, 10, 5, 3, 8, 4, 2, 9, 6]
После шага [2, 10, 5, 3, 8, 4, 7, 9, 6]
До шага [2, 10, 5, 3, 8, 4, 7, 9, 6]
После шага [2, 3, 5, 10, 8, 4, 7, 9, 6]
До шага [2, 3, 5, 10, 8, 4, 7, 9, 6]
После шага [2, 3, 4, 10, 8, 5, 7, 9, 6]
До шага [2, 3, 4, 10, 8, 5, 7, 9, 6]
После шага [2, 3, 4, 5, 8, 10, 7, 9, 6]
До шага [2, 3, 4, 5, 8, 10, 7, 9, 6]
После шага [2, 3, 4, 5, 6, 10, 7, 9, 8]
До шага [2, 3, 4, 5, 6, 10, 7, 9, 8]
После шага [2, 3, 4, 5, 6, 7, 10, 9, 8]
До шага [2, 3, 4, 5, 6, 7, 10, 9, 8]
После шага [2, 3, 4, 5, 6, 7, 8, 9, 10]
До шага [2, 3, 4, 5, 6, 7, 8, 9, 10]
После шага [2, 3, 4, 5, 6, 7, 8, 9, 10]
До шага [2, 3, 4, 5, 6, 7, 8, 9, 10]
После шага [2, 3, 4, 5, 6, 7, 8, 9, 10]


### Быстрая сортировка quicksort

![image.png](attachment:6ad0cefb-cac5-42ae-a38b-1edd5433ce7c.png)

https://habrastorage.org/getpro/habr/upload_files/0a9/afd/372/0a9afd372156de5806bd87f93c875834.gif

In [2]:
nums = [1, 2, 3, 4, 5]
print(nums[:-1])
print(nums[::-1])

[1, 2, 3, 4]
[5, 4, 3, 2, 1]


![image.png](attachment:0fbdb770-5826-44ce-b3d9-47978172f396.png)

In [3]:
def quick_sort2(nums):
    if len(nums) <= 1:
        return nums
    pivot = nums[-1] 
    left = [x for x in nums[:-1] if x <= pivot]  
    right = [x for x in nums[:-1] if x > pivot] 
    print(f"Левое {left}, Правое {right}, Опорный элемент {pivot}")
    return quick_sort2(left) + [pivot] + quick_sort2(right)

num = [9, 1, 8, 2, 7, 3, 5, 6, 4]
sorted_num2 = quick_sort2(num)
print(sorted_num2)

Левое [1, 2, 3], Правое [9, 8, 7, 5, 6], Опорный элемент 4
Левое [1, 2], Правое [], Опорный элемент 3
Левое [1], Правое [], Опорный элемент 2
Левое [5], Правое [9, 8, 7], Опорный элемент 6
Левое [], Правое [9, 8], Опорный элемент 7
Левое [], Правое [9], Опорный элемент 8
[1, 2, 3, 4, 5, 6, 7, 8, 9]


In [4]:
num = [19, 7, 15, 12, 16, 18, 4, 11, 13]
sorted_num2 = quick_sort2(num)
print(sorted_num2)

Левое [7, 12, 4, 11], Правое [19, 15, 16, 18], Опорный элемент 13
Левое [7, 4], Правое [12], Опорный элемент 11
Левое [], Правое [7], Опорный элемент 4
Левое [15, 16], Правое [19], Опорный элемент 18
Левое [15], Правое [], Опорный элемент 16
[4, 7, 11, 12, 13, 15, 16, 18, 19]


In [7]:
def quick_sort1(nums):
    if len(nums) <= 1:
        return nums
    pivot = nums[0]
    left = [x for x in nums[1:] if x <= pivot] 
    right = [x for x in nums[1:] if x > pivot] 
    print(f" Левое {left}, Правое {right}, Опорный элемент {pivot}")
    return quick_sort1(left) + [pivot] + quick_sort1(right)

num = [9, 1, 8, 2, 7, 3, 5, 6, 4]
sorted_num1 = quick_sort1(num)
print(sorted_num1) 

 Левое [1, 8, 2, 7, 3, 5, 6, 4], Правое [], Опорный элемент 9
 Левое [], Правое [8, 2, 7, 3, 5, 6, 4], Опорный элемент 1
 Левое [2, 7, 3, 5, 6, 4], Правое [], Опорный элемент 8
 Левое [], Правое [7, 3, 5, 6, 4], Опорный элемент 2
 Левое [3, 5, 6, 4], Правое [], Опорный элемент 7
 Левое [], Правое [5, 6, 4], Опорный элемент 3
 Левое [4], Правое [6], Опорный элемент 5
[1, 2, 3, 4, 5, 6, 7, 8, 9]


In [6]:
from random import choice
def quick_sort3(nums):
    if len(nums) <= 1:
        return nums
    pivot = choice(nums)
    left = [x for x in nums if x < pivot] 
    right = [x for x in nums if x > pivot]
    print(f" Левое {left}, Правое {right}, Опорный элемент {pivot}")
    return quick_sort3(left) + [pivot] + quick_sort3(right)

num = [9, 1, 8, 2, 7, 3, 5, 6, 4]
sorted_num3 = quick_sort3(num)
print(sorted_num3) 

 Левое [1, 2], Правое [9, 8, 7, 5, 6, 4], Опорный элемент 3
 Левое [], Правое [2], Опорный элемент 1
 Левое [4], Правое [9, 8, 7, 6], Опорный элемент 5
 Левое [7, 6], Правое [9], Опорный элемент 8
 Левое [], Правое [7], Опорный элемент 6
[1, 2, 3, 4, 5, 6, 7, 8, 9]


Синтаксис функции enumerate() выглядит следующим образом:

enumerate(iterable, start)

Функция enumerate() принимает два параметра: iterable и start.

iterable — это итерируемый объект (список, кортеж и т.д.), который будет возвращен в виде пронумерованного объекта (объекта enumerate)
start — это начальный индекс для возвращаемого объекта enumerate. Значение по умолчанию равно 0, поэтому, если вы опустите этот параметр, в качестве первого индекса будет использоваться 0.

In [57]:
names = ["Olga", "Helen", "Nick"]
enumNames = enumerate(names)
print(list(enumNames))

[(0, 'Olga'), (1, 'Helen'), (2, 'Nick')]


In [58]:
names = ["Olga", "Helen", "Nick"]
enumNames = enumerate(names, 10)
print(list(enumNames))

[(10, 'Olga'), (11, 'Helen'), (12, 'Nick')]


In [59]:
names = ["Olga", "Helen", "Nick"]
enumNames = enumerate(names)
for item in enumNames:
    print(item)

(0, 'Olga')
(1, 'Helen')
(2, 'Nick')


In [53]:
def quick_sort4(nums):
    if len(nums) <= 1:
        return nums
    mid = len(nums) // 2
    pivot = nums[mid]
    left = [x for i, x in enumerate(nums) if x <= pivot and i!= mid]
    right = [x for i, x in enumerate(nums) if x > pivot and i!= mid]
    print(f"Левое {left}, Правое {right}, Опорный элемент {pivot}")
    return quick_sort1(left) + [pivot] + quick_sort1(right)

num = [9, 1, 8, 2, 7, 3, 5, 6, 4]
sorted_num4 = quick_sort4(num)
print(sorted_num4)

Левое [1, 2, 3, 5, 6, 4], Правое [9, 8], Опорный элемент 7
Левое [1, 2, 3, 4], Правое [6], Опорный элемент 5
Левое [1, 2], Правое [4], Опорный элемент 3
Левое [1], Правое [], Опорный элемент 2
Левое [], Правое [9], Опорный элемент 8
[1, 2, 3, 4, 5, 6, 7, 8, 9]


In [8]:
def quick_sort(nums, start, end):
    if start < end:
        pivot_index = partition(nums, start, end)
        quick_sort(nums, start, pivot_index - 1)
        quick_sort(nums, pivot_index + 1, end)

def partition(nums, start, end):
    pivot = nums[end]
    i = start - 1
    for j in range(start, end):
        if nums[j] <= pivot:
            i += 1
            nums[i], nums[j] = nums[j], nums[i]  
    nums[i + 1], nums[end] = nums[end], nums[i + 1]
    return i + 1

num = [9, 1, 8, 2, 7, 3, 5, 6, 4]
quick_sort(num, 0, len(num) - 1)
print(num) 

[1, 2, 3, 4, 5, 6, 7, 8, 9]


### Сортировка пирамидой

![image.png](attachment:f6d34252-36f5-46a3-a92e-940d36144e55.png)

range(start, stop, step=1)!!!!

In [9]:
def heap_sort(nums):
    """Пирамидальная сортировка."""
    n = len(nums)
    # Построение max-кучи (перегруппируем массив в кучу)
    for i in range(n // 2 - 1, -1, -1):
        heapify(nums, n, i)
    for i in range(n - 1, 0, -1):
        # Перемещаем текущий корень (максимум) в конец массива
        nums[0], nums[i] = nums[i], nums[0]
        # Вызываем heapify на уменьшенной куче
        heapify(nums, i, 0)


def heapify(nums, heap_size, root_index):
    """
    Приведение поддерева с корнем root_index в max-кучу.
    nums: массив, представляющий кучу.
    heap_size: размер кучи.
    root_index: индекс корневого элемента поддерева.
    """
    largest = root_index  # Изначально считаем корень наибольшим элементом
    left_child = 2 * root_index + 1  # Индекс левого потомка
    right_child = 2 * root_index + 2  # Индекс правого потомка

    # Если левый потомок больше корня
    if left_child < heap_size and nums[left_child] > nums[largest]:
        largest = left_child
    # Если правый потомок больше "наибольшего" элемента (корня или левого потомка)
    if right_child < heap_size and nums[right_child] > nums[largest]:
        largest = right_child
    # Если "наибольший" элемент не корень, меняем их местами и продолжаем процесс
    if largest != root_index:
        nums[root_index], nums[largest] = nums[largest], nums[root_index]
        # Рекурсивно применяем heapify к затронутому поддереву
        heapify(nums, heap_size, largest)


nums = [9, 1, 8, 2, 7, 3, 5, 6, 4]
heap_sort(nums)
print("Отсортированный массив:", nums)


Отсортированный массив: [1, 2, 3, 4, 5, 6, 7, 8, 9]


n // 2 - 1 вычисляет индекс последнего узла, имеющего потомков в двоичном дереве. В куче узлы с индексами от n // 2 до n - 1 — это листья, которые не имеют потомков и сами по себе являются «кучей»
Мы начинаем с этого индекса и идём влево (к уменьшающимся индексам), потому что хотим вызывать heapify от последних узлов с потомками к корню