[Źródło](https://github.com/MatiPl01/Algorytmy-i-struktury-danych/blob/fe3625438c7b65f62c0d04abb12a456f22beac79/Przydatne%20algorytmy/Moje%20opracowania)

# Funkcje pomocnicze

Funkcja tworząca przykładowe dane do testowania algorytmów sortowania

In [None]:
import random

def generate_data(size=10, data_type='random', min_value=0, max_value=100):
  if data_type == 'random':
    return [random.randint(min_value,max_value) for _ in range(size)]
  elif data_type == 'random_float':
        return [round(random.uniform(min_value, max_value),2) for _ in range(size)]
  elif data_type == 'sorted':
    return list(range(min_value,min_value + size))
  elif data_type == 'reversed':
    return list(range(min_value + size - 1,min_value - 1, -1))
  else:
    raise ValueError("Nieznany typ danych. Wybierz spośród: 'random', 'sorted', 'reversed'")

In [None]:
print(generate_data(data_type='random'))
print(generate_data(data_type='random_float'))
print(generate_data(data_type='sorted'))
print(generate_data(data_type='reversed'))


[84, 32, 100, 47, 5, 14, 86, 11, 4, 53]
[62.29, 4.49, 51.6, 42.85, 54.76, 23.37, 93.31, 83.52, 73.57, 0.57]
[0, 1, 2, 3, 4, 5, 6, 7, 8, 9]
[9, 8, 7, 6, 5, 4, 3, 2, 1, 0]


# Algorytmy o złożoności $ O(n^2) $

Algorytmy, których czas działania rośnie kwadratowo wraz ze wzrostem danych wejściowych n. Najczęściej wolne, ale bardzo łatwe w implementacji.

## **Bubble Sort (Sortowanie bąbelkowe)**



### Działanie


Jeden z najprostzych algorytmów sortowania. Polega na wielokrotnym przechodzeniu przez tablicę i zamienianiu miejscami sąsiadujących elementów, jeśli są w złej kolejności.

### Złożoność czasowa


#### Najlepszy przypadek
$ O(n^2) $

#### Najgorszy przypadek

$ O(n^2) $

### Złożoność pamięciowa


#### Najlepszy przypadek

$ O(1) $


#### Najgorszy przypadek
$ O(1) $

### Sortowanie w miejscu? - Tak

### Implementacja

In [None]:
def BubbleSort(arr):
  for i in range(len(arr)-1):
    for j in range(len(arr)-1-i):
      if arr[j] > arr[j+1]:
        arr [j], arr[j+1] = arr[j+1], arr[j]

In [None]:
arr = generate_data(data_type='random')
print(arr)
BubbleSort(arr)
print(arr)

[39, 92, 8, 53, 83, 54, 37, 99, 58, 12]
[8, 12, 37, 39, 53, 54, 58, 83, 92, 99]


### Optymalizacja - zatrzymywanie algorytmu


Bubble Sort można przyspieszyć, dodając mechanizm sprawdzania, czy w danej iteracji doszło do zamiany elementów. Jeśli nie było żadnej zamiany, oznacza to, że tablica jest już posortowana i można zakończyć działanie wcześniej, zamiast wykonywać niepotrzebne iteracje. Wtedy w najlepszym przypadku uzyskamy złożoność $ O(n) $.

In [None]:
def BubbleSortOptimized(arr):
  for i in range(len(arr)-1):
    swapped = False
    for j in range(len(arr)-1-i):
      if arr[j] > arr[j+1]:
        arr[j], arr[j+1] = arr[j+1], arr[j]
        swapped = True
    if not swapped:
      break

In [None]:
arr = generate_data(data_type='random')
print(arr)
BubbleSortOptimized(arr)
print(arr)

[95, 77, 40, 30, 62, 38, 62, 89, 48, 96]
[30, 38, 40, 48, 62, 62, 77, 89, 95, 96]


## **Selection Sort (Sortowanie przez wybór)**


### Działanie



1. Najpierw znajdujemy najmniejszy element i zamieniamy go z pierwszym elementem. W ten sposób najmniejszy element trafia na swoją właściwą pozycję.
2. Następnie znajdujemy najmniejszy spośród pozostałych elementów (czyli drugi najmniejszy) i zamieniamy go z drugim elementem.
3. Powtarzamy ten proces, aż wszystkie elementy zostaną przeniesione na właściwe miejsca.

### Złożoność czasowa


#### Najlepszy przypadek
$ O(n^2) $

#### Najgorszy przypadek

$ O(n^2) $

### Złożoność pamięciowa


#### Najlepszy przypadek

$ O(1) $


#### Najgorszy przypadek
$ O(1) $

### Sortowanie w miejscu? - Tak

### Implementacja

In [None]:
def SelectionSort(arr):
  for i in range(len(arr)-1):
    min_index = i
    for j in range(i+1, len(arr)):
      if arr[j] < arr[min_index]:
        min_index = j
      arr[i], arr[min_index] = arr[min_index], arr[i]

In [None]:
arr = generate_data(data_type='random')
print(arr)
SelectionSort(arr)
print(arr)

[78, 62, 99, 31, 39, 11, 15, 13, 74, 50]
[11, 13, 15, 39, 31, 50, 74, 62, 78, 99]


## **Insertion Sort (Sortowanie przez wstawianie)**


### Działanie


1. Zaczynamy od drugiego elementu tablicy, ponieważ zakładamy, że pierwszy element jest już posortowany.
2. Porównujemy drugi element z pierwszym i sprawdzamy, czy jest mniejszy – jeśli tak, zamieniamy je miejscami.
3. Przechodzimy do trzeciego elementu, porównujemy go z pierwszymi dwoma i umieszczamy na właściwej pozycji.
4. Powtarzamy ten proces, aż cała tablica zostanie posortowana.

### Złożoność czasowa


#### Najlepszy przypadek
$ O(n) $

#### Najgorszy przypadek

$ O(n^2) $

### Złożoność pamięciowa


#### Najlepszy przypadek

$ O(1) $


#### Najgorszy przypadek
$ O(1) $

### Sortowanie w miejscu? - Tak

### Implementacja

In [None]:
def InsertionSort(arr):
  for i in range(1, len(arr)):
    key = arr[i]
    prev = i-1
    while prev >= 0 and arr[prev] > key:
      arr[prev+1] =arr[prev]
      prev -= 1
    arr[prev+1] = key

In [None]:
arr = generate_data(data_type='random')
print(arr)
InsertionSort(arr)
print(arr)

[15, 15, 78, 78, 41, 6, 94, 22, 29, 28]
[6, 15, 15, 22, 28, 29, 41, 78, 78, 94]


## **Cycle Sort (Sortowanie cykliczne)**

Cyklowe sortowanie (Cycle Sort) to niestabilny algorytm sortowania działający w miejscu, który jest szczególnie przydatny do sortowania tablic zawierających elementy z niewielkiego zakresu wartości.

Podstawowa idea cyklowego sortowania polega na podziale tablicy wejściowej na cykle, gdzie każdy cykl składa się z elementów, które powinny znaleźć się na tych samych pozycjach w posortowanej tablicy. Algorytm wykonuje serię zamian, aby umieścić każdy element we właściwej pozycji w ramach jego cyklu, aż do momentu, gdy wszystkie cykle zostaną zakończone, a tablica będzie posortowana.

### Działanie


1. Rozpocznij od nieposortowanej tablicy zawierającej **n** elementów.  
2. Zainicjalizuj zmienną **cycleStart** na **0**.  
3. Dla każdego elementu w tablicy porównaj go z każdym innym elementem znajdującym się na prawo od niego. Jeśli znajdziesz elementy mniejsze od bieżącego, zwiększ wartość **cycleStart**.  
4. Jeśli po porównaniu pierwszego elementu ze wszystkimi innymi **cycleStart** nadal wynosi **0**, przejdź do następnego elementu i powtórz krok 3.  
5. Gdy znajdziesz mniejszy element, zamień bieżący element z pierwszym elementem w jego cyklu. Następnie kontynuuj cykl, aż bieżący element powróci na swoją pierwotną pozycję.  
6. Powtarzaj kroki 3-5, dopóki wszystkie cykle nie zostaną zakończone.

[Szczegółowy opis](https://www.geeksforgeeks.org/cycle-sort/)

### Złożoność czasowa


#### Najlepszy przypadek
$ O(n^2) $

#### Najgorszy przypadek

$ O(n^2) $

### Złożoność pamięciowa


#### Najlepszy przypadek

$ O(1) $


#### Najgorszy przypadek
$ O(1) $

### Sortowanie w miejscu? - Tak

### Implementacja

In [None]:
def CycleSort(arr):
  writes = 0 # przechowuje liczbe zamian

  # iterujemy przez tablice aby znalezc cykle
  for cycleStart in range(0,len(arr)-1):
    item = arr[cycleStart]
    pos = cycleStart

    #szukamy gdzie nalezy wstawic item
    for i in range(cycleStart + 1, len(arr)):
      if arr[i] < item:
        pos += 1

    #jesli pozycja == cycleStart to nie ma cyklu
    if pos == cycleStart:
      continue;

    # jesli nie to wstaw item na pos lub dalej jesli sa duplikaty
    while item == arr[pos]:
      pos += 1
    arr[pos], item = item, arr[pos]
    writes += 1

    #Teraz rotation dla pozostalej czeci cyklu
    while pos != cycleStart:

      pos = cycleStart
      for i in range(cycleStart + 1, len(arr)):
        if arr[i] < item:
          pos += 1
      #wstaw item na pos lub dalej jesli sa duplikaty
      while item == arr[pos]:
        pos += 1
      arr[pos], item = item, arr[pos]
      writes += 1

  return writes

In [None]:
arr = generate_data(data_type='random')
print(arr)
CycleSort(arr)
print(arr)

[13, 93, 80, 14, 47, 60, 45, 72, 68, 7]
[7, 13, 14, 45, 47, 60, 68, 72, 80, 93]


## **Comb Sort (Sortowanie grzebieniowe)**

Sortowanie grzebieniowe (Comb Sort) stanowi głównie ulepszenie sortowania bąbelkowego (Bubble Sort). W sortowaniu bąbelkowym porównywane są zawsze sąsiadujące wartości, co powoduje, że inwersje są eliminowane pojedynczo.  

Sortowanie grzebieniowe poprawia ten proces, stosując **odstęp większy niż 1**. Na początku algorytm używa dużej wartości odstępu (`gap`), która w każdej iteracji zmniejsza się o współczynnik **1.3**, aż osiągnie wartość **1**. Dzięki temu Comb Sort eliminuje więcej niż jedną inwersję w jednej zamianie, co sprawia, że działa wydajniej niż Bubble Sort.  

Empirycznie ustalono, że optymalny współczynnik zmniejszania wynosi **1.3** (na podstawie testów na ponad 200 000 losowych list) [Źródło: Wikipedia].  

Choć Comb Sort działa lepiej niż Bubble Sort w większości przypadków, jego **najgorsza złożoność czasowa pozostaje na poziomie O(n²)**.

### Działanie


1. Rozpocznij od nieposortowanej tablicy zawierającej **n** elementów.  
2. Zainicjalizuj zmienną **cycleStart** na **0**.  
3. Dla każdego elementu w tablicy porównaj go z każdym innym elementem znajdującym się na prawo od niego. Jeśli znajdziesz elementy mniejsze od bieżącego, zwiększ wartość **cycleStart**.  
4. Jeśli po porównaniu pierwszego elementu ze wszystkimi innymi **cycleStart** nadal wynosi **0**, przejdź do następnego elementu i powtórz krok 3.  
5. Gdy znajdziesz mniejszy element, zamień bieżący element z pierwszym elementem w jego cyklu. Następnie kontynuuj cykl, aż bieżący element powróci na swoją pierwotną pozycję.  
6. Powtarzaj kroki 3-5, dopóki wszystkie cykle nie zostaną zakończone.

[Szczegółowy opis](https://www.geeksforgeeks.org/cycle-sort/)

### Złożoność czasowa


#### Najlepszy przypadek
$  O(n*log(n) $)

#### Najgorszy przypadek

$ O(n^2) $

### Złożoność pamięciowa


#### Najlepszy przypadek

$ O(1) $


#### Najgorszy przypadek
$ O(1) $

### Sortowanie w miejscu? - Tak

### Implementacja

In [None]:
def getNextGap(gap):
  gap = (gap*10) // 13
  if gap < 1:
    return 1
  return gap

def combSort(arr):
  n = len(arr)

  gap = n
  swapped = True

  while gap != 1 or swapped == True:
    gap = getNextGap(gap)
    swapped = False
    for i in range(0, n-gap):
      if arr[i]>arr[i+gap]:
        arr[i],arr[i+gap] = arr[i+gap],arr[i]
        swapped = True

In [None]:
arr = generate_data(data_type='random')
print(arr)
combSort(arr)
print(arr)

[11, 61, 10, 80, 45, 0, 62, 67, 98, 34]
[0, 10, 11, 34, 45, 61, 62, 67, 80, 98]


# Algorytmy o złożoności $ O(n * log(n)) $

## **Merge Sort (Sortowanie przez scalanie)**

Algorytm **Merge Sort** to algorytm sortowania oparty na metodzie **dziel i zwyciężaj**. Sortuje tablicę, najpierw dzieląc ją na mniejsze części, a następnie składając je z powrotem w poprawnej kolejności, aby uzyskać posortowaną tablicę.  
**Podział (Divide):**  
Algorytm rozpoczyna od dzielenia tablicy na coraz mniejsze fragmenty, aż każda podtablica składa się tylko z jednego elementu.  

**Scalanie (Conquer):**  
Następnie algorytm scala te małe fragmenty, umieszczając mniejsze wartości jako pierwsze, aż powstanie w pełni posortowana tablica.




### Działanie
1. **Podziel tablicę** na dwie podtablice o połowie rozmiaru oryginalnej tablicy.  
2. **Kontynuuj dzielenie** podtablic tak długo, jak długo dana część ma więcej niż jeden element.  
3. **Scalaj podtablice**, zawsze umieszczając mniejszą wartość jako pierwszą.  
4. **Powtarzaj scalanie**, aż nie pozostaną żadne podtablice – wówczas tablica będzie posortowana.

### Złożoność czasowa


#### Najlepszy przypadek
$ O(nlog(n)) $

#### Najgorszy przypadek

$ O(nlog(n)) $

### Złożoność pamięciowa


#### Najlepszy przypadek

$ O(n) $


#### Najgorszy przypadek
$ O(n) $

### Sortowanie w miejscu? - Nie

### Implementacja


In [None]:
def mergeSort(arr):
  if len(arr) <= 1:
    return arr

  mid = len(arr) // 2
  left = arr[:mid]
  right = arr[mid:]

  sortedLeft = mergeSort(left)
  sortedRight = mergeSort(right)

  return merge(sortedLeft,sortedRight)

def merge(left,right):
  result = []
  left_idx = right_idx = 0
  while left_idx < len(left) and right_idx < len(right):
    if left[left_idx] < right[right_idx]:
      result.append(left[left_idx])
      left_idx+=1
    else:
      result.append(right[right_idx])
      right_idx+=1

  #Krótsze pythonowe
  result.extend(left[left_idx:])
  result.extend(right[right_idx:])

  # Klasyczne podejscie
  #for i in range(left_idx,len(left)): result.append(left[i])
  #for i in range(right_idx,len(right)): result.append(right[i])

  return result

In [None]:
arr = generate_data(data_type='random')
print(arr)
# Trzeba przypisac
arr = mergeSort(arr)
print(arr)

[13, 30, 27, 48, 48, 46, 0, 83, 22, 42]
[0, 13, 22, 27, 30, 42, 46, 48, 48, 83]


### Najlepsza implementacja - nie trzeba alokować co chwilę nowych tablic oraz niepotrzebnie kilka razy przepisywać wartości (wersja bez rekurencji)

In [None]:
def mergeSortBest(arr):
  temp_arr = [None] * len(arr) # tablica pomocnicza do przehowywania wyników scalania
  step = 1 # zaczynamy scalanie od najmnijeszej podtablicy

  while step < len(arr):
    for left_idx in range(0,len(arr)-step, 2*step): # tak musi byc zeby kilka razy tego samego nie brac
      mid_idx = left_idx + step
      right_idx = mid_idx + step

      if right_idx > len(arr): right_idx = len(arr)

      # Merging
      l = left_idx #do iterowania po lewej podtablicy (od left_idx do mid_idx).
      m = mid_idx  #do iterowania po prawej podtablicy (od mid_idx do right_idx).
      k = left_idx # do przypisywania wartości do temp_arr (od left_idx).

      while l < mid_idx and m < right_idx:
        if arr[l] <= arr[m]:
          temp_arr[k] = arr[l]
          l += 1
        else:
          temp_arr[k] = arr[m]
          m += 1
        k += 1

      #Dopisujemy pozostale
      while l < mid_idx:
        temp_arr[k] = arr[l]
        l += 1
        k += 1
      while m < right_idx:
        temp_arr[k] = arr[m]
        m += 1
        k += 1

    #jesli dalej jakis waartosci nie ma to dopisujemy
    while k < len(arr):
      temp_arr[k] = arr[k]
      k += 1

    #Zamieniamy tablice
    arr, temp_arr = temp_arr, arr
    step *= 2 # Aby scalac wieksze tablice

  return arr


In [None]:
arr = generate_data(data_type='random',size=15,min_value=-10)
print(arr)
# Trzeba przypisac
arr = mergeSortBest(arr)
print(arr)

[-9, 98, 17, 84, 100, 98, 52, 53, 40, 56, 54, 56, -5, 54, 83]
[-9, -5, 17, 40, 52, 53, 54, 54, 56, 56, 83, 84, 98, 98, 100]


## **Heap Sort (Sortowanie kopcowe)**


Heap Sort polega na zbudowaniu KOMPLETNEGO drzewa binarnego z kolejnych wartości, jakie znajdują się w sortowanej sekwencji (tablicy), a dokładniej struktury, która nazywa się Max Heap, a następnie odczycie kolejnych największych wartości z pozostałej części struktury i przenoszeniu wartości już posortowanych na koniec sekwencji (tablicy). Budowa struktury jest szybka, a jej złożoność czasowa wynosi
$ O(n) $, natomiast sam odczyt wartości z "Maksymalnego Kopca" (Max Heap) wymaga już wykonania $ O(n*log(n)) $
 operacji. Wynika to stąd, że za każdym razem ściągamy wartość z korzenia kopca (kompletnego drzewa binarnego), tym samym "psując" kopiec. W miejsce usuniętej wartości wstawiamy dowolną wartość (najlepiej ostatni z liści), a następnie naprawiamy drzewo w czasie O(log(n)) $
.

### Złożoność czasowa


#### Najlepszy przypadek
$  O(n*log(n) $)

#### Najgorszy przypadek

$  O(n*log(n) $)

### Złożoność pamięciowa


#### Najlepszy przypadek

$ O(1) $


#### Najgorszy przypadek
$ O(1) $

### Sortowanie w miejscu? - Tak

### Implementacja 1 (użycie klasy reprezentującej Max Heap)

In [None]:
class MaxHeap:
  def __init__ (self,values=None):
    self.heap = values
    self.build_heap()

  #Dekorator @property pozwala traktować metodę klasy jak atrybut, czyli możemy ją wywoływać bez użycia nawiasów ()
  @property
  def heap_size(self):
    return len(self.heap)

  # gdy rodzic ma indeks k to
  # lewe dziecko ma indeks 2k+1
  # prawe dziecko ma indeks 2k+2

  #Dekorator @staticmethod pozwala definiować metody, które nie wymagają dostępu do atrybutów instancji (self) ani klasy (cls).
  @staticmethod
  def left_child_idx(curr_idx):
    return 2*curr_idx + 1


  @staticmethod
  def right_child_idx(curr_idx):
    return 2*curr_idx + 2

  def swap(self,i,j):
    self.heap[i], self.heap[j] = self.heap[j], self.heap[i]

  def max_heapify(self,curr_idx,end_idx):
    while True:
      left_idx = self.left_child_idx(curr_idx)
      right_idx = self.right_child_idx(curr_idx)
      largest_idx = curr_idx
      if left_idx < end_idx:
            if self.heap[left_idx] > self.heap[curr_idx]:
              largest_idx = left_idx
            if right_idx < end_idx and self.heap[right_idx] > self.heap[largest_idx]:
              largest_idx = right_idx
      if largest_idx != curr_idx:
        self.swap(curr_idx,largest_idx)
        curr_idx = largest_idx
      else:
        break


  def build_heap(self):
    for i in range((len(self.heap)-1) // 2,-1,-1): # Węzły od połowy tablicy w dół są liśćmi (nie mają dzieci). Zaczynamy od połowy tablicy, bo liście nie wymagają modyfikacji.
      self.max_heapify(i,self.heap_size)

def heapSort(arr):
  max_heap = MaxHeap(arr)
  # Ściągamy czubek, wstawiamy tam liscia i naprawiamy drzewo
  for i in range(len(arr) - 1,0,-1):
    arr[i], arr[0] = arr[0], arr[i]
    max_heap.max_heapify(0,i)


In [None]:
arr = generate_data(data_type='random')
print(arr)
heapSort(arr)
print(arr)

[36, 39, 53, 96, 28, 23, 23, 21, 23, 4]
[4, 21, 23, 23, 23, 28, 36, 39, 53, 96]


### Implementacja 2 (jedynie z użyciem funkcji)

In [None]:
left_idx = lambda i: 2*i+1
right_idx = lambda i: 2*i+2

def max_heapify(arr, curr_idx, end_idx):
  while True:
    left = left_idx(curr_idx)
    right = right_idx(curr_idx)
    largest_idx = curr_idx

    if left < end_idx:
      if arr[left] > arr[curr_idx]:
        largest_idx = left
      if right < end_idx and arr[right] > arr[largest_idx]:
        largest_idx = right

    if largest_idx != curr_idx:
      arr[curr_idx], arr[largest_idx] = arr[largest_idx], arr[curr_idx]
      curr_idx = largest_idx
    else:
      return

def build_heap(arr):
  for i in range((len(arr)-1) // 2,-1,-1):
    max_heapify(arr,i,len(arr))

def heapSort(arr):
  build_heap(arr)
  for i in range(len(arr)-1,0,-1):
    arr[i], arr[0] = arr[0], arr[i]
    max_heapify(arr,0,i)

In [None]:
arr = generate_data(data_type='random')
print(arr)
heapSort(arr)
print(arr)

[8, 5, 32, 83, 28, 35, 28, 4, 41, 44]
[4, 5, 8, 28, 28, 32, 35, 41, 44, 83]


## **Quick Sort (Sortowanie szybkie)**

 Quicksort pobiera tablicę wartości, wybiera jeden z elementów jako "pivot", a następnie przemieszcza pozostałe wartości tak, aby mniejsze wartości znajdowały się po lewej stronie pivota, a większe wartości po jego prawej stronie.

### Działanie


QuickSort działa na zasadzie **dziel i zwyciężaj**, rozbijając problem na mniejsze podproblemy, które są łatwiejsze do rozwiązania.

Algorytm QuickSort składa się głównie z trzech kroków:

1. **Wybór pivota**: Wybierz element z tablicy jako pivot. Wybór pivota może się różnić (np. pierwszy element, ostatni element, losowy element lub mediana).
   
2. **Podział tablicy**: Przekształć tablicę wokół pivota. Po podziale wszystkie elementy mniejsze od pivota znajdą się po jego lewej stronie, a większe po prawej. Pivot znajdzie się w swojej docelowej pozycji, a my uzyskujemy jego indeks.

3. **Rekurencyjne wywołanie**: Rekursywnie stosuj ten sam proces do dwóch podtablic (po lewej i prawej stronie pivota).

4. **Warunek zakończenia rekurencji**: Rekursja kończy się, gdy w podtablicy zostaje tylko jeden element, ponieważ pojedynczy element jest już posortowany.

#### Wybór Pivota

Istnieje wiele różnych sposobów wyboru pivota:

- **Zawsze wybieraj pierwszy (lub ostatni) element jako pivot.** Ta metoda może prowadzić do najgorszego przypadku, jeśli tablica jest już posortowana.
  
- **Wybierz losowy element jako pivot.** Jest to preferowana metoda, ponieważ nie tworzy wzorca, który prowadzi do najgorszego przypadku.

- **Wybierz element jako pivot na podstawie mediany.** Jest to optymalna metoda pod względem złożoności czasowej, ponieważ możemy znaleźć medianę w czasie liniowym, a funkcja podziału zawsze podzieli tablicę na dwie równe części. Jednak metoda ta ma wyższe koszty obliczeniowe, ponieważ znajdowanie mediany jest czasochłonne.

#### Algorytm Podziału (Partition Algorithm)

Kluczowym procesem w QuickSort jest funkcja **partition()**. Istnieją trzy popularne algorytmy do podziału tablicy. Wszystkie te algorytmy mają złożoność czasową **O(n)**:

1. **Naive Partition**: Tworzymy kopię tablicy. Najpierw umieszczamy wszystkie elementy mniejsze niż pivot, a potem wszystkie większe. Na końcu kopiujemy tymczasową tablicę z powrotem do oryginalnej. Ta metoda wymaga dodatkowej pamięci **O(n)**.

2. **Lomuto Partition**: Jest to prostszy algorytm, który śledzi indeksy mniejszych elementów i wykonuje zamiany.

3. **Hoare’s Partition**: Jest to najszybsza z metod. Algorytm przechodzi przez tablicę z obu stron i zamienia elementy większe po lewej stronie z mniejszymi po prawej stronie, aż tablica jest w pełni podzielona. Daje to lepszą wydajność niż Lomuto, ponieważ wymaga mniej zamian.




### Złożoność czasowa


#### Najlepszy przypadek
$ O(n*log(n)) $

#### Najgorszy przypadek

$ O(n^2) $ - źle dobrany pivot

### Złożoność pamięciowa


#### Najlepszy przypadek

$ O(log(n)) $


#### Najgorszy przypadek
$ O(n) $ - dla źle wybranego pivota

### Sortowanie w miejscu? - Tak (przy założeniu, że pamięć, jaką zajmuje stos rekurencyjny, wliczamy do złożoności)

Głosy są podzielone. Niby nie rezerwujemy pamięci w sposób jawny w celu tymczasowego przechowywania częściowo posortowanych danych, ale jednak złożoność pamięciowa algorytmu nie wynosi $ O(1) $
, ponieważ zmienne przechowywane na stosie rekurencyjnym również zajmują pamięć, więc stwierdzenie, czy sortowanie odbywa się w miejscu, zależy od tego, jak na to spojrzymy.

### Implementacja 1 (Pivot z góry określony (ostatni element),rekurencyjne , algorytm Lomuto)


In [None]:
def quickSort(arr):
  _quickSort(arr,0,len(arr)-1)

def _quickSort(arr, left_idx, right_idx):
  while left_idx<right_idx:
    pivot_position = partition(arr,left_idx,right_idx)
    _quickSort(arr,left_idx,pivot_position-1)
    left_idx = pivot_position + 1 # usunięta rekursja ogonowa
    '''Bez usuwania rekursji ogonowej'''
#     if left_idx < right_idx:
#         pivot_position = partition(arr, left_idx, right_idx)
#         _quick_sort(arr, left_idx, pivot_position - 1)
#         _quick_sort(arr, pivot_position + 1, right_idx)

'''Wersja Lomuto'''
def partition(arr,left_idx,right_idx):
  pivot = arr[right_idx]

  i = left_idx
  #Podzial na 2 podtablice - wieksze i mniejsze
  for j in range(left_idx, right_idx):
    if arr[j] < pivot:
      swap(arr,i,j)
      i += 1

  #Przesuniecie pivota na odpowiedznie miejse
  swap(arr,i,right_idx)

  #Zwracamy pozycję pivota
  return i

def swap(arr,i,j):
  arr[i], arr[j] = arr[j], arr[i]

In [None]:
arr = generate_data(data_type='random',size=15)
print(arr)
quickSort(arr)
print(arr)

[31, 54, 46, 63, 22, 94, 13, 11, 61, 62, 85, 50, 97, 22, 96]
[11, 13, 22, 22, 31, 46, 50, 54, 61, 62, 63, 85, 94, 96, 97]


### Implementacja 2 (Pivot z góry określony (teraz pierwszy element),rekurencyjne , algorytm podziału Hoare’a )

O ile w implementacji funkcji partition zaproponowanej przez Lomuto mamy pewność, że po podziale, pivot znajduje się na swojej końcowej pozycji, tj. wyznaczyliśmy jego położenie końcowe w posortowanej tablicy, więc w kolejnych iteracjach sortujemy pozostałe części tablicy z pominięciem pivota, tak w implementacji funkcji podziału Hoare'a, wiemy jedynie, że pivot znajduje się pod koniec na zwróconej przez funkcję partition pozycji i należy do części tablicy, składającej się z elementów od niego mniejszych i mu równych. Nie oznacza to, że pivot znalazł się na swojej końcowej pozycji, więc musimy posortować lewą część tablicy wraz z pivotem oraz prawą (bez pivota).

In [None]:
def _quickSort(arr, left_idx, right_idx):
  while left_idx<right_idx:
    pivot_position = partition(arr,left_idx,right_idx)
    _quickSort(arr,left_idx,pivot_position), '<- zamiast pivot_position-1 samo pivot_position'
    left_idx = pivot_position + 1 # usunięta rekursja ogonowa

'''Wersja Hoare'a'''
def partition(arr,left_idx,right_idx):
  pivot = arr[left_idx]

  i = left_idx - 1
  j = right_idx + 1
  while True:
    i += 1
    while arr[i] < pivot: i += 1

    j -= 1
    while arr[j] > pivot: j -= 1

    if i<j:
      swap(arr, i, j)
    else: #zwracamy pozycje pivota
      return j

def swap(arr,i,j):
  arr[i], arr[j] = arr[j], arr[i]

In [None]:
arr = generate_data(data_type='random',size=15)
print(arr)
quickSort(arr)
print(arr)

[84, 21, 63, 27, 86, 23, 56, 45, 49, 46, 48, 69, 47, 97, 88]
[21, 23, 27, 45, 46, 47, 48, 49, 56, 63, 69, 84, 86, 88, 97]


# Algorytmy o złożoności $ O(n) $

## **Counting Sort (Sortowanie przez zliczanie)**

Założenia, aby użycie było opłacalne:


*   Z reguły zakładamy, że sortowane elementy to liczby całkowite z przedziału od 0 do pewnej wartości k, będącej największą wartością w sortowanej tablicy (możliwe jest oczywiście sortowanie również liczb ujemnych, przy pomocy tego algorytmu, bądź także liter (ciągów tekstowych więcej niż 1-literowych lepiej nie sortować tym sposobem), po wprowadzeniu odpowiednich modyfikacji algorytmu,
*   Counting Sort działa najlepiej dla danych, w których wiele wartości się powtarza, choć nie wpływa to znacząco na jego złożoność, która ZAWSZE zależy w największym stopniu od zakresu wartości, czyli jaka jest wartość najmniejsza i jaka największa.



### Ograniczenia



*   Liczby całkowite
*   Ograniczony zakres liczb
*   Nieujemne ( można obejść )





### Złożoność czasowa


Każdy przypadek

$ O(n + k) $

 $ n $- liczba elementów w sortowanej tablicy (wszystkich),

 $ k $- zakres unikatowych wartości (zazwyczaj liczba liczb całkowitych, jakie znajdują się w przedziale $ [0,k] $
, gdzie $ k $
 jest największą liczbą z sortowanej tablicy) (rzeczywiście na przedziale domkniętym jest $ k + 1 $
 unikatowych wartości, ale różnica o stałą równą
 nie jest uwzględniana w złożoności)

### Złożoność pamięciowa


#### Każdy przypadek

$ O(n + k) $

 $ k $- tworzymy pomocniczą tablicę, w której będziemy przechowywać liczby wystąpień poszczególnych wartości pod indeksami, które odpowiadają tym wartościom (dlatego najlepiej działa ten algorytm na liczbach z małych przedziałów). Później modyfikujemy tę tablicę tak, by dla danego indeksu (odpowiadającego danej liczbie), w komórce tablicy pomocniczej o tym indeksie, występowała liczba wartości, które są nie większe niż indeks tej komórki.

$ n $ - pomocnicza tablica, do której przepisujemy wartości w odpowiedniej kolejności, tak, aby je ponownie później przepisać do tablicy wyjściowej.

### Sortowanie w miejscu? - Nie

### Implementacja 1 ( Nieujemne wartości i po prostu funkcja max, bez użycia po i append, z robieniem sumy prefiksowej)

In [None]:
def countingSort(arr):
  # Największa wartość
  max_value = max(arr)
  # Tablica do zliczania
  counts = [0] * (max_value + 1)
  #Zliczamy wystąpienia
  for val in arr:
    counts[val]+=1
  # Mofyfikacja tablicy aby wskazywala ile wrtosci jest nie wiekszych niz dana
  for i in range(1,len(counts)):
    counts[i] += counts[i-1]
  # Tablica pomocnicza
  temp = [None] * len(arr)
  # Przeoisujemy wartosci do temporary
  for i in range(len(arr)-1,-1,-1):
    counts[arr[i]] -= 1 # zaznazamy w counts ze spotkana juz raz
    temp[counts[arr[i]]] = arr[i] # przypisujemy odpowiedia wartosc
    # dzieki uzyciu tablicy prefiksowej bedziemy za kazdym razem wiedizc gdzie wpisac wartosc
  #Przepisujemy posortowane wartosci
  for i in range(len(temp)):
    arr[i] = temp[i]

In [None]:
arr = generate_data(data_type='random',max_value=10,size =20)
print(arr)
countingSort(arr)
print(arr)

[2, 3, 5, 3, 7, 0, 2, 0, 4, 7, 4, 9, 7, 6, 2, 0, 7, 9, 6, 2]
[0, 0, 0, 2, 2, 2, 2, 3, 3, 4, 4, 5, 6, 6, 7, 7, 7, 7, 9, 9]


### Implementacja 2 (  Nieujemne wartości i po prostu funkcja max, używamy pop i append(mniej efektywne))

In [None]:
def countingSort(arr):
  max_value = max(arr)
  count = [0] * (max_value + 1)

  while len(arr) > 0:
    num = arr.pop(0)
    count[num] += 1

  for i in range(len(count)):
    while count[i] > 0:
      arr.append(i)
      count[i] -= 1
  return arr


In [None]:
arr = generate_data(data_type='random',max_value=10,size =20)
print(arr)
countingSort(arr)
print(arr)

[5, 6, 1, 10, 8, 8, 3, 6, 2, 7, 7, 9, 9, 4, 1, 8, 4, 8, 5, 5]
[1, 1, 2, 3, 4, 4, 5, 5, 5, 6, 6, 7, 7, 8, 8, 8, 8, 9, 9, 10]


### Implementacja 3 ( ujemne wartości, liniowe wyszukiwanie wartości najmniejszej i największej )

In [None]:
def countingSort(arr):
  min_,max_ = minmax(arr)
  _countingSort(arr,min_,max_)

def minmax(arr):
  global_min = global_max = arr[-1]

  for i in range(0,len(arr)-1,2):
    if arr[i] > arr[i+1]:
      if arr[i] > global_max: global_max = arr[i]
      if arr[i+1] < global_min: global_min = arr[i+1]
    else:
      if arr[i+1] > global_max: global_max = arr[i+1]
      if arr[i] < global_min: global_min = arr[i]
  return global_min, global_max

def _countingSort(arr,min_,max_):
  counts = [0] * (max_ - min_ + 1)
  temp = [None] * len(arr)
  for val in arr:
    counts[val - min_] += 1
  #metoda z suma prefiksowa
  for i in range(1, len(counts)):
    counts[i] += counts[i-1]
  for i in range(len(arr)-1, -1, -1):
    counts[arr[i] - min_] -= 1
    temp[counts[arr[i] - min_]] = arr[i]
  for i in range(len(arr)):
    arr[i] = temp [i]


In [None]:
arr = generate_data(data_type='random',min_value=-20,max_value=10,size =20)
print(arr)
countingSort(arr)
print(arr)

[-10, 6, 1, -9, 6, -9, -11, -7, 3, 4, -16, -4, -12, -8, -5, 8, -10, -5, -19, -8]
[-19, -16, -12, -11, -10, -10, -9, -9, -8, -8, -7, -5, -5, -4, 1, 3, 4, 6, 6, 8]


## **Radix Sort (Sortowanie pozycyjne)**

### Działanie

1. Zacznij od najmniej znaczącej cyfry (najbardziej prawej cyfry).  
2. Posortuj wartości na podstawie aktualnie analizowanej cyfry – umieszczając je najpierw w odpowiednich "kubełkach" według tej cyfry, a następnie przepisując je z powrotem do tablicy w odpowiedniej kolejności.  
3. Przejdź do kolejnej cyfry i ponownie posortuj dane według tej cyfry, tak jak w poprzednim kroku. Powtarzaj, aż wszystkie cyfry zostaną przetworzone.

### Ograniczenia i założenia

- Dane wejściowe musi się dać podzielić na poszczególne fragmenty, odpowiadające pojednyczej cyfrze (lub pojedynczemu znakowi w przypadku sortowania tekstu),(tylko liczby całkowite)

- Algorytm pomocniczy, przy pomocy którego będziemy sortować wartości według znaków (poszczególnych cyfr), musi mieć niską złożoność i, przede wszystkim, być stabilny (tylko wtedy Radix Sort działa prawidłowo).

### Złożoność czasowa


Każdy przypadek: $ O(d * ( n + b)) $

$ d $ - $ log_b(k)$, gdzie $ k $ - maksymalna wartość w sortowanej tablicy,

$ n $ - liczba elementów w sortowanej tablicy,

$ b $ - podstawa systemu liczbowego, w jakim odbywa się sortowanie (bo tyle elementów będzie miała tablica, służąca do zliczania powrótek wartości (Radix Sort zazwyczaj korzysta z Counting Sorta) (W przypadku sortowania tekstu, jako podstawę przyjmujemy różnicę między największym kodem ASCII liter a najmniejszym (plus **1**
), zwykle będzie to liczba **26**
, ponieważ tyle jest małych liter alfabetu łacińskiego. Samo sortowanie wygląda jednak nieco inaczej niż w przypadku sortowania liczb))

### Złożoność pamięciowa


Każdy przypadek: $ O(n + b) $

$ n $ -  liczba sortowanych elementów (tyle elementów będzie miała tablica temp),

$ b $ - podstawa systemu liczbowego (tyle elementów będzie miała tablica count). Podstawa ta może być dowolna (nie musimy koniecznie sortować liczb dziesiętnych, biorąc za podstawę systemu liczbowego wartość $ b $ = 10)

### Sortowanie w miejscu? - Nie

Zawsze musimy użyć dodatkowej pamięci, która jest zależna od danych wejściowych (tu od liczby elementów do posortowania oraz liczby unikatowych wartości z tego przedziału, do którego należą sortowane wartości).

### Implementacja 1 (dla podstawy 10, pomocniczy - Counting sort, nieujemne całkwoite)

In [None]:
def helperCountingSort(arr, digit_place):
  counts = [0] * 10
  temp = [None] * len(arr)
  for value in arr:
    digit = (value // digit_place) % 10
    counts[digit] += 1
  for i in range(1,10):
    counts[i] += counts[i-1]
  for i in range(len(arr) - 1, -1, -1):
    digit = (arr[i] // digit_place) % 10
    counts[digit] -= 1
    temp[counts[digit]] = arr[i]
  for i in range(len(arr)):
    arr[i]=temp[i]

def radixSort(arr):
  max_value = _max(arr)
  digit_place = 1
  while max_value >= digit_place:
    helperCountingSort(arr, digit_place)
    digit_place *= 10


def _max(arr):
  max_value = arr[0]
  for i in range(1,len(arr)):
    if arr[i] > max_value: max_value = arr[i]
  return max_value

In [None]:
arr = generate_data(data_type='random',max_value=10,size =20)
print(arr)
radixSort(arr)
print(arr)

[3, 1, 10, 10, 3, 8, 6, 9, 6, 6, 2, 9, 6, 4, 5, 9, 5, 8, 6, 8]
[1, 2, 3, 3, 4, 5, 5, 6, 6, 6, 6, 6, 8, 8, 8, 9, 9, 9, 10, 10]


### Implementacja 2 (dowolna podstawa ( w której sortujemy), pomocniczy - Counting sort, nieujemne całkwoite)

In [None]:
def helperCountingSort(arr, base, digit_place):
  counts = [0] * base
  temp = [None] * len(arr)
  for value in arr:
    digit = (value // digit_place) % base
    counts[digit] += 1
  for i in range(1,10):
    counts[i] += counts[i-1]
  for i in range(len(arr) - 1, -1, -1):
    digit = (arr[i] // digit_place) % base
    counts[digit] -= 1
    temp[counts[digit]] = arr[i]
  for i in range(len(arr)):
    arr[i]=temp[i]

def radixSort(arr, base=10): # domyslnie w 10 , mozna zmienic
  max_value = _max(arr)
  digit_place = 1
  while max_value >= digit_place:
    helperCountingSort(arr, base, digit_place)
    digit_place *= base


def _max(arr):
  max_value = arr[0]
  for i in range(1,len(arr)):
    if arr[i] > max_value: max_value = arr[i]
  return max_value

In [None]:
arr = generate_data(data_type='random',max_value=10,size =20)
print(arr)
radixSort(arr)
print(arr)

[0, 10, 7, 9, 10, 7, 3, 7, 7, 4, 0, 2, 0, 5, 8, 3, 1, 4, 0, 6]
[0, 0, 0, 0, 1, 2, 3, 3, 4, 4, 5, 6, 7, 7, 7, 7, 8, 9, 10, 10]


## **Bucket Sort (Sortowanie kubełkowe)**

### Ograniczenia i założenia


- MAMY PEWNOŚĆ, że otrzymujemy dane wejściowe o ROZKŁADZIE JEDNOSTAJNYM. Oznacza to, że każde z wiaderek, na które podzielimy dane wejściowe (w czasie liniowym), będzie zawierało zbliżoną liczbę elementów do pozostałych wiaderek,
- Tak naprawdę algorytm sortowania Bucket Sort sam w sobie nie jest algorytmem sortowania, a jedynie algorytmem, który dzieli dane wejściowe na mniejsze, szybsze i łatwiejsze w sortowaniu zbiory danych,
- Podzielone na wiaderka dane musimy posortować jakimś wydajnym (w zależności od liczby elementów w wiaderku) algorytmem. Jeżeli liczba elementów jest niewielka, najlepiej się sprawdzi uniwersalny algorytm sortowania, jakim jest Insertion Sort (dla małych danych algorytm ten jest szybki, poza tym, jest to stabilny algorytm sortowania, więc możemy otrzymać stabilną wersję Bucket Sorta i jeszcze jedno, dla prawie posortowanych danych, złożoność Insertion Sorta jest liniowa, a więc istnieje największa szansa, że użycie tego prostego algorytmu o średniej złożoności obliczeniowej $ O(n^2) $
, spowoduje posortowanie niektórych wiaderek w czasie liniowym), natomiast dla większych wiaderek, lepiej wykorzystać jakiś algorytm o złożoności $ O(n * log(n)) $
,
- Warto dodać, że jeżeli pojemniki (wiaderka) zawierają liczby całkowite lub ciągi tekstowe, można wykorzystać np. Radix Sorta do posortowania każdego z pojemników lub Counting Sorta, jeżeli zakres liczb jest niewielki, a liczb o powtarzającej się wartości jest dużo,
- Ponieważ nie mamy pewności, ile dokładnie elementów trafi do danego pojemnika, nie opłaca się alokować pamięci "na sztywno" dla każdego z pojemników.

### Działanie

1. Podziel zadany przedział liczb na k podprzedziałów (kubełków) o równej długości.

2. Przypisz liczby z sortowanej tablicy do odpowiednich kubełków.

3. Sortuj liczby w niepustych kubełkach.

4. Wypisz po kolei zawartość niepustych kubełków.

### Złożoność czasowa


#### Najlepszy przypadek

$ O(n + k) $

$ O(n) $ - czas utworzenia kubełków (jest on tyle równy
, ponieważ zawsze liczba kubełków powinna zależeć od wielkości danych wejściowych oraz konieczne jest liniowe przejście po tablicy i umieszczenie wartości w odpowiednich wiaderkach)

 $ O(k) $- czas sortowania wszystkich kubełków (zależny od liczby kubełków) (przyjmujemy, że czas sortowania pojedynczego kubełka jest w przybliżeniu stały, ponieważ zawiera on niewielką liczbę elementów; dokładniej, to skoro $ kn $
, to iloraz $ n/k $

, który wynosi tyle, ile przybliżona liczba elementów, które przypadają na jeden kubełek, jest stały (zwykle ustalamy tę liczbę odgórnie, zamiast liczby kubełków))

UWAGA:
Aby osiągnąć złożoność liniową, musimy ustalić tak wartość $ k $
, aby zależała ona od $ n $
.

#### Najgorszy przypadek

$ O(n^2) $

W praktyce, przy dobrym doborze wiaderek, istnieje niewielka szansa na osiągnięcie złożoności $ O(n^2) $
. Złożoność będzie tym bliższa złożoności pesymistycznej ( $ O(n^2) $
), im więcej wartości trafi do pojedynczego wiaderka (w szczególności, gdy wszystkie wartości znajdą się w jednym wiaderku, a wiaderka sortujemy algorytmem o złożoności $ O(n^2) $
)

### Złożoność pamięciowa


Każdy przypadek: $ O(n + k) $

Zależy od liczby elementów, jakie otrzymujemy w tablicy do posortowania oraz od liczby kubełków, jakie tworzymy. Ponieważ powinniśmy dobrać tak liczbę kubełków  $ k $
, aby $ k = θ(n)$
 (asymptotycznie $ k $
 musi być liniowe względem rozmiaru tablicy do posortowania), otrzymamy złożoność pamięciową $ O(n+n) = O(n) $

### Sortowanie w miejscu? - Nie

Zawsze musimy użyć dodatkowej pamięci, która jest zależna od danych wejściowych (tu od liczby elementów do posortowania oraz liczby wiaderek, która również zależy od wielkości danych wejściowych).

### Implementacja 1 (z góry podana liczba kubełków, przy pomocy Insertion Sort)

In [None]:
def insertionSort(arr):
  for i in range(1,len(arr)):
    key = arr[i]
    j = i - 1
    while j >= 0 and arr[j] > key:
      arr[j+1] = arr[j]
      j -= 1
    arr[j+1] = key
  return arr

def minmax(arr):
  global_min = global_max = arr[-1]

  for i in range(0,len(arr)-1,2):
    if arr[i] > arr[i+1]:
      if arr[i] > global_max: global_max = arr[i]
      if arr[i+1] < global_min: global_min = arr[i+1]
    else:
      if arr[i+1] > global_max: global_max = arr[i+1]
      if arr[i] < global_min: global_min = arr[i]
  return global_min, global_max

def get_bucket_index(num, min_val, bucket_range, k):
  return min(k-1,int((num - min_val) / bucket_range))

def bucketSort(arr,k):
  _min,_max = minmax(arr)
  bucket_range = (_max - _min) / k
  buckets = [[] for _ in range(k)]
  for num in arr:
    idx = get_bucket_index(num, _min, bucket_range, k)
    buckets[idx].append(num)

  sorted_arr = []
  for bucket in buckets:
    #print(bucket)
    sorted_arr.extend(insertionSort(bucket))

  for i in range(len(arr)):
    arr[i]=sorted_arr[i]

In [None]:
arr = generate_data(data_type='random_float',max_value=10,size =20)
print(arr)
bucketSort(arr,10)
print(arr)

[3.65, 9.19, 1.3, 7.39, 7.72, 0.97, 2.3, 6.32, 0.99, 8.5, 3.74, 7.74, 8.22, 8.65, 6.95, 5.58, 6.33, 7.33, 3.5, 1.79]
[0.97, 0.99, 1.3, 1.79, 2.3, 3.5, 3.65, 3.74, 5.58, 6.32, 6.33, 6.95, 7.33, 7.39, 7.72, 7.74, 8.22, 8.5, 8.65, 9.19]
