## Bucket sort

Plaats elke waarde van de een-dimensionale array in een rij van de bucket array,
gebaseerd op het meest rechtse cijfer in het getal (de "een"-waarde). 
Bijvoorbeeld, 97 wordt geplaatst in rij 7, 3 wordt geplaatst in rij 3 en 100 wordt geplaatst in rij 0. 
Deze stap heet de distribution pass.


Loop door de bucket array rij voor rij, en kopieer de waardes terug in de originele array. 
Deze stap heet de gathering pass. De volgorde van de hierboven genoemde getallen is dus nu 100, 3, 97.

Herhaal dit proces voor elke volgende digit-positie (dus voor de tientallen, honderdtallen, etc.). 
Na de laatste gathering pass is de array gesorteerd.
        
        # Pseudocode #
       
        function bucketSort(Array)
            n = Array.lenght
            let B[0,...,n-1] be a new array
            for i in 0 to n - 1 
                B[i] <-- 0
            for i = 1 to n
                B[[nArray[i]]] <-- Array[i]
            for i = 0 to n - 1 
                sort list B[i] using insertion sort
            concatenate the lists B[0],B[1],...,B[n-1]
            return B 
            


- array index | 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 |
- element     | n | . | . | . | . | . | . | . | . | . |

- right index: i % (10 ** 1)

Literatuurlijst: 
- https://www.growingwiththeweb.com/2015/06/bucket-sort.html
- https://www.cs.umd.edu/class/fall2019/cmsc351-0101/files/bucketSort.pdf

In [1]:
from numpy import random
import math
import timeit

In [217]:
def generate_random_list(num_steps):
    lijst = [random.randint(1,100) for x in range(num_steps)]
    return lijst

def bucket_sort():
    """Generate a list with n random numbers using the function above"""
    lijst = generate_random_list(10)
    print("The generated list with random numbers: {}".format(lijst))
    
    """Generate n buckets"""
    buckets_list = []
    i = 0
    while(i<num_steps):
        buckets_list.append([])
        i+=1
    print("The empty buckets: {}".format(buckets_list))
        
    """Distribution pass"""
    for i in lijst:
        # for this algorithm we will sort the integers in the first round depending on its right index
        right_index = i % (10 ** 1)
        buckets_list[right_index].append(i)
    print("List with filled buckets: {}".format(buckets_list))
    
    """Gathering pass"""
    lijst = []
    for i in buckets_list:
        for j in i:
            lijst.append(j)
#     return lijst
    print("Return list with all the random numbers after distribution pass: {}".format(lijst))
    
    
    
    
    # same process for each digit position   

In [218]:
bucket_sort()

The generated list with random numbers: [91, 14, 53, 10, 67, 95, 43, 63, 10, 10]
The empty buckets: [[], [], [], [], [], [], [], [], [], []]
List with filled buckets: [[10, 10, 10], [91], [], [53, 43, 63], [14], [95], [], [67], [], []]
Return list with all the random numbers after distribution pass: [10, 10, 10, 91, 53, 43, 63, 14, 95, 67]


In [96]:
# def bucket_sort(lijst,num_steps):
#     """make 10 buckets in which the integers will be sorted, from 0 to 9"""
#     buckets_list = []
#     i = 0
#     while(i<num_steps):
#         buckets_list.append([])
#         i+=1

#     max_value = max(lijst)
    
#     """sort each item in list to bucket"""
#     for i in lijst:
#         num = (int(math.ceil((i/max_value)*len(buckets_list))))
#         buckets_list[num-1].append(i)
    
#     out_bucket = [num for bucket in buckets_list for num in sorted(bucket)]
    
#     return out_bucket

In [97]:
# bucket_sort(lijst,10)

[10, 22, 37, 44, 46, 46, 65, 68, 88, 91]

## Theorie

- Best case: O(n+k)
- Average case: O(n+k)
---
Als de getallen in de lijst zo zijn gegenereerd dat er per bucket maar 1 getal voorkomt waardoor het eigenlijk al is gesorteerd en je per bucket niet meer hoeft te sorteren. 


---- 
- Worst case: O(n^2)

De worst case is wanneer de meeste getallen in de lijst bij elkaar in de zelfde bucket komen. Stel je hebt de getallen 12,22,32,42,52,62, dan komen ze allemaal in dezelfde bucket (2) en duurt het langer om te sorteren.

---- 

In [None]:
def timer(function):
    start_time = timeit.default_timer()
    function
    print('This algorithm took {:.10f} seconds'.format((timeit.default_timer() - start_time)))

In [None]:
timer(bucket_sort(lijst,10))