# **Confronto tra algoritmi di ordinamento**
In questo notebook vado a svolgere un confronto tra i due algoritmi di ordinamento **Insertion sort** e **Counting sort** per lo stesso array in input.
In particolar modo pongo attenzione sui tempi impiegati dai due algoritmi e sulla correttezza dei risultati.
Le aspettative per i due algoritmi sono le seguenti:
- **Insertion sort**: è un algoritmo semplice che costruisce l'array di output andando a confrontare ogni nuovo elemento con quelli già ordinati in precedenza andandolo ad inserire nella posizione corretta. Risulta quindi un algoritmo efficiente per piccoli array o per array quasi ordinati ma ha una complessità di **_θ(n²)_** nei casi peggiori, con _n_ lunghezza dell'array.
- **Counting sort**: è un algoritmo che non si basa sui confronti tra gli elementi dell'array ma va ad utilizzare un array ausiliario per poter contare le occorrenze di ogni valore dell'array in input, grazie a questo array di appoggio va poi a creare quello di output. È efficiente per array con un intervallo di valori limitato ed ha una complessità di **_θ(n+k)_** con _n_ lunghezza dell'array e _k_ il valore massimo ovvero l'intervallo dei valori.

Di seguito sono riportate tre funzioni, in ordine: algoritmo di **Insertion sort**, algoritmo di **Counting sort** e funzione per creare un array random, partendo dai volori _n_ e _k_, da dare in input agli algoritmi di ordinamento.

In [558]:
def InsertionSort(A, n):
    for j in range(1, n):
        key = A[j]
        i = j - 1
        while i >= 0 and A[i] > key:
            A[i + 1] = A[i]
            i = i-1
        A[i + 1] = key
    return A

In [559]:
def CountingSort(A, k):
    B = [0] * (len(A))
    C = [0] * (k)
    for j in range(len(A)):
        C[A[j]] = C[A[j]] + 1
    for i in range(1, k):
        C[i] = C[i] + C[i - 1]
    for j in range(len(A) -1, -1, -1):
        B[C[A[j]] -1] = A[j]
        C[A[j]] = C[A[j]] - 1
    return B

In [560]:
def generateRandomArray(n, k):
    import random
    A = [0] * (n)
    for i in range(n):
        A[i] = random.randint(0, k - 1)
    return A

Andiamo adesso a considerare tutti i casi possibili al variare di _n_ e _k_ per confrontare al meglio i due algoritmi di ordinamento

## Test con array di lunghezza ridotta e intervallo di valori limitato

In [561]:
import time

# Genera un array randomico di dimensione n con valori tra 0 e k-1
n = 100
k = 10
A = generateRandomArray(n, k)
B = A.copy()

print("Initial array: ", A)

# Misura il tempo impiegato da Insertion Sort
start_time = time.time()
insertionSortResult = InsertionSort(A, n)
end_time = time.time()
print("Sorted array using Insertion Sort: ", insertionSortResult)
print("Time taken by Insertion Sort: {:.6f} seconds".format(end_time - start_time))

# Misura il tempo impiegato da Counting Sort
start_time = time.time()
countingSortResults = CountingSort(B, k)
end_time = time.time()
print("Sorted array using Counting Sort: ", countingSortResults)
print("Time taken by Counting Sort: {:.6f} seconds".format(end_time - start_time))

Initial array:  [9, 5, 9, 8, 9, 2, 8, 9, 1, 7, 1, 8, 1, 5, 0, 4, 4, 5, 0, 7, 0, 1, 8, 8, 0, 7, 0, 0, 7, 2, 2, 1, 3, 8, 4, 0, 4, 2, 7, 8, 9, 8, 1, 4, 5, 0, 5, 0, 0, 4, 4, 6, 2, 3, 8, 0, 7, 2, 3, 1, 0, 9, 4, 7, 9, 2, 7, 7, 3, 2, 2, 3, 5, 0, 4, 6, 9, 3, 1, 1, 6, 6, 1, 3, 6, 5, 5, 6, 7, 5, 4, 7, 6, 9, 7, 0, 6, 9, 1, 5]
Sorted array using Insertion Sort:  [0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 2, 2, 2, 2, 2, 2, 2, 2, 2, 3, 3, 3, 3, 3, 3, 3, 4, 4, 4, 4, 4, 4, 4, 4, 4, 4, 5, 5, 5, 5, 5, 5, 5, 5, 5, 5, 6, 6, 6, 6, 6, 6, 6, 6, 7, 7, 7, 7, 7, 7, 7, 7, 7, 7, 7, 7, 8, 8, 8, 8, 8, 8, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9]
Time taken by Insertion Sort: 0.000346 seconds
Sorted array using Counting Sort:  [0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 2, 2, 2, 2, 2, 2, 2, 2, 2, 3, 3, 3, 3, 3, 3, 3, 4, 4, 4, 4, 4, 4, 4, 4, 4, 4, 5, 5, 5, 5, 5, 5, 5, 5, 5, 5, 6, 6, 6, 6, 6, 6, 6, 6, 7, 7, 7, 7, 7, 7, 7, 7, 7, 7, 7, 7, 8, 8, 8, 8, 8, 8, 8,

### Commento sui risultati
Possiamo notare che in questo caso il tempo impiegato dai due algoritmi non differisce di molto, entrambi hanno prestazioni ottimali nonostante la differenza nelle complessità in cui una è quadratica e l'altra lineare. Inoltre l'array ausiliario del **Counting sort** utilizza poca memoria.

## Test con array di lunghezza elevata e intervallo di valori ampio

In [None]:
import time

# Genera un array randomico di dimensione n con valori tra 0 e k-1
n = 100000
k = 100000
A = generateRandomArray(n, k)
B = A.copy()

print("Initial array: ", A)

# Misura il tempo impiegato da Insertion Sort
start_time = time.time()
insertionSortResult = InsertionSort(A, n)
end_time = time.time()
print("Sorted array using Insertion Sort: ", insertionSortResult)
print("Time taken by Insertion Sort: {:.6f} seconds".format(end_time - start_time))

# Misura il tempo impiegato da Counting Sort
start_time = time.time()
countingSortResults = CountingSort(B, k)
end_time = time.time()
print("Sorted array using Counting Sort: ", countingSortResults)
print("Time taken by Counting Sort: {:.6f} seconds".format(end_time - start_time))

Initial array:  [719, 932, 933, 419, 69, 0, 364, 547, 84, 438, 588, 516, 936, 222, 793, 808, 705, 912, 377, 252, 898, 670, 538, 827, 957, 790, 555, 494, 520, 154, 679, 368, 472, 744, 472, 883, 232, 212, 603, 479, 481, 718, 753, 986, 175, 454, 995, 764, 960, 327, 380, 520, 173, 443, 813, 804, 758, 357, 53, 427, 298, 441, 328, 408, 550, 306, 896, 446, 409, 949, 332, 372, 341, 920, 696, 441, 68, 462, 247, 628, 990, 921, 567, 628, 225, 741, 590, 571, 425, 605, 864, 773, 470, 549, 156, 431, 507, 360, 214, 880, 614, 705, 690, 899, 869, 600, 765, 817, 376, 115, 876, 947, 361, 727, 192, 133, 608, 750, 196, 780, 458, 133, 298, 704, 766, 393, 665, 929, 774, 780, 143, 514, 197, 328, 340, 490, 102, 174, 281, 830, 743, 820, 125, 516, 34, 67, 59, 913, 21, 489, 718, 169, 545, 198, 230, 171, 900, 805, 907, 375, 92, 505, 171, 265, 317, 186, 435, 524, 431, 589, 552, 447, 337, 393, 996, 968, 952, 79, 369, 383, 661, 61, 892, 803, 758, 603, 824, 882, 990, 971, 393, 170, 139, 684, 319, 71, 9, 419, 318, 976,

### Commento sui risultati
In questo caso notiamo come **Insertion sort** soffre della sua complessità quadratica legata al valore di _n_ andando a ordinare l'array in tempi elevati risultando così inefficiente.
Invece **Counting sort** avendo complessità lineare è legato alla grandezza di _k_, al suo aumentare impiega più tempo per ordinare l'array, inoltre il vettore ausiliario occupa molta memoria. Tuttavia rimane più efficiente rispetto a **Insertion sort** per grandi array a patto di avere una distanza tra _k_ ed _n_ non troppo eccessiva.

## Test con array di lunghezza elevata e intervallo di valori limitato

In [None]:
import time

# Genera un array randomico di dimensione n con valori tra 0 e k-1
n = 100000
k = 10
A = generateRandomArray(n, k)
B = A.copy()

print("Initial array: ", A)

# Misura il tempo impiegato da Insertion Sort
start_time = time.time()
insertionSortResult = InsertionSort(A, n)
end_time = time.time()
print("Sorted array using Insertion Sort: ", insertionSortResult)
print("Time taken by Insertion Sort: {:.6f} seconds".format(end_time - start_time))

# Misura il tempo impiegato da Counting Sort
start_time = time.time()
countingSortResults = CountingSort(B, k)
end_time = time.time()
print("Sorted array using Counting Sort: ", countingSortResults)
print("Time taken by Counting Sort: {:.6f} seconds".format(end_time - start_time))

Initial array:  [2, 0, 9, 7, 3, 5, 3, 9, 2, 8, 1, 1, 0, 1, 6, 7, 3, 6, 6, 2, 2, 7, 4, 5, 8, 5, 9, 0, 2, 9, 1, 3, 8, 5, 5, 0, 2, 5, 9, 7, 7, 3, 7, 2, 2, 0, 3, 8, 6, 1, 7, 1, 2, 1, 6, 1, 3, 6, 8, 4, 7, 2, 2, 5, 9, 1, 6, 2, 3, 8, 6, 4, 1, 4, 6, 6, 9, 9, 0, 2, 0, 0, 4, 7, 8, 4, 1, 5, 8, 6, 0, 0, 5, 4, 4, 9, 4, 6, 2, 1, 7, 2, 9, 1, 4, 7, 1, 1, 9, 6, 9, 6, 6, 3, 0, 9, 9, 7, 6, 0, 2, 2, 6, 8, 2, 8, 9, 9, 9, 6, 8, 5, 3, 5, 8, 2, 1, 4, 7, 5, 7, 2, 1, 7, 9, 6, 9, 8, 4, 7, 1, 2, 0, 7, 5, 8, 2, 8, 7, 6, 7, 1, 2, 9, 3, 5, 0, 4, 4, 0, 3, 4, 7, 7, 4, 4, 2, 4, 5, 4, 0, 0, 6, 6, 1, 7, 8, 5, 7, 2, 6, 0, 0, 2, 3, 2, 6, 7, 6, 4, 6, 9, 7, 7, 3, 4, 0, 7, 9, 0, 1, 1, 9, 7, 8, 3, 1, 2, 8, 3, 6, 1, 7, 6, 4, 7, 4, 2, 5, 7, 3, 6, 1, 5, 0, 6, 2, 9, 9, 8, 1, 0, 6, 4, 5, 1, 9, 0, 6, 5, 2, 1, 8, 8, 3, 5, 3, 9, 5, 3, 4, 6, 1, 0, 4, 6, 0, 2, 9, 8, 6, 6, 5, 8, 0, 9, 1, 1, 7, 0, 8, 3, 2, 9, 3, 4, 5, 6, 6, 2, 8, 2, 8, 9, 2, 8, 4, 5, 8, 9, 4, 7, 5, 4, 0, 9, 8, 3, 8, 3, 9, 1, 7, 6, 8, 9, 3, 2, 6, 4, 3, 4, 2, 6, 8, 5, 7, 3,

### Commento sui risultati
In questo caso notiamo come **Insertion sort** soffre ancora della sua complessità quadratica legata al valore di _n_ andando ad aumentare rapidamente i tempi di risoluzione.
Il **Counting sort** invece utilizza un array ausiliario che occupa poca memoria dato il valore basso di _k_. È prorpio per questo motivo che nella complessità lineare _k_ ha un impatto trascurabile andando a rendere l'algoritmo molto più efficiente rispetto all'**Insertion sort**

## Test con array di lunghezza ridotta e intervallo di valori ampio

In [None]:
import time

# Genera un array randomico di dimensione n con valori tra 0 e k-1
n = 100
k = 100000
A = generateRandomArray(n, k)
B = A.copy()

print("Initial array: ", A)

# Misura il tempo impiegato da Insertion Sort
start_time = time.time()
insertionSortResult = InsertionSort(A, n)
end_time = time.time()
print("Sorted array using Insertion Sort: ", insertionSortResult)
print("Time taken by Insertion Sort: {:.6f} seconds".format(end_time - start_time))

# Misura il tempo impiegato da Counting Sort
start_time = time.time()
countingSortResults = CountingSort(B, k)
end_time = time.time()
print("Sorted array using Counting Sort: ", countingSortResults)
print("Time taken by Counting Sort: {:.6f} seconds".format(end_time - start_time))

Initial array:  [743, 450, 595, 846, 160, 55, 167, 831, 446, 778, 356, 973, 418, 703, 845, 100, 590, 263, 448, 529, 696, 918, 467, 517, 371, 371, 111, 213, 593, 590, 381, 890, 142, 56, 773, 304, 166, 822, 153, 947, 586, 665, 42, 502, 166, 394, 915, 87, 799, 2, 773, 477, 948, 95, 209, 184, 414, 119, 394, 505, 154, 780, 396, 854, 725, 532, 377, 56, 465, 525, 533, 298, 489, 49, 434, 97, 298, 48, 663, 501, 518, 546, 546, 898, 138, 960, 280, 55, 140, 653, 909, 642, 413, 548, 586, 212, 538, 280, 29, 267]
Sorted array using Insertion Sort:  [2, 29, 42, 48, 49, 55, 55, 56, 56, 87, 95, 97, 100, 111, 119, 138, 140, 142, 153, 154, 160, 166, 166, 167, 184, 209, 212, 213, 263, 267, 280, 280, 298, 298, 304, 356, 371, 371, 377, 381, 394, 394, 396, 413, 414, 418, 434, 446, 448, 450, 465, 467, 477, 489, 501, 502, 505, 517, 518, 525, 529, 532, 533, 538, 546, 546, 548, 586, 586, 590, 590, 593, 595, 642, 653, 663, 665, 696, 703, 725, 743, 773, 773, 778, 780, 799, 822, 831, 845, 846, 854, 890, 898, 909, 91

### Commento sui risultati
**Insertion sort** torna ad essere efficiente per via del basso valore di _n_ avendo quindi pochi elementi dell'array da dover ordinare.
Al contrario **Counting sort** ha un array ausiliario che occupa molta memoria nonostante il numero ridotto di elementi da ordinare, di conseguenza la complessità è dominata dal valore elevato di _k_ rendendo l'algoritmo inefficiente. 

## Test con array ordinato

In [None]:
import time

# Genera un array ordinato di dimensione n con valori tra 0 e k-1
n = 100000
k = 100000
A = list(range(n))
B = A.copy()

print("Initial array: ", A)

# Misura il tempo impiegato da Insertion Sort
start_time = time.time()
insertionSortResult = InsertionSort(A, n)
end_time = time.time()
print("Sorted array using Insertion Sort: ", insertionSortResult)
print("Time taken by Insertion Sort: {:.6f} seconds".format(end_time - start_time))

# Misura il tempo impiegato da Counting Sort
start_time = time.time()
countingSortResults = CountingSort(B, k)
end_time = time.time()
print("Sorted array using Counting Sort: ", countingSortResults)
print("Time taken by Counting Sort: {:.6f} seconds".format(end_time - start_time))

Initial array:  [0, 1, 2, 3, 4, 5, 6, 7, 8, 9]
Sorted array using Insertion Sort:  [0, 1, 2, 3, 4, 5, 6, 7, 8, 9]
Time taken by Insertion Sort: 0.000056 seconds
Sorted array using Counting Sort:  [0, 1, 2, 3, 4, 5, 6, 7, 8, 9]
Time taken by Counting Sort: 0.000051 seconds


### Commento sui risultati
In questo caso non andiamo più ad utilizzare la funzione per generare un array casuale ma passiamo agli algoritmi array già ordinati.
Quello che notiamo è che **Insertion sort** confronta solo _n_-1 elementi e trovandoli già ordinati non ha necessità di effettuare spostamenti. Questo è dunque il caso migliore per questo algoritmo la cui complessità adesso diventa **_θ(n)_**.
**Counting sort** invece non basandosi sui confronti non risente dell'ordinamento iniziale dell'array, ciò implica che i suoi tempi restano invariati.
In questo caso quindi **Insertion sort** è più efficiente di **Counting sort**

## Test con array ordinato al contrario

In [None]:
import time

# Genera un array ordinato al contrario di dimensione n con valori tra 0 e k-1
n = 100000
k = 100000
A = list(range(n - 1, -1, -1))
B = A.copy()

print("Initial array: ", A)

# Misura il tempo impiegato da Insertion Sort
start_time = time.time()
insertionSortResult = InsertionSort(A, n)
end_time = time.time()
print("Sorted array using Insertion Sort: ", insertionSortResult)
print("Time taken by Insertion Sort: {:.6f} seconds".format(end_time - start_time))

# Misura il tempo impiegato da Counting Sort
start_time = time.time()
countingSortResults = CountingSort(B, k)
end_time = time.time()
print("Sorted array using Counting Sort: ", countingSortResults)
print("Time taken by Counting Sort: {:.6f} seconds".format(end_time - start_time))

Initial array:  [99, 98, 97, 96, 95, 94, 93, 92, 91, 90, 89, 88, 87, 86, 85, 84, 83, 82, 81, 80, 79, 78, 77, 76, 75, 74, 73, 72, 71, 70, 69, 68, 67, 66, 65, 64, 63, 62, 61, 60, 59, 58, 57, 56, 55, 54, 53, 52, 51, 50, 49, 48, 47, 46, 45, 44, 43, 42, 41, 40, 39, 38, 37, 36, 35, 34, 33, 32, 31, 30, 29, 28, 27, 26, 25, 24, 23, 22, 21, 20, 19, 18, 17, 16, 15, 14, 13, 12, 11, 10, 9, 8, 7, 6, 5, 4, 3, 2, 1, 0]
Sorted array using Insertion Sort:  [0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99]
Time taken by Insertion Sort: 0.000466 seconds
Sorted array using Counting Sort:  [0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 2

### Commento sui risultati
Anche in questo caso non andiamo più ad utilizzare la funzione per generare un array casuale ma passiamo agli algoritmi array già ordinati al contrario.
Notiamo che **Insertion sort** confronta tutti gli elementi e ha necessità di spostarli tutti quanti poiché nessuno è nella posizione corretta. Questo è dunque il caso peggiore per questo algoritmo e la sua complessità torna ad essere **_θ(n²)_**.
**Counting sort**, come nel caso precedente, non basandosi sui confronti non risente dell'ordinamento iniziale dell'array, quindi i suoi tempi restano invariati.
In questo caso **Counting sort** è nettamente più efficiente di **Insertion sort**


## Considerazioni finali
Analizzando tutti i casi è evidente che la scelta dell'algoritmo di ordinamento dipende dalla lunghezza e dall'intervallo di valori dell'array di input.
In particolar modo:
- **Insertion sort** è efficiente per array piccoli o quasi ordinati ma soffre gravemente nei casi peggiori di array grandi o ordinati al contrario. La sua complessità è dunque **_θ(n²)_**.
- **Counting sort** è efficiente per array che abbiano un intervallo di valori limitato indipendentemente dal numero di elementi che compongono l'array ma risulta inefficiente, in particolare per quanto riguarda la memoria, per array con _k_ molto più grande di _n_. La sua complessità è dunque **_θ(n+k)_**.