# Ordinamento in tempo lineare

Gli algoritmi di ordinamento visti fin'ora hanno un costo computazionale di

$$
O(n\log_2(n))
$$

Questi si basano sul confronto tra gli elementi da ordinare, per questo prendono il nome di ordinamento per confronto

Dati due elementi a e b si possono verificare i seguenti casi

$$
a>b,⠀
a\ge b,⠀
a=b,⠀
a\le b,⠀
a < b⠀
$$

Potendo escludere a=b considerando un vettore con elementi distinti avremo i 4 esiti complementari tra loro

Possiamo considerare quindi solamente il caso in cui

$$
a\le b
$$

Per ogni vettore da ordinare possiamo costruire un albero di indecisione dove ogni elemento ha la (a:b) e rappresenta il confronto tra i due elementi

Per arrivare ad un ordinamento dovremmo percorrere tutto l'albero fino ad arrivare ad una foglia

Ciò significa che il costo computazionale sarà 

$$
\Omega(n\log_2(n))
$$

Se vogliamo aumentare ulteriormente le prestazioni dovremmo necessariamente cambiare tipologia di algoritmo

# Counting Sort

L'algoritmo Counting Sort si basa sul contare il numero di volte che si ripetono i vari elementi

Questo prevede che si sappia il valore massimo presente nell'array

Questo sfrutta poi due array ausiliari, uno contenente le occorrenze degli elementi dell'array da ordinare, mentre il secondo conterrà il vettore ordinato

IL vettore ausiliare contenente le occorrenze (C) dev'essere grande quanto il valore massimo del vettore da ordinare, ogni elemento di C infatti conterrà tutte le volte che l'elemento i si presenta

esempio:

- in A l'elemento 3 appare 4 volte
- C[3] = 4

Successivamente all'elemento i-esimo di C si dovrà aggiungere l'elemento (i-1)-esimo, questo perchè ogni posizione di C dovrà indicare il numero totale di elementi che precedono il valore i

Avendo completato il vettore C a questo punto possiamo pensare di riempire il vettore B in modo ordinato

Per far ciò dovremmo inserire in B[C[A[j]-1] l'elemento A[j], infatti C[A[j]] rappresenta quanti elementi ci sono prima ci A[j], successivamente dovremmo decrementare il valore di C[A[j]]

In [1]:
def counting_sort(data, maximum=None):
    if not maximum:
        maximum = max(data)
    c = [0 for i in range(0, maximum+1)]
    b = [0 for i in range(0,len(data))]

    # Inizializzo C
    for i in range(0, len(data)):
        c[data[i]] += 1
    for i in range(1, maximum+1):
        c[i] += c[i-1]
        
    for i in range(len(data)-1, -1, -1):
        b[c[data[i]]-1] = data[i]
        c[data[i]] -= 1
    return b
        
a = [7,4,6,1,9,2,8,3,3,4,9,9,1,1]
a = counting_sort(a)
print(a)

[1, 1, 1, 2, 3, 3, 4, 4, 6, 7, 8, 9, 9, 9]


# Complessità computazionale

Il Counting Sort è composto da 4 cicli, due complessità:

$$
O(maximum)
$$

gli altri due:

$$
O(k)
$$

La complessità temporale sarà dunque:

$$
O(k+n)
$$

Mentre da una parte diminuiamo il tempo di esecuzione dell'ordinamento, dall'altra aumentiamo la memoria richiesta dall'algoritmo, infatti necessitiamo di due array di appoggio

La complessità spaziale diventerà

$$ 
O(n) ➛ O(n+k)
$$