In [1]:
# pacchetto degli ALGORITMI

def QuickSort( A, p, q ):
    if( p < q ):
        r = Partition( A, p, q)
        QuickSort( A, p, r-1 )
        QuickSort( A, r+1, q )
    return A

def Partition(A, p, q):
    x = A[q]
    i = p - 1
    for j in range(p, q):
        if A[j] <= x:   # (corretto A[j], non A[q])
            i += 1
            Scambia(A, i, j)
    Scambia(A, i + 1, q)    # posiziona il pivot al centro
    return i + 1

def Scambia(A, i, j):
    temp = A[i]
    A[i] = A[j]
    A[j] = temp

def QuickSort3Way(arr, l, r):
    if l >= r:
        return

    lt = l
    i = l
    gt = r
    pivot = arr[l]

    while i <= gt:
        if arr[i] < pivot:
            arr[lt], arr[i] = arr[i], arr[lt]
            lt += 1
            i += 1
        elif arr[i] > pivot:
            arr[i], arr[gt] = arr[gt], arr[i]
            gt -= 1
        else:
            i += 1

    QuickSort3Way (arr, l, lt - 1)
    QuickSort3Way (arr, gt + 1, r)

    return lt, gt

def countingSort(arr):
    max = arr[0]
    min = arr[0]

    for i in range(1, len(arr)):
        if arr[i] > max:
            max = arr[i]
        elif arr[i] < min:
            min = arr[i]

    C = [0] * (max - min + 1)
    for i in range(len(arr)):
        C[arr[i] - min] += 1

    k = 0
    for i in range(len(C)):
        while C[i] > 0:
            arr[k] = i + min
            k += 1
            C[i] -= 1
    return arr

def RadixSort(arr):
    radix_array = [[], [], [], [], [], [], [], [], [], []]  # array delle cifre
    max_val = max(arr)  # assegno il valore massimo dell'array
    exp = 1 

    while (max_val // exp) > 0:
        while len(arr) > 0:
            val = arr.pop()
            radix_index = (val // exp) % 10
            radix_array[radix_index].append(val)

        for bucket in radix_array:
            while len(bucket) > 0:
                val = bucket.pop()
                arr.append(val)

        exp *= 10
    return arr    

In [2]:
# MISURAZIONE TEMPI MEDI DI ESECUZIONE:
# Al variare di:
# - n = lunghezza array
# - m = dimensione range interi elementi array

# 100 <= n <= 100000
# 10 <= m <= 1000000

# asse x = n o m, y = tempo medio esecuzione 
# se asse x = n -> m = 100000 costante
# se asse x = m -> n = 10000 costante

# Genera ALMENO 100 campioni per grafico, ciascuno è un possibile valore per n o m con corrispondente tempo medio di esecuzione
# Valori di n/m -> serie geometrica nell'intervallo specificato sopra per ciascuno [usa ciclo for da i=0 a 99 e definisci lunghezza n come
# funzione esponenziale di i, es. n_i = floor(A*B^i) con A e B costanti in virgola mobile così da ottenere n_i=100 se i=0 e ni=100000 se i=99]

# (Una serie geometrica è una sequenza di numeri in cui ogni termine è ottenuto moltiplicando il precedente per una costante, chiamata ragione (o rapporto), 
# indicata spesso con r. es. valore 1, ragione 2 -> 1,2,4,8,16,32,...)

# Scelti valori per n e m -> misurazione tempo medio esecuzione avviene generando array di n interi scelti casualmente nell'intervallo [1,m].
# NOTA: l'array verrà modificato per cui bisogna rigenerarlo ad ogni misurazione.
# aggiungi tempo inizializzazione array al tempo di esecuzione, oppure stimata separatamente e in seguito sottratta al tempo totale per inizializzazione
# ed esecuzione algoritmo di ordinamento.

# Per stime tempi medi di esecuzione meno sensibili al contenuto dell'array generato -> una decina di misurazioni per la stessa scelta dei parametri
# n ed m, poi calcola media tempi di esecuzione misurati

# !) Stima tempi di esecuzione di un algoritmo su un array deve garantire ERRORE RELATIVO MASSIMO = 0.001
# -> per tutte le misurazioni del tempo trascorso serve usare un clock di sistema monotono (perf_counter() modulo time python)
# -> 1) stimo risoluzione clock di sistema con ciclo while per calcolare intervallo minimo di tempo misurabile
import time
...
def resolution():
    start = time.perf_counter()
    while time.perf_counter() == start:
        pass
    stop = time.perf_counter()
    return stop - start

# -> 2) in funzione della risoluzione stimata R e dell'errore relativo massimo ammissibile (E=0.001), calcolo tempo minimo misurabile
#       Tmin = R * (1/E + 1)

# Stima tempo medio secuzione -> ciclo while, iterando esecuzione algoritmo su input grande n generato con interi scelti casualmente nel range [1,m]
# e misurando complessivamente un intervallo di tempo superiore a Tmin.
# Effettua misurazione senza interrompere clock = calcolando intero intervallo di tempo trascorso dall'inizio dell'iterazione fino a quando tempo 
# misurato risulti superiore a Tmin.

# Tempo medio di esecuzione per una singola istanza di input sarà ottenuto calcolando il rapporto fra tempo totale misurato e il numero di iterazioni
# dell'algoritmo eseguite (questa divisione non influisce sull'errore relativo commesso).

# Procedura di misurazione in pseudocodice:  
'''
function measure(n, m, min_time):
    // n is the desired size of the array
    // m is the size of the range of integers appearing in the array
    // min_time is the minumum measurable time, calculated as suggested above
    count = 0
    start_time = get_time() // mi raccomando: l'inizio del clock va messo fuori dal ciclo while!!!!
    while True:
        a = initialize_array(n, m)
        execute_algorithm(a)
        count = count + 1
        end_time = get_time()
        if end_time - start_time >= min_time
             break
    return (end_time - start_time) / count
'''    

# stimare preventivamente tempo medio di inizializzazione e poi sottrarre tale stima al tempo totale di esecuzione (alla procedura sopra metti alla fine:
return (end_time - start_time) / count - avg_init_time

# CONSIGLI: usa grafici comparativi, sia in scale lineari - che riportano ad es. n in ascissa e t(n) in ordinata - sia scale doppiamente logaritmiche
#           che riportano ad es. log(n) in x e log(t(n)) in y.

SyntaxError: 'return' outside function (501097463.py, line 70)

In [None]:
n = list(range(100,100001)) # lunghezza array
m = list(range(10, 1000001)) # range interi dell'array

In [None]:
# metteremo n nell'ascissa quindi m = 100000 costante
m = 100000

# 100 campioni
import math

def genera_campioni():
    # ricavo A e B in base a quello che viene fornito dal problma
    A = 100
    B = 1.0723
    n_i = []
    for i in range(0,100):
        # campioni in serie geometrica
        n_i.append(math.floor(A*B**i))
    return n_i

In [None]:
# Scelti valori per n e m -> misurazione tempo medio esecuzione avviene generando array di n interi scelti casualmente nell'intervallo [1,m].
import random
import numpy as np

# misuro tempo di inizializzazione array casuale + ritorno l'array generato su cui applicare gli algoritmi
def risoluzione(n, m):
    inizio = time.perf_counter()
    array = np.random.randint(1, m+1, size=n) # array di dimensione n
    array = array.tolist()
    fine = time.perf_counter()
    tempo = fine - inizio
    return array, tempo

In [None]:
# vogliamo ERRORE RELATIVO MASSIMO = 0.001
# calcolo tempo minimo misurabile: Tmin = R * (1/E + 1)

_, R = risoluzione()
E = 0.001

T_min = R * (1/E + 1)

In [None]:
# Stima tempo medio secuzione -> ciclo while, iterando esecuzione algoritmo su input grande n generato con interi scelti casualmente nel range [1,m]
# e misurando complessivamente un intervallo di tempo superiore a Tmin.
# Effettua misurazione senza interrompere clock = calcolando intero intervallo di tempo trascorso dall'inizio dell'iterazione fino a quando tempo 
# misurato risulti superiore a Tmin.

# Tempo medio di esecuzione per una singola istanza di input sarà ottenuto calcolando il rapporto fra tempo totale misurato e il numero di iterazioni
# dell'algoritmo eseguite (questa divisione non influisce sull'errore relativo commesso).
import time

def execute_algorithm(ar, alg):
    if alg == "Q":
        QuickSort(ar, 0, len(ar)-1)
    elif alg == "Q3":
        QuickSort3Way(ar, 0, len(ar)-1)
    elif alg == "C":
        countingSort(ar)
    elif alg == "R":
        RadixSort(ar)

# stimare preventivamente tempo medio di inizializzazione e poi sottrarre tale stima al tempo totale di esecuzione
def stima_inizializzazione(n, m, ripetizioni=10):
    totale = 0
    for _ in range(ripetizioni):
        _, tmp = risoluzione(n,m)
        totale += tmp
    return totale / ripetizioni

def misurazione(n, m, T_min, alg):
    count = 0
    start = time.perf_counter()
    avg_init_time = stima_inizializzazione(n,m)
    while True:
        arr, _ = risoluzione(n, m)
        execute_algorithm(arr, alg)
        count += 1
        end = time.perf_counter()
        if end - start >= T_min:
            break
    return ((end - start) / count) - avg_init_time 

In [None]:
# MISURAZIONI

import seaborn as sns
import matplotlib.pyplot as plt
import pandas as pd
import numpy as np

E = 0.001  # errore relativo massimo

n_values = genera_campioni() # genero i campioni

# devo memorizzare i dati:
n_values_list = []
algorithm_list = []
time_list = []

for n in n_values: # per ciascun possibile campione calcolo il tempo di esecuzione medio

    # per ciascun campione calcolo il tempo minimo misurabile
    _, R = risoluzione(n,m)
    T_min = R * (1/E + 1)

    algoritmi = ["Q", "Q3", "C", "R"]
    tempi = {}

    for algo in algoritmi:
        tempi[algo] = misurazione(n, m, T_min, algo)
        n_values_list.append(n)
        algorithm_list.append(algo)
        time_list.append(tempi[algo])
        
    print(f"n={n} | Q={tempi['Q']:.6f} | Q3={tempi['Q3']:.6f} | C={tempi['C']:.6f} | R={tempi['R']:.6f}")
    
# creo un dataframe
df = pd.DataFrame({
    'n': n_values_list,
    'algoritmo': algorithm_list,
    'tempo': time_list  # assumendo che il tempo sia in secondi
})

print("\nDataFrame creato:")
print(df.head())

df.to_csv('tempi_esecuzione_algoritmi.csv', index=False)
print("\nDati salvati in 'tempi_esecuzione_algoritmi.csv'")

In [None]:
# CONSIGLI: usa grafici comparativi, sia in scale lineari - che riportano ad es. n in ascissa e t(n) in ordinata - sia scale doppiamente logaritmiche
#           che riportano ad es. log(n) in x e log(t(n)) in y.

from matplotlib.ticker import ScalarFormatter
from scipy import stats

sns.set_theme(style="whitegrid")
plt.rcParams['figure.figsize'] = (10, 6)
plt.rcParams['font.size'] = 12

# usiamo i tempi in millisecondi
if 'tempi_ms' not in df.columns:
    df['tempi_ms'] = df['tempo'] * 1000

# faccio i grafici affiancati
fig, (ax1, ax2) = plt.subplots(1, 2, figsize=(16, 6))

# Grafico lineare
sns.lineplot(data=df, x='n', y='tempi_ms', hue='algoritmo', marker='o', ax=ax1)
ax1.set_title('Scala lineare')
ax1.set_xlabel('n')
ax1.set_ylabel('Tempo (ms)')
ax1.grid(True, linestyle='--', alpha=0.7)

# Da questo ricaviamo in ordine crescente di tempi medi di esecuzione: CountingSort, RadixSort, QuickSort, QuickSort3way

# Grafico logaritmico

# la pendenza della linea corrisponde all'esponente della complessità 
# -> pendenza = 1 -> O(n) lineare
# -> pendenza = 1,2-1,5 -> O(nlogn) 
# -> pendenza = 2 -> O(n^2) quadratica
# -> pendenza = 3 -> O(n^3) cubica
sns.lineplot(data=df, x='n', y='tempi_ms', hue='algoritmo', marker='s', ax=ax2)
ax2.set_title('Scale logaritmiche')
ax2.set_xlabel('n')
ax2.set_ylabel('Tempo (ms)')
ax2.set_xscale('log')
ax2.set_yscale('log')
ax2.grid(True, which='both', linestyle='--', alpha=0.7)

ax = plt.gca()
annotations_count = 0  # Contatore per tenere traccia delle annotazioni

for algorithm in df['algoritmo'].unique():
    algo_data = df[df['algoritmo'] == algorithm]
    if len(algo_data) < 2:
        continue
        
    x_log = np.log10(algo_data['n'])
    y_log = np.log10(algo_data['tempi_ms'])
    
    slope, intercept, _, _, _ = stats.linregress(x_log, y_log)
    
    x_end = max(algo_data['n'])
    y_end = 10**(slope * np.log10(x_end) + intercept)
    
    # Trova il colore dalla linea corrispondente
    color = 'black'
    for line in ax.get_lines():
        if line.get_label() == algorithm:
            color = line.get_color()
            break
    
    # Modifica l'offset per il secondo algoritmo
    annotations_count += 1
    if annotations_count == 2:  # Seconda annotazione
        text_offset = (15, 15)  # Sposta 15 punti più in alto
    else:
        text_offset = (15, 0)
    
    ax.annotate(f'm = {slope:.2f}', 
                xy=(x_end, y_end),
                xytext=text_offset,  # Usa offset diverso per il secondo
                textcoords='offset points',
                fontsize=11,
                fontweight='bold',
                color=color,
                ha='left',
                va='center',
                bbox=dict(boxstyle='round,pad=0.2', facecolor='white', alpha=0.8, edgecolor=color))

# aggiungiamo complessità teoriche per confrontarle con quelle che escono nei grafici

n_range = np.array([min(df['n']), max(df['n'])])

# Linee guida per complessità teoriche
plt.plot(n_range, 0.0001 * n_range, 'k--', alpha=0.5, label='O(n)')  # pendenza 1
plt.plot(n_range, 0.00005 * n_range * np.log2(n_range), 'k:', alpha=0.5, label='O(n log n)')  # pendenza ~1.3
plt.plot(n_range, 0.000001 * n_range**2, 'k-.', alpha=0.5, label='O(n²)')  # pendenza 2

plt.legend(title='Algoritmi e complessità teoriche')

plt.tight_layout()
plt.savefig('confronto_DEFINITIVO.png', dpi=300, bbox_inches='tight')
plt.show()

# CONCLUSIONI (OSSERVATE DAI GRAFICI):

# Grafico lineare: in ordine dal meno efficente al più efficente gli algoritmi, QuickSort, QuickSort3Way, RadixSort, CountingSort.
# Si nota che per input piccoli, quindi array con n piccolo, hanno efficenza simile. 
# Con input grandi notiamo innanzitutto che tutti e 4 gli algoritmi crescono quasi linearmente senza pendenze altalenanti.
# Al tempo = 100 (input circa 38000), QuickSort e QuickSort3Way si sovrappongono con stesso tempo di esecuzione. In generale hanno andamento simile.
# CountingSort invece presenta una crescita molto lenta, mantenendo un ottima efficenza anche per input molto grandi.

# Grafico logaritmico: per QuickSort, QuickSort3Way abbiamo costo medio di O(nlogn), quindi pendenza 1.14 e 1.15 [corretto];
#       per RadixSort abbiamo costo medio d*O(n), quindi lineare e pendenza 0.99 [corretto]
#       per CountingSort fa storcere il naso perché costo medio O(n+k), quindi lineare MA pendenza 0.26 (quindi quasi costante?!)
# Perciò notiamo come CountingSort sia estremamente efficente.
# Le distribuzioni di QuickSort e QuickSort3Way sono quasi sovrapposte, mentre quella di RadixSort é molto vicina alle due.
# Interessante é l'andamento iniziale di CountingSort che fino ad un n mediano fra 10^3 e 10^4 é quasi costante, mentre da quel punto in poi
# il tempo medio di esecuzione medio aumenta, sempre però rimanendo sotto agli andamenti degli altri algoritmi.