-
Notifications
You must be signed in to change notification settings - Fork 0
/
Main.py
82 lines (73 loc) · 2.61 KB
/
Main.py
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
import time
import BandMatrix
import CAHDalgorithm
import OutputData
import getopt
import sys
"""
Main principale per la
chiamata alle classi
BandMatrix & CAHDalgorithm
"""
if __name__ == "__main__":
dim_finale = 250 # dimensione massima matrice
num_sensibile = 13 # n° dati sensibili
grado_privacy = 10 # grado di privacy richiesto
alpha = 3
# lettura da file del dataset
nameFile = "Dataset/BMS1.csv"
listaItem = "Dataset/Items_BMS1.txt"
# controllo gli eventuali argomenti di command line
try:
opts, args = getopt.getopt(sys.argv[1:], "hd:i:n:m:p:", ["dataset=", "items=", "n=", "m=", "p="])
except getopt.GetoptError:
print('Main.py \n'+
' -d <path del dataset>\n'+
' -i <path del file con i codici prodotti>\n'+
' -n <dimensione matrice quadrata>\n'+
' -m <numero attributi sensibili>\n'+
' -p <grado di privacy>')
sys.exit(2)
for opt, arg in opts:
if opt == '-h':
print('Main.py \n' +
' -d <path del dataset>\n' +
' -i <path del file con i codici prodotti>\n' +
' -n <dimensione matrice quadrata>\n' +
' -m <numero attributi sensibili>\n' +
' -p <grado di privacy>')
sys.exit()
elif opt in ("-d", "--dataset"):
nameFile = arg
elif opt in ("-i", "--items"):
listaItem = arg
elif opt in ("-n", "--n"):
dim_finale = int(arg)
elif opt in ("-m", "--m"):
num_sensibile = int(arg)
elif opt in ("-p", "--p"):
grado_privacy = int(arg)
print("Read Dataset")
# partenza cronometro per registrazione prestazioni
start_time = time.time()
print("Calcolo la band matrix" + "\n")
df = BandMatrix.BandMatrix(nameFile)
# calcolo matrice banda
df.compute_band_matrix(
dim_finale=dim_finale,
nome_file_item=listaItem,
num_sensibile=num_sensibile)
# applicazione algoritmo CAHD
cahd = CAHDalgorithm.CAHDalgorithm(
df,
grado_privacy=grado_privacy,
alfa=alpha)
print("Eseguo Anonimizzazione")
if cahd.CAHD_algorithm():
end_time = time.time() - start_time
print("Il tempo di esecuzione per il grado di privacy %s è %s" % (cahd.grado_privacy, end_time))
print("")
pr = OutputData.Printer(cahd, df)
pr.stampa_gruppi()
print("Control data")
pr.controllo_dati(control=True)