Tecniche di classificazione mono-classe per problemi di medicina legale.
Questo modulo permette di effettuare delle Nested Cross-Validation sul dataset run-over, utilizzando diversi algoritmi: OneClassSVM, LocalOutlierFactor e IsolationForest, e utilizzando diverse tecniche per la riduzione delle dimensionalità: PCA, TruncatedSVD, FastICA e EncoderMLP (una classe per la riduzione presente nel modulo basata su un MLPRegressor).
Assicurati di avere installato Anaconda sul tuo sistema. Anaconda è una distribuzione di Python che include una serie di pacchetti scientifici e strumenti di gestione degli ambienti virtuali.
-
Creazione di un Ambiente Virtuale:
Apri il terminale (o Anaconda Prompt su Windows) e crea un nuovo ambiente virtuale con Python 3.8 (o altra versione supportata):
conda create --name nested_cv_env python=3.8
-
Attivazione dell'Ambiente Virtuale
conda activate nested_cv_env
-
Installazione delle dipendenze
Apri il terminale e installa le dipendenze con pip:
pip install numpy pip install pandas pip install sklearn
-
Importa il modulo
Assicurati che il modulo importato sia nella tua directory di lavoro:
from mltools import load_csv
-
Caricamento del Dataset
Carica il dataset relativo:
from mltools import load_csv X = load_csv(reduced=True)
-
Esecuzione della Nested Cross-Validation
Esegui la Nested Cross-Validation specificando i parametri necessari:
from mltools import load_csv, nested_cv_svm, get_random_seed from sklearn.decomposition import PCA X = load_csv(reduced=True) random_seed = get_random_seed() nested_cv_svm(X, random_seed, PCA, 'nested_cv_svm_pca.log', n_components=85)