In [None]:
from google.colab import drive
drive.mount('/content/drive')

Mounted at /content/drive


In [None]:
import cv2
from sklearn.decomposition import MiniBatchDictionaryLearning

# Carica il video di input
vidcap = cv2.VideoCapture('/content/drive/MyDrive/Colab Notebooks/VIDEO/8_m.avi')

# Imposta i parametri per la codifica sparsa
# N.B La spiegazione dei parametri settati è riportata nella prossima cella 
n_components = 1
alpha = 1
batch_size = 3
n_iter = 1000
shuffle = True
random_state = None
positive_dict = False
transform_algorithm = 'omp'
transform_alpha = None
transform_n_nonzero_coefs = None

# Inizializza il modello di apprendimento del dizionario
dict_learning = MiniBatchDictionaryLearning(n_components=n_components)

# Loop attraverso i frame del video
while True:
    # Leggi il frame successivo
    ret, frame = vidcap.read()
  
    # Se non ci sono più frame, esci dal loop
    if not ret:
        break
    
    # Converti l'immagine in scala di grigi
    gray_frame = cv2.cvtColor(frame, cv2.COLOR_BGR2GRAY)
    
    # Appiattisci l'immagine in un array 1D
    flat_frame = gray_frame.flatten()
    
    # Apprendi il dizionario sparsificato dal frame corrente
    dict_learning.partial_fit([flat_frame])

# Recupera il dizionario appreso
dictionary = dict_learning.components_[0]

# Stampa il dizionario appreso e la sua forma
print("Dizionario appreso:\n", dictionary)
print("Forma del dizionario appreso:", dictionary.shape)

# Salva il dizionario in un file
#np.save('dictionary.npy', dictionary)

Dizionario appreso:
 [0.00574293 0.0057364  0.00573144 ... 0.00157428 0.00156792 0.00156357]
Forma del dizionario appreso: (60000,)


#Descrizione dell'algoritmo ♟
Il codice implementa l'algoritmo di apprendimento del dizionario MiniBatchDictionaryLearning della libreria Python Scikit-learn. Questo algoritmo è una variante del metodo K-SVD, che è un algoritmo di apprendimento del dizionario sparsificato.

In particolare, MiniBatchDictionaryLearning è un algoritmo di apprendimento non supervisionato che cerca di apprendere un dizionario sparsificato che può rappresentare in modo efficiente un insieme di dati. L'algoritmo utilizza una tecnica chiamata codifica sparsa per rappresentare i dati in termini di una combinazione lineare di componenti del dizionario. La sparsità della rappresentazione significa che solo un piccolo numero di componenti del dizionario contribuisce significativamente alla rappresentazione di un dato.

MiniBatchDictionaryLearning utilizza un approccio a batch per l'apprendimento del dizionario, il che significa che il dizionario viene appreso utilizzando solo un sottoinsieme dei dati di training alla volta. Ciò rende l'algoritmo molto efficiente in termini di memoria e può essere utilizzato per apprendere dizionari da grandi insiemi di dati.

L'algoritmo MiniBatchDictionaryLearning utilizza anche la regolarizzazione L1 per promuovere la sparsità della rappresentazione e può essere utilizzato con diversi algoritmi di codifica sparsa, come l'algoritmo Orthogonal Matching Pursuit (OMP) utilizzato in questo codice.



#Lista di parametri da modificare
*   ***n_components = 1***:  Numero di componenti del dizionario (default=1). In questo caso è impostato a 1, il che significa che il dizionario avrà una sola componente.

*  ***alpha = 1***: Coefficiente di regolarizzazione L1 (default=1). Un valore più alto di alpha aumenta la sparsità della rappresentazione.
*  ***batch_size = 3***:  Numero di campioni per batch (default=3). Un valore più alto di batch_size può portare a una maggiore efficienza computazionale.
*  ***n_iter = 1000***: Numero di iterazioni massime per l'apprendimento del dizionario (default=1000). Un valore più alto di n_iter può aumentare la precisione del modello, ma anche il tempo di esecuzione.
*  ***shuffle = True***: Se True, i campioni vengono mescolati prima di ogni iterazione (default=True). La mescolanza dei campioni può aiutare a evitare che il modello si concentri troppo su specifici campioni.

* ***random_state = None***:  Generatore di numeri casuali per la riproducibilità dei risultati (default=None). Se specificato, questo parametro consente di riprodurre i risultati in modo deterministico.
* ***positive_dict = False***: Se True, i componenti del dizionario sono vincolati ad avere solo valori positivi (default=False). Questo può essere utile quando si vogliono rappresentare solo segnali positivi.
* ***transform_algorithm = 'omp'***: Algoritmo di codifica sparsa (default='omp'). In questo caso, si utilizza l'algoritmo OMP (Orthogonal Matching Pursuit), che è un algoritmo iterativo per la codifica sparsa.
* ***transform_alpha = None***: Coefficiente di regolarizzazione per la codifica sparsa (default=None). Un valore più alto di transform_alpha aumenta la sparsità della rappresentazione.
* ***transform_n_nonzero_coefs = None***: Numero massimo di elementi non nulli nella rappresentazione sparsa (default=None). Questo parametro può essere utilizzato per controllare la sparsità della rappresentazione.


