Nella cartella *files* trovi 8 file:
- 2 file di testo
- 2 file audio
- 4 immagini,

con varie estensioni.

**Step 1**

Inizia creando, in un notebook, uno script Python che iteri in ordine alfabetico sui file della cartella files e, a seconda del tipo (audio, documento, immagine), li sposti nella relativa sottocartella (qui sotto trovi un esempio). Se la sottocartella non esiste, il tuo script dovrà crearla automaticamente.

Durante il ciclo, lo script deve stampare le informazioni dei file: nome, tipo e dimensione in byte. Questo è l'output desiderato:

In [1]:
# Si imprtano le librerie necessarie per lo svolgimento
import numpy as np
import os
from pathlib import Path
import shutil
import pandas as pd

# Di seguito si va a selezionare la cartella su cui si andrà a lavorare
directory = os.fsencode('files')

# Si creano 3 liste per salvare rispettivamente nome del file, tipe e dimensione
list_names = []
list_types = []
list_sizes = []

# Si crea una variabile booleana per aiutarsi a verificare l' esistenza del file recap.csv
recap_exists = False

# Si inizializza un ciclo for sui file che sono contenuti nella directory
for file_enc in sorted(os.listdir(directory)):
    
    # Si trasformano i file da variabile byte(file_enc) a stringa 
    file = os.fsdecode(file_enc)
    # Si salva il percorso completo in una variabile
    full_path = os.path.join('files',file)

    # Si controlla che vengano considerati solamente i file e non le sottocartelle che si andrà a creare
    if not os.path.isfile(full_path):
        continue
    
    # Si verifica l' esistenza del file recap.csv
    if 'recap.csv' == file:
        recap_exists = True
        continue
    
    # Variabile che contiene solo il nome del file senza estensione
    file_name = Path(file).stem
    # Variabile che contiene la dimensione del file in Byte
    file_size = os.path.getsize(full_path)
    
    # Si creano 2 liste a cui si aggiungeranno i nomi e le dimensioni dei file
    list_names.append(file_name)
    list_sizes.append(file_size)

    # Si convertono tutti file in minuscolo per un controllo migliore
    file_lower = file.lower()

    # Di seguito si va a dividere i file in base alla loro estensione
    
    if file_lower.endswith(('.txt', '.odt')):      
        # Variabile tipo e cartella di destinazione per i file di tipo documento
        file_type = 'doc'
        dest_folder = 'Docs'
        
    elif file_lower.endswith(('.jpg', '.jpeg', '.png')):
        # Variabile tipo e cartella di destinazione per i file di tipo immagine
        file_type = 'image'
        dest_folder = 'Images'

    elif file_lower.endswith('.mp3'):
        # Variabile tipo e cartella di destinazione per i file di tipo audio
        file_type = 'audio'
        dest_folder = 'Audio'

    else:
        # Variabile di controllo per i file di tipo sconosciuto
        file_type = 'unknown'
        # Non viene assegnato nessun valore alla cartella di destinazione dei file sconosciuti
        dest_folder = None

    # Lista dei tipi a cui verrà aggiunto il tipo di ogni singolo file
    list_types.append(file_type)
    # Si stampa a schermo un riepilogo contenente nome, tipo di file e dimensione in Byte(B)
    print(file_name, f'type:{file_type}', f'size:{file_size}B')

    # Se è stato assegnato un nome alla sottocartella di destinazione allora vi sposteremo il file
    if dest_folder:
        # Variabile con il percorso della sottocartella
        dest_path = os.path.join('files', dest_folder)
        # Si crea la sottocartella se non esiste
        os.makedirs(dest_path, exist_ok=True)
        # Si sposta il file nella sottocartella con il percorso dest_path
        shutil.move(full_path, os.path.join(dest_path, file))

# Si crea un dizionario con tutti i dati contenuti nella lista
dict_recap = {
    'name' : list_names,
    'type' : list_types,
    'size(B)' : list_sizes
}
# Variabile con il percorso dove salvare il file di recap.csv 
csv_path = 'files/recap.csv'
# Si crea il DataFrame dal dizionario contenente tutti i dati utili per il recap.csv
df_recap = pd.DataFrame(dict_recap)

# Se il file recap.csv esiste già si aggiorna il csv
if recap_exists:
    df_recap.to_csv(csv_path, mode='a', header=False, index=False)
# Se il recap.csv non esiste viene creato
else:
    df_recap.to_csv(csv_path, index=False)

bw type:image size:94926B
ciao type:doc size:12B
daffodil type:image size:24657B
eclipse type:image size:64243B
pippo type:doc size:8299B
song2 type:audio size:764176B
trump type:image size:10195B


In [None]:
#FILL ME

bw type:image size:94926B
ciao type:doc size:12B
daffodil type:image size:24657B
eclipse type:image size:64243B
pippo type:doc size:8299B
song1 type:audio size:1087849B
song2 type:audio size:764176B
trump type:image size:10195B


Oltre a stamparne le informazioni via via che li sposti, tieni traccia dei file creando un documento *recap.csv* con le stesse informazioni. Trovi un esempio in questa cartella.

La struttura finale della cartella files dovrà essere:

        - files            
            - audio
                - song1.mp3
                - song2.mp3
            - docs
                - ciao.txt
                - pippo.odt
            - images
                - bw.png
                - daffodil.jpg
                - eclipse.png
                - trump.jpeg    
            - recap.csv

Commenta il codice con i passaggi che fai. Questo vale anche per i prossimi Step.

**Attenzione**: lo script, ogni volta che viene lanciato per spostare nuovi file, deve *aggiornare* (e non sovrascrivere) le sottocartelle e il file di recap. Per controllare che tutto funzioni correttamente, puoi aggiungere altri file alla cartella files e fare un test; oppure, puoi dividere gli 8 file originali in due gruppi e lasciarne uno per il test.

**Consiglio**: puoi usare le librerie *os*, *shutil* e *csv*. 
                
---

**Step 2**

Inserisci lo script che hai creato in un piccolo eseguibile (chiamalo *addfile.py* e posizionalo in questa cartella, a fianco del notebook) dotato di *interfaccia a linea di comando* (CLI).

Lo scopo dell'eseguibile è spostare un *singolo* file (che si trova nella cartella files) nella sottocartella di competenza, aggiornando il recap.

L'interfaccia dell'eseguibile ha come unico argomento (obbligatorio) il nome del file da spostare (comprensivo di formato, es: 'trump.jpeg'). Nel caso in cui il file passato come argomento non esista, l'interfaccia deve comunicarlo all'utente.

**Consiglio**: oltre alle precedenti, puoi usare le librerie *sys* e *argparse*.

---

**Step 3**

Una immagine in scala di grigio ha un solo livello di colore, una RGB ne ha 3, una RGBA 4 (l'ultimo è detto canale *alpha*).

Il modulo *Image* della libreria *PIL* permette di caricare un'immagine, che può essere trasformata in un array NumPy attraverso la funzione *np.array*. A partire da tale array, è possibile capire se l'immagine caricata è in scala di grigio, RGB o RGBA.

Aggiungi al notebook dello Step 1 uno script che iteri sulla sottocartella *images* e costruisca una tabella riassuntiva come questa (prodotta con la libreria *tabulate*):

In [None]:
# Si importano le librerie necessarie per lo svolgimento
from PIL import Image
from tabulate import tabulate

# Si seleziona la cartella di interesse
image_dir = os.fsencode('files/Images')

# Si inizializzano 1 lista per salvare le varie medie dei signoli colori
list_stats = []

# Si utilizza un ciclo for per scorrere tutti i file della cartella
for im_enc in sorted(os.listdir(image_dir)):

    # Si trasformano i file da formato byte a stringa
    im_dec = os.fsdecode(im_enc)
    # Si salva il percorso completo del file in una variabile
    path_img = os.path.join(os.fsdecode(image_dir),im_dec)
    # Si apre l'immagine selezionata dal percorso path_img
    im = Image.open(path_img)
    # Si converte l'immagine in vettore numpy
    im_array = np.array(im)
    # Si salva la dimensione della matrice in una variabile
    shape = im_array.shape
    col_mean = im_array.mean(axis=(0,1))
    # Si da un valore di default alle variabili
    grayscale = red = green = blue = alpha = 0.0
    
    # Si va a dividere i vari casi di immagine che può esistere
    # Si avrà una scala di grigi nel caso di una matrice M x N
    if len(shape) == 2:
        grayscale = float(col_mean)
    # Si avrà un' immagine a colori nel caso di una matrice M x N x L
    # Si va a classificare l' immagine come RGB se L = 3
    elif len(shape) == 3:
        # Variabili rappresentanti i vari canali RGB
        red = float(col_mean[0]) # media del canale rosso
        green = float(col_mean[1]) # media del canale verde
        blue = float(col_mean[2]) # media del canale blu
        # Si va a considerare il canale alpha per immagini RGBA, cioè L = 4
        if shape[2] == 4:
            alpha = float(col_mean[3]) # media del canale alpha
    # Si inserisce un controllo per il mancato riconoscimento di un formato
    else:
        print('Formato non riconosciuto')
    # Si va a creare una lista di dizionari che contengono i valori da mostrare nella tabella
    list_stats.append({
        'name' : Path(path_img).stem,
        'height' : shape[0],
        'width' : shape[1],
        'grayscale' : grayscale,
        'R' : red,
        'G' : green,
        'B' : blue,
        'ALPHA' : alpha
    })
# Si va a stampare a schermo la tabella
print(tabulate(list_stats,headers='keys', tablefmt='fancy_grid',floatfmt= '.2f'))

╒══════════╤══════════╤═════════╤═════════════╤════════╤════════╤═══════╤═════════╕
│ name     │   height │   width │   grayscale │      R │      G │     B │   ALPHA │
╞══════════╪══════════╪═════════╪═════════════╪════════╪════════╪═══════╪═════════╡
│ bw       │      512 │     512 │       21.48 │   0.00 │   0.00 │  0.00 │    0.00 │
├──────────┼──────────┼─────────┼─────────────┼────────┼────────┼───────┼─────────┤
│ daffodil │      500 │     335 │        0.00 │ 109.23 │  85.52 │  4.77 │    0.00 │
├──────────┼──────────┼─────────┼─────────────┼────────┼────────┼───────┼─────────┤
│ eclipse  │      256 │     256 │        0.00 │ 109.05 │ 109.52 │ 39.85 │  133.59 │
├──────────┼──────────┼─────────┼─────────────┼────────┼────────┼───────┼─────────┤
│ trump    │      183 │     275 │        0.00 │  97.01 │  98.99 │ 90.92 │    0.00 │
╘══════════╧══════════╧═════════╧═════════════╧════════╧════════╧═══════╧═════════╛


In [11]:
#FILL ME

╒══════════╤══════════╤═════════╤═════════════╤════════╤════════╤═══════╤═════════╕
│ name     │   height │   width │   grayscale │      R │      G │     B │   ALPHA │
╞══════════╪══════════╪═════════╪═════════════╪════════╪════════╪═══════╪═════════╡
│ bw       │      512 │     512 │       21.48 │   0.00 │   0.00 │  0.00 │    0.00 │
├──────────┼──────────┼─────────┼─────────────┼────────┼────────┼───────┼─────────┤
│ daffodil │      500 │     335 │        0.00 │ 109.25 │  85.56 │  4.97 │    0.00 │
├──────────┼──────────┼─────────┼─────────────┼────────┼────────┼───────┼─────────┤
│ eclipse  │      256 │     256 │        0.00 │ 109.05 │ 109.52 │ 39.85 │  133.59 │
├──────────┼──────────┼─────────┼─────────────┼────────┼────────┼───────┼─────────┤
│ trump    │      183 │     275 │        0.00 │  97.01 │  98.99 │ 90.92 │    0.00 │
╘══════════╧══════════╧═════════╧═════════════╧════════╧════════╧═══════╧═════════╛


Oltre al nome del file, la tabella riporta:

- altezza dell'immagine, in pixel
- larghezza dell'immagine, in pixel
- se l'immagine è in scala di grigio, la colonna *grayscale* indica la media dei valori dell'unico livello di colore
- se l'immagine è a colori, le altre colonne indicano la media dei valori di ogni livello di colore.

---

**Dovrai consegnare**:
- un notebook con gli Step 1 e 3; per semplicità puoi chiamarlo come questo
- addfile.py con quanto richiesto dallo Step 2.