In [2]:
import os
import librosa
import shutil
from tqdm import tqdm

def get_silence_duration(audio_path):
    """ Calcola la durata del silenzio in un file audio """
    try:
        y, sr = librosa.load(audio_path, sr=None)
        silence = librosa.effects.split(y, top_db=20)
        non_silence_duration = sum([s[1] - s[0] for s in silence]) / sr
        # Correggi la chiamata a get_duration qui sotto
        total_duration = librosa.get_duration(y=y, sr=sr)
        silence_duration = total_duration - non_silence_duration
        return silence_duration
    except Exception as e:
        print(f"Errore nel processare {audio_path}: {e}")
        return None  # Restituire None per i file che non possono essere processati

def cleanup_directory(directory, max_files=8000):
    """ Pulisce le directory che hanno più di `max_files` mantenendo quelli con meno silenzio """
    for root, dirs, files in os.walk(directory):
        audio_files = [os.path.join(root, file) for file in files if file.endswith(('.wav', '.mp3'))]
        if len(audio_files) > max_files:
            print(f"Analizzando la cartella: {root} con {len(audio_files)} files")
            # Calcola la durata del silenzio per ciascun file
            silence_durations = {file: get_silence_duration(file) for file in tqdm(audio_files, desc="Calcolando silenzio")}
            # Ordina i file dalla minor durata di silenzio alla maggiore (preserva più contenuto audio significativo)
            sorted_files = sorted(silence_durations, key=silence_durations.get, reverse=True)
            # Elimina i file meno significativi per scendere a 8000
            files_to_delete = sorted_files[max_files:]
            for file in files_to_delete:
                os.remove(file)
            print(f"Eliminati {len(files_to_delete)} files dalla cartella {root}.")

# Specifica la directory principale da analizzare
root_directory = 'NuovoDataset/Segmented'
cleanup_directory(root_directory)


Analizzando la cartella: NuovoDataset/Segmented/Target/Tug con 10162 files



Calcolando silenzio:   0%|          | 0/10162 [00:00<?, ?it/s][A
Calcolando silenzio:   0%|          | 24/10162 [00:00<00:43, 235.37it/s][A
Calcolando silenzio:   0%|          | 49/10162 [00:00<00:41, 241.85it/s][A
Calcolando silenzio:   1%|          | 75/10162 [00:00<00:40, 246.50it/s][A
Calcolando silenzio:   1%|          | 101/10162 [00:00<00:40, 248.60it/s][A
Calcolando silenzio:   1%|          | 127/10162 [00:00<00:40, 249.55it/s][A
Calcolando silenzio:   2%|▏         | 153/10162 [00:00<00:39, 250.93it/s][A
Calcolando silenzio:   2%|▏         | 179/10162 [00:00<00:39, 251.67it/s][A
Calcolando silenzio:   2%|▏         | 205/10162 [00:00<00:39, 251.82it/s][A
Calcolando silenzio:   2%|▏         | 231/10162 [00:00<00:39, 252.83it/s][A
Calcolando silenzio:   3%|▎         | 257/10162 [00:01<00:39, 252.12it/s][A
Calcolando silenzio:   3%|▎         | 283/10162 [00:01<00:38, 253.32it/s][A
Calcolando silenzio:   3%|▎         | 309/10162 [00:01<00:38, 253.41it/s][A
Calcolando s

Eliminati 2162 files dalla cartella NuovoDataset/Segmented/Target/Tug.
Analizzando la cartella: NuovoDataset/Segmented/Target/Cargo con 9671 files



Calcolando silenzio:   0%|          | 0/9671 [00:00<?, ?it/s][A
Calcolando silenzio:   0%|          | 25/9671 [00:00<00:39, 246.55it/s][A
Calcolando silenzio:   1%|          | 51/9671 [00:00<00:37, 253.28it/s][A
Calcolando silenzio:   1%|          | 77/9671 [00:00<00:37, 255.01it/s][A
Calcolando silenzio:   1%|          | 103/9671 [00:00<00:37, 251.91it/s][A
Calcolando silenzio:   1%|▏         | 129/9671 [00:00<00:37, 251.33it/s][A
Calcolando silenzio:   2%|▏         | 156/9671 [00:00<00:37, 254.40it/s][A
Calcolando silenzio:   2%|▏         | 182/9671 [00:00<00:37, 255.23it/s][A
Calcolando silenzio:   2%|▏         | 208/9671 [00:00<00:37, 255.31it/s][A
Calcolando silenzio:   2%|▏         | 234/9671 [00:00<00:37, 255.04it/s][A
Calcolando silenzio:   3%|▎         | 260/9671 [00:01<00:36, 256.30it/s][A
Calcolando silenzio:   3%|▎         | 286/9671 [00:01<00:36, 257.21it/s][A
Calcolando silenzio:   3%|▎         | 312/9671 [00:01<00:36, 256.40it/s][A
Calcolando silenzio:   3%

Eliminati 1671 files dalla cartella NuovoDataset/Segmented/Target/Cargo.
Analizzando la cartella: NuovoDataset/Segmented/Target/Passengership con 11728 files



Calcolando silenzio:   0%|          | 0/11728 [00:00<?, ?it/s][A
Calcolando silenzio:   0%|          | 26/11728 [00:00<00:46, 253.21it/s][A
Calcolando silenzio:   0%|          | 53/11728 [00:00<00:44, 260.30it/s][A
Calcolando silenzio:   1%|          | 80/11728 [00:00<00:44, 262.12it/s][A
Calcolando silenzio:   1%|          | 107/11728 [00:00<00:44, 262.31it/s][A
Calcolando silenzio:   1%|          | 134/11728 [00:00<00:44, 262.74it/s][A
Calcolando silenzio:   1%|▏         | 161/11728 [00:00<00:44, 260.53it/s][A
Calcolando silenzio:   2%|▏         | 188/11728 [00:00<00:44, 260.49it/s][A
Calcolando silenzio:   2%|▏         | 215/11728 [00:00<00:44, 261.27it/s][A
Calcolando silenzio:   2%|▏         | 242/11728 [00:00<00:44, 259.10it/s][A
Calcolando silenzio:   2%|▏         | 269/11728 [00:01<00:44, 259.42it/s][A
Calcolando silenzio:   3%|▎         | 296/11728 [00:01<00:43, 260.16it/s][A
Calcolando silenzio:   3%|▎         | 323/11728 [00:01<00:43, 262.49it/s][A
Calcolando s

Eliminati 3728 files dalla cartella NuovoDataset/Segmented/Target/Passengership.
Analizzando la cartella: NuovoDataset/Segmented/Target/Tanker con 11221 files



Calcolando silenzio:   0%|          | 0/11221 [00:00<?, ?it/s][A
Calcolando silenzio:   0%|          | 26/11221 [00:00<00:44, 251.84it/s][A
Calcolando silenzio:   0%|          | 52/11221 [00:00<00:43, 256.03it/s][A
Calcolando silenzio:   1%|          | 79/11221 [00:00<00:42, 259.26it/s][A
Calcolando silenzio:   1%|          | 106/11221 [00:00<00:42, 260.59it/s][A
Calcolando silenzio:   1%|          | 133/11221 [00:00<00:42, 261.87it/s][A
Calcolando silenzio:   1%|▏         | 160/11221 [00:00<00:42, 260.59it/s][A
Calcolando silenzio:   2%|▏         | 187/11221 [00:00<00:42, 260.79it/s][A
Calcolando silenzio:   2%|▏         | 214/11221 [00:00<00:42, 260.73it/s][A
Calcolando silenzio:   2%|▏         | 241/11221 [00:00<00:42, 260.80it/s][A
Calcolando silenzio:   2%|▏         | 268/11221 [00:01<00:41, 262.81it/s][A
Calcolando silenzio:   3%|▎         | 295/11221 [00:01<00:41, 261.63it/s][A
Calcolando silenzio:   3%|▎         | 322/11221 [00:01<00:41, 261.64it/s][A
Calcolando s

Eliminati 3221 files dalla cartella NuovoDataset/Segmented/Target/Tanker.
