In [8]:
import os
import librosa
import librosa.display
import matplotlib.pyplot as plt

In [9]:
from google.colab import drive
drive.mount('/content/drive')

Drive already mounted at /content/drive; to attempt to forcibly remount, call drive.mount("/content/drive", force_remount=True).


In [12]:
import cv2  # biblioteka graficzna opencv
import os   # functions for interacting with the operating system
import librosa  # biblioteka do przetwarzania dźwięku
import matplotlib.pyplot as plt  # biblioteka do wizualizacji
import librosa.display

def audio_to_image(indir, outdir):  # definicja funkcji

    # Tworzenie folderu wyjściowego, jeśli nie istnieje
    if not os.path.exists(outdir):
        os.makedirs(outdir)

    samples = []
    labels = []

    print('os.listdir(indir)=', os.listdir(indir))  # Test RB
    print('indir=', indir)  # Test RB

    for class_dir in os.listdir(indir):
        class_path = os.path.join(indir, class_dir)
        if not os.path.isdir(class_path):
            print(f"os.path.isdir({class_path})=", os.path.isdir(class_path))  # wypisanie nazwy klasy - czyli nazwy katalogu z którego pobierane są pliki audio
            continue

        # Tworzenie folderu wyjściowego dla klasy (gatunku), jeśli nie istnieje
        output_class_dir = os.path.join(outdir, class_dir)
        if os.path.exists(output_class_dir):
            print(f"Folder {output_class_dir} już istnieje, pomijam ten gatunek.")
            continue
        else:
            os.makedirs(output_class_dir)

        print("Loading:", class_dir)  # wypisanie nazwy klasy - czyli nazwy katalogu z którego pobierane są pliki audio
        the_class = class_dir

        for file in os.listdir(class_path):
            if file.endswith('.wav'):  # Upewnij się, że plik jest plikiem audio
                audio_path = os.path.join(class_path, file)

                # Wczytanie pliku audio i generowanie spektrogramu
                y, sr = librosa.load(audio_path, sr=None, duration=30.0)
                S = librosa.amplitude_to_db(abs(librosa.stft(y)), ref=1.0)

                # Rysowanie spektrogramu
                plt.figure(figsize=(10, 4))
                librosa.display.specshow(S, sr=sr, y_axis='log', x_axis='time')
                plt.title(f'{class_dir.upper()} Spectrogram')
                plt.colorbar(format='%+2.0f dB')
                plt.tight_layout()

                # Ścieżka do zapisu spektrogramu
                output_image_path = os.path.join(output_class_dir, file.replace('.wav', '.png'))
                plt.savefig(output_image_path, dpi=200)
                plt.close()

                # Dodanie ścieżek i etykiet do list
                samples.append(output_image_path)
                labels.append(the_class)

    return samples, labels

# Przykład użycia
indir = '/content/drive/MyDrive/genres_original'  # Katalog źródłowy z plikami audio
outdir = '/content/gtzan_spectrograms'  # Katalog do zapisu spektrogramów
samples, labels = audio_to_image(indir, outdir)

print('Loaded', len(samples), 'samples')  # Liczba spektrogramów
print('Classes:', set(labels))  # Unikalne etykiety klas

os.listdir(indir)= ['classical', 'rock', 'pop', 'disco', 'jazz', 'reggae', 'country', 'blues', 'hiphop', 'metal']
indir= /content/drive/MyDrive/genres_original
Folder /content/gtzan_spectrograms/classical już istnieje, pomijam ten gatunek.
Folder /content/gtzan_spectrograms/rock już istnieje, pomijam ten gatunek.
Folder /content/gtzan_spectrograms/pop już istnieje, pomijam ten gatunek.
Folder /content/gtzan_spectrograms/disco już istnieje, pomijam ten gatunek.
Loading: jazz
Folder /content/gtzan_spectrograms/reggae już istnieje, pomijam ten gatunek.
Folder /content/gtzan_spectrograms/country już istnieje, pomijam ten gatunek.
Folder /content/gtzan_spectrograms/blues już istnieje, pomijam ten gatunek.
Folder /content/gtzan_spectrograms/hiphop już istnieje, pomijam ten gatunek.
Folder /content/gtzan_spectrograms/metal już istnieje, pomijam ten gatunek.
Loaded 99 samples
Classes: {'jazz'}
