In [6]:

#Import needed libraries
import os
import numpy as np
import librosa
import librosa.display
import matplotlib.pyplot as plt
from tqdm import tqdm
import argparse


"""
Authors: Toufik FERHAT, Asma DAGMOUNE , Rayane KADEM
This script is used to create audio features dataset : 
    - Mel-spectrogram
    - MFCC
    - Chroma-stft
    - Chroma-cqt
    - Chroma-cens
    - CQT
The audio files dataset consists of 10 folders which correspond to 10 different genres and each folder contains 100 different audio files.
According to the choosed feature, it will create a dataset of images representing the audio files.
"""

def create_dataset(dataset_path_in, dataset_path_out, feature, n_fft, hop_length):
    """
    This function is used to create dataset of images.
    :param dataset_path_in: path of the dataset
    :param dataset_path_out : path of image dataset
    :param feature: feature to extract
    :param n_fft: number of fft points
    :param hop_length: number of samples between successive frames
    :return:
    """
    # Create the folders
    if not os.path.exists(dataset_path_out):
        os.makedirs(dataset_path_out)
    if not os.path.exists(dataset_path_out + "/" + feature):
        os.makedirs(dataset_path_out + "/" + feature)

    # Get the list of folders
    folders = os.listdir(dataset_path_in)
    # For each folder
    for folder in tqdm(folders):
        # Get the list of audio files
        files = os.listdir(dataset_path_in + "/" + folder)
        # For each audio file
        for file in tqdm(files):
            # Get the path of the audio file
            path = dataset_path_in + "/" + folder + "/" + file
            # Read the audio file
            y, sr = librosa.load(path)
            # Extract the feature
            if feature == "melspectrogram":
                image = librosa.feature.melspectrogram(y=y, sr=sr, n_fft=n_fft, hop_length=hop_length,n_mels=128)
            elif feature == "mfcc":
                image = librosa.feature.mfcc(y=y, sr=sr, n_mfcc=128)
            elif feature == "chroma_stft":
                image = librosa.feature.chroma_stft(y=y, sr=sr, n_fft=n_fft, hop_length=hop_length)
            elif feature == "chroma_cqt":
                image = librosa.feature.chroma_cqt(y=y, sr=sr,  hop_length=hop_length)
            elif feature == "chroma_cens":
                image = librosa.feature.chroma_cens(y=y, sr=sr, n_fft=n_fft, hop_length=hop_length)
            elif feature == "cqt":
                image = librosa.cqt(y=y, sr=sr, hop_length=hop_length,n_bins=128)
            
            # Ommit the .wav file extension file
            file = file[:-4]

            # Check if the folder exists
            if not os.path.exists(dataset_path_out + "/" + feature + "/" + folder):
                os.makedirs(dataset_path_out + "/" + feature + "/" + folder)
            
            # Librosa display 
            librosa.display.specshow(librosa.power_to_db(image, ref = np.max), sr =sr , hop_length = hop_length)
            # Ommit axis  
            plt.axis('off')
            plt.axis('tight')
            # Set padding to 0
            plt.tight_layout(pad=0)
                 
            # Save the image
            plt.savefig(dataset_path_out + "/" + feature + "/" + folder + "/" + file + ".png")
            # Close the plot
            plt.close()
            


        

create_dataset("data/genres", "data/images/nftt2048hop512bins128", "chroma_cqt", 2048, 512)

    


  0%|                                                                                           | 0/10 [00:00<?, ?it/s]
  0%|                                                                                          | 0/100 [00:00<?, ?it/s][A
  1%|▊                                                                                 | 1/100 [00:02<03:51,  2.34s/it][A
  2%|█▋                                                                                | 2/100 [00:03<02:13,  1.36s/it][A
  3%|██▍                                                                               | 3/100 [00:03<01:44,  1.08s/it][A
  4%|███▎                                                                              | 4/100 [00:04<01:33,  1.02it/s][A
  5%|████                                                                              | 5/100 [00:05<01:31,  1.04it/s][A
  6%|████▉                                                                             | 6/100 [00:06<01:24,  1.11it/s][A
  7%|█████▋        

 65%|████████████████████████████████████████████████████▋                            | 65/100 [00:56<00:23,  1.48it/s][A
 66%|█████████████████████████████████████████████████████▍                           | 66/100 [00:57<00:22,  1.48it/s][A
 67%|██████████████████████████████████████████████████████▎                          | 67/100 [00:57<00:21,  1.50it/s][A
 68%|███████████████████████████████████████████████████████                          | 68/100 [00:58<00:21,  1.51it/s][A
 69%|███████████████████████████████████████████████████████▉                         | 69/100 [00:59<00:20,  1.52it/s][A
 70%|████████████████████████████████████████████████████████▋                        | 70/100 [00:59<00:19,  1.52it/s][A
 71%|█████████████████████████████████████████████████████████▌                       | 71/100 [01:00<00:19,  1.51it/s][A
 72%|██████████████████████████████████████████████████████████▎                      | 72/100 [01:01<00:18,  1.52it/s][A
 73%|███████████

 29%|███████████████████████▍                                                         | 29/100 [00:21<00:46,  1.53it/s][A
 30%|████████████████████████▎                                                        | 30/100 [00:21<00:45,  1.53it/s][A
 31%|█████████████████████████                                                        | 31/100 [00:22<00:44,  1.54it/s][A
 32%|█████████████████████████▉                                                       | 32/100 [00:22<00:44,  1.54it/s][A
 33%|██████████████████████████▋                                                      | 33/100 [00:23<00:43,  1.55it/s][A
 34%|███████████████████████████▌                                                     | 34/100 [00:24<00:42,  1.54it/s][A
 35%|████████████████████████████▎                                                    | 35/100 [00:24<00:42,  1.54it/s][A
 36%|█████████████████████████████▏                                                   | 36/100 [00:25<00:41,  1.55it/s][A
 37%|███████████

 95%|████████████████████████████████████████████████████████████████████████████▉    | 95/100 [01:06<00:03,  1.39it/s][A
 96%|█████████████████████████████████████████████████████████████████████████████▊   | 96/100 [01:07<00:03,  1.28it/s][A
 97%|██████████████████████████████████████████████████████████████████████████████▌  | 97/100 [01:07<00:02,  1.32it/s][A
 98%|███████████████████████████████████████████████████████████████████████████████▍ | 98/100 [01:08<00:01,  1.33it/s][A
 99%|████████████████████████████████████████████████████████████████████████████████▏| 99/100 [01:09<00:00,  1.31it/s][A
100%|████████████████████████████████████████████████████████████████████████████████| 100/100 [01:10<00:00,  1.42it/s][A
 20%|████████████████▌                                                                  | 2/10 [02:30<09:53, 74.19s/it]
  0%|                                                                                          | 0/100 [00:00<?, ?it/s][A
  1%|▊             

 59%|███████████████████████████████████████████████▊                                 | 59/100 [00:48<00:31,  1.32it/s][A
 60%|████████████████████████████████████████████████▌                                | 60/100 [00:49<00:30,  1.31it/s][A
 61%|█████████████████████████████████████████████████▍                               | 61/100 [00:50<00:29,  1.31it/s][A
 62%|██████████████████████████████████████████████████▏                              | 62/100 [00:50<00:28,  1.32it/s][A
 63%|███████████████████████████████████████████████████                              | 63/100 [00:51<00:28,  1.30it/s][A
 64%|███████████████████████████████████████████████████▊                             | 64/100 [00:52<00:28,  1.28it/s][A
 65%|████████████████████████████████████████████████████▋                            | 65/100 [00:53<00:26,  1.31it/s][A
 66%|█████████████████████████████████████████████████████▍                           | 66/100 [00:53<00:25,  1.33it/s][A
 67%|███████████

 23%|██████████████████▋                                                              | 23/100 [00:19<01:02,  1.23it/s][A
 24%|███████████████████▍                                                             | 24/100 [00:20<01:02,  1.22it/s][A
 25%|████████████████████▎                                                            | 25/100 [00:20<00:58,  1.29it/s][A
 26%|█████████████████████                                                            | 26/100 [00:21<00:54,  1.35it/s][A
 27%|█████████████████████▊                                                           | 27/100 [00:22<00:56,  1.30it/s][A
 28%|██████████████████████▋                                                          | 28/100 [00:22<00:53,  1.35it/s][A
 29%|███████████████████████▍                                                         | 29/100 [00:23<00:51,  1.39it/s][A
 30%|████████████████████████▎                                                        | 30/100 [00:24<00:50,  1.40it/s][A
 31%|███████████

 89%|████████████████████████████████████████████████████████████████████████         | 89/100 [01:07<00:07,  1.43it/s][A
 90%|████████████████████████████████████████████████████████████████████████▉        | 90/100 [01:08<00:06,  1.46it/s][A
 91%|█████████████████████████████████████████████████████████████████████████▋       | 91/100 [01:09<00:06,  1.47it/s][A
 92%|██████████████████████████████████████████████████████████████████████████▌      | 92/100 [01:09<00:05,  1.46it/s][A
 93%|███████████████████████████████████████████████████████████████████████████▎     | 93/100 [01:10<00:04,  1.47it/s][A
 94%|████████████████████████████████████████████████████████████████████████████▏    | 94/100 [01:11<00:04,  1.48it/s][A
 95%|████████████████████████████████████████████████████████████████████████████▉    | 95/100 [01:11<00:03,  1.46it/s][A
 96%|█████████████████████████████████████████████████████████████████████████████▊   | 96/100 [01:12<00:02,  1.48it/s][A
 97%|███████████

 53%|██████████████████████████████████████████▉                                      | 53/100 [00:35<00:31,  1.47it/s][A
 54%|███████████████████████████████████████████▋                                     | 54/100 [00:36<00:31,  1.47it/s][A
 55%|████████████████████████████████████████████▌                                    | 55/100 [00:37<00:30,  1.49it/s][A
 56%|█████████████████████████████████████████████▎                                   | 56/100 [00:37<00:29,  1.50it/s][A
 57%|██████████████████████████████████████████████▏                                  | 57/100 [00:38<00:28,  1.51it/s][A
 58%|██████████████████████████████████████████████▉                                  | 58/100 [00:39<00:27,  1.52it/s][A
 59%|███████████████████████████████████████████████▊                                 | 59/100 [00:39<00:27,  1.51it/s][A
 60%|████████████████████████████████████████████████▌                                | 60/100 [00:40<00:26,  1.51it/s][A
 61%|███████████

 17%|█████████████▊                                                                   | 17/100 [00:11<00:56,  1.47it/s][A
 18%|██████████████▌                                                                  | 18/100 [00:12<00:55,  1.47it/s][A
 19%|███████████████▍                                                                 | 19/100 [00:12<00:54,  1.48it/s][A
 20%|████████████████▏                                                                | 20/100 [00:13<00:53,  1.51it/s][A
 21%|█████████████████                                                                | 21/100 [00:14<00:52,  1.50it/s][A
 22%|█████████████████▊                                                               | 22/100 [00:14<00:52,  1.50it/s][A
 23%|██████████████████▋                                                              | 23/100 [00:15<00:51,  1.51it/s][A
 24%|███████████████████▍                                                             | 24/100 [00:16<00:50,  1.49it/s][A
 25%|███████████

 83%|███████████████████████████████████████████████████████████████████▏             | 83/100 [00:56<00:11,  1.51it/s][A
 84%|████████████████████████████████████████████████████████████████████             | 84/100 [00:56<00:10,  1.47it/s][A
 85%|████████████████████████████████████████████████████████████████████▊            | 85/100 [00:57<00:10,  1.48it/s][A
 86%|█████████████████████████████████████████████████████████████████████▋           | 86/100 [00:58<00:09,  1.49it/s][A
 87%|██████████████████████████████████████████████████████████████████████▍          | 87/100 [00:58<00:08,  1.47it/s][A
 88%|███████████████████████████████████████████████████████████████████████▎         | 88/100 [00:59<00:08,  1.49it/s][A
 89%|████████████████████████████████████████████████████████████████████████         | 89/100 [01:00<00:07,  1.49it/s][A
 90%|████████████████████████████████████████████████████████████████████████▉        | 90/100 [01:00<00:06,  1.49it/s][A
 91%|███████████

 47%|██████████████████████████████████████                                           | 47/100 [00:32<00:38,  1.38it/s][A
 48%|██████████████████████████████████████▉                                          | 48/100 [00:33<00:36,  1.41it/s][A
 49%|███████████████████████████████████████▋                                         | 49/100 [00:33<00:35,  1.44it/s][A
 50%|████████████████████████████████████████▌                                        | 50/100 [00:34<00:37,  1.34it/s][A
 51%|█████████████████████████████████████████▎                                       | 51/100 [00:35<00:37,  1.30it/s][A
 52%|██████████████████████████████████████████                                       | 52/100 [00:36<00:37,  1.26it/s][A
 53%|██████████████████████████████████████████▉                                      | 53/100 [00:36<00:35,  1.34it/s][A
 54%|███████████████████████████████████████████▋                                     | 54/100 [00:37<00:35,  1.30it/s][A
 55%|███████████

 11%|████████▉                                                                        | 11/100 [00:07<01:00,  1.48it/s][A
 12%|█████████▋                                                                       | 12/100 [00:08<00:59,  1.48it/s][A
 13%|██████████▌                                                                      | 13/100 [00:08<00:59,  1.47it/s][A
 14%|███████████▎                                                                     | 14/100 [00:09<00:58,  1.47it/s][A
 15%|████████████▏                                                                    | 15/100 [00:10<00:57,  1.48it/s][A
 16%|████████████▉                                                                    | 16/100 [00:10<00:56,  1.49it/s][A
 17%|█████████████▊                                                                   | 17/100 [00:11<00:55,  1.50it/s][A
 18%|██████████████▌                                                                  | 18/100 [00:12<00:54,  1.50it/s][A
 19%|███████████

 77%|██████████████████████████████████████████████████████████████▎                  | 77/100 [00:52<00:15,  1.50it/s][A
 78%|███████████████████████████████████████████████████████████████▏                 | 78/100 [00:53<00:14,  1.51it/s][A
 79%|███████████████████████████████████████████████████████████████▉                 | 79/100 [00:54<00:13,  1.51it/s][A
 80%|████████████████████████████████████████████████████████████████▊                | 80/100 [00:54<00:13,  1.44it/s][A
 81%|█████████████████████████████████████████████████████████████████▌               | 81/100 [00:55<00:14,  1.31it/s][A
 82%|██████████████████████████████████████████████████████████████████▍              | 82/100 [00:56<00:13,  1.31it/s][A
 83%|███████████████████████████████████████████████████████████████████▏             | 83/100 [00:57<00:13,  1.31it/s][A
 84%|████████████████████████████████████████████████████████████████████             | 84/100 [00:58<00:12,  1.26it/s][A
 85%|███████████

 41%|█████████████████████████████████▏                                               | 41/100 [00:31<00:39,  1.49it/s][A
 42%|██████████████████████████████████                                               | 42/100 [00:32<00:38,  1.49it/s][A
 43%|██████████████████████████████████▊                                              | 43/100 [00:32<00:38,  1.49it/s][A
 44%|███████████████████████████████████▋                                             | 44/100 [00:33<00:37,  1.49it/s][A
 45%|████████████████████████████████████▍                                            | 45/100 [00:34<00:37,  1.49it/s][A
 46%|█████████████████████████████████████▎                                           | 46/100 [00:34<00:36,  1.49it/s][A
 47%|██████████████████████████████████████                                           | 47/100 [00:35<00:35,  1.51it/s][A
 48%|██████████████████████████████████████▉                                          | 48/100 [00:36<00:34,  1.51it/s][A
 49%|███████████

  5%|████                                                                              | 5/100 [00:03<01:05,  1.46it/s][A
  6%|████▉                                                                             | 6/100 [00:04<01:04,  1.47it/s][A
  7%|█████▋                                                                            | 7/100 [00:04<01:02,  1.48it/s][A
  8%|██████▌                                                                           | 8/100 [00:05<01:05,  1.41it/s][A
  9%|███████▍                                                                          | 9/100 [00:06<01:08,  1.33it/s][A
 10%|████████                                                                         | 10/100 [00:07<01:06,  1.36it/s][A
 11%|████████▉                                                                        | 11/100 [00:07<01:05,  1.36it/s][A
 12%|█████████▋                                                                       | 12/100 [00:08<01:03,  1.39it/s][A
 13%|██████████▌

 71%|█████████████████████████████████████████████████████████▌                       | 71/100 [00:54<00:20,  1.45it/s][A
 72%|██████████████████████████████████████████████████████████▎                      | 72/100 [00:55<00:19,  1.45it/s][A
 73%|███████████████████████████████████████████████████████████▏                     | 73/100 [00:56<00:18,  1.44it/s][A
 74%|███████████████████████████████████████████████████████████▉                     | 74/100 [00:56<00:18,  1.43it/s][A
 75%|████████████████████████████████████████████████████████████▊                    | 75/100 [00:57<00:17,  1.45it/s][A
 76%|█████████████████████████████████████████████████████████████▌                   | 76/100 [00:58<00:16,  1.45it/s][A
 77%|██████████████████████████████████████████████████████████████▎                  | 77/100 [00:58<00:16,  1.43it/s][A
 78%|███████████████████████████████████████████████████████████████▏                 | 78/100 [00:59<00:15,  1.43it/s][A
 79%|███████████