In [2]:
import pandas as pd
import numpy as np
import librosa
import os
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import LabelEncoder

In [4]:
# Diretório onde os gêneros estão localizados
data_dir = 'Data/genres_original'

# Lista para armazenar as features e os rótulos
features = []
labels = []

# Iterar sobre cada gênero no diretório
for genre in os.listdir(data_dir):
    genre_path = os.path.join(data_dir, genre)
    if os.path.isdir(genre_path):
        print(f"Processando gênero: {genre}")
        # Iterar sobre cada arquivo de áudio no subdiretório
        for filename in os.listdir(genre_path):
            if filename.endswith('.wav'):
                file_path = os.path.join(genre_path, filename)
                
                # Carregar o arquivo de áudio
                y, sr = librosa.load(file_path, mono=True, duration=30)
                
                # Extrair os MFCCs
                mfccs = librosa.feature.mfcc(y=y, sr=sr, n_mfcc=40)
                
                # Calcular a média dos MFCCs para simplificar a representação
                mfccs_mean = np.mean(mfccs.T, axis=0)
                
                features.append(mfccs_mean)
                labels.append(genre)

# Transformar as listas em DataFrames
df_features = pd.DataFrame(features)
df_features['genre'] = labels

# Exibir as primeiras linhas do DataFrame final
print("\nDataFrame de Features:")
print(df_features.head())

Processando gênero: blues
Processando gênero: classical
Processando gênero: country
Processando gênero: disco
Processando gênero: hiphop
Processando gênero: jazz
Processando gênero: metal
Processando gênero: pop
Processando gênero: reggae
Processando gênero: rock

DataFrame de Features:
            0           1          2          3          4          5  \
0 -113.619385  121.553017 -19.151058  42.345768  -6.371168  18.613033   
1 -207.581512  123.997147   8.939115  35.870758   2.919971  21.518787   
2  -90.776344  140.448608 -29.100559  31.687340 -13.975971  25.741682   
3 -199.462006  150.094727   5.649167  26.870144   1.755441  14.236880   
4 -160.291855  126.195770 -35.602501  22.151169 -32.487640  10.862022   

           6          7          8          9  ...        31        32  \
0 -13.692060  15.339378 -12.283618  10.973776  ... -3.270344 -0.203871   
1  -8.555368  23.355938 -10.101037  11.906445  ... -3.751413 -4.099237   
2 -13.644712  11.623112 -11.775921   9.700466  ... 

In [5]:
# Codificar os rótulos de texto para números
le = LabelEncoder()
df_features['genre_encoded'] = le.fit_transform(df_features['genre'])

# Separar features (X) e rótulos (y)
X = df_features.drop(['genre', 'genre_encoded'], axis=1)
y = df_features['genre_encoded']

# Dividir os dados em treino e teste
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42, stratify=y)

print("\nShape dos conjuntos de dados:")
print("X_train:", X_train.shape)
print("X_test:", X_test.shape)
print("y_train:", y_train.shape)
print("y_test:", y_test.shape)

# Salve os dados processados para a próxima etapa
X_train.to_csv('X_train_music.csv', index=False)
X_test.to_csv('X_test_music.csv', index=False)
y_train.to_csv('y_train_music.csv', index=False)
y_test.to_csv('y_test_music.csv', index=False)


Shape dos conjuntos de dados:
X_train: (799, 40)
X_test: (200, 40)
y_train: (799,)
y_test: (200,)


In [6]:
# Transformar as listas em DataFrames
df_features = pd.DataFrame(features)
df_features['genre'] = labels

# Exibir as primeiras linhas do DataFrame final para confirmação
print("\nDataFrame de Features:")
print(df_features.head())

# ==========================================================
# Adicione este bloco para salvar o DataFrame
# ==========================================================
# Crie a pasta 'data' se ela ainda não existir
import os
if not os.path.exists('data'):
    os.makedirs('data')

# Salve o DataFrame completo na pasta 'data'
df_features.to_csv('data/df_features.csv', index=False)

print("\nDataFrame df_features.csv salvo com sucesso na pasta 'data'!")


DataFrame de Features:
            0           1          2          3          4          5  \
0 -113.619385  121.553017 -19.151058  42.345768  -6.371168  18.613033   
1 -207.581512  123.997147   8.939115  35.870758   2.919971  21.518787   
2  -90.776344  140.448608 -29.100559  31.687340 -13.975971  25.741682   
3 -199.462006  150.094727   5.649167  26.870144   1.755441  14.236880   
4 -160.291855  126.195770 -35.602501  22.151169 -32.487640  10.862022   

           6          7          8          9  ...        31        32  \
0 -13.692060  15.339378 -12.283618  10.973776  ... -3.270344 -0.203871   
1  -8.555368  23.355938 -10.101037  11.906445  ... -3.751413 -4.099237   
2 -13.644712  11.623112 -11.775921   9.700466  ... -4.745265 -0.376574   
3  -4.828873   9.297849  -0.753142   8.147393  ... -4.210177 -2.704965   
4 -23.357162   0.500523 -11.804770   1.203877  ...  3.641650 -3.004783   

         33        34        35        36        37        38        39  genre  
0 -2.999194