In [4]:
def piano_roll_to_events(piano_roll):
    """
    Converte uma matriz de piano roll (64x84) para o formato esperado do VAE: (bar_pos, events).
    """
    events = []
    bar_pos = []
    num_steps, num_pitches = piano_roll.shape

    for step in range(num_steps):
        if step % 16 == 0:
            # Início de uma nova barra
            bar_pos.append(len(events))
            events.append({'name': 'Bar', 'value': None})

        # Subdivisão da barra (sub-beat)
        sub_beat = step % 16
        events.append({'name': 'Beat', 'value': sub_beat})

        # Notas ativas no piano roll
        for pitch in range(num_pitches):
            if piano_roll[step, pitch]:
                events.append({'name': 'Note_Pitch', 'value': pitch})
                events.append({'name': 'Note_Duration', 'value': 120})  # Valor padrão, ajuste se necessário

    return bar_pos, events

In [31]:
import os

# Caminhos de entrada e saída
input_folder = r"C:\Users\not\Documents\Estudos\Unicamp - Mestrado\Dataset (use directly)\JCP_mixed"  # Substitua pelo caminho correto
output_folder = r"C:\Users\not\Documents\Estudos\Unicamp - Mestrado\MuseMorphose\remi_dataset_pkl"  # Substitua pelo caminho correto

# Criar a pasta de saída, se não existir
import os
os.makedirs(output_folder, exist_ok=True)

# Lista todos os arquivos .npy
npy_files = [f for f in os.listdir(input_folder) if f.endswith('.npy')]

# Processar cada arquivo
for npy_file in npy_files:
    npy_path = os.path.join(input_folder, npy_file)

    # Carregar o arquivo .npy
    piano_roll_data = np.load(npy_path, allow_pickle=True)

    # Ajustar formatos inesperados (remover dimensões extras, se necessário)
    if len(piano_roll_data.shape) == 3 and piano_roll_data.shape[2] == 1:
        piano_roll_data = piano_roll_data.squeeze(axis=2)

    # Verificar formato esperado
    if piano_roll_data.shape != (64, 84):
        print(f"Arquivo {npy_file} ignorado: formato inesperado {piano_roll_data.shape}.")
        continue

    # Converter para o formato esperado
    bar_pos, events = piano_roll_to_events(piano_roll_data)

    # Salvar o arquivo no formato esperado
    output_path = os.path.join(output_folder, os.path.splitext(npy_file)[0] + '.pkl')
    with open(output_path, 'wb') as f:
        pickle.dump((bar_pos, events), f)

    print(f"Arquivo convertido e salvo: {output_path}")

print("Conversão concluída!")

Arquivo convertido e salvo: C:\Users\not\Documents\Estudos\Unicamp - Mestrado\MuseMorphose\remi_dataset_pkl\classic_piano_train_1.pkl
Arquivo convertido e salvo: C:\Users\not\Documents\Estudos\Unicamp - Mestrado\MuseMorphose\remi_dataset_pkl\classic_piano_train_10.pkl
Arquivo convertido e salvo: C:\Users\not\Documents\Estudos\Unicamp - Mestrado\MuseMorphose\remi_dataset_pkl\classic_piano_train_100.pkl
Arquivo convertido e salvo: C:\Users\not\Documents\Estudos\Unicamp - Mestrado\MuseMorphose\remi_dataset_pkl\classic_piano_train_1000.pkl
Arquivo convertido e salvo: C:\Users\not\Documents\Estudos\Unicamp - Mestrado\MuseMorphose\remi_dataset_pkl\classic_piano_train_10000.pkl
Arquivo convertido e salvo: C:\Users\not\Documents\Estudos\Unicamp - Mestrado\MuseMorphose\remi_dataset_pkl\classic_piano_train_10001.pkl
Arquivo convertido e salvo: C:\Users\not\Documents\Estudos\Unicamp - Mestrado\MuseMorphose\remi_dataset_pkl\classic_piano_train_10002.pkl
Arquivo convertido e salvo: C:\Users\not\Doc

In [24]:
import pickle

# Caminho do arquivo .pkl
file_path = 'C:\\Users\\not\\Documents\\Estudos\\Unicamp - Mestrado\\MuseMorphose\\1.pkl'

# Função para carregar e inspecionar o conteúdo
def inspect_pkl(file_path):
    with open(file_path, 'rb') as f:
        data = pickle.load(f)
    
    print(f"Tipo de dado no arquivo: {type(data)}")
    if isinstance(data, dict):
        print("Chaves no dicionário:", data.keys())
        for key, value in data.items():
            print(f"Chave: {key} -> Tipo: {type(value)}")
    elif isinstance(data, list):
        print("Número de itens na lista:", len(data))
        print("Primeiros 3 itens:")
        for item in data[:3]:
            print(f"  Tipo: {type(item)}, Valor: {item}")
    elif isinstance(data, tuple):
        print("Número de itens na tupla:", len(data))
        print("Primeiro item da tupla:")
        print(f"  Tipo: {type(data[0])}, Valor: {data[0]}")
        if len(data) > 1:
            print("Segundo item da tupla:")
            print(f"  Tipo: {type(data[1])}, Valor: {data[1]}")
    else:
        print("Dado não reconhecido. Tipo:", type(data))
        print("Conteúdo:", data)

# Chamar a função
inspect_pkl(file_path)


Tipo de dado no arquivo: <class 'tuple'>
Número de itens na tupla: 2
Primeiro item da tupla:
  Tipo: <class 'list'>, Valor: [0, 54, 105, 143, 188, 247, 302, 361, 414, 465, 530, 587, 652, 726, 795, 863, 934, 1010, 1093, 1166, 1220, 1285, 1363, 1433, 1475, 1542, 1597, 1665, 1720, 1811, 1892, 1976, 2036, 2109, 2162, 2226, 2261, 2312, 2368, 2425, 2491, 2545, 2596, 2675, 2735, 2808, 2889, 2961, 3033, 3108, 3183, 3268, 3343, 3391, 3456, 3501, 3516, 3521]
Segundo item da tupla:
  Tipo: <class 'list'>, Valor: [{'name': 'Bar', 'value': None}, {'name': 'Beat', 'value': 0}, {'name': 'Chord', 'value': 'N_N'}, {'name': 'Tempo', 'value': np.int64(119)}, {'name': 'Note_Pitch', 'value': 45}, {'name': 'Note_Velocity', 'value': np.int64(60)}, {'name': 'Note_Duration', 'value': 1440}, {'name': 'Beat', 'value': 2}, {'name': 'Note_Pitch', 'value': 52}, {'name': 'Note_Velocity', 'value': np.int64(62)}, {'name': 'Note_Duration', 'value': 720}, {'name': 'Beat', 'value': 4}, {'name': 'Tempo', 'value': np.int64

In [35]:
import os
import pickle
import random

# Pasta contendo o novo dataset de treino
new_dataset_folder = r"C:\Users\not\Documents\Estudos\Unicamp - Mestrado\MuseMorphose\remi_dataset"

# Caminhos para salvar os arquivos de treino e validação
train_pkl_path = r"C:\Users\not\Documents\Estudos\Unicamp - Mestrado\MuseMorphose\train_pieces2.pkl"
val_pkl_path = r"C:\Users\not\Documents\Estudos\Unicamp - Mestrado\MuseMorphose\val_pieces2.pkl"

# Percentual de validação
val_percentage = 0.05
#train_percentage = 0.15

# Listar todos os arquivos .pkl na pasta
file_list = [f for f in os.listdir(new_dataset_folder) if f.endswith('.pkl')]

# Verificar se a lista está preenchida
if not file_list:
    raise ValueError("Nenhum arquivo .pkl encontrado na pasta especificada!")

# Embaralhar a lista para seleção aleatória
random.shuffle(file_list)

# Calcular o número de arquivos para validação
val_count = int(len(file_list) * val_percentage)
#train_count = int(len(file_list) * train_percentage)

# Dividir os arquivos em treino e validação
val_files = file_list[:val_count]
train_files = file_list[val_count:]

# Salvar os arquivos de treino e validação
with open(train_pkl_path, 'wb') as train_file:
    pickle.dump(train_files, train_file)

with open(val_pkl_path, 'wb') as val_file:
    pickle.dump(val_files, val_file)

print(f"Arquivo de treino criado com {len(train_files)} itens: {train_pkl_path}")
print(f"Arquivo de validação criado com {len(val_files)} itens: {val_pkl_path}")


Arquivo de treino criado com 31966 itens: C:\Users\not\Documents\Estudos\Unicamp - Mestrado\MuseMorphose\train_pieces2.pkl
Arquivo de validação criado com 1682 itens: C:\Users\not\Documents\Estudos\Unicamp - Mestrado\MuseMorphose\val_pieces2.pkl


In [32]:
import os

folder = "C:\\Users\\not\\Documents\\Estudos\\Unicamp - Mestrado\\MuseMorphose\\remi_dataset"
mapping_file = "C:\\Users\\not\\Documents\\Estudos\\Unicamp - Mestrado\\MuseMorphose\\mapping.pkl"  # Caminho para salvar o dicionário
mapping = {}  # Dicionário para armazenar o mapeamento
unique_id = 1

# Renomear arquivos e criar o mapeamento
for filename in sorted(os.listdir(folder)):  # Ordenar para consistência
    if filename.endswith('.pkl'):
        new_name = f"{unique_id}.pkl"
        old_path = os.path.join(folder, filename)
        new_path = os.path.join(folder, new_name)

        # Renomear o arquivo
        os.rename(old_path, new_path)
        print(f"Renomeado: {filename} -> {new_name}")

        # Adicionar ao mapeamento
        mapping[new_name] = filename
        unique_id += 1

# Salvar o dicionário em um arquivo .pkl
with open(mapping_file, 'wb') as f:
    pickle.dump(mapping, f)

print(f"Mapeamento salvo em: {mapping_file}")

Renomeado: classic_piano_train_1.pkl -> 1.pkl
Renomeado: classic_piano_train_10.pkl -> 2.pkl
Renomeado: classic_piano_train_100.pkl -> 3.pkl
Renomeado: classic_piano_train_1000.pkl -> 4.pkl
Renomeado: classic_piano_train_10000.pkl -> 5.pkl
Renomeado: classic_piano_train_10001.pkl -> 6.pkl
Renomeado: classic_piano_train_10002.pkl -> 7.pkl
Renomeado: classic_piano_train_10003.pkl -> 8.pkl
Renomeado: classic_piano_train_10004.pkl -> 9.pkl
Renomeado: classic_piano_train_10005.pkl -> 10.pkl
Renomeado: classic_piano_train_10006.pkl -> 11.pkl
Renomeado: classic_piano_train_10007.pkl -> 12.pkl
Renomeado: classic_piano_train_10008.pkl -> 13.pkl
Renomeado: classic_piano_train_10009.pkl -> 14.pkl
Renomeado: classic_piano_train_1001.pkl -> 15.pkl
Renomeado: classic_piano_train_10010.pkl -> 16.pkl
Renomeado: classic_piano_train_10011.pkl -> 17.pkl
Renomeado: classic_piano_train_10012.pkl -> 18.pkl
Renomeado: classic_piano_train_10013.pkl -> 19.pkl
Renomeado: classic_piano_train_10014.pkl -> 20.pkl
