In [1]:
!pip install tensorflow pretty_midi


Collecting pretty_midi
  Downloading pretty_midi-0.2.10.tar.gz (5.6 MB)
     ---------------------------------------- 0.0/5.6 MB ? eta -:--:--
     ---------------------------------------- 0.0/5.6 MB 660.6 kB/s eta 0:00:09
     ---------------------------------------- 0.1/5.6 MB 656.4 kB/s eta 0:00:09
     - -------------------------------------- 0.1/5.6 MB 950.9 kB/s eta 0:00:06
     - -------------------------------------- 0.2/5.6 MB 1.1 MB/s eta 0:00:06
     - -------------------------------------- 0.2/5.6 MB 1.1 MB/s eta 0:00:06
     --- ------------------------------------ 0.5/5.6 MB 1.8 MB/s eta 0:00:03
     --- ------------------------------------ 0.5/5.6 MB 1.5 MB/s eta 0:00:04
     --- ------------------------------------ 0.5/5.6 MB 1.4 MB/s eta 0:00:04
     ----- ---------------------------------- 0.8/5.6 MB 1.9 MB/s eta 0:00:03
     ------ --------------------------------- 1.0/5.6 MB 1.9 MB/s eta 0:00:03
     --------- ------------------------------ 1.4/5.6 MB 2.4 MB/s eta 0



In [2]:
import os
import pretty_midi

def ler_arquivos_midi(caminho_pasta):
    arquivos_midi = []
    for arquivo in os.listdir(caminho_pasta):
        if arquivo.endswith('.mid') or arquivo.endswith('.midi'):
            caminho = os.path.join(caminho_pasta, arquivo)
            midi = pretty_midi.PrettyMIDI(caminho)
            arquivos_midi.append(midi)
    return arquivos_midi

# Caminho para a pasta com arquivos MIDI
caminho_pasta_midi = 'midi'
musicas_midi = ler_arquivos_midi(caminho_pasta_midi)




In [4]:
def extrair_notas_e_duracoes(midi_file):
    notas_duracoes = []
    for instrument in midi_file.instruments:
        if not instrument.is_drum:
            for nota in instrument.notes:
                inicio = nota.start
                fim = nota.end
                duracao = fim - inicio
                nota_duracao = (nota.pitch, duracao)
                notas_duracoes.append(nota_duracao)
    return notas_duracoes

dados_midi = [extrair_notas_e_duracoes(midi) for midi in musicas_midi]


In [9]:
tamanho_sequencia = 20  # Número de pares nota-duração na sequência de entrada
entradas, saidas = [], []

for musica in dados_midi:
    for i in range(0, len(musica) - tamanho_sequencia):
        entrada = musica[i:i + tamanho_sequencia]
        saida = musica[i + tamanho_sequencia]
        entradas.append(entrada)
        saidas.append(saida)


In [6]:
#1. Mapeamento de Notas e Durações para Índices

notas = set()
duracoes = set()

for musica in dados_midi:
    for nota, duracao in musica:
        notas.add(nota)
        duracoes.add(duracao)

# Mapeamento de notas e durações para índices
nota_para_indice = {nota: i for i, nota in enumerate(sorted(notas))}
duracao_para_indice = {duracao: i for i, duracao in enumerate(sorted(duracoes))}


In [15]:
#One hot encoding 

import numpy as np

entradas = []
saidas = []

entradas = []
saidas = []

for musica in dados_midi:
    for i in range(0, len(musica) - tamanho_sequencia):
        entrada_seq = musica[i:i + tamanho_sequencia]
        saida_seq = musica[i + tamanho_sequencia]

        entrada = [(nota_para_indice[n], duracao_para_indice[d]) for n, d in entrada_seq]
        saida = (nota_para_indice[saida_seq[0]], duracao_para_indice[saida_seq[1]])

        entradas.append(entrada)
        saidas.append(saida)

from scipy.sparse import lil_matrix
from tqdm import tqdm

# Criar matrizes esparsas para entradas e saídas
entradas_one_hot = lil_matrix((len(entradas), tamanho_sequencia * (num_notas + num_duracoes)), dtype='float32')
saidas_one_hot = lil_matrix((len(saidas), num_notas + num_duracoes), dtype='float32')

# Usando tqdm para mostrar o progresso
for i in tqdm(range(len(entradas)), desc="Processando entradas"):
    seq = entradas[i]
    for j, (nota_indice, duracao_indice) in enumerate(seq):
        entradas_one_hot[i, j * (num_notas + num_duracoes) + nota_indice] = 1
        entradas_one_hot[i, j * (num_notas + num_duracoes) + num_notas + duracao_indice] = 1

for i in tqdm(range(len(saidas)), desc="Processando saídas"):
    nota_indice, duracao_indice = saidas[i]
    saidas_one_hot[i, nota_indice] = 1
    saidas_one_hot[i, num_notas + duracao_indice] = 1

    from scipy.sparse import csr_matrix

# Suponha que 'entradas_one_hot' e 'saidas_one_hot' são as suas matrizes one-hot
entradas_csr = csr_matrix(entradas_one_hot)
saidas_csr = csr_matrix(saidas_one_hot)


Processando entradas: 100%|██████████████████████████████████████████████████| 374362/374362 [01:08<00:00, 5453.54it/s]
Processando saídas: 100%|██████████████████████████████████████████████████| 374362/374362 [00:03<00:00, 102120.66it/s]


In [17]:
# Definindo o Codificador (Encoder)

from tensorflow.keras.layers import Input, LSTM, RepeatVector
from tensorflow.keras.models import Model

# Definindo o tamanho da sequência de entrada e o número de features
tamanho_sequencia = entradas_csr.shape[1]
num_features = entradas_csr.shape[1]

# Camada de entrada
entrada = Input(shape=(tamanho_sequencia, num_features))

# Codificador
encoder = LSTM(256, return_state=True)
encoder_outputs, state_h, state_c = encoder(entrada)

# Nós apenas precisamos dos estados, não das saídas
encoder_states = [state_h, state_c]


In [18]:
#Definindo o Decodificador (Decoder)

# Decodificador
decoder_lstm = LSTM(256, return_sequences=True, return_state=True)
decoder_outputs, _, _ = decoder_lstm(RepeatVector(tamanho_sequencia)(encoder_outputs), initial_state=encoder_states)


In [21]:
# Construindo o Modelo Completo

from tensorflow.keras.layers import Dense

decoder_dense = Dense(num_features, activation='softmax')
decoder_outputs = decoder_dense(decoder_outputs)

# Modelo completo
model = Model(entrada, decoder_outputs)

# Compilação do modelo
model.compile(optimizer='adam', loss='categorical_crossentropy')


In [22]:
model.fit(entradas_csr, saidas_csr, batch_size=64, epochs=50)

Epoch 1/50


ValueError: in user code:

    File "C:\Users\ealbvit\AppData\Local\anaconda3\envs\redes_neurais\lib\site-packages\keras\src\engine\training.py", line 1338, in train_function  *
        return step_function(self, iterator)
    File "C:\Users\ealbvit\AppData\Local\anaconda3\envs\redes_neurais\lib\site-packages\keras\src\engine\training.py", line 1322, in step_function  **
        outputs = model.distribute_strategy.run(run_step, args=(data,))
    File "C:\Users\ealbvit\AppData\Local\anaconda3\envs\redes_neurais\lib\site-packages\keras\src\engine\training.py", line 1303, in run_step  **
        outputs = model.train_step(data)
    File "C:\Users\ealbvit\AppData\Local\anaconda3\envs\redes_neurais\lib\site-packages\keras\src\engine\training.py", line 1080, in train_step
        y_pred = self(x, training=True)
    File "C:\Users\ealbvit\AppData\Local\anaconda3\envs\redes_neurais\lib\site-packages\keras\src\utils\traceback_utils.py", line 70, in error_handler
        raise e.with_traceback(filtered_tb) from None
    File "C:\Users\ealbvit\AppData\Local\anaconda3\envs\redes_neurais\lib\site-packages\keras\src\engine\input_spec.py", line 235, in assert_input_compatibility
        raise ValueError(

    ValueError: Exception encountered when calling layer 'model' (type Functional).
    
    Input 0 of layer "lstm" is incompatible with the layer: expected ndim=3, found ndim=2. Full shape received: (None, 119620)
    
    Call arguments received by layer 'model' (type Functional):
      • inputs=SparseTensor(indices=Tensor("DeserializeSparse:0", shape=(None, 2), dtype=int64), values=Tensor("DeserializeSparse:1", shape=(None,), dtype=float32), dense_shape=Tensor("stack:0", shape=(2,), dtype=int64))
      • training=True
      • mask=None


MemoryError: Unable to allocate 167. GiB for an array with shape (374362, 119620) and data type float32