# 2-2. LSTM

<img src="./img/lstm.png" alt="lstm" width="500" align="left"/>

<img src="./img/song_lstm.png" alt="song_lstm" width="500" align="left"/>

### 모듈 임포트

- os (디렉토리 생성)
- tensorflow (학습, 내부 케라스 모듈)
- numpy (데이터 핸들링)

In [None]:
import os
import tensorflow as tf
import numpy as np

### Logging Directory 설정

In [None]:
CKPT_DIR = "../generated_output/LSTM"

### Logging Directory 생성

In [None]:
if not os.path.exists(CKPT_DIR):
    os.makedirs(CKPT_DIR)

### 재현 위한 랜덤 시드 부여

In [None]:
np.random.seed(5)

### '나비야' 악보 코드

In [None]:
seq = ['g8', 'e8', 'e4', 'f8', 'd8', 'd4', 'c8', 'd8', 'e8', 'f8', 'g8', 'g8', 'g4',
       'g8', 'e8', 'e8', 'e8', 'f8', 'd8', 'd4', 'c8', 'e8', 'g8', 'g8', 'e8', 'e8', 'e4',
       'd8', 'd8', 'd8', 'd8', 'd8', 'e8', 'f4', 'e8', 'e8', 'e8', 'e8', 'e8', 'f8', 'g4',
       'g8', 'e8', 'e4', 'f8', 'd8', 'd4', 'c8', 'e8', 'g8', 'g8', 'e8', 'e8', 'e4']

### 코드를 integer label로 인코딩 하는 매퍼 딕셔너리
### label을 코드로 디코딩 하는 매퍼 딕셔너리

In [None]:
note2idx = {'c4':0, 'd4':1, 'e4':2, 'f4':3, 'g4':4, 'a4':5, 'b4':6,
            'c8':7, 'd8':8, 'e8':9, 'f8':10, 'g8':11, 'a8':12, 'b8':13}

idx2note = {0:'c4', 1:'d4', 2:'e4', 3:'f4', 4:'g4', 5:'a4', 6:'b4',
            7:'c8', 8:'d8', 9:'e8', 10:'f8', 11:'g8', 12:'a8', 13:'b8'}

note_num = 14

### 데이터셋 생성 함수

- window size만큼씩 옮겨 가면서 window size + 1개의 노트 수집 (feature + label)
- 반복적으로 append하여 2차원 array로 변환

In [None]:
def seq2dataset(seq, window_size):
    dataset = []
    for i in range(len(seq)-window_size):
        subset = seq[i:(i+window_size+1)]
        dataset.append([note2idx[item] for item in subset])
    return np.array(dataset)

### 데이터셋 생성

- 데이터: 나비야 코드, window size = 4
- 5개씩 코드 수집하여 4개는 feature로 이용, 1개는 label로 이용

In [None]:
dataset = seq2dataset(seq, window_size = 4)

### Feature, Label 추출

- 데이터셋에서 4개 컬럼 추출하여 feature
- 마지막 5번째 컬럼 추출하여 label
- feature normalization
- feature [-1, 4, 1] 형태로 변환 (keras LSTM 레이어 요구조건)
    - batch size * cell * feature 꼴
- label one-hot encoding

In [None]:
x_train = dataset[:,0:4]
y_train = dataset[:,4]
max_idx_value = 13
x_train = x_train / float(max_idx_value)
x_train = x_train.reshape([-1, 4, 1])

### Network 설계

[1, 4, 1]
$\rightarrow$ Stateful LSTM(4, 1, 128) $\rightarrow$ [1, 128]  
$\rightarrow$ Dense(128, 14) $\rightarrow$ softmax $\rightarrow$ [1, 14]  

In [None]:
model = tf.keras.Sequential()
model.add(tf.keras.layers.LSTM(128, batch_input_shape = (1, 4, 1), stateful=True))
model.add(tf.keras.layers.Dense(note_num, activation='softmax'))

### Model 컴파일

- loss function: sparse categorical crossentropy
    - 레이블에 one-hot encoding 하지 않아도 됨
- optimizer: ADAM optimizer
- metrics: 학습간 로그에 표시할 메트릭

In [None]:
model.compile(loss='sparse_categorical_crossentropy', optimizer='adam', metrics=['accuracy'])

### 학습

- 전체 데이터 1500회 이용
- 1개 샘플씩 학습
- stateful LSTM
    - batch 1짜리 LSTM학습을 모델 외부에서 반복하여 학습하는 형태로 구현
    - reset_states()를 콜하지 않는 이상 state가 계속 유지
    - 연속적인 데이터 전체를 기억할 때 이용
    - state핸들링하기가 어려워, 데이터 경향성 학습에는 stateless lstm이 유리
- stateful LSTM에서 주의할 점
    - stateless LSTM과는 달리, batch간 연속성이 중요
    - batch size: 1
        - batch size가 1이 아닐 경우 다음에 이어지는 데이터가 batch로 들어와 연속성 붕괴
    - shuffle: false
        - shuffling 진행할 경우 batch간 연속성 붕괴 

In [None]:
num_epochs = 1500

for epoch_idx in range(num_epochs):
    print ('epochs : ' + str(epoch_idx) )
    model.fit(
        x_train, y_train, epochs=1, batch_size=1, verbose=2, shuffle=False)
    model.reset_states()

### 평가

In [None]:
scores = model.evaluate(x_train, y_train, batch_size=1)
print("%s: %.2f%%" %(model.metrics_names[1], scores[1]*100))
model.reset_states()

### One step Prediction

<img src="./img/one_step.png" alt="one_step" width="500" align="left"/>

In [None]:
pred_count = 50

note_onestep = ['g8', 'e8', 'e4', 'f8']
# 결과 리스트 초기 4개 레이블로 초기화

pred_out = model.predict(x_train, batch_size=1)
# x_train 전체 데이터로 prediction 진행

for i in range(pred_count):
    
    idx = np.argmax(pred_out[i])
    # one-hot encoding된 상태로 나온 prediction 자연수 레이블로 변환
        
    note_onestep.append(idx2note[idx])
    # 레이블 코드로 변환하여 결과 리스트에 추가
    
model.reset_states()
# LSTM state 초기화

### Full song Prediction

<img src="./img/full_song.png" alt="full_song" width="500" align="left"/>

In [None]:
seq_in = ['g8', 'e8', 'e4', 'f8']
# 초기 4개 인풋값 리스트 설정

note_fullsong = seq_in
# 결과 리스트 초기 4개 레이블로 초기화

seq_in = [note2idx[it] / float(max_idx_value) for it in seq_in]
# 초기 4개 인풋값 Network에 투입 가능한 형태로 전처리

for i in range(pred_count):
    
    sample_in = np.array(seq_in)
    # input array 인풋 리스트값으로 초기화
    
    sample_in = np.reshape(sample_in, (1, 4, 1))
    # (4,)형태의 input array를 (1, 4, 1)형태로 변환
    
    pred_out = model.predict(sample_in)
    # 1개 batch (4개 코드에 대한 결과) prediction
    
    idx = np.argmax(pred_out)
    # one-hot encoding된 상태로 나온 prediction 자연수 레이블로 변환
    
    note_fullsong.append(idx2note[idx])
    # 레이블 코드로 변환하여 결과 리스트에 추가
    
    seq_in.append(idx / float(max_idx_value))
    # 인풋 리스트에 prediction 결과 전처리하여 추가
    
    seq_in.pop(0)
    # 인풋 리스트에서 맨 앞의 값 제거
    
model.reset_states()
# LSTM state 초기화

### Prediction 결과

<img src="./img/song.png" alt="lstm_result" width="500" align="left"/>

In [None]:
print("one step prediction : ", note_onestep)
print("full song prediction : ", note_fullsong)

### 코드 MIDI파일로 컴파일하여 저장

In [None]:
import music21 as m21

def writeMIDI(key,instr,bpm,notes,fname):

    # start stream
    stream = m21.stream.Stream()

    # Add tempo to stream
    bpm = m21.tempo.MetronomeMark(number = bpm)
    stream.append(bpm)

    # Add key to stream
    k = m21.key.Key(key)
    stream.append(k)

    # Add instrument
    ins = m21.instrument.fromString(instr)
    stream.append(ins)

    # Add notes to stream at different offsets
    for tup in notes:
        note = m21.note.Note(tup[0])
        offset = tup[1]
        note.quarterLength = tup[2]
        note.volume.velocity = tup[3]
        stream.insert(offset,note)

    # convert stream to midi and write out
    mf = m21.midi.translate.streamToMidiFile(stream)
    mf.open(fname+'.mid', 'wb')
    mf.write()

In [None]:
def note2midi(notes, num):
    n = []
    global start
    start = 0
    for i in range(len(notes)):
        timing = int(8/int(notes[i][1]))
        if timing == 1: n.append((notes[i][0]+'5',start+i,1,120))
        else :
            n.append((notes[i][0]+'5',start+i,1*timing,120))
            start += 1
        if not os.path.exists(CKPT_DIR+'/Midi'):
            os.makedirs(CKPT_DIR+'/Midi')
        writeMIDI('C','piano', 130, n, (CKPT_DIR+'/Midi/LSTM_result_%d' % num))
        
    return print("MLP result_%d export complete!" % num)


note2midi(note_onestep, 1)
note2midi(note_fullsong, 2)

[MIDI 재생 사이트 링크](https://onlinesequencer.net/import)