In [0]:
# 본인의 구글 드라이브 → 지금 실행중인 코드

# google.colab.drive : 구글 드라이브에서 파일을 가져오기 위한 코드를 담고 있다.
from google.colab import drive

# 본인의 구글 드라이브를 '/gdrive' 라는 경로로 하여 쓸 수 있다.
drive.mount('/gdrive', force_remount=True)

Go to this URL in a browser: https://accounts.google.com/o/oauth2/auth?client_id=947318989803-6bn6qk8qdgf4n4g3pfee6491hc0brc4i.apps.googleusercontent.com&redirect_uri=urn%3aietf%3awg%3aoauth%3a2.0%3aoob&response_type=code&scope=email%20https%3a%2f%2fwww.googleapis.com%2fauth%2fdocs.test%20https%3a%2f%2fwww.googleapis.com%2fauth%2fdrive%20https%3a%2f%2fwww.googleapis.com%2fauth%2fdrive.photos.readonly%20https%3a%2f%2fwww.googleapis.com%2fauth%2fpeopleapi.readonly

Enter your authorization code:
··········
Mounted at /gdrive


In [0]:
# 악보 파일 (MIDI 파일)을 다루기 위한 라이브러리 music21 설치
!pip install music21



In [0]:
!nvidia-smi

Thu Nov 21 06:42:20 2019       
+-----------------------------------------------------------------------------+
| NVIDIA-SMI 430.50       Driver Version: 418.67       CUDA Version: 10.1     |
|-------------------------------+----------------------+----------------------+
| GPU  Name        Persistence-M| Bus-Id        Disp.A | Volatile Uncorr. ECC |
| Fan  Temp  Perf  Pwr:Usage/Cap|         Memory-Usage | GPU-Util  Compute M. |
|   0  Tesla K80           Off  | 00000000:00:04.0 Off |                    0 |
| N/A   73C    P8    36W / 149W |      0MiB / 11441MiB |      0%      Default |
+-------------------------------+----------------------+----------------------+
                                                                               
+-----------------------------------------------------------------------------+
| Processes:                                                       GPU Memory |
|  GPU       PID   Type   Process name                             Usage      |
|  No ru

In [0]:
import glob, pickle # 파일 불러오기에 유용한 라이브러리들

import numpy as np # 행렬 계산

# MIDI 파일을 다루기 위한 라이브러리
from music21 import converter, instrument, note, chord, stream 

# 순차 모델 생성을 위한 라이브러리
from keras.models import Sequential

# LSTM : CPU 동작 / CuDNNLSTM : GPU 동작
from keras.layers import Dense, Dropout, LSTM, CuDNNLSTM

# One-hot Vector 만들기 위한 라이브러리
from keras.utils import np_utils

In [0]:
# MIDI 파일을 잘 불러왔는지 테스트

# MIDI 파일을 불러오는 함수
midi = converter.parse("/gdrive/My Drive/Colab Notebooks/chopin/chpn-p9_format0.mid")

# MIDI 파일 내의 notes(음정, 박자를 포함하는 정보)를 불러온다
notes_to_parse = midi.flat.notes

# 불러온 notes의 갯수
print(np.shape(notes_to_parse))

# 10개 테스트 출력
for e in notes_to_parse[:20]:
  print(e, e.offset)

# Note / Chord 두 종류로 나뉜다, Chord는 Note의 집합이다

(247,)
<music21.chord.Chord B3 E2> 0.0
<music21.chord.Chord E3 G#3> 0.0
<music21.note.Note B> 1/3
<music21.chord.Chord E3 G#3> 2/3
<music21.note.Note B> 1.0
<music21.chord.Chord E-3 F#3> 1.0
<music21.note.Note B> 1.0
<music21.note.Note B> 4/3
<music21.chord.Chord E-3 F#3> 5/3
<music21.note.Note B> 1.75
<music21.chord.Chord B3 E2> 2.0
<music21.chord.Chord E3 G#3> 2.0
<music21.note.Note B> 7/3
<music21.chord.Chord E3 G#3> 8/3
<music21.note.Note C#> 3.0
<music21.chord.Chord E3 A3> 3.0
<music21.note.Note A> 3.0
<music21.note.Note C#> 10/3
<music21.chord.Chord E3 A3> 11/3
<music21.note.Note G#> 3.75


In [0]:
# Chopin 폴더의 모든 MIDI 파일의 정보를 뽑아 하나로 만든다

# MIDI 파일로부터 Note 정보만 뽑아서 저장할 리스트
notes = []

# chopin 폴더 내의 모든 MIDI 파일에 반복문으로 접근
# glob.glob() : *를 제외한 나머지 부분이 같은 파일 이름들을 배열로 저장
# enumerate : 파일이름 배열을 순차적으로 하나씩 file에 넣는다
# i : 0 부터 1씩 증가 / file : 각 파일 이름
for i,file in enumerate(glob.glob("/gdrive/My Drive/Colab Notebooks/chopin/*.mid")):

  # midi: MIDI 파일의 전체 정보를 담고 있다 ------------------------------------------
  midi = converter.parse(file) 
  print('\r', 'Parsing file ', i, " ",file, end='') # 현재 진행 상황 출력

  # notes_to_parse : MIDI 파일을 Notes로 나누어 다루기 위한 변수
  notes_to_parse = None

  # try / except : try 수행 중 에러 발생 시 except 수행 -----------------------------
  # MIDI 파일 구조 차이로 인한 에러 방지

  # MIDI 파일의 Note / Chord / Tempo 정보만 가져온다
  try: # file has instrument parts
    s2 = instrument.partitionByInstrument(midi)
    notes_to_parse = s2.parts[0].recurse() 
    
  except: # file has notes in a flat structure
    notes_to_parse = midi.flat.notes

  # Note / Chord / Tempo 정보 중 Note, Chord 의 경우 따로 처리, Tempo 정보는 무시 ----
  for e in notes_to_parse:

    # Note 인 경우 높이(Pitch), Octave 로 저장
    if isinstance(e, note.Note):
      notes.append(str(e.pitch))

    # Chord 인 경우 각 Note의 음높이(Pitch)를 '.'으로 나누어 저장
    elif isinstance(e, chord.Chord):

      # ':'.join([0, 1, 2]) : [0, 1, 2] -> [0:1:2]
      # str(n) for n in e.normalOrder 
      #     => e.normalOrder 라는 배열 내의 모든 원소 n에 대해 str(n) 해준 새 배열을 만든다.
      #        ex) str(i) for i in [1, 2, 3] => ['1', '2', '3']
      notes.append('.'.join(str(n) for n in e.normalOrder))

 Parsing file  50   /gdrive/My Drive/Colab Notebooks/chopin/chp_op31_format0.mid

In [0]:
# MIDI 파일 정보를 다루기 쉽게 바꿔준다

# n_vocab : 모델 출력의 가짓수를 정하기 위해 Note의 총 가짓수를 센다
# set() : 중복되는 원소는 한번만 쓴다 / ex) set("Hello") => {'e', 'H', 'l', 'o'}
n_vocab = (len(set(notes)))
print('Classes of notes : ', n_vocab, '\n')

print('notes : ', notes[:500])
print('length of notes : ', len(notes), '\n')

# pitchnames : notes 배열의 모든 가능한 Note / Chord 를 정렬해놓은 배열  
pitchnames = sorted(set(item for item in notes))
print('pitchnames : ', pitchnames)
print('length of pitchnames : ', len(pitchnames), '\n')

# create a dictionary to map pitches to integers
# 음높이(Pitch)를 정수에 매핑하는 dictionary 자료형 생성
# ex) dict = {'key': value} => dict['key'] = value
note_to_int = dict((note, number) for number, note in enumerate(pitchnames))

print('note_to_int : ', note_to_int)

Classes of notes :  456 

notes :  ['G#6', 'A6', 'G#6', 'A6', 'G#6', 'C#3', 'G6', 'G#3', '8.1', 'E4', 'A6', 'G#6', 'E6', 'E-6', '8.1', 'E-6', 'C#6', 'A5', 'G#5', 'F#2', 'C#3', '1.6', 'A3', 'G#5', 'F#5', 'E5', 'E-5', 'C#3', 'G#3', '8.1', 'E4', 'E-5', 'C#5', 'A4', 'G#4', 'F#2', 'C#3', '1.6', 'A3', 'G#4', 'F#4', 'E4', 'E-4', 'C#2', 'G#2', '8.1', 'E3', 'E-4', 'C#4', 'B3', 'A3', 'G#3', '0.3', 'G#2', '8.10.1', 'G#2', '0.3', '1.4.8', '0.3.6', 'G#2', 'E4', '8', 'C#3', 'G#3', '8.1', 'E4', 'A6', 'G#6', 'E6', 'E-6', '8.1', 'E-6', 'C#6', 'A5', 'G#5', 'F#2', 'C#3', '1.6', 'A3', 'G#5', 'F#5', 'E5', 'E-5', 'C#3', 'G#3', '8.1', 'E4', 'E-5', 'C#5', 'A4', 'G#4', 'F#2', 'C#3', '1.6', 'A3', 'G#4', 'F#4', 'E4', 'E-4', 'C#2', 'G#2', '8.1', 'E3', 'E-4', 'C#4', 'B3', 'B-3', 'G#3', '3', 'C4', 'E-2', 'D2', 'E2', '7.10', 'E-2', 'E2', 'E-2', 'E2', 'E-2', 'D2', 'E-2', '8.11.3', 'G#2', '8.10.1.3', '8.11.3', 'G#4', '8', 'F#2', 'C#3', '1.6', 'A3', 'G#6', 'F#6', 'D6', 'C#6', 'B2', 'F#3', '6.11', 'D4', 'C#6', 'B5', 'A5

In [0]:
# LSTM 모델을 위한 Training Dataset 생성
# 곡을 배끼는 것이 아닌 작곡이기 때문에 Validation이 필요없다

seq_len = 100 # 시퀀스 길이

# Pitch를 정수로 바꾸어 LSTM 모델의 입출력으로 만들어준다
net_in = []
net_out = []

# LSTM 모델의 입출력을 만들기 위해 ( 전체 길이 - 시퀀스 길이(=100) ) 만큼 반복
# ex) 입력 : 출력 짝지어주기
#     [0 ~ 99] : [100] / [1 ~ 100] : [101] / ... / [전체 길이-100 ~ 전체 길이-1] : [전체 길이]
for i in range(0, len(notes) - seq_len):

  # LSTM 모델 입력과 출력을 만들어준다
  seq_in = notes[i:i + seq_len] # ex) [0:100] => [0 ~ 99]
  seq_out = notes[i + seq_len]  # ex) [100]

  # LSTM은 문자열이 아닌 숫자를 입출력으로 하므로 문자열을 정수로 바꿔야 한다
  net_in.append([note_to_int[char] for char in seq_in]) # 배열 안의 모든 원소에 대해 실행
  net_out.append(note_to_int[seq_out]) # 출력값 하나에 대해 실행

print(np.shape(net_in))
print(np.shape(net_out))

(55535, 100)
(55535,)


In [0]:
# LSTM 모델 입출력에 맞게 Dataset 전처리

# 시퀀스 길이(100) 만큼을 빼고 반복했으므로 100개 적은 패턴이 생긴다
n_patterns = len(net_in)
print('n_patterns : ', n_patterns)

# reshape the input into a format compatible with LSTM layers
# LSTM 입력에 맞는 모양으로 바꿔준다 : (샘플 수, 시퀀스 길이, 자료의 차원)
net_in = np.reshape(net_in, (n_patterns, seq_len, 1))
print('shape of net_in : ', net_in.shape)

# 데이터 범위 정규화 : 0 ~ (n_vocab - 1) => 0 ~ 1
net_in = net_in / float(n_vocab)

# 분류이므로 출력을 One-hot Vector로 만들어주어야 한다.
net_out = np_utils.to_categorical(net_out)
print('shape of net_out : ', net_out.shape)

n_patterns :  55535
shape of net_in :  (55535, 100, 1)
shape of net_out :  (55535, 456)


In [0]:
# 모델 구성

# 데이터의 Feature(특징) 수 or Dimension(차원)
data_dim = net_in.shape[2]

# GPU 환경 : CuDNNLSTM() / CPU 환경 : LSTM()
model = Sequential(name="Chopin_LSTM")

# return_sequences : True : Many to Many / False : Many to One
# seq_len : 입력으로 넣을 시계열 데이터의 길이 / data_dim : 각 데이터의 차원

model.add(CuDNNLSTM(512, input_shape=(seq_len, data_dim), return_sequences=True))
# GPU / CUDA / CuDNN 이 없는 환경에선 CuDNNLSTM만 LSTM으로 바꾸어 쓰면 됩니다.
# model.add(LSTM(512, input_shape=(seq_len, data_dim), return_sequences=True))
model.add(Dropout(rate=0.3))

model.add(CuDNNLSTM(512, return_sequences=True))
model.add(Dropout(rate=0.3))

model.add(CuDNNLSTM(512))

model.add(Dense(256))
model.add(Dropout(rate=0.3))

model.add(Dense(n_vocab, activation='softmax'))

model.compile(loss='categorical_crossentropy', optimizer='adam')

model.summary()





Instructions for updating:
Please use `rate` instead of `keep_prob`. Rate should be set to `rate = 1 - keep_prob`.


Model: "Chopin_LSTM"
_________________________________________________________________
Layer (type)                 Output Shape              Param #   
cu_dnnlstm_1 (CuDNNLSTM)     (None, 100, 512)          1054720   
_________________________________________________________________
dropout_1 (Dropout)          (None, 100, 512)          0         
_________________________________________________________________
cu_dnnlstm_2 (CuDNNLSTM)     (None, 100, 512)          2101248   
_________________________________________________________________
dropout_2 (Dropout)          (None, 100, 512)          0         
_________________________________________________________________
cu_dnnlstm_3 (CuDNNLSTM)     (None, 512)               2101248   
_________________________________________________________________
dense_1 (Dense)              (None, 256)               131328    


In [0]:
# 모델 학습
# 음악 작곡이기 때문에 Validation Set이 없다
# LSTM : 13시간 / CuDNN : 3시간 반
# loss 는 0.7 ~ 0.8 만 되어도 충분히 작곡 능력을 갖는다.
model.fit(net_in, net_out, epochs=75, batch_size=64)

Epoch 1/75
Epoch 2/75
Epoch 3/75
Epoch 4/75
Epoch 5/75
Epoch 6/75
Epoch 7/75
Epoch 8/75
Epoch 9/75
Epoch 10/75
Epoch 11/75
Epoch 12/75
Epoch 13/75
Epoch 14/75
Epoch 15/75
Epoch 16/75
Epoch 17/75
Epoch 18/75
Epoch 19/75
Epoch 20/75
Epoch 21/75
Epoch 22/75
Epoch 23/75
Epoch 24/75
Epoch 25/75
Epoch 26/75
Epoch 27/75
Epoch 28/75
Epoch 29/75
Epoch 30/75
Epoch 31/75
Epoch 32/75
Epoch 33/75
Epoch 34/75
Epoch 35/75
Epoch 36/75
Epoch 37/75
Epoch 38/75
Epoch 39/75
Epoch 40/75
Epoch 41/75
Epoch 42/75
Epoch 43/75
Epoch 44/75
Epoch 45/75
Epoch 46/75
Epoch 47/75
Epoch 48/75
Epoch 49/75
Epoch 50/75
Epoch 51/75
Epoch 52/75
Epoch 53/75
Epoch 54/75
Epoch 55/75
Epoch 56/75
Epoch 57/75
Epoch 58/75
Epoch 59/75
Epoch 60/75
Epoch 61/75
Epoch 62/75
Epoch 63/75
Epoch 64/75
Epoch 65/75
Epoch 66/75
Epoch 67/75
Epoch 68/75
Epoch 69/75
Epoch 70/75
Epoch 71/75
Epoch 72/75
Epoch 73/75
Epoch 74/75
Epoch 75/75


<keras.callbacks.History at 0x7f9c95365588>

In [0]:
# 작곡을 위해 LSTM 모델 입력을 다시 만든다
# 위와 동일하므로 주석 생략

net_in = []
output = []

for i in range(0, len(notes) - seq_len, 1):
  seq_in = notes[i:i + seq_len]
  seq_out = notes[i + seq_len]

  net_in.append([note_to_int[char] for char in seq_in])
  output.append(note_to_int[seq_out])
  
n_patterns = len(net_in)

In [0]:
# LSTM 모델이 작곡을 시작하기 위해 시작점으로써 랜덤한 시퀀스를 골라야 한다

# pattern : Dataset의 입력 전체 시퀀스 중 랜덤하게 고른 시퀀스
start = np.random.randint(0, len(net_in)-1)
pattern = net_in[start]
print('Random Sequence : ', pattern)

# int_to_note: 정수를 다시 Note로 바꾸기 위한 dictionary 자료형
int_to_note = dict((number, note) for number, note in enumerate(pitchnames))
print('int_to_note : ', int_to_note)

Random Sequence :  [386, 446, 446, 433, 433, 426, 426, 419, 419, 398, 66, 419, 123, 332, 52, 447, 36, 393, 66, 393, 160, 387, 392, 387, 315, 447, 52, 447, 36, 393, 66, 393, 160, 387, 392, 387, 196, 447, 420, 434, 99, 421, 197, 421, 36, 400, 194, 400, 160, 393, 420, 419, 393, 66, 393, 160, 387, 332, 194, 52, 447, 36, 393, 66, 393, 160, 387, 392, 387, 315, 447, 52, 447, 36, 393, 66, 393, 160, 387, 392, 387, 196, 447, 399, 427, 344, 400, 159, 400, 99, 393, 52, 393, 36, 381, 123, 160, 393, 420, 386]
int_to_note :  {0: '0', 1: '0.1', 2: '0.1.3.6.9', 3: '0.1.3.7', 4: '0.1.4', 5: '0.1.4.6.8', 6: '0.1.4.8', 7: '0.1.5', 8: '0.1.5.8', 9: '0.2', 10: '0.2.3.6', 11: '0.2.4', 12: '0.2.5', 13: '0.2.5.8', 14: '0.2.6', 15: '0.2.6.8', 16: '0.2.7', 17: '0.3', 18: '0.3.4.6.8', 19: '0.3.5', 20: '0.3.5.6', 21: '0.3.5.6.8', 22: '0.3.5.7', 23: '0.3.5.8', 24: '0.3.6', 25: '0.3.6.8', 26: '0.3.6.8.9', 27: '0.3.6.9', 28: '0.3.7', 29: '0.4', 30: '0.4.6', 31: '0.4.7', 32: '0.4.8', 33: '0.5', 34: '0.5.6', 35: '0.6',

In [0]:
# LSTM 모델이 만든 출력값을 저장하기 위한 빈 리스트
pred_out = []

# generate 500 notes
for i in range(0, 500):

  # 랜덤하게 고른 시퀀스를 LSTM 모델 입력에 맞게 바꿔준다
  pred_in = np.reshape(pattern, (1, len(pattern), 1))

  # 입력 범위 정규화 / 0 ~ (n_vocab -1) => 0 ~ 1
  pred_in = pred_in / float(n_vocab)

  # LSTM 모델 사용
  prediction = model.predict(pred_in, verbose=0)

  # 출력 중 값이 가장 큰 Index 선택
  index = np.argmax(prediction)

  # 정수 값을 Note 값으로 변경
  result = int_to_note[index]
  print('\r', 'Predicted ', i, " ",result, end='')
  
  # LSTM이 만든 Note를 하나씩 리스트에 담는다
  pred_out.append(result)

  # 다음 입력을 위해 입력에 새 값 추가 후 가장 과거 값 제거
  # ex) [0:99] -> [1:100] -> ... -> [n : n + 99]
  pattern.append(index)
  pattern = pattern[1:len(pattern)]

 Predicted  499   G#2

In [0]:
print('length of pred_out : ', len(pred_out))
print('pred_out : ', pred_out)

length of pred_out :  500
pred_out :  ['G#4', '3', 'G4', '8.11', '8', '3', '8.11', '7.10', '7.10', '10.1', '8.11', 'E4', 'E-4', '3', '8.11', '7.10', '7.10', '10.1', '8.11', 'F#4', 'E4', 'E4', 'E-4', '3', '8', 'F#5', 'F5', 'F#5', 'G#5', 'F#5', 'E5', 'E-5', '10.1.4', 'F#4', 'F#3', 'B-4', '8.1', '6', '1.6', '3.6', '10.1.4', 'F#4', 'F#3', 'B-4', '8.1', '6', '1.6', '3.6', '11.1.4', '6', '11.3', '6', '11.3', '6.11', '11.3.5', '6', '8.11', '3.6', '4.6.11', '11.3.6', '10.1.4', 'F#4', 'F#3', 'B-4', '8.1', '6', '1.6', '3.6', '10.1.4', 'F#4', 'F#3', 'B-4', '8.1', '6', '1.6', '3.6', '11.1.4', '6', '11.3', '6', '11.3', '6.11', '11.3.6', '6', '7.11.1', '4.7', '8.11', '3.8', '8.11.3', 'E-5', 'E-3', 'F#5', '3.4', '3.8', '11.3', '8.11', '3.6.10', '3.6', 'B-4', 'B-3', 'C#5', '6.11', '10.3', '3.6.10', 'B4', '4.8', 'E4', 'B3', 'G#4', '6.11', '4.8', 'G#4', 'B3', '1.4', '11', 'E-5', '3.5', '6', '1.3', '6.11', '8', '10.1.4', 'F#4', 'F#3', 'G#4', 'B-4', '8.1', '6', '1.6', '3.6', '10.1.4', 'F#4', 'F#3', 'G#4',

In [0]:
# LSTM 모델이 예측한 값들로부터 MIDI 파일을 만들어준다

offset = 0 # 음(Note/Chord)을 언제 들려줄지 정하는 timing offset (박자 정보를 대신 함)

# MIDI 파일 생성을 위한 빈 리스트
output_notes = []

# create note and chord objects based on the values generated by the model
# LSTM 모델 예측 값을 하나씩 처리
for pattern in pred_out:

    # pattern이 Chord 일 때
    if ('.' in pattern) or pattern.isdigit():
        notes_in_chord = pattern.split('.') # ['8.1'].split('.') => ['8', '1']
        notes = [] # Note 정보를 저장할 빈 리스트

        # notes_in_chord의 텍스트를 Note 정보로 바꿔준다
        for current_note in notes_in_chord:
            new_note = note.Note(int(current_note)) # Text => 정수 => Note
            new_note.storedInstrument = instrument.Piano() # 악기 정보 설정
            notes.append(new_note) # notes 리스트에 더해준다

        # Note => Chord
        new_chord = chord.Chord(notes)
        new_chord.offset = offset # 시간 정보 설정
        output_notes.append(new_chord)

    # pattern이 Note 일 때
    else:
        new_note = note.Note(pattern)
        new_note.offset = offset
        new_note.storedInstrument = instrument.Piano()
        output_notes.append(new_note)

    # 반복마다 offset을 증가시킨다 (고정 박자)
    offset += 0.5

# Note/Chord => Stream => MIDI File
midi_stream = stream.Stream(output_notes)
midi_stream.write('midi', fp='/gdrive/My Drive/test_output.mid')

'/gdrive/My Drive/test_output.mid'

In [0]:
# 모델은 h5 파일 형태로 저장됩니다
# 경로에 주의합시다
model.save('/gdrive/My Drive/Chopin_LSTM.h5')

# 모델을 불러오기 위해 지워줍니다
del model

# 저장되어 있는 모델을 불러오기 위한 load_model 함수
from keras.models import load_model

# 'model' 에 해당 모델을 불러옵니다
model = load_model('/gdrive/My Drive/Chopin_LSTM.h5')