# 패키지

In [1]:
import os

In [2]:
import tensorflow as tf             # 텐서플로
import tensorflow_addons as tfa     # 텐서플로 애드온
import pandas as pd                 # 판다스


TensorFlow Addons (TFA) has ended development and introduction of new features.
TFA has entered a minimal maintenance and release mode until a planned end of life in May 2024.
Please modify downstream libraries to take dependencies from other repositories in our TensorFlow community (e.g. Keras, Keras-CV, and Keras-NLP). 

For more information see: https://github.com/tensorflow/addons/issues/2807 

 The versions of TensorFlow you are currently using is 2.12.0 and is not supported. 
Some things might work, some things might not.
If you were to encounter a bug, do not file an issue.
If you want to make sure you're using a tested and supported configuration, either change the TensorFlow version or the TensorFlow Addons's version. 
You can find the compatibility matrix in TensorFlow Addon's readme:
https://github.com/tensorflow/addons


# GPU 사용 설정

In [3]:
# 사용 가능한 모든 GPU 리스트
gpus = tf.config.list_physical_devices('GPU')

# 사용할 프로세서 선택 : GPU
if gpus:
    try: tf.config.set_visible_devices(gpus[0], 'GPU')
    except RuntimeError as e: print(e)

# 데이터셋 준비

In [4]:
# 데이터셋 주소
dataset_dir = os.path.join('.', 'datasets', 'MusicalSymbol-v.1.1.5')

# CSV 파일 주소
csv_dir = os.path.join(dataset_dir, 'label.csv')

# csv 파일 불러오기
df = pd.read_csv(csv_dir)

# name을 정수값으로 추출
df['name_int'] = df['name'].str.extract('(\d+)').astype(int)

# 정수값을 기준으로 정렬 및 인덱스 초기화
df = df.sort_values('name_int')
df.reset_index(drop=True, inplace=True)

# 필요 없는 name, name_int 열 제거
df = df.drop(columns=['name', 'name_int'])

In [5]:
def column_extract(dataframe, keywords):
    # 빈 데이터 프레임 생성
    new_df = pd.DataFrame()

    # 기존 데이터 프레임 추출 시작
    for key in keywords:
        # 키워드 추출
        name_list = [s for s in dataframe.columns.to_numpy() if key in s]
        
        # 추출된 키워드 열 끼리 병합
        for n in name_list:
            # 키워드 열 끼리 or 연산
            if key in new_df:   new_df[key.strip()] = new_df[key] | dataframe[n]
            else:               new_df[key.strip()] = dataframe[n]
    
    # 새로 생성된 데이터 프레임 반환
    return new_df

def column_pick(dataframe, keywords):
    # 빈 데이터 프레임 생성
    new_df = pd.DataFrame()

    # 기존 데이터 프레임 추출 시작
    for key in keywords:
        # 키워드 추출
        name_list = [s for s in dataframe.columns.to_numpy() if key in s]

        # 추출된 키워드로 데이터 프레임 새로 만들기
        for n in name_list:
            new_df[n.strip()] = dataframe[n]
    
    # 새로 생성된 데이터 프레임 반환
    return new_df

In [6]:
# 악상 기호 전체 분류
df_all = column_extract(df, keywords=[ 
    'note', 
    'accidental', 
    'articulation', 
    'dynamic', 
    'octave', 
    'ornament', 
    'repitition', 
    'clef', 
    'key', 
    'measure', 
    'repetition', 
    'rest', 
    'time'
])

# 악상 기호 세부 분류
df_pitch        = column_pick(df, keywords=['staff-']).drop(columns=['staff-half-left', 'staff-half-right'])
df_note         = column_pick(df, keywords=['note'])
df_accidental   = column_pick(df, keywords=['accidental'])
df_dynamic      = column_pick(df, keywords=['dynamic'])
df_octave       = column_pick(df, keywords=['octave'])
df_ornament     = column_pick(df, keywords=['ornament'])
df_repitition   = column_pick(df, keywords=['repitition'])
df_clef         = column_pick(df, keywords=['clef'])
df_key          = column_pick(df, keywords=['key'])
df_measure      = column_pick(df, keywords=['measure'])
df_repetition   = column_pick(df, keywords=['repetition'])
df_rest         = column_pick(df, keywords=['rest'])
df_time         = column_pick(df, keywords=['time'])

#
print(df_all.columns.to_numpy())

['note' 'octave' 'rest']


In [7]:
# pandas 데이터 프레임을 tensorflow 텐서로 변환
df_all          = tf.convert_to_tensor(df_all.values, dtype=tf.int16)
df_pitch        = tf.convert_to_tensor(df_pitch.values, dtype=tf.int16)
df_note         = tf.convert_to_tensor(df_note.values, dtype=tf.int16)
df_accidental   = tf.convert_to_tensor(df_accidental.values, dtype=tf.int16)
df_dynamic      = tf.convert_to_tensor(df_dynamic.values, dtype=tf.int16)
df_octave       = tf.convert_to_tensor(df_octave.values, dtype=tf.int16)
df_ornament     = tf.convert_to_tensor(df_ornament.values, dtype=tf.int16)
df_repitition   = tf.convert_to_tensor(df_repitition.values, dtype=tf.int16)
df_clef         = tf.convert_to_tensor(df_clef.values, dtype=tf.int16)
df_key          = tf.convert_to_tensor(df_key.values, dtype=tf.int16)
df_measure      = tf.convert_to_tensor(df_measure.values, dtype=tf.int16)
df_repetition   = tf.convert_to_tensor(df_repetition.values, dtype=tf.int16)
df_rest         = tf.convert_to_tensor(df_rest.values, dtype=tf.int16)
df_time         = tf.convert_to_tensor(df_time.values, dtype=tf.int16)

Metal device set to: Apple M1

systemMemory: 16.00 GB
maxCacheSize: 5.33 GB



In [8]:
@tf.function
def make_data(img_path):
    # 타겟 생성
    image = tf.io.read_file(img_path)               # 파일 로드
    image = tf.image.decode_png(image, channels=1)  # png 파일로 변환
    image = tf.cast(image, tf.float32)              # uint8 -> float32
    image = image / 255.0                           # 0~1 로 정규화
    image = 1.0 - image                             # 흑백 이미지 반전

    # 레이블 생성
    lable_index = tf.strings.split(img_path, os.path.sep)[-1]           # 파일 이름 추출
    lable_index = tf.strings.split(lable_index, '.')[0]                 # 확장자 제거
    lable_index = tf.strings.to_number(lable_index, out_type=tf.int32)  # 숫자 변환
    lable = tf.gather(df, lable_index)                                  # df 에서 lable_index 번째 label 추출

    # 타겟과 레이블 반환
    return (image, lable)

@tf.function
def add_noise(image, label):
    # 이미지 잡음
    #noise = tf.random.normal(shape=tf.shape(image), mean=0.5, stddev=0.2, dtype=tf.float32)     # 정규 분포
    noise = tf.random.uniform(shape=tf.shape(image), minval=-0.7, maxval=0.7, dtype=tf.float32)  # 균등 분포
    image = image + noise
    image = tf.clip_by_value(image, 0.0, 1.0)
    return image, label

@tf.function
def rotate_image(image, label):
    # 이미지 회전
    angle = tf.random.uniform([], minval=-15, maxval=15, dtype=tf.float32)
    angle_rad = angle * (3.141592653589793 / 180.0)
    image = tfa.image.rotate(image, angle_rad)
    return image, label

def scale_image(image, label):
    # 이미지 확대 및 축소
    pass

def shift_image(image, label):
    # 이미지 상하좌우로 이동
    pass

def shake_image(image, label):
    # 이미지 흔들림
    pass

@tf.function
def filter_dataset(image, label):
    # label이 모두 0인 경우 필터링
    return tf.math.reduce_any(label != 0)

In [9]:
# 데이터셋 확인해보기
import matplotlib.pyplot as plt

def plot_images(dataset, num_images):
    plt.figure(figsize=(10, 10))
    for images, labels in dataset.take(1):
        for i in range(num_images):
            ax = plt.subplot(4, 8, i + 1)
            plt.imshow(images[i], cmap='gray')
            plt.axis('off')
    plt.show()

In [10]:
# 데이터셋 생성
dataset = tf.data.Dataset.list_files(os.path.join(dataset_dir, '*.png'))

# map : make_data
dataset = dataset.map(make_data, num_parallel_calls=tf.data.experimental.AUTOTUNE)

# map : shift_image
#dataset = dataset.map(shift_image, num_parallel_calls=tf.data.experimental.AUTOTUNE)

# map : rotate_image
dataset = dataset.map(rotate_image, num_parallel_calls=tf.data.experimental.AUTOTUNE)

# map : scale_image
#dataset = dataset.map(scale_image, num_parallel_calls=tf.data.experimental.AUTOTUNE)

# map : shake_image
#dataset = dataset.map(shake_image, num_parallel_calls=tf.data.experimental.AUTOTUNE)

# map : add_noise
dataset = dataset.map(add_noise, num_parallel_calls=tf.data.experimental.AUTOTUNE)

# filter
dataset = dataset.filter(filter_dataset)

# cache
dataset = dataset.cache()

# shuffle
dataset = dataset.shuffle(buffer_size=25000)

# repeat
#dataset = dataset.repeat(3)

# train, validation
ds_validation = dataset.take(320).batch(32).prefetch(tf.data.experimental.AUTOTUNE)
ds_train = dataset.skip(320).batch(32)

# 만들어진 데이터셋 확인
#plot_images(ds_validation, 32)

# 모델 학습

In [9]:
# 그래프 초기화
tf.keras.backend.clear_session()

# 모델 생성 및 학습
with tf.device('/device:GPU:0'):
    # 모델 생성
    model = tf.keras.models.Sequential()
    model.add(tf.keras.layers.Conv2D(32, (5, 5), activation='relu', input_shape=(192, 512, 1)))
    model.add(tf.keras.layers.Dropout(rate=0.2))
    model.add(tf.keras.layers.MaxPool2D(2, 2))
    model.add(tf.keras.layers.Conv2D(64, (3, 3), activation='relu'))
    model.add(tf.keras.layers.Dropout(rate=0.2))
    model.add(tf.keras.layers.MaxPool2D(2, 2))
    model.add(tf.keras.layers.Flatten())
    model.add(tf.keras.layers.Dense(32, activation='relu'))
    model.add(tf.keras.layers.Dense(11, activation='softmax'))

    # 모델 컴파일
    model.compile(optimizer='adam', loss='categorical_crossentropy', metrics=['accuracy'])
    
    # 모델 학습
    model.fit(ds_train, epochs=4, validation_data=ds_validation)

Epoch 1/4
Epoch 2/4
Epoch 3/4
Epoch 4/4
