# csv 데이터 불러오기

In [1]:
import pandas as pd

input_file = pd.read_csv('train_data0307.csv')
target_file = pd.read_csv('target_data0307.csv')

# 기존 옥타브 평가 알고리즘

In [2]:
# 최종 코드
def calculate_euclidean_distance(notes1, notes2):
    if len(notes1) == 0 and len(notes2) == 0:
        return 0
    
    max_length = max(len(notes1), len(notes2))
    notes1 += [0] * (max_length - len(notes1))
    notes2 += [0] * (max_length - len(notes2))

    # 두 리스트 간의 유클리드 거리 계산
    distance = np.linalg.norm(np.array(notes1) - np.array(notes2))

    return distance

def calculate_octave_similarity(df_input, df_target):
    total_matched_octaves = 0
    total_notes = 0
    
    for index in range(len(df_input)):
        notes_input = eval(df_input.at[index, 'note'])
        notes_target = eval(df_target.at[index, 'note'])

        # 0으로 된 값 리스트로 처리
        if not isinstance(notes_input, list):
            notes_input = [notes_input]
        if not isinstance(notes_target, list):
            notes_target = [notes_target]

        # 벡터화 & 정규화
        input_octaves = list(set((note // 12) for note in notes_input))
        input_octaves = [octave / np.linalg.norm(input_octaves) for octave in input_octaves]
        target_octaves = list(set((note // 12) for note in notes_target))
        target_octaves = [octave / np.linalg.norm(target_octaves) for octave in target_octaves]
        # 현재 행의 일치하는 옥타브 수 초기화
        matched_octaves = 0
        
        # 한 행에 있는 리스트들 간의 비교
        # 수정된 부분: 유클리드 거리를 사용하여 옥타브 유사도 계산
        distance = calculate_euclidean_distance(input_octaves, target_octaves)
        similarity = 1 / (1 + distance)

        # 유사도가 일정 값 이상인 경우에 가중 점수 추가
        if similarity >= 0.8:
            matched_octaves += 1.2
        elif similarity >= 0.7:
            matched_octaves += 0.8
        elif similarity >= 0.6:
            matched_octaves += 0.6
        elif similarity >= .5:
            matched_octaves += 0.3

        total_matched_octaves += matched_octaves
        total_notes += len(set(input_octaves) | set(target_octaves))

    max_possible_matched_octaves = total_notes  # 모든 노트의 옥타브가 유사한 경우
    octave_similarity = min(100, (total_matched_octaves / max_possible_matched_octaves) * 100)

    return f'{octave_similarity:.2f}%'

# 옥타브는 다음 그림과 같은 것이다.

![image.png](attachment:image.png)

# 옥타브 ?

- 한 옥타브가 내려가면 주파수가 1/2배, 올라가면 2배, 한 음계 올라가면 2^ (1/12)배가 된다.

|옥타브|note의 범위|음계|
|--|--|--|
|C0||C = 도|
|C1|24(24, 26, 28, 29, 31, 33, 35, 36)36|피아노의 경우|
|C2|36(36, 38, 40, 41, 43, 45 47, 48)48||
|C3|48(48, 50, 52, 53, 55, 57, 59, 60)60||
|C4||60(60, 62, 64, 65, 67, 69, 71, 72)72|
|C5|72(72, 74, 76, 77, 79, 81, 83, 84)84||
|C6|84(84, 86, 88, 89, 81, 93, 95, 96)96||
|C7|96(96, 98, 100, 101, 103, 105, 107, 108)108||
|C8|||
|C9|||


- 옥타브 별 주파수 <br>
0옥타브(C0 ~ B0): 16 ~ 31(Hz)<br>
1옥타브(C1 ~ B1): 33 ~ 62(Hz)<br>
2옥타브(C2 ~ B2): 65 ~ 123(Hz)<br>
3옥타브(C3 ~ B3): 131 ~ 247(Hz)<br>
4옥타브(C4 ~ B4): 262 ~ 494(Hz)<br>
5옥타브(C5 ~ B5): 523 ~ 988(Hz)<br>
6옥타브(C6 ~ B6): 1047 ~ 1976(Hz)<br>
7옥타브(C7 ~ B7): 2093 ~ 3951(Hz)<br>
8옥타브(C8 ~ B8): 4186 ~ 7902(Hz)<br>
9옥타브(C9 ~ B9): 8372 ~ 15804(Hz)<br>
10옥타브(C10 ~ B10): 16744 ~ 31608(Hz)<br>
![image.png](attachment:image.png)